夹层共底结构红外图像拼接方法

盛涛; 郑金华; 向苹; 陈超; 徐红杰; 江海军

夹层共底结构红外图像拼接方法

盛涛¹,
郑金华¹,
向苹¹,
陈超¹,
徐红杰¹,
江海军^2, ,

1.
上海复合材料科技有限公司, 上海 201112
2.
南京诺威尔光电系统有限公司, 江苏南京 210014

详细信息

作者简介:
盛涛（1984-），男，上海市人，高级工程师，学士，研究方向为复合材料无损检测技术

通讯作者:
江海军（1988-），男，江苏省南京市人，高级工程师，硕士，研究方向为红外无损检测技术及图像处理。E-mail: hjiang@novelteq.com

中图分类号: TB302.5
计量
- 文章访问数: 109
- HTML全文浏览量: 45
- PDF下载量: 27
出版历程
- 收稿日期: 2023-03-28
- 修回日期: 2023-04-27
- 刊出日期: 2023-09-19

Infrared Image Stitching Method for Sandwich Bulkhead Structure

1.
Shanghai Composite Material Science & Technology Co., Ltd, Shanghai 201112, China
2.
Nanjing Novelteq Co., Ltd, Nanjing 210014, China

摘要

摘要: 夹层共底贮箱体积庞大，采用脉冲红外无损检测技术单次只能检测一小片区域，需要数百次检测才能完成对夹层共底贮箱的检测，单个工程不利于缺陷位置的判断。本文采用固定重叠区域的红外图像拼接方法，重叠区域采用加权融合方式可有效消除拼缝，夹层共底结构侧边6个子区域采用弧形拼接方式，可有效解决弧形区域的拼接，可有效解决多工程拼接难题。采集工程缺陷标注后，拼接图像直接显示缺陷的位置信息，对于夹层共底结构缺陷信息判断带来了极大的便利。
- 脉冲红外无损检测 /
- 夹层共底贮箱 /
- 图像拼接 /
- 弧形拼接
Abstract: A sandwich bulkhead structure has a large volume. Because infrared non-destructive testing technology can only detect a small area, hundreds of tests are required to detect the sandwich bottom structure, which is not conducive to determining the location of defects in a single project. This article proposes a fixed overlapping-area infrared image stitching method in which the overlapping area is fused using weighted fusion to effectively eliminate seams. The six sub-regions on the side of the sandwich bottom structure are stitched using an arc-shaped method. This approach not only solves the problem of stitching in multiple projects but also greatly improves the accuracy and efficiency of defect detection. After collecting and annotating the defects in the project, the stitched image directly displays the location information of the defects, which greatly facilitates the identification of defect information in the sandwich bulkhead structure.
- pulsed infrared thermography /
- sandwich common bottom tank /
- image stitching /
- arc-shaped stitching

HTML全文

0. 引言

图像目标识别检测技术作为数字图像处理和模式识别领域中的一个重要分支，广泛地应用于自动驾驶、医疗图像、工业检测、智能机器人、智能视频监控等诸多场景^[1-2]。目标检测是通过分析目标特征信息，对视频或图像中感兴趣目标区域进行定位提取，并准确识别出各个区域的目标类别及其对应的包围框^[3]。近年来，随着深度学习在图像处理领域的不断突破，目标检测技术也得到了长足的进步^[4]。目前，大多数目标检测算法主要基于可见光图像，可见光图像虽然包含丰富的纹理和细节信息，但通常实际场景中各目标所处环境错综复杂，造成目标存在遮挡、尺度变化范围大、光照不均以及噪声干扰等情况，使目测检测技术的落地仍存在较大挑战^[5]。而红外图像主要利用热辐射能量成像，受光照影响较少，但图像对比度低，目标纹理结构等特征损失严重，较大地限制了其在目标检测领域中的应用。因此，研究一种基于可见光与红外图像相结合的目标检测方法，可以有效实现性能互补，同时降低光照、雨雾等噪声干扰，对目标检测技术的发展以及实际场景的应用都有较大的促进作用。

传统的目标检测算法流程主要为图像预处理、候选框提取、特征提取、目标分类以及后处理几个步骤，尽管在各个领域得到了广泛的应用，但存在候选框众多、特征设计复杂、算法迁移性差等问题^[5]。为了缓解传统算法的弊端，研究者将深度学习方法应用于目标检测，通过端到端的训练方式，使目标检测精度得到大幅提升。尽管目前大多数目标检测研究工作是基于可见光图像，但也有部分研究者对可见光和红外图像融合检测进行了探索。郝永平等^[6]人利用双通道深度残差卷积网络分别对可见光和红外图像进行特征提取，并通过计算特征欧氏距离结合注意力机制实现对感兴趣区域的目标检测。李舒涵等^[7]人提出了一种基于红外与可见光融合的交通标志检测方法，通过对两种图像中的目标进行粗定位后再结合卷积网络对定位框进行决策融合，实现交通标志高效检测。Xiao等^[8]人利用差分最大损失函数指导红外和可见光两个支路的卷积网络提取目标特征，并设计特征增强和级联语义扩展模块提升对不同尺度目标的检测。Banuls等^[9]人提出了一种基于决策级融合的目标检测算法，利用改进YOLOv3网络对可见光和红外图像进行分别检测后再进行加权融合提升目标检测效果。可见，基于深度学习的红外与可见光融合的检测方法可以有效提升目标检测效果，但大多数方法采用分别提取特征后再融合检测，未能充分利用两类图像中目标特征进行信息互补。

针对上述情况，本文在结合前人研究成果的基础上，提出了一种基于深度可分离卷积的特征交叉融合目标检测网络模型。为了网络保障效率，该模型以深度可分离卷积作为基本特征提取单元，构建轻量级的双支路特征提取结构，分别提取可见光和红外图像中目标信息。同时，利用双支路特征交叉融合结构，对各阶段提取的特征进行充分融合互补，并结合多层特征跳层融合实现不同尺度目标高精度识别检测。

1. 目标检测网络

1.1 整体框架

本文所设计的红外可见光融合目标检测网络整体结构如图 1所示。该网络由特征提取模块、特征融合模块以及检测模块3部分构成。针对红外和可见光图像，特征提取部分由两个并列的相同结构支路构成，主要采用深度可分离卷积作为特征提取基本单元，结合LeakyReLU激活层、最大池化层、上采样等操作，对红外和可见光图像特征信息由浅到深的高效提取。特征融合模块通过线性组合方式对两支路池化层特征进行建模，利用自主学习方式实现红外与可见光信息共享，使两支路提取的特征进行互补，提升网络特征多样性。检测模块利用多个不同尺度的深层特征以逐层上采样融合的操作构建特征金字塔预测结构，使网络在不同尺度上都具有强语义信息，保障网络对不同尺度的目标实现准确检测。

图 1 双支路自适应目标检测网络整体结构

Figure 1. The overall structure of the dual-branch adaptive object detection network

下载: 全尺寸图片幻灯片

1.2 特征提取模块

特征提取作为目标检测的首要任务，其提取的特征好坏直接决定目标检测模型的优劣。对于传统目标检测而言，特征主要靠人工设计，如SIFT（Scale Invariant Feature Transform）、HOG（Histogram of Oriented Gradient）、Haar、DPM（Deformable Part Model）等^[10]，通过提取滑动窗口中相应特征并利用机器学习进行分类，实现目标检测。而基于深度学习的目标检测方法扩大了特征提取的范畴，利用端到端的训练学习方式自动学习目标特征，避免了人工设计特征的局限。因此，基于深度学习的检测算法通常能够获得比传统方法更优的检测效果。基于此，本文借鉴目前经典的深度学习网络，设计了适用于红外和可见光图像的并列双支路特征提取网络。

为有效提取图像中各目标浅层和深层特征，本文所构建的特征提取结构采用多个不同特征尺度的子模块串联堆叠构成，详细结构如表 1所示。

表 1 特征提取结构

Table 1. Feature extraction structure

Stage	Layer structure	Repetitions	Output size
Original	RGB, 3	1	448×448
Init	Conv 3×3, 13 Max pooling 2×2, 3	1	224×224
Stage1	DWconv 3×3, 32 Residual	1	112×112
Stage2	DWconv 3×3, 64 Residual	2	56×56
Stage3	DWconv 3×3, 128 Residual	4	28×28
Stage4	DWconv 3×3, 256 Residual	4	14×14
Stage5	DWconv 3×3, 512 Residual	2	7×7

下载: 导出CSV

| 显示表格

特征提取结构由init模块和多个stage模块组成，如图 2所示。init模块如图 2(a)所示，该结构主要对原图进行特征预处理，采用步长为2的并列卷积和池化两条支路提取目标显著特征，降低图像维度的同时也过滤了部分噪声，保障后续结构对特征的深入提取。stage模块如图 2(b)所示，主要利用卷积层、激活层以残差结构方式构建，不同stage之间通过步长为2的2×2池化操作进行降维。由于需要分别对红外和可见光图像进行特征提取，为避免网络计算量过大，stage模块采用深度可分离卷积替代传统卷积来提取特征，有效减少了网络参数并降低了计算量。深度可分离卷积相对于传统卷积虽然提取的特征信息有所降低，但双支路的信息融合可以较好地弥补特征缺失等问题。同时，stage模块引入残差结构来避免网络层数过深造成训练时出现梯度消失、梯度爆炸等问题，并以LeakyReLU作为激活函数，如式(1)所示，降低神经元“坏死”概率，使网络更快收敛。

$$ f(x) = \left\{ \begin{gathered} \alpha x\;\;\;x < 0 \hfill \\ x\;\;\;\;\;x \geqslant 0 \hfill \\ \end{gathered} \right. $$

(1)

图 2 特征提取子模块

Figure 2. Feature extraction submodules

下载: 全尺寸图片幻灯片

式中：α是偏移量，为一个较小数值的超参数，默认设置为0.02。由LeakyReLU公式可以看出，当输入小于零时，函数的输出不为零，求导之后导数为固定值，从而避免进入负区间神经元不学习的问题。

1.3 特征融合模块

通常，可见光图像包含丰富的颜色、纹理等信息，能够提供较多的细节信息，但容易受到光照强度、天气等影响；而红外图像利用目标的热辐射能量大小进行成像，不受光照影响，但图像对比度较低，会损失部分目标的纹理、结构等外观特征。因此，通过融合红外和可见光图像信息，可以更好地增强和发现目标^[11-12]。基于此，本文在特征提取结构基础上，设计了特征交叉融合模块，使提取的红外和可见光图像信息互补，融合结构如图 3所示。

图 3 特征融合模块

Figure 3. Feature fusion modules

下载: 全尺寸图片幻灯片

融合结构考虑到网络运行效率，主要将特征提取过程中每个尺度的最后一层进行融合，即init模块最后一层和stage模块之间的池化层（图 3中未画出init层，i取值为1, 2, 3, 4）。同时，融合结构采用自主学习的线性加权方式来替代特征信息直接相加，避免融合时引入过多噪声。具体融合计算过程如式(2)所示。

$$ \left[ \begin{gathered} y_A^{ij} \hfill \\ y_B^{ij} \hfill \\ \end{gathered} \right] = \left[ \begin{gathered} {\alpha _{AA}}\;\;{\alpha _{AB}} \hfill \\ {\alpha _{BA}}\;\;{\alpha _{BB}} \hfill \\ \end{gathered} \right]\left[ \begin{gathered} x_A^{ij} \hfill \\ x_B^{ij} \hfill \\ \end{gathered} \right] $$

(2)

自主学习过程中权重迭代计算如式(3)(4)所示：

$$ \left[ \begin{gathered} \frac{{\partial L}}{{x_A^{ij}}} \hfill \\ \frac{{\partial L}}{{x_B^{ij}}} \hfill \\ \end{gathered} \right] = \left[ \begin{gathered} {\alpha _{AA}}\;\;{\alpha _{BA}} \hfill \\ {\alpha _{AB}}\;\;{\alpha _{BB}} \hfill \\ \end{gathered} \right]\left[ \begin{gathered} \frac{{\partial L}}{{y_A^{ij}}} \hfill \\ \frac{{\partial L}}{{y_B^{ij}}} \hfill \\ \end{gathered} \right] $$

(3)

$$ \frac{{\partial L}}{{\partial {\alpha _{AA}}}} = \frac{{\partial L}}{{y_A^{ij}}}x_A^{ij},\;\;\;\frac{{\partial L}}{{\partial {\alpha _{AB}}}} = \frac{{\partial L}}{{y_B^{ij}}}x_A^{ij} $$

(4)

式中：x_A^ij为待融合可见光特征图上坐标位置为(i, j)的像素值；同理，x_B^ij为待融合红外特征图上坐标位置为(i, j)的像素值；α_AA, α_AB, α_BA, α_BB为待学习的权重；y为融合后的对应特征图位置的输出，表示利用误差反向传播更新权重。由式(2)可以看出，当α_AA＝α_BB＝1，α_AB＝α_BA＝0时，表明该层特征信息并不融合，通过自主学习的方式决定红外和可见光图像特征信息的融合程度，进而达到最优组合。

1.4 检测模块

对于基于深度学习的目标检测算法而言，目前的检测思路可根据预设框大致分为两类：Anchor Based和Anchor-free检测模型^[4]。Anchor Based需要事先预设多个包围框，预测时通过微调包围框实现检测。Anchor Based又分为Two-stage和One-stage检测模型，Two-stage模型检测思路主要分为3个部分：候选区域生成、基于卷积神经网络的特征提取和目标定位分类，典型的网络有R-CNN^[13]系列网络；One-stage模型则舍弃了候选框的生成过程，直接在特征图上对预设框进行微调实现检测，典型的网络有YOLO（You Only Look Once）系列^[14]、SSD（Single Shot MultiBox Detector）^[15]等网络。而Anchor-free模型则舍弃所有包围框，直接根据提取的特征信息对目标进行定位识别，典型网络有FCOS（Fully Convolutional One-Stage）^[16]、LSNet（Light-Weight Siamese Network）^[17]等网络。考虑到不同检测模型的效率和精度，本文基于One-stage模型设计了特征金字塔检测模块，如图 4所示。

图 4 金字塔检测结构

Figure 4. Pyramid detection structure

下载: 全尺寸图片幻灯片

检测模块以特征融合结构的输出作为输入，由于特征融合的输出为红外和可见光两个通道，故采用concat操作对两路特征拼接后作为检测输入，即图 4中fuse部分。同时，考虑到现实场景中各目标大小差异十分明显，本文采用多个不同维度的融合特征（fuse2~fuse5），以自上而下的方式构建特征金字塔检测结构，该结构首先将融合后的深层特征通过点卷积调整特征通道与浅层特征一致；然后，上采样至浅层特征尺度大小，并与浅层特征拼接；再将拼接后的特征信息进行卷积操作，充分融合深层特征信息；将fuse5~fuse2的特征依次重复上述上采样拼接融合操作，使检测模块能充分获取全局以及局部特征信息；最后，分别利用4个尺度的特征对目标类别和位置进行预测，并将预测结果通过极大值抑制算法筛选出最优目标检测框，进而实现对各目标的精准检测。而对于预设框的设置，利用k-means算法对训练集中的标注框利用聚合，自动生成一组适用于对应场景的预设框。

2. 实验与结果分析

为有效验证本文所提的方法，实验分别采用搭载Titan Xp的高性能电脑以及NVIDIA Jetson TX2嵌入式平台进行实验。网络采用caffe深度学习框架进行构建，通过公开数据集和实际变电站数据集分别对网络的可行性和实际落地性进行测试。为方便与其他同类网络对比，网络训练时的超参数主要参照文献[8-9, 14]进行设置：采用小批次梯度下降方法（mini batch Stochastic Gradient Descent）优化网络参数，并利用Momentum动量算法加速优化，动量参数设置为0.9；初始学习率设置为0.001，学习策略采用step模式，即迭代训练3万次之后每迭代1万次学习率降低十分之一；权值衰减系数设为0.0005，防止过拟合；对于损失函数，由于目标检测是多任务模型，因此，训练时的损失为分类损失、置信度损失以及回归框损失的叠加，具体的损失函数参考YOLO网络^[14]计算方式。

对于所提网络的精度及效率评价分别采用均值平均精度（mAP）和网络每秒处理图像数量（FPS）来评价。均值平均精度指各个类别的平均精度的平均值，而针对目标尺寸不同，又分为mAP_s、mAP_m、mAP_l来衡量网络对小中大目标的检测效果，以边界框面积32²和96²作为区分边界。

$$ {\text{Precesio}}{{\text{n}}_{\text{C}}} = \frac{{N{{({\text{True Positives}})}_{\text{C}}}}}{{N{{({\text{Total Objects}})}_{\text{C}}}}} $$

(5)

$$ {\text{A}}{{\text{P}}_{\text{C}}} = \frac{{\sum {{\text{Precisio}}{{\text{n}}_{\text{C}}}} }}{{N{{({\text{Total Image}})}_{\text{C}}}}} $$

(6)

$$ {\text{mAP}} = \frac{{\sum {{\text{A}}{{\text{P}}_{\text{C}}}} }}{{N({\text{Classes}})}} $$

(7)

$$ {\text{FPS}} = N/\sum\limits_k^N {{T_k}} $$

(8)

式(5)(6)(7)中：C为类别；N(True Positives)_C指一张图像中的C类目标正确预测的数量；N(Total Object)_C指该图像中C类目标总数；Precision_C指该图像中C类目标检测精度；N(Total Image)_C指训练集中含C类目标的图像数量；N(Classes)表示样本中类别数，AP_C指所有图像中C类目标的平均精度。式(8)为效率评价指标：N为图像数量，T_k指网络处理第k张图像所消耗的时间。

2.1 标准数据集测试

为有效验证所提方法的可行性，实验采用李成龙教授团队构建的RGBT210数据集^[18]作为标准数据进行测试。RGBT210数据集由具有相同的成像参数红外和可见光摄像机在210种场景下采集的图像构成。该数据集包含约21万张图像，涵盖约20多种目标在不同时间段、不同光照强度下的红外和可见光图像对。由于该数据集较大，且大多数图像相似，为了能快速验证所提网络，从中筛选出了5000张相似度较低的图像进行测试。筛选出的图像包含汽车、行人、自行车、狗、风筝等10种类别，将其归一化图像尺寸为512×448，并以7:1:2的比例构建训练、验证及测试集，在搭载Titan Xp的电脑上进行训练测试。

实验首先对所提网络的单条支路进行测试，即删除融合模块和红外支路，只利用可见光支路进行目标检测。网络训练时设置batchsize为4，经过约10万次迭代收敛后，与同类型的目标检测网络对比如表 2所示。

表 2 可见光网络测试结果对比

Table 2. Comparison of visible network test results

Network	FPS	Test accuracy/(%)
Network	FPS	mAP	mAP_s	mAP_m	mAP_l
Faster RCNN^[13]	25	71.9	52.2	73.2	82.6
YOLO^[14]	66	67.5	49.1	70.6	78.9
Shuffle+SSD^[15]	113	65.6	46.1	68.3	75.3
Visible-light branch	93	67.3	48.5	70.1	77.6

下载: 导出CSV

| 显示表格

由表 2可以看出，本文所构建的可见光单支路网络与目前主流的高精度（Faster RCNN）和高效率（Shuffle+SSD）目标检测网络相比，较好地平衡了网络性能。同时，网络以深度可分离卷积替代传统卷积，并引用了残差、LeakyReLU激活函数等网络构建策略，与同类型网络（YOLO）相比，所提网络以较小的精度损失来换取网络效率大幅提升。但相对于Faster RCNN，由于所提网络为单步检测，并且深度可分离卷积相对传统卷积损失了部分特征信息，所以造成精度有所降低。为进一步验证红外与可见光双支路结构的特征互补性以及所提特征融合结构的有效性，实验分别测试了可见光、红外以及融合后的网络性能，同时，针对两支路的融合结构，分别测试了直接相加（Eltwise）、拼接（Concat）以及本文所提的自适应融合结构，实验结果如表 3和图 5所示。

表 3 不同结构测试结果

Table 3. Different dilation rates test results

Network	FPS	Test accuracy /(%)
Network	FPS	mAP	mAP_s	mAP_m	mAP_l
Infrared branch	94	61.0	45.3	64.2	71.8
Visible-light branch	93	67.3	48.5	70.1	77.6
Eltwise Fusion	81	70.4	51.1	73.8	80.1
Concat Fusion	79	71.6	52.3	74.2	81.6
This paper	78	73.8	54.3	75.1	83.2

下载: 导出CSV

| 显示表格

图 5 单支路与融合支路目标检测结果

Figure 5. Single branch and fusion branch object detection results

下载: 全尺寸图片幻灯片

由表 3和图 5可以看出，红外图像由于缺少较多细节信息，与可见光图像相比，目标检测效果较差；而可见光受光照等影响，也造成部分目标无法识别。通过两支路融合的方式，使图像特征信息更加丰富，网络检测精度也有较大提升，但由于引入了新的支路，网络效率有一定的下降。同时，不同的融合方式，对网络性能也有一定的影响，Eltwise和Concat融合方式虽然增加了特征信息，但也引入了较多噪声，而本文所提方法较好地缓解了噪声的引入，使两支路的有效信息能更好的互补，检测精度也更高。为更好地验证所提网络的优势，实验分别与基于多级分层检测^[7]、基于特征级融合^[8]以及基于决策级融合^[19]的红外与可见光联合检测网络进行了测试对比，实验结果如表 4所示，检测效果如图 6所示。

表 4 同类型网络测试结果对比

Table 4. Comparison of test results of the same type of network

Network	FPS	Test accuracy/(%)
Network	FPS	AP	AP_s	AP_m	AP_l
Literature[7]	83	68.1	49.5	71.0	76.3
Literature [8]	51	74.0	54.0	76.5	84.1
Literature [19]	73	72.2	51.2	74.6	81.5
This paper	78	73.8	54.3	75.1	83.2

下载: 导出CSV

| 显示表格

图 6 红外-可见光网络检测效果对比

Figure 6. Comparison of infrared-visible network detection effects

下载: 全尺寸图片幻灯片

根据上述结果可以看出，与同类型的红外-可见光联合检测网络相比，虽然融合方式提高目标的显著性，但也引入了更多的噪声，如图 6文献[7]中错误检测出car。同时，对于复杂背景并且红外图像无法检测的目标，各算法检测效果较差，如图 6第3排中雨伞的检测。尽管本文所提网络未能在所有指标中达到最优，但基本保持高精度和高效率的完成目标检测。同时，由于自适应融合的方式可以较好地避免噪声的引入，所以网络对浅层信息也进行了融合，使网络能更好地识别检测出图像中的小目标，并且对存在遮挡的目标也有较好的检测效果。

2.2 变电站场景测试

标准数据集的测试结果有效地验证了所提网络的可行性，为了进一步验证该网络的泛化能力以及实际落地性，本文采用实际变电站场景下的设备图像数据，对网络进行测试验证。在实际变电站场景中，大多数设备需要巡检机器人进行红外测温来监测设备状况，但由于实际环境复杂，如何避免其他设备干扰，准确定位出待测设备对机器人而言极为重要。基于此，本文以搭载Jetson TX2变电站巡检机器人为测试平台，通过机器人搭载的可见光和红外相机对设备图像进行采集，并根据两相机参数，将采集的红外和可见光图像进行裁剪使各目标对齐。实验主要采集了断路器、绝缘子、冷控箱、变压器等6种变电站设备图像，涵盖了不同大小的目标，从中筛选出5000张重复率较低的图像，利用公开标注工具LabelImg对图像中的各个目标进行手动标注，并调整图像尺寸为512×448大小。将处理后的图像以7:1:2的比例构建训练、验证和测试集，在Jetson TX2平台上进行训练测试，测试结果如表 5所示，检测效果如图 7所示。

表 5 可见光网络测试结果对比

Table 5. Comparison of visible network test results

Network	FPS	Test accuracy /(%)
Network	FPS	AP	AP_s	AP_m	AP_l
Literature[7]	21	73.2	54.1	76.6	81.4
Literature [8]	13	78.2	58.9	81.4	88.7
Literature [19]	17	76.9	56.2	78.3	86.6
This paper	20	78.1	59.1	80.8	88.4

下载: 导出CSV

| 显示表格

图 7 变电站设备检测效果对比

Figure 7. Comparison of substation equipment detection effects

下载: 全尺寸图片幻灯片

根据实际场景中的实验结果可以看出，由于测试平台的计算性能较低，各网络的效率都相应地下降到较低水平，但总体来看，本文所提网络与同类型高效率网络相比，基本达到相同的检测效率。尽管效率仍相对较低，但相对于巡检速度较慢的机器人而言，也基本能满足其实时检测的需求。同时，在检测精度方面，由于实际场景中的数据相对于标准数据集较为简单，各方法在检测精度上都有所提升，对于简单的设备环境，各算法基本都能实现准确检测，如图 7第一排中对变电箱的检测；但对于相对复杂的环境，如图 7第二、三排中，存在目标过大、各目标相互影响、背景复杂的情况，使各算法检测效果受到较大影响。但通过整体对比，可以看出本文所提网络的检测效果基本与高精度网络不相上下，并且可以达到高效率网络的检测效率。综上可见，本文所提方法具有更强的鲁棒性及泛化能力，可以很好地适用于巡检机器人对变电站设备的检测，使机器人能够保持高精度高效率的完成检测任务。

3. 结论

本文针对目前单一可见光目标检测算法存在的局限，提出了一种融合红外和可见光图像特征信息的深度神经网络目标检测方法。该方法以深度可分离卷积为基本特征提取单元，结合高效率LeakyReLU激活函数和残差结构构建并列的红外-可见光特征提取支路；为有效融合红外和可见光图像中目标特征信息，引入了自适应特征融合模块，利用自主学习的方式对两支路中的有效信息进行融合，避免了过多噪声的引入；同时，为保证网络对不同大小目标的准确检测，采用特征金字塔结构方式融合不同维度的特征信息，并利用多个尺度特征分别对目标进行预测，提升了对不同大小目标的检测效果。通过在标准数据集以及实际变电站设备检测场景中的实验结果表明，本文所提网络有效地平衡了检测精度与效率，可以较好地应用于变电站巡检机器人完成设备检测任务。尽管本文所提网络在一定程度上提高了目标检测效果，但仍有较多值得深入研究的地方，后续将尝试引入注意力机制来进一步提升检测精度，并利用模型剪枝或知识蒸馏等策略，提高网络的检测效率。

图 1 夹层共底结构示意图

Figure 1. Schematic diagram of sandwich common bottom structure

下载: 全尺寸图片幻灯片

图 2 便携红外无损检测设备

Figure 2. Portable infrared nondestructive testing equipment

下载: 全尺寸图片幻灯片

图 3 脉冲激励后红外序列图像

Figure 3. Infrared sequence images after pulsed excitation

下载: 全尺寸图片幻灯片

图 4 弧形图像处理

Figure 4. Arc image processing

下载: 全尺寸图片幻灯片

图 5 加权系数图像

Figure 5. Image of weighting coefficient

下载: 全尺寸图片幻灯片

图 6 使用两种方法的平面拼接结果

Figure 6. The results of planar stitching using two methods

下载: 全尺寸图片幻灯片

图 7 弧形拼接结果

Figure 7. Results of arc-shaped splicing

下载: 全尺寸图片幻灯片

图 8 夹层共底图像拼接结果

Figure 8. Mosaic results of sandwich bulkhead image

下载: 全尺寸图片幻灯片

图 9 夹层共底图像缺陷分布

Figure 9. Defect distribution of sandwich bulkhead image

下载: 全尺寸图片幻灯片

参考文献(13)

[1]	王彬, 杨瑞生, 郑卫东, 等. 运载火箭共底贮箱加注过程非稳态温度分布数值模拟[J]. 化工学报, 2020, 71(S01): 68-76. https://www.cnki.com.cn/Article/CJFDTOTAL-HGSZ2020S1010.htm WANG B, YANG R S, ZHENG W D, et al. Numerical simulations on unsteady temperature distribution of sandwich bulkhead tank in launch vehicle[J]. CIESC Journal, 2020, 71(S01): 68-76. https://www.cnki.com.cn/Article/CJFDTOTAL-HGSZ2020S1010.htm
[2]	湛利华, 关成龙, 黄诚, 等. 航天低温复合材料贮箱国内外研究现状分析[J]. 航空制造技术, 2019, 62(16): 1-9. https://www.cnki.com.cn/Article/CJFDTOTAL-HKGJ201916016.htm ZHAN L H, GUAN C L, HUANG C, et al. Analysis of research status of composite cryotank for space[J]. Aeronautical Manufacturing Technology, 2019, 62(16): 1-9. https://www.cnki.com.cn/Article/CJFDTOTAL-HKGJ201916016.htm
[3]	孙培杰, 李鹏, 张振涛, 等. 新一代运载火箭共底贮箱隔热性能试验及环境预示[J]. 上海航天, 2014, 31(5): 54-59. https://www.cnki.com.cn/Article/CJFDTOTAL-SHHT201405012.htm SUN P J, LI P, ZHANG Z T. Experimental and numerical investigation of heat insulation performances of coplanar tanks in new generation launch vehicle[J]. Aerospace ShangHai, 2014, 31(5): 54-59. https://www.cnki.com.cn/Article/CJFDTOTAL-SHHT201405012.htm
[4]	李茂, 韩涵, 唐杰, 等. 大温差隔热共底在运载贮箱中的应用研究[J]. 上海航天, 2016, 32(B05): 43-50. https://www.cnki.com.cn/Article/CJFDTOTAL-SHHT2016S1008.htm LI M, HAN H, TANG J. Application of PMI foam cored sandwich bulkhead tank in launch vehicle[J]. Aerospace ShangHai, 2016, 32(B05): 43-50. https://www.cnki.com.cn/Article/CJFDTOTAL-SHHT2016S1008.htm
[5]	江海军, 陈力, 张淑仪. 激光扫描红外热波成像技术在无损检测中的应用[J]. 无损检测, 2014, 36(12): 20-22. https://www.cnki.com.cn/Article/CJFDTOTAL-WSJC201412007.htm JIANG H J, CHEN L, ZHANG S Y. Applications of the laser scanning infrared thermography for nondestructive testing[J]. Nondestructive Testing, 2014, 36(12): 20-22. https://www.cnki.com.cn/Article/CJFDTOTAL-WSJC201412007.htm
[6]	郑凯, 江海军, 陈力. 红外热波无损检测技术的研究现状与进展[J]. 红外技术, 2018, 40(5): 401-411. http://hwjs.nvir.cn/article/id/hwjs201805001 ZHENG K, JIANG H J, CHEN L. Infrared thermography NDT and its development[J]. Infrared Technology, 2018, 40(5): 401-411. http://hwjs.nvir.cn/article/id/hwjs201805001
[7]	刘颖韬, 郭广平, 杨党纲, 等. 脉冲热像法在航空复合材料构件无损检测中的应用[J]. 航空材料学报, 2012, 2(1): 72-77. https://www.cnki.com.cn/Article/CJFDTOTAL-HKCB201201017.htm LIU Y T, GUO G P, YANG D G. Pulsed thermography of composite components used in aerospace applications[J]. Journal of Aeronautical Materials, 2012, 32(1): 72-77. https://www.cnki.com.cn/Article/CJFDTOTAL-HKCB201201017.htm
[8]	郭伟, 董丽虹, 徐滨士, 等. 主动红外热像无损检测技术的研究现状与进展[J]. 无损检测, 2016, 38(4): 58-66. https://www.cnki.com.cn/Article/CJFDTOTAL-WSJC201604016.htm GUO W, DONG L H, XU B S, et al. Research status and progress of active infrared thermographic nondestructive testing[J]. Nondestructive Testing, 2016, 38(4): 58-66. https://www.cnki.com.cn/Article/CJFDTOTAL-WSJC201604016.htm
[9]	刘颖韬, 郭广平, 曾智, 等. 红外热像无损检测技术的发展历程、现状和趋势[J]. 无损检测, 2017, 39(8): 63-70. https://www.cnki.com.cn/Article/CJFDTOTAL-WSJC201708016.htm LIU Y T, GUO G P, ZENG Z, et al. The development history, status and trends of infrared thermographic nondestructive testing[J]. Nondestructive Testing, 2017, 39(8): 63-70. https://www.cnki.com.cn/Article/CJFDTOTAL-WSJC201708016.htm
[10]	孙艳丽, 周伟, 张亚周, 等. 基于SIFT的航空侦查图像拼接算法[J]. 电子测量技术, 2020, 43(19): 112-116. https://www.cnki.com.cn/Article/CJFDTOTAL-DZCL202019024.htm SUN Y L, ZHOU W, ZHANG Y ZH, et al. Image mosaic algorithm of aerial investigation based on SIFT[J]. Electronic Measurement Technology, 2020, 43(19): 112-116. https://www.cnki.com.cn/Article/CJFDTOTAL-DZCL202019024.htm
[11]	黄康, 王明泉, 张俊生, 等. 基于SURF算法的射线底片拼接技术研究[J]. 国外电子测量技术, 2021, 40(2): 93-97. https://www.cnki.com.cn/Article/CJFDTOTAL-GWCL202102021.htm HUANG K, WANG M Q, ZHANG J SH, et al. Research on image stitching of radiographic technology film based on SURF stitching algorithm[J]. Foreign Electronic Measurement Technology, 2021, 40(2): 93-97. https://www.cnki.com.cn/Article/CJFDTOTAL-GWCL202102021.htm
[12]	Leutenegger S, Chli M, Siegwart R Y. BRISK: Binary robust invariant scalable keypoints[C]//Proceedings of 2011 International Conference on Computer Vision. Barcelona, 2011: 2548-2555.
[13]	Rublee E, Rabaud V, Konolige K, et al. ORB: An efficient alternative to SIFT or SURF[C]//Proceedings of the 2011 International Conference on Computer Vision, 2011: 2564-2571.

施引文献(1)

期刊类型引用(0)

其他类型引用(1)

资源附件(0)

图(9)

计量

文章访问数: 109
HTML全文浏览量: 45
PDF下载量: 27
被引次数: 1

0. 引言
1. 目标检测网络
1.1 整体框架
1.2 特征提取模块
1.3 特征融合模块
1.4 检测模块
2. 实验与结果分析
2.1 标准数据集测试
2.2 变电站场景测试
3. 结论

夹层共底结构红外图像拼接方法

作者简介: 盛涛（1984-），男，上海市人，高级工程师，学士，研究方向为复合材料无损检测技术

通讯作者: 江海军（1988-），男，江苏省南京市人，高级工程师，硕士，研究方向为红外无损检测技术及图像处理。E-mail: hjiang@novelteq.com

计量

出版历程