一种基于生成对抗网络与注意力机制的可见光和红外图像融合方法

罗迪; 王从庆; 周勇军

一种基于生成对抗网络与注意力机制的可见光和红外图像融合方法

罗迪^{1, 2,},
王从庆^{1, 2},
周勇军^2, ,

1.
南京航空航天大学自动化学院，江苏南京 210016
2.
近地面探测技术重点实验室，江苏无锡 214000

基金项目:

近地面探测技术重点实验室基金资助项目 TCGZ2019A006

详细信息

作者简介:
罗迪（1995-），男，硕士研究生，主要研究方向：深度学习与无人机目标检测。E-mail：1366701808@qq.com

通讯作者:
周勇军（1972），男，高级工程师，主要研究方向：近地面目标探测技术。E-mail：478992155@qq.com

中图分类号: TN753
计量
- 文章访问数: 574
- HTML全文浏览量: 150
- PDF下载量: 129
出版历程
- 收稿日期: 2020-09-07
- 修回日期: 2020-10-11
- 刊出日期: 2021-06-19

A Visible and Infrared Image Fusion Method based on Generative Adversarial Networks and Attention Mechanism

LUO Di^{1, 2,},
WANG Congqing^{1, 2},
ZHOU Yongjun^2, ,

1.
College of Automation Engineering of Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China
2.
Science and Technology on Near-Surface Detection Laboratory, Wuxi 214000, China

摘要

摘要: 针对低照度可见光图像中目标难以识别的问题，提出了一种新的基于生成对抗网络的可见光和红外图像的融合方法，该方法可直接用于RGB三通道的可见光图像和单通道红外图像的融合。在生成对抗网络中，生成器采用具有编码层和解码层的U-Net结构，判别器采用马尔科夫判别器，并引入注意力机制模块，使得融合图像可以更关注红外图像上的高强度信息。实验结果表明，该方法在维持可见光图像细节纹理信息的同时，引入红外图像的主要目标信息，生成视觉效果良好、目标辨识度高的融合图像，并在信息熵、结构相似性等多项客观指标上表现良好。
- 图像融合 /
- 可见光/红外图像 /
- 低照度图像 /
- 生成对抗网络 /
- 注意力机制
Abstract: A new fusion method for visible and infrared images based on generative adversarial networks is proposed to solve the problem of recognizing targets in low-light images; the method can be directly applied to the fusion of RGB three-channel visible images and infrared images. In generative adversarial networks, the generator adopts a U-Net structure with encoding and decoding layers. The discriminator adopts a Markovian discriminator, and the attention mechanism is introduced to force the fused image to pay more attention to the high-intensity information on infrared images. The experimental results show that the proposed method not only maintains the detailed texture information of visible images but also introduces the main target information of infrared images to generate fusion images with good visual effects and high target identification, and it performs well in information entropy, structural similarity, and other objective indexes.
- image fusion /
- visible and infrared image /
- low-lightimage /
- generative adversarial networks /
- attention mechanism

HTML全文

0. 引言

长期工作在恶劣环境下的起重机械，由于服役时间长且长期承受交变载荷，其金属构件极有可能会产生不同程度的损伤^[1]。因此，为了确保起重机械服役过程的实用性和安全性，对金属结构早期裂纹的判断和识别是非常必要的。但是在复杂又多变的环境中对金属构件裂纹缺陷接触检测难以实现且检测结果并不准确，而常规无损检测技术检测又存在速度慢、便携度差和检测精度差的缺点，已经无法满足常规试件便携、快速、准确的检测需求，因此对具有非接触、检测速度快的红外热成像检测技术^[2]的应用和研究具有重大意义。

关于红外热成像检测技术，Avdelidis N P^[3-4]等采用红外热成像技术实现了对航空设备涡轮叶片缺陷的检测，并取得了不错的检测效果。Zou H^[5]等将红外热成像检测技术应用于检测电气设备故障，检测结果显示该检测方法的准确率达到了97%以上。哈尔滨工业大学的秦雷等人^[6]运用超声热成像检测技术和锁相热成像检测技术，对金属材料表面缺陷进行检测，实现了金属材料试件表面缺陷的检测。沈阳理工大学的胡海林等人^[7]基于红外热成像无损检测技术，对金属构件内部缺陷进行检测，结果表明红外热成像无损检测实现了金属构件内部缺陷的定量识别。

脉冲红外热成像技术相比于红外热成像技术具有检测过程不易受噪声干扰的优点^[8]。本文结合脉冲红外热成像技术的检测原理，选择了合适的热激励源设备，设计了脉冲红外热成像检测系统并搭建了实验平台；对定制的含有裂纹缺陷的金属试件进行实验，完成了红外图像的采集，对采集的红外图像进行图像处理，并针对传统图像处理算法处理后的图像存在缺陷轮廓边缘模糊的问题，提出一种基于巴特沃斯低通滤波算法的改进算法，即巴特沃斯带通滤波算法，有效地滤除了图像噪声；然后通过阈值分割和边缘检测算子等图像处理算法，实现了金属裂纹缺陷的快速、准确地识别；最后根据平板试件的实际尺寸和轮廓特征图像像素之间的换算关系，得到缺陷面积、长度和宽度的计算数值，实现了裂纹缺陷的定量识别。

1. 脉冲红外热成像技术检测原理

脉冲红外热成像检测是通过施加方波形式的热流主动加热被检试件^[9]，由传热学理论可知，当被检试件内部或表面存在不连续缺陷时，热量在被检试件内部传递受到阻碍，在缺陷区域产生热量堆积，形成“热区”和“冷区”造成被检试件表面温度分布差异，利用红外热像仪实时捕捉并采集该温度场分布差异^[10-11]，通过图像预处理、图像滤波、阈值分割和边缘检测等图像处理算法，对采集的红外图像进行处理，实现被检试件内部缺陷可视化。脉冲红外热成像的检测原理如图 1所示。

图 1 脉冲红外热成像检测原理图

Figure 1. The principle of pulsed infrared thermal imaging detection

下载: 全尺寸图片幻灯片

2. 红外热成像检测系统与试验平台

根据脉冲红外热成像检测原理可知，脉冲红外热成像检测系统应含热源系统、热成像系统和图像采集分析系统。搭建了脉冲红外热成像检测系统如图 2所示。计算机通过数据端口连接热源系统和红外热像仪，控制整个试验进程。热源系统由两个高能卤素灯、时间继电器、可控电源及灯罩组成，其中时间继电器和可控电源用于控制检测系统的加热时间和脉冲能量；灯罩的作用是使高能卤素灯聚光，保护检测人员的眼睛。热成像系统主要由红外热像仪组成，它的作用是实时观测并采集红外图像^[12]，为后续图像处理算法的研究提供数据。图像采集分析系统主要包括图像预处理，缺陷边缘轮廓提取算法。红外图像的处理是实现缺陷定性分析和定量识别的前提。

图 2 脉冲红外热成像硬件系统框图

Figure 2. The diagram of pulsed infrared thermal testing hardware system

下载: 全尺寸图片幻灯片

根据图 2脉冲红外热成像检测系统的设计思路，选取检测系统中所需要的关键设备搭建了如图 3所示的脉冲红外热成像检测系统的实验平台。

图 3 脉冲红外热成像检测系统实验平台

Figure 3. Experimental platform of pulsed infrared thermal testing system

下载: 全尺寸图片幻灯片

式(1)为任意时刻材料表面的温度表达式：

$$ T\left( {0,\tau } \right) = \frac{q}{{\sqrt {\pi \rho c\mu \tau } }} $$

(1)

式中：T为物体表面温度，℃；q为脉冲强度，W/m²；τ为时间，s；ρ为材料密度，kg/m³；c为比热容，J/(kg⋅℃)；μ为导热系数。

分别采用脉冲能量为q＝10⁵ W⋅m^－2、q＝20⁵ W⋅m^－2、q＝30⁵ W⋅m^－2、q＝40⁵ W⋅m^－2加热被检试件，通过式(1)得出的被检试件表面温度的变化情况如图 4所示。由图 4可知：室温下加热被检试件，当加热时间相同时，脉冲强度越大，被检试件表面温度增加的幅度也越高。因此脉冲能量越高，脉冲热成像检测的成像效果越好。但是考虑到实验室的试验条件，以及随着脉冲能量的增加会导致被检试件表面被烧伤的危险，需根据材料属性选择合适的脉冲能量，达到最佳的检测效果，同时不烧伤被检试件的表面。

图 4 不同脉冲强度下被检试件表面温度变化情况

Figure 4. Temperature field of the specimen surface after different pulsed intensities

下载: 全尺寸图片幻灯片

根据图 4所示的不同脉冲强度下被检试件表面温度变化情况，在该脉冲红外热成像检测系统实验平台中，热激励源选择了额定电压为220 V、最大额定功率为2000 W的红外镀金管，时间控制器选择了型号为JSS48A、额定电压为220~380 V的正泰数显时间继电器并设置通电时间为60 s，红外热像仪选择了Fluke Ti480型号，该款热像仪具有MultiSharp^TM多点对焦功能，可以实现自动对焦，降低错误识温的概率，它的工作波段从7.5~14 μm，图像捕捉频率为60 Hz，生成的红外图像像素为640×480。

本文选择材料被广泛应用于工程机械领域的Q235钢材作为红外热成像检测试验的试验对象，设计试件的尺寸为100 mm×50 mm×5 mm，预制长宽为20 mm×1 mm的微小裂纹，在试验开始前，对被检试件进行表面清洁和喷漆处理来提高被检试件表面的光谱吸收率以及红外发射率。图 5所示为含有裂纹缺陷的Q235钢板试件。

图 5 金属裂纹试件

Figure 5. Metal crack specimen

下载: 全尺寸图片幻灯片

图 6为脉冲红外热成像试验采集的红外图像及三维显示图。由图 6可知，采集的红外图像存在裂纹缺陷边缘轮廓模糊、无端噪点多、灰度范围窄且集中、明暗对比度低、图像分辨率低的问题。为了改善图像的显示效果，需要采用合适的图像处理算法对采集的红外图像进行处理，便于后续裂纹缺陷轮廓的提取和缺陷特征的定量识别^[13]。

图 6 采集的某帧红外图像

Figure 6. One of collected infrared thermal image

下载: 全尺寸图片幻灯片

3. 红外图像处理算法的研究

为了在高噪声的图像中辨别出裂纹缺陷微弱的温度变化信息，需要对采集的红外图像进行图像处理，降低图像噪声，增大图像的明暗对比度，达到改善红外图像视觉效果的目的^[14]。因此采用了巴特沃斯带通滤波算法，并和中值滤波、巴特沃斯低通滤波算法对比分析，发现巴特沃斯带通滤波算法的滤波处理效果较好。

3.1 灰度转换

对采集的原始红外图像进行灰度转换，可以有效地减小红外图像占用的内存，进而加快图像的处理速度。如图 7所示为经过灰度变化后的灰度图像、图像直方图，其中灰度直方图表示某一灰度级在整幅图像像素中出现的频率，代表某一灰度级占总像素的比例。由图 7(a)可知经过灰度转换后，裂纹缺陷的形状更清晰和直观，一些无关的噪声信息被弱化了。由图 7(b)可知，灰度图像的灰度级^[15]分布在中段，灰度范围窄。灰度变换虽然可以提高图像处理速度，但是裂纹缺陷边缘轮廓模糊的现象依然存在，不利于后续裂纹缺陷边缘轮廓的提取，因此需要引入直方图均衡化使得灰度图像的灰度范围分布均匀。

图 7 灰度变换后的图像

Figure 7. Infrared image after grayscale transforming

下载: 全尺寸图片幻灯片

3.2 直方图均衡化

图 8所示为直方图均衡化后的图像和图像直方图，由图 8(a)所示，均衡化后，图像的背景区域与裂纹区域的对比度被强化，突出了缺陷的边缘轮廓。对比灰度直方图 8(b)和图 7(b)可知，经过直方图均衡化处理后的灰度图像，灰度范围扩展至整个灰度级，有较大的灰度范围。显示效果得到了优化。

图 8 直方图均衡化

Figure 8. Histogram equalized image

下载: 全尺寸图片幻灯片

3.3 中值滤波

为了能够有效提取裂纹缺陷的轮廓特征和温度信息，需要对图像进行滤波降噪处理。图 9所示为经过中值滤波处理后的图像和图像直方图。由图 9可知，中值滤波不仅扩展了原始灰度图像的灰度级分布范围，解决了图像边缘轮廓模糊的问题；而且还对原始的图像数据进行了压缩，提高了计算机运算处理图像的速度。

图 9 中值滤波后图像

Figure 9. Median filtered image

下载: 全尺寸图片幻灯片

3.4 巴特沃斯低通滤波

巴特沃斯低通滤波^[16]是一种基于频率域的图像处理算法。其实现过程如图 10所示。

图 10 频率域图像处理

Figure 10. Image processing algorithm based on frequency domain

下载: 全尺寸图片幻灯片

由图 10可知，实现频率域处理的第一步是读取外部输入图像f(x, y)，将原始红外图像f(x, y)通过傅里叶变换为F(u, v)；第二步将F(u, v)与传递函数H(u, v)卷积，其卷积表达式如式(2)所示；最后通过傅里叶反变换，将频率域的图像变换为空间域的图像即可得到滤波处理之后的图像g(x, y)。

$$ G(u, v)=F(u, v)^{*} H(u, v) $$

(2)

式中：G(u, v)为卷积结果；F(u, v)为输入图像傅里叶变换后的频率谱；H(u, v)为滤波器的传递函数。

由式(2)可知，滤波器传递函数的选择，关乎基于频率域图像滤波算法图像降噪的效果，巴特沃斯低通滤波的传递函数如式(3)所示：

$$ H\left( {u,v} \right) = \frac{1}{{1 + {{\left[ {\frac{{D\left( {u,v} \right)}}{{{D_0}}}} \right]}^{2n}}}} $$

(3)

式中：$ D\left( {u,v} \right) = \sqrt {{u^2} + {v^2}} $；H(u, v)为滤波器的传递函数；D₀为截止频率；2n为阶数。

如图 11所示为经过巴特沃斯低通滤波处理后的图像、图像直方图及三维显图。由图 11(a)和图 11(b)可知，巴特沃斯低通滤波可以有效滤除高频噪声，降噪效果较好。由图 11(c)可知，虽然巴特沃斯低通滤波可以有效滤除图像噪声点，但是也造成了缺陷边缘轮廓模糊，不利于后续裂纹缺陷边缘轮廓的提取。针对巴特沃斯低通滤波处理后缺陷边缘轮廓模糊的问题，本文提出一种改进的算法——巴特沃斯带通滤波算法。

图 11 巴特沃斯低通滤波

Figure 11. Butterworth low-pass filtered image

下载: 全尺寸图片幻灯片

3.5 巴特沃斯带通滤波

巴特沃斯带通滤波算法是通过将不同截止频率的巴特沃兹低通滤波和巴特沃兹高通滤波进行串联，综合低通滤波有效滤除图像噪声，高通滤波强化图像边缘轮廓的优点^[17]，保证有用信号通过，同时滤除图像噪声及其他干扰信息的一种改进算法。巴特沃斯带通滤波算法的实现过程与巴特沃斯低通滤波相似，它们的主要区别在于传递函数的选择不同，巴特沃兹带通滤波算法传递函数的表达式如式(4)所示：

$$ H\left( {u,v} \right) = \frac{1}{{1\left| { + \frac{{D\left( {u,v} \right)}}{{{D_{\text{H}}}}} \wedge \left( {2*n} \right)} \right.}} \times \frac{1}{{1\left| { + \frac{{{D_{\text{L}}}}}{{D\left( {u,v} \right)}} \wedge \left( {2*n} \right)} \right.}} $$

(4)

式中：$ D\left( {u,v} \right) = \sqrt {{u^2} + {v^2}} $；H(u, v)为传递函数；D_L为低通滤波的截至频率；D_H为高通滤波的截止频率，其中（D_L＜D_H）；n为阶数；*为卷积符号。

如图 12所示为经过巴特沃斯带通滤波后的图像、图像直方图及三维显示图。由图 12(a)可知，经过改进过巴特沃兹带通滤波算法处理的图像实现了缺陷区域和背景区域的有效分离。由图 12(b)和12(c)可知，改进的巴特沃兹带通滤波算法可以有效地滤除图像噪声，同时完整保留了裂纹缺陷的边缘轮廓。由以上分析可知，改进的巴特沃兹带通滤波算法可以有效滤除图像噪声、同时增强图像亮区和暗区的对比度，实现了金属裂纹缺陷的快速、准确识别，为后续裂纹缺陷边缘轮廓的提取和缺陷定量识别奠定基础。

图 12 改进的巴特沃兹带通滤波算法处理后的图像

Figure 12. Infrared images aftert the improved Butterworth bandpass filtering algorithm

下载: 全尺寸图片幻灯片

3.6 图像预处理结果量化分析

通过图片判断缺陷特征，属于定性分析；为了客观评价图像预处理算法的处理效果，可以采用峰值信噪比进行比较。峰值信噪比是基于对应像素点间的误差，峰值信噪比越大表示失真越小。峰值信噪比（Peak Signal-To-Noise Ratio，PSNR）的定义如式(5)所示：

$$ {\text{PSNR}} = 10 \times \lg \frac{{255 \times 255}}{{{\text{RMS}}{{\text{E}}^2}}} $$

(5)

式中：RMSE为均方根误差：

$$ {\text{RMSE}} = \sqrt {\frac{{\sum\limits_{i = 1}^N {\sum\limits_{j = 2}^M {{{\left[ {R\left( {i,j} \right) - F\left( {i,j} \right)} \right]}^2}} } }}{{M \times N}}} $$

表 1为4种滤波器的峰值信噪比，由表 1可知，巴特沃斯带通滤波算法的PSNR最大，与定性分析基本吻合。试验结果表明：采用巴特沃斯带通滤波算法对红外图像进行滤波处理，在突出高频分量的同时，仍能保留低频部分，对比度得到明显增强，峰值信噪比变大，图像缺陷判断变得更加容易。

表 1 各种滤波后图像的峰值信噪比

Table 1. Peak signal-to-noise ratio of various filtered images

Test subject	Median Filter SNR	Butterworth Low Pass Filtering Algorithm SNR	Butterworth Bandpass Filtering Algorithm SNR
Metal specimens with crack defects	43.3848	38.9708	68.9181

下载: 导出CSV

| 显示表格

4. 裂纹缺陷特征识别

4.1 Otsu阈值分割

采用最大类间方差法（Otsu）^[18]求取的最优阈值，可以减少缺陷区域和背景区域像素点的模糊的现象。如图 13所示为最大类间方差处理的二值图。由图 13可知，裂纹缺陷位于试件正中，形状为细长的矩形条。由此可知最大类间方差法，可以有效地分离图像的缺陷区域和背景区域，实现了快速判断缺陷形状、大小、位置的目的，完成了裂纹缺陷的定性分析，为后续裂纹缺陷边缘轮廓的提取提供奠定基础。

图 13 改进巴特沃斯带通滤波算法处理后

Figure 13. The binary image after the improved Butterworth band pass filtering algorithm

下载: 全尺寸图片幻灯片

4.2 图像边缘检测

图像边缘检测为裂纹缺陷轮廓的提取和定位做准备，是实现边缘信息可视化最重要的一步^[19]。图 14为裂纹缺陷边缘轮廓特征提取的效果图。由图 14可知经过边缘检测算子Canny算子^[20]处理后的裂纹缺陷边缘连续且清晰，得到了完整裂纹缺陷的边缘轮廓。

图 14 Canny算子边缘检测效果

Figure 14. Canny operator edge detection result

下载: 全尺寸图片幻灯片

4.3 裂纹缺陷面积定量识别

采用像素法计算裂纹缺陷特征，像素法的公式为：

$$ {S_{\text{d}}}{\text{ = }}\frac{{{S_{\text{a}}}}}{{{S_i}}} \cdot {\text{PI}}{{\text{X}}_{\text{S}}} $$

(6)

$$ {L_{\text{d}}}{\text{ = }}\frac{{{L_{\text{a}}}}}{{{L_{\text{i}}}}} \cdot {\text{PI}}{{\text{X}}_{\text{L}}} $$

(7)

$$ {D_{\text{d}}}{\text{ = }}\frac{{{D_{\text{a}}}}}{{{D_{\text{i}}}}} \cdot {\text{PI}}{{\text{X}}_{\text{D}}} $$

(8)

式中：S_a、L_a和D_a分别为实际试件的面积、长和宽；S_d、L_d和D_d分别为预埋裂纹缺陷轮廓的面积、长和宽的计算值；S_i、L_i和D_i分别为对应行、列像素求出的相应像素面积、实际试件的长和宽在红外热图像对应的行、列最大像素值；PIX_S、PIX_L、PIX_D分别为预埋裂纹缺陷轮廓特征图像的像素面积、长和宽。

本节选取的红外热图像的图像像素（长×宽）为640 pixel×480 pixel，对应上表面尺寸（长×宽）为55 mm×41.25 mm的Q235钢板试件，预埋长度为20 mm，宽度为1 mm的裂纹缺陷。根据式(6)、(7)和(8)，计算得到Q235钢板试件中裂纹缺陷的特征识别参数及其精度计算结果，如表 2所示。

表 2 裂纹缺陷的特征识别参数及其精度

Table 2. Identification parameters and accuracy of rack defects features

Parameter category	Parameters	Parameter value
Attributes	PIX_S/pixel	2692
	PIX_L/pixel	192
	PIX_D/pixel	18
Actual parameters of crack defect	Actual area/mm²	20
	Actual length/mm	20
	Actual width/mm	1
Crack defect calculation parameters	Area-calculation/mm²	19.88
	Length-calculation/mm	16.50
	Width-calculation/mm	1.55
Crack defect calculation error	Area-calculation error/%	0.60 %
	Length-calculation error/%	17.50 %
	Width-calculation error/%	55.00 %

下载: 导出CSV

| 显示表格

由表 2可知，裂纹缺陷的长度计算误差为17.50%，宽度计算误差为55.00%，而面积测量误差仅为0.6%。其中，裂纹缺陷的长度和宽度误差较大，但裂纹缺陷整体的识别结果较好，与采用中值滤波处理，缺陷面积误差为9.85%相比^[21]，本文计算缺陷的面积误差为0.6%，表明本文采用的算法处理效果较好，可以实现对大型起重机械结构裂纹的检测需求。

5. 结语

通过搭建的脉冲红外热成像检测系统的试验平台，完成了对定制的含有裂纹缺陷的金属试件的红外图像的采集。针对采集的红外图像含有图像噪声以及其他干扰信息的特点，采用灰度转换和直方图均衡化对试验采集的红外图像进行预处理，使用了中值滤波和巴特沃斯低通滤波算法进行降噪，并提出了一种基于巴特沃斯低通滤波的改进算法——巴特沃斯带通滤波算法，对比发现巴特沃斯带通滤波算法使图像对比度得到明显增强，峰值信噪比变大，图像缺陷判断变得更加容易；采用最大类间方差阈值分割，实现了裂纹缺陷区域和背景区域的分离；采用Canny算子对裂纹缺陷边缘轮廓进行提取，得到了完整的裂纹缺陷的边缘轮廓；最后采用像素法求解裂纹缺陷面积、长度和宽度的数值。计算结果显示，计算面积与实际裂纹缺陷的面积误差仅为0.6%，证明本文采用的算法，实现了对大型起重机械结构裂纹的定性分析和定量检测。

图 1 生成器的网络结构

Figure 1. The network structure of the generator

下载: 全尺寸图片幻灯片

图 2 CBAM的网络结构

Figure 2. The network structure of the CBAM

下载: 全尺寸图片幻灯片

图 3 判别器的网络结构

Figure 3. The network structure of the discriminator

下载: 全尺寸图片幻灯片

图 4 融合图像对比

Figure 4. The comparison results of fusion images

下载: 全尺寸图片幻灯片

表 1 生成器网络参数

Table 1 The parameters of generator

Convolution layer	Kernel size/stride	Padding	Input size	Output size
Conv1	4×4/2	(1, 1)	480×640×4	240×320×32
CBAM	4×4/2	(1, 1)	240×320×32	240×320×32
Conv2	4×4/2	(1, 1)	240×320×32	120×160×64
Conv3	4×4/2	(1, 1)	120×160×64	60×80×128
Conv4	4×4/2	(1, 1)	60×80×128	30×40×256
Conv5	4×4/2	(2, 1)	30×40×256	16×20×512
Conv6	4×4/2	(1, 1)	16×20×512	8×10×512
Conv7	4×4/2	(1, 2)	8×10×512	4×6×512
Conv8	4×4/2	(1, 1)	4×6×512	2×3×512
ConvTrans8	4×4/2	(1, 1)	2×3×512	4×6×512
ConvTrans7	4×4/2	(1, 2)	4×6×1024	8×10×512
ConvTrans6	4×4/2	(1, 1)	8×10×1024	16×20×512
ConvTrans5	4×4/2	(2, 1)	16×10×1024	30×40×256
ConvTrans4	4×4/2	(1, 1)	30×40×512	60×80×128
ConvTrans3	4×4/2	(1, 1)	60×80×256	120×160×64
ConvTrans2	4×4/2	(1, 1)	120×160×128	240×320×32
ConvTrans1	4×4/2	(1, 1)	240×320×64	480×640×3

下载: 导出CSV

表 2 判别器参数

Table 2 The parameters of discriminator

Convolution layer	Kernel size/stride	Padding	Output size
Conv1	4×4/2	(1, 1)	240×320×64
Conv2	4×4/2	(1, 1)	120×160×128
Conv3	4×4/2	(1, 1)	60×80×256
Conv4	4×4/2	(1, 1)	30×40×512
Conv5	4×4/2	(1, 1)	15×20×512
Conv6	1×1/1	(0, 0)	15×20×1

下载: 导出CSV

表 3 融合图像客观指标值

Table 3 The quantitative comparisons of fusion images

Fusion methods	EN	MI	FMI	SSIM	CC	PSNR
LP	5.918	11.836	0.944	0.681	0.646	68.496
LP-SR	6.393	12.785	0.945	0.823	0.566	67.801
NSCT	5.821	11.643	0.942	0.671	0.652	68.575
NSCT-SR	6.224	12.447	0.940	0.859	0.575	67.472
DTCWT	5.804	11.608	0.942	0.670	0.647	68.570
DTCWT-SR	6.455	12.910	0.945	0.782	0.525	67.338
DenseFuse	6.036	12.071	0.939	0.631	0.684	67.319
CBAM-GAN	5.918	11.836	0.928	0.796	0.649	68.751
Avarage	6.111	12.223	0.941	0.740	0.606	67.967

下载: 导出CSV

参考文献(16)

[1]	MA J, MA Y, LI C. Infrared and visible image fusion methods and applications: a survey[J]. Information Fusion, 2019, 45: 153-178. DOI: 10.1016/j.inffus.2018.02.004
[2]	Burt P J, Adelson E H. The Laplacian pyramid as a compact image code[J]. Readings in Computer Vision, 1987, 31(4): 671-679. https://www.sciencedirect.com/science/article/pii/B9780080515816500659
[3]	Selesnick I W, Baraniuk R G, Kingsbury N C. The dual-tree complex wavelet transform[J]. IEEE Signal Processing Magazine, 2005, 22(6): 123-151. DOI: 10.1109/MSP.2005.1550194
[4]	A L da Cunha, J Zhou, M N Do. Nonsubsampled contourilet transform: filter design and applications in denoising[C]//IEEE International Conference on Image Processing 2005, 749: (doi: 10.1109/ICIP.2005.1529859).
[5]	Hariharan H, Koschan A, Abidi M. The direct use of curvelets in multifocus fusion[C]//16th IEEE International Conference on Image Processing (ICIP), 2009: 2185-2188(doi: 10.1109/ICIP.2009.5413840).
[6]	LI Hui. Dense fuse: a fusion approach to infrared and visible images[C]//IEEE Transactions on Image Processing, 2018, 28: 2614- 2623(doi: 0.1109/TIP.2018.2887342).
[7]	MA J, YU W, LIANG P, et al. Fusion GAN: a generative adversarial network for infrared and visible image fusion[J]. Information Fusion, 2019, 48: 11-26. DOI: 10.1016/j.inffus.2018.09.004
[8]	Ronneberger O, Fischer P, Brox T. U-net: convolutional networks for biomedical image segmentation[C]//International Conference on Medical Image Computing and Computer-assisted Intervention, 2015: 234-241.
[9]	Hwang S, Park J, Kim N, et al. Multispectral pedestrian detection: Benchmark dataset and baseline[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2015: 1037-1045.
[10]	Goodfellow I, Pouget-Abadie J, Mirza M, et al. Generative adversarial nets[C]//Advances in Neural Information Processing Systems, 2014: 2672-2680.
[11]	Radford A, Metz L, Chintala S. Unsupervised representation learning with deep convolutional generative adversarial networks[J/OL][2015-11-07]. arXiv preprint arXiv: 1511.06434, 2015: https://arxiv.org/abs/1511.06434v1.
[12]	MAO X, LI Q, XIE H, et al. Least squares generative adversarial networks[C]//2017 IEEE International Conference on Computer Vision (ICCV), 2017: 2813-2821(doi: 10.1109/ICCV.2017.304).
[13]	Isola Phillip, ZHU Junyan, ZHOU Tinghui, et al. Image-to-image translation with conditional adversarial networks, 2017: 5967-5976 (doi: 10.1109/CVPR.2017.632).
[14]	Jaderberg M, Simonyan K, Zisserman A. Spatial transformer networks[C]//Advances in Neural Information Processing Systems, 2015: 2017-2025.
[15]	HU J, SHEN L, SUN G. Squeeze-and-excitation networks[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018: 7132-7141.
[16]	Woo S, Park J, Lee J Y, et al. Cbam: convolutional block attention module[C]//Proceedings of the European Conference on Computer Vision (ECCV), 2018: 3-19.

施引文献(14)

期刊类型引用(5)

1.	赵丽斌，刘浩，马国忠，郭潆茹，贺铮，王悦. 气象遥感图像去噪预处理方法研究. 气象科技. 2024(03): 309-317 . 百度学术
2.	勾一，李清英，刘森云. 基于闪光红外热波探测的积冰界线识别算法研究. 实验流体力学. 2024(05): 37-43 . 百度学术
3.	胡森龙，沙杰，李金洋，周高伟，鲁庆洋，刘梦园. 基于小波变换的焊接起始点图像去噪方法研究. 焊接技术. 2023(03): 87-91 . 百度学术
4.	许超，李月月，陈初侠. 一种具有边缘保持的去除图像椒盐噪声算法. 电脑知识与技术. 2023(11): 15-17 . 百度学术
5.	娄华生，行鸿彦，李瑾，施成龙. 基于改进CEEMDAN和小波阈值的雨声信号去噪算法研究. 电子测量技术. 2023(07): 103-109 . 百度学术

其他类型引用(9)

资源附件(0)

图(4) / 表(3)

计量

文章访问数: 574
HTML全文浏览量: 150
PDF下载量: 129
被引次数: 14

0. 引言
1. 脉冲红外热成像技术检测原理
2. 红外热成像检测系统与试验平台
3. 红外图像处理算法的研究
3.1 灰度转换
3.2 直方图均衡化
3.3 中值滤波
3.4 巴特沃斯低通滤波
3.5 巴特沃斯带通滤波
3.6 图像预处理结果量化分析
4. 裂纹缺陷特征识别
4.1 Otsu阈值分割
4.2 图像边缘检测
4.3 裂纹缺陷面积定量识别
5. 结语

0. 引言
1. 脉冲红外热成像技术检测原理
2. 红外热成像检测系统与试验平台
3. 红外图像处理算法的研究
3.1 灰度转换
3.2 直方图均衡化
3.3 中值滤波
3.4 巴特沃斯低通滤波
3.5 巴特沃斯带通滤波
3.6 图像预处理结果量化分析
4. 裂纹缺陷特征识别
4.1 Otsu阈值分割
4.2 图像边缘检测
4.3 裂纹缺陷面积定量识别
5. 结语

参考文献(16)

施引文献(14)

资源附件(0)

一种基于生成对抗网络与注意力机制的可见光和红外图像融合方法

作者简介: 罗迪（1995-），男，硕士研究生，主要研究方向：深度学习与无人机目标检测。E-mail：1366701808@qq.com

通讯作者: 周勇军（1972），男，高级工程师，主要研究方向：近地面目标探测技术。E-mail：478992155@qq.com

计量

出版历程