基于空洞卷积与双注意力机制的红外与可见光图像融合

何乐, 李忠伟, 罗偲, 任鹏, 隋昊

何乐, 李忠伟, 罗偲, 任鹏, 隋昊. 基于空洞卷积与双注意力机制的红外与可见光图像融合[J]. 红外技术, 2023, 45(7): 732-738.
引用本文: 何乐, 李忠伟, 罗偲, 任鹏, 隋昊. 基于空洞卷积与双注意力机制的红外与可见光图像融合[J]. 红外技术, 2023, 45(7): 732-738.
HE Le, LI Zhongwei, LUO Cai, REN Peng, SUI Hao. Infrared and Visible Image Fusion Based on Dilated Convolution and Dual Attention Mechanism[J]. Infrared Technology , 2023, 45(7): 732-738.
Citation: HE Le, LI Zhongwei, LUO Cai, REN Peng, SUI Hao. Infrared and Visible Image Fusion Based on Dilated Convolution and Dual Attention Mechanism[J]. Infrared Technology , 2023, 45(7): 732-738.

基于空洞卷积与双注意力机制的红外与可见光图像融合

基金项目: 

国家自然科学基金联合基金 U1906217

国家自然科学基金 62071491

国家重点研发计划 2021YFE0111600

中央高校基本科研业务费专项资金资助 22CX01004A-1

详细信息
    作者简介:

    何乐(1997-),女,硕士研究生。主要研究方向为图像融合与目标检测。E-mail:hele0128@163.com

    通讯作者:

    罗偲(1983-),男,副教授。主要研究方向为无人系统的仿生设计和控制。E-mail:tsai.lo.95@gmail.com

  • 中图分类号: TP391

Infrared and Visible Image Fusion Based on Dilated Convolution and Dual Attention Mechanism

  • 摘要: 针对红外与可见光图像融合算法中多尺度特征提取方法损失细节信息,且现有的融合策略无法平衡视觉细节特征和红外目标特征,出了基于空洞卷积与双注意力机制(Dilated Convolution and Dual Attention Mechanism, DCDAM)的融合网络。该网络首先通过多尺度编码器从图像中提取原始特征,其中编码器利用空洞卷积来系统地聚合多尺度上下文信息而不通过下采样算子。其次,在融合策略中引入双注意力机制,将获得的原始特征输入到注意力模块进行特征增强,获得注意力特征;原始特征和注意力特征合成最终融合特征,得在不丢失细节信息的情况下捕获典型信息,同时抑制融合过程中的噪声干扰。最后,解码器采用全尺度跳跃连接和密集网络对融合特征进行解码生成融合图像。通过实验表明,DCDAM比其他同类有代表性的方法在定性和定量指标评价都有提高,体现良好的融合视觉效果。
    Abstract: The multiscale features extraction method in infrared and visible image fusion algorithms loses detail information. Existing fusion strategies also cannot balance the visual detail and infrared target features. Therefore, a fusion network via a dilated convolution and dual-attention mechanism (DCDAM) is proposed. First, the network extracts the original features from the image through a multiscale encoder. The encoder systematically aggregates the multiscale context information through dilated convolution instead of using downsampling operator. Second, a dual-attention mechanism is introduced into the fusion strategy, and the original features are input into the attention module for feature enhancement to obtain the attention features. The original and attention features were combined into the final fusion feature. The mechanism captured the typical information without losing details and suppressed the noise during the fusion process. Finally, the decoder used a full-scale jump connection and dense network to decode the fusion features and generate the fused image. The experimental results show that the DCDAM is better than other representative methods in qualitative and quantitative index evaluations and has a good visual effect.
  • 红外场景产生器是红外成像系统内场半实物仿真测试的重要组成部分,其可将计算机仿真的灰度图像实时转换为红外成像系统能敏感的红外辐射信号,用来模拟各类目标、背景以及干扰的红外辐射[1]。数字微镜器件(Digital Micro-mirror Device,DMD)以其分辨率高、帧频高、动态范围大等优势广泛应用于各类红外场景产生器中[2]。对于理想的DMD红外场景产生器,在相同的输入下所有微镜单元应产生一致的红外辐射响应。而实际由于光源、光学系统以及DMD器件响应一致性等因素的影响,各个微镜单元的红外辐射响应却并不相同,即表现为红外场景产生器辐射的非均匀性。根据前期调研结果,DMD红外场景产生器当前在国内工业部门的半实物仿真测试中主要用来模拟目标的运动特性,而对目标和背景红外辐射特性的模拟精度要求相对不高,并且鲜有对于人为主动干扰的模拟。DMD红外场景产生器非均匀性对于工业部门红外成像系统半实物仿真测试的影响可以忽略不计,因此在非均匀性校正(Nonuniformity Correction,NUC)方面的研究比较少[3-5]

    对于复杂光电环境下红外成像系统对抗的内场仿真测试试验,红外场景产生器不仅要模拟目标的运动特性,更需要精确模拟目标、背景的红外辐射特性以及自然、人为干扰效应和大气传输效应。此时,DMD红外场景产生器的非均匀性则成为影响其红外场景仿真质量而不容忽视的一个的重要因素。

    为了提高内场仿真试验中红外辐射场景模拟的逼真度,本文在深入研究当前广泛使用的非均匀性校正方法基础上,针对DMD分辨率相对电阻阵列较大的特点,根据非均匀性测量信号的信噪比调整稀疏网格大小,提出一种适用于DMD红外场景产生器的非均匀性测量和校正方法。该方法可有效改善DMD红外场景产生器的非均匀性,提高红外场景模拟精度,对DMD红外场景产生器在红外场景动态仿真方面的应用具有一定参考价值。

    对每个辐射元的辐射响应特性进行精确测量是非均匀性校正的前提。目前国内外对电阻阵列非均匀性测量方法的研究较多并且大多只针对电阻阵列器件自身。本文将在深入研究电阻阵列非均匀性测量方法的基础上,充分考虑DMD特性,提出一种适用于DMD的非均匀性测量方法。同时考虑到DMD配套不同光学系统,其非均匀性表现是不同的,因此本文将对DMD红外场景产生器整个系统的非均匀性进行测量。

    当前关于电阻阵列非均匀性测量的方法主要有“稀疏网格”法和“Flood”法两种,区别主要是非均匀性信息的采集方法和数据处理方法上的不同。稀疏网格法是将电阻阵列划分成网格再对网格中每个辐射元进行逐个测量,而Flood法是把电阻阵列作为一个整体进行测量。测量过程中,Flood法需要精确调校电阻阵列辐射元与热像仪像元之间的映射比,而稀疏网格法则不需要考虑电阻阵列辐射元与热像仪像元之间的映射比,更加简便易用[6-11]。考虑到DMD的辐射元数量远高于电阻阵列,同时也高于大部分红外成像设备,难以准确建立DMD微镜单元与热像仪像元之间的映射比,因此本文主要对稀疏网格法进行研究。

    传统稀疏网格法的测量原理如下[12]:首先在DMD上划分虚拟的网格,网格大小的选取以相邻网格中同一位置微镜单元的辐射能量在探测焦平面不发生混叠为准。然后依次点亮网格图像,对DMD每个微镜单元的输出响应进行测量。DMD的每一幅网格图像都是通过点亮各网格内的某一特定位置上的单个微镜单元产生的。点亮每个网格中第一行第一列的微镜单元,构成第一幅网格图像。对第一幅网格图像测量完毕后,熄灭其中的微镜单元,然后点亮每个网格中第一行第二列的微镜单元,构成第二幅网格图像。依次点亮每个网格中的单个微镜单元,产生一幅幅网格图像,依次对网格图像进行测量,直到对整个DMD测量完毕。依次点亮网格图像的过程可称为网格图像的“移位”。DMD网格图像产生和移位过程如图 1所示,图中为一个假想的4×4 DMD,每个小方格表示一个微镜单元,填充黑色部分表示被点亮的微镜单元。将该DMD划分为4个网格,每个网格的大小为2×2,测量整个DMD共需要投射4幅网格图像。

    图  1  稀疏网格测量示意图
    Figure  1.  Measurement diagram of sparse grid

    稀疏网格法最大的优点在于能够对DMD每一个微镜单元的输出响应进行单独测量,各个微镜单元之间的辐射没有耦合。不过在对单个微镜单元的输出响应进行测量时,由于微镜单元的面积很小,辐射亮度有限。因此在驱动占空较大的高辐射区间即信噪比较高时,测量精度较高,而在驱动占空比较小的低辐射区间即信噪比较低时,很容易受到背景红外辐射和随机噪声的干扰,甚至被淹没掉,所以该方法对测量设备和测试环境的要求很高。为了克服单个微镜单元在低辐射区间容易受到背景红外辐射和随机噪声干扰的难题,本文结合现有测试条件对传统稀疏网格法做了改进,提出一种变尺度的稀疏网格测量方法。

    当DMD辐射亮度较低时,由于红外成像系统探测能力有限,因此在一定区域范围内(m×m)的微镜单元的非均匀性可以近似忽略,并且m值随着DMD辐射亮度的降低而增大。根据该测试现象,与传统稀疏网格法在测量过程中只点亮各网格内单个微镜单元不同,本文将网格内m×m区间范围内的微镜单元同时点亮然后移位,如图 2所示。图中为一个假想的8×8 DMD,每个小方格表示一个微镜单元。设定网格大小为4×4,将该DMD划分为4个网格。在对某一辐射亮度测量过程中,以4个微镜单元为一组,即在网格中2×2区间范围内微镜单元的响应差别可以忽略不计。测量时,首先点亮每个子网格内的第一组微镜单元,取这4个微镜单元响应输出的平均值,将此平均值作为各个子网格内第一组4个微镜单元的响应输出。然后按此方法依次对每个子网格内其它若干组微镜单元的响应输出进行测量,直到对整个DMD的所有微镜单元响应输出测量完毕。

    图  2  变尺度稀疏网格测量示意图
    Figure  2.  Measurement diagram of variable scale sparse grid

    在整个辐射亮度范围测量过程中,以m×m区间范围内微镜单元响应的平均值作为其中每个微镜单元的响应,并且m的取值大小会随着辐射亮度的变化而相应调整。当微镜单元辐射亮度较小时,由于测量信号的信噪比较低,此时m的取值相对较大;测量过程中随着微镜单元辐射亮度逐渐增大,m的取值随之逐渐减小;当微镜单元辐射亮度增大到一定范围时,由于测量信号的信噪比较高,可将m的设置为1,此时测量方法与传统的稀疏网格相同。这样通过调整m值大小可以保证在DMD整个辐射亮度范围内都有较好的测量结果。

    理论上当DMD辐射亮度较小时,忽略同一区间范围内各微镜单元之间的非均匀性,对“面”测量取平均值会带来方法误差,测量精度必然会比对“点”测量要低。然而在实际测量中发现,受测量设备灵敏度所限,当DMD辐射亮度较小时,对“面”测量取平均值的精度反而要优于直接对“点”测量的精度。因此,本文所提出的变尺度稀疏网格测量方法非常适合现有测量条件下对DMD红外场景产生器非均匀性的测量。

    DMD红外场景产生器非均匀性校正的基本思路是首先对非均匀性测量数据进行离线处理,生成非均匀性校正所需的校正参数查找表(Look up table, LUT);然后再根据非均匀性校正参数对DMD红外场景产生器的输入量进行在线修正,以此实现对DMD红外场景产生器非均匀性的实时校正。

    为了降低非均匀校正难度,首先对微镜单元响应特性进行线性化处理。根据微镜单元平均响应特性数据拟合曲线并作为所有微镜单元的标准响应曲线,然后求其反函数作为每个微镜单元的线性化函数。这样,每个微镜单元的输入经过线性化函数运算后再作用于微镜上,即可使得微镜单元的输入与输出近似为线性关系。为了保证线性化运算的实时性,选择选取适当的断点数量将线性化函数分段线性化,如图 3所示。

    图  3  线性化查找表生成原理图
    Figure  3.  The schematic of linearization LUT generation

    假设选取h个断点将其分为h-1个直线段,线性化函数每个直线段都对应一组由增益Glinek和偏置Olinek组成的修正数据,其中:

    $$ \left\{ \begin{array}{l} G_{{\rm{line}}}^k = \frac{{{d^{k + 1}} - {d^k}}}{{{{\bar l}^{k + 1}} - {{\bar l}^k}}}\\ O_{{\rm{line}}}^k = \frac{{{d^k} \cdot {{\bar l}^{k + 1}} - {d^{k + 1}} \cdot {{\bar l}^k}}}{{{{\bar l}^{k + 1}} - {{\bar l}^k}}} \end{array} \right.\quad k = 1, \cdots , h - 1 $$ (1)

    式中:dk为第k个断点处微镜单元的驱动占空比; ${\bar l^k} $为第k个断点处微镜单元的标准响应。将式(1)中增益校正系数Glinek和偏置校正系数Olinek存于缓存以供非线性实时校正时使用,即为线性化查找表。线性化查找表的数据量为2×(h-1)个,与DMD的分辨率无关。

    由于DMD每个微镜单元响应特性的差异,经过线性化处理后,不同微镜单元的响应表现为近似直线的不同曲线。因此还需要通过非均匀性校正将各个微镜单元线性化后的响应曲线归一化到标准响应曲线上,如图 4所示。

    图  4  非均匀性校正查找表生成原理图
    Figure  4.  The schematic of correction LUT generation

    考虑非均匀性校正实时性因素,校正过程采用分段校正方法。对于DMD任意一个位置(i, j)处的微镜单元,同样选取h个断点将其分为h-1个直线段。经过数学推导可得,每个直线段都对应一组由增益$ G_{i, j}^{{\rm{nuc}}, k}$和偏置$ O_{i, j}^{{\rm{nuc}}, k}$组成的修正数据,

    $$ \left\{ \begin{array}{l} G_{i, j}^{{\rm{nuc}}, k} = \frac{{l_{i, j}^{{\rm{corr}}, k + 1} - l_{i, j}^{{\rm{corr}}, k}}}{{l_{i, j}^{{\rm{in}}, k + 1} - l_{i, j}^{{\rm{in}}, k}}}\\ O_{i, j}^{{\rm{nuc}}, k} = l_{i, j}^{{\rm{corr}}, k} - \frac{{l_{i, j}^{{\rm{corr}}, k + 1} - l_{i, j}^{{\rm{corr}}, k}}}{{l_{i, j}^{{\rm{in}}, k + 1} - l_{i, j}^{{\rm{in}}, k}}}l_{i, j}^{{\rm{in}}, k} \end{array} \right.\quad \begin{array}{*{20}{l}} {k = 1, \cdots , h - 1, }\\ {i = 1, \cdots , M, }\\ {j = 1, \cdots , N} \end{array} $$ (2)

    式中:$l_{i, j}^{{\rm{corr}}, k} $、$l_{i, j}^{{\rm{corr}}, k + 1} $分别为分段点处校正后的标准响应输出; $l_{i,j}^{{\rm{in}},k} $、 $ l_{i,j}^{{\rm{in}},k + 1}$分别为分段点处的实际响应输出。将式(2)中的修正数据$(G_{i, j}^{{\rm{nuc}}, k}, O_{i, j}^{{\rm{nuc}}, k}) $增存于缓存以供非线性实时校正时使用,即为非均匀性校正查找表。如果DMD的分辨率为M×N,那么非均匀性校正查找表的数据量即为M×N×2×(h-1)。

    通过上述的数据处理,分别生成了DMD红外场景产生器非均匀性校正所需的线性化查找表和非均匀性校正查找表。在非均匀性实时校正过程中仅需要根据输入在查找表中查找对应的参数进行修正即可,整个非均匀性实时校正流程如图 5所示。

    图  5  非均匀性实时校正流程图
    Figure  5.  The flow of NUC

    中非均匀性实时校正主要分为以下两步:首先根据输入的期望辐射亮度 $l_{i,j}^{{\rm{in}}} $在非均匀性校正查找表中查找相应的修正参数,计算得到校正数据 $l_{i,j}^{{\rm{in}}} $;

    $$ l_{i, j}^{{\rm{corr}}} = G_{i, j}^{{\rm{nuc}}, k} \cdot l_{i, j}^{{\rm{in}}} + O_{i, j}^{{\rm{nuc}}, k}\begin{array}{*{20}{c}} {}&{k = 1, 2, \cdots , h - 1} \end{array} $$ (3)

    然后通过线性化查找表,计算 $l_{i,j}^{{\rm{corr}}} $所对应的控制占空比di, j,驱动DMD产生与期望相同的红外辐射亮度。

    $$ {d_{i, j}} = G_{{\rm{line}}}^k \cdot l_{i, j}^{{\rm{corr}}} + O_{{\rm{line}}}^k\begin{array}{*{20}{c}} {}&{k = 1, 2, \cdots , h - 1} \end{array} $$ (4)

    设DMD红外场景产生器单个微镜单元的输出响应为li, jMN分别为DMD的行数和列数,其非均匀性定义为输出响应标准差与均值之比,如公式(5)所示。

    $$ {\rm{NUC}} = {\rm{Std}}({l_{i, j}})/{\rm{Mean}}({l_{i, j}}) $$ (5)

    式中:

    $$ {\rm{Mean}}({l_{i, j}}) = \frac{1}{{M \times N}}\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^M {{l_{i, j}}} }, $$
    $$ {\rm{Std}}({l_{i, j}}) = \sqrt {\frac{{\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^M {({l_{i, j}}} } - {{\bar l}_{i, j}})}}{{M \times N - 1}}} 。 $$

    非均匀性校正算法的优劣主要取决于校正后残余非均匀性指标,其次还要兼顾对非均匀性校正参数存储量的需求。为验证本文所述非均匀校正算法的效果,在Matlab中对生成的模拟DMD进行仿真验证。以真实DMD微镜单元平均响应特性的实测数据作为模拟DMD的标准响应特性,在标准响应特性曲线采样点的输出数据上添加高斯噪声,模拟DMD红外场景产生器的非均匀性。最终生成的模拟DMD微镜单元的响应曲线如图 6所示。

    图  6  仿真DMD响应特征曲线
    Figure  6.  The response characteristic curve of simulated DMD

    首先,检验分段校正点个数对非均匀校正效果的影响。通过计算,当数值DMD所有微镜单元驱动占空比一致均为50%时,其原始输出的非均匀性为10.72%。通过设定不同分段点数对非均匀性校正算法分别进行了数值计算,结果如表 1所示。

    表  1  不同分段点数非均匀性校正结果
    Table  1.  The NUC results about different segmentation points
    Number of segment points Residual non-uniformity
    3 8.52%
    6 4.42%
    9 0.52%
    12 0.49%
    下载: 导出CSV 
    | 显示表格

    从仿真结果来看,适当增加分段点个数,可以显著降低残余非均匀性,不过达到一定量的时候,继续增加分段点个数不再显著降低剩余非均匀性。过多的分段点会增加校正数据的存储量,影响查表速度,因此需要根据实际需求确定分段校正点的个数,在满足校正精度需求的前提下尽量减少数据量。

    为了验证在不同驱动占空比输入下DMD红外场景产生器非均匀性校正效果,设定分段点的数量为9且固定不变,选取输入为10%~100%的10组数据分别对非均匀性校正算法分别进行了数值计算,结果如表 2所示。

    表  2  不同驱动占空比非均匀性校正结果
    Table  2.  The NUC results about different drive duty cycle
    Drive duty cycle Residual non-uniformity (before correction) Residual non-uniformity (after correction)
    10% 9.34% 0.42%
    20% 9.77% 0.41%
    30% 10.13% 0.45%
    40% 10.32% 0.43%
    50% 10.72% 0.52%
    60% 10.71% 0.51%
    70% 10.74% 0.52%
    80% 10.42% 0.47%
    90% 10.25% 0.43%
    100% 10.11% 0.44%
    下载: 导出CSV 
    | 显示表格

    从仿真结果来看,从未校正数值阵列在不同驱动占空比的非均匀性在10%左右,而校正后的残余非均匀性在0.5%左右,该非均匀性校正方法在不同驱动占空比下均具有较好的校正效果。

    本文结合工程实际应用背景重点研究了DMD红外场景产生器的非均匀性校正方法。首先在深入研究传统稀疏网格测量方法的基础上,充分考虑DMD的红外辐射调制特性,提出了一种变尺度稀疏网格的非均匀性测量方法,该方法可根据测量信号的信噪比调整网格大小,有效解决了传统稀疏网格在低信噪比条件下测量困难的问题。然后研究了分段校正算法的原理与实现方法。最后利用模拟数值DMD对校正算法进行了仿真验证,在不同驱动占空比输入下该方法均可有效降低DMD红外场景产生器的非均匀性。下一步可以考虑在此研究基础上设计基于硬件平台的数据传输校正卡,将非均匀校正算法和参数固化于其中,在工程上实现对DMD红外场景产生器非均匀性的实时校正。

  • 图  1   基于空洞卷积与双注意力机制的融合框架

    Figure  1.   Fusion network framework based on dilated convolution and dual attention mechanism

    图  2   双注意力机制融合策略

    Figure  2.   Fusion strategy diagram of dual attention mechanism

    图  3   解码器聚合图

    Figure  3.   Decoder aggregation diagram

    图  4   训练框架

    Figure  4.   Training network framework

    图  5   TNO数据集实验对比数据

    Figure  5.   Comparison of TNO dataset fusion results

    图  6   INO数据集实验对比数据

    Figure  6.   Shows of INO dataset fusion result

    图  7   VOT-RGBT数据集实验对比数据

    Figure  7.   Shows of VOT-RGBT dataset fusion result

    表  1   编码器的网络设置

    Table  1   The encoder network settings

    Layers Channel(Input) Channel(Output) Output Size Dilated Rated
    CB1 1 64 1/2 -
    CB2 64 128 1/4 -
    DCB1 128 256 1/8 1,2,5
    DCB2 256 512 1/16 1,2,5
    DCB3 512 1024 1/16 1,2,5
    下载: 导出CSV

    表  2   TNO数据集评价指标

    Table  2   Evaluation indexes of TNO dataset

    Fusion Methods EN SD MI SSIMa VIF PSNR
    CBF[9] 7.38 71.024 10.727 0.5412 0.6301 59.820
    Densefuse[3] 5.46 58.520 11.505 0.6876 0.6614 57.825
    Deeplearning [10] 5.46 63.866 9.806 0.7488 0.7092 58.583
    FusionGAN[11] 5.40 55.654 10.995 0.6173 0.6309 59.251
    Bayesian[12] 6.84 65.658 11.343 0.7487 0.6112 59.950
    NestFuse[5] 7.28 78.918 13.039 0.7634 0.7347 59.097
    DDcGAN[13] 7.45 74.808 13.176 0.7224 0.6868 58.684
    Proposed 7.58 78.722 13.673 0.8035 0.7936 60.866
    下载: 导出CSV

    表  3   INO数据集评价指标

    Table  3   Evaluation indexes of INO dataset

    Methods EN SD MI SSIMa VIF PSNR
    CBF 5.241 43.651 10.487 0.622 0.771 55.322
    Densefuse 6.914 44.144 13.771 0.692 0.691 55.715
    Deeplearnin 6.885 46.649 13.236 0.724 0.863 55.953
    FusionGAN 5.248 35.784 10.497 0.652 0.480 55.822
    Bayesian 7.355 60.627 14.755 0.694 1.048 56.209
    NestFuse 6.973 50.317 13.946 0.724 1.203 55.860
    DDcGAN 7.427 49.743 14.810 0.679 0.929 55.958
    Proposed 7.593 57.980 15.186 0.726 1.388 56.571
    下载: 导出CSV

    表  4   VOT-RGBT数据集评价指标

    Table  4   Evaluation indexes of VOT-RGBT dataset

    Methods EN SD MI SSIMa VIF PSNR
    CBF 6.9837 62.287 11.856 0.6542 0.7039 57.367
    Densefuse 6.5287 69.880 11.782 0.7384 0.6239 58.117
    Deeplearnin 6.8882 63.520 12.792 0.7929 0.6983 58.094
    FusionGAN 5.8544 57.944 11.048 0.7777 0.5822 57.757
    Bayesian 6.9072 67.608 13.044 0.8084 0.6222 59.971
    NestFuse 6.9498 78.408 13.795 0.8031 0.7533 59.040
    DDcGAN 7.0221 71.131 12.324 0.7947 0.7562 60.080
    Proposed 7.2823 78.517 14.043 0.8110 0.7652 61.559
    下载: 导出CSV
  • [1]

    LI S, KANG X, FANG L, et al. Pixel-level image fusion: a survey of the state of the art[J]. Information Fusion, 2017, 33: 100-112. DOI: 10.1016/j.inffus.2016.05.004

    [2]

    ZHAO W, LU H, WANG D. Multisensor image fusion and enhancement in spectral total variation domain[J]. IEEE Transactions on Multimedia, 2017, 20(4): 866-879.

    [3]

    HUI L, WU X J. DenseFuse: a fusion approach to infrared and visible images[J]. IEEE Transactions on Image Processing, 2018, 28(5): 2614-2623.

    [4]

    JIAN L, YANG X, LIU Z, et al. SEDRFuse: A symmetric encoder–decoder with residual block network for infrared and visible image fusion[J]. IEEE Transactions on Instrumentation and Measurement, 2020, 70: 1-15.

    [5]

    LI H, WU X J, Durrani T. NestFuse: An infrared and visible image fusion architecture based on nest connection and spatial/channel attention models[J]. IEEE Transactions on Instrumentation and Measurement, 2020, 69(12): 9645-9656. DOI: 10.1109/TIM.2020.3005230

    [6]

    YU F, Koltun V. Multi-scale context aggregation by dilated convolutions[J/OL]. arXiv preprint arXiv: 1511.07122, 2015.

    [7]

    WANG P, CHEN P, YUAN Y, et al. Understanding convolution for semantic segmentation[C]//2018 IEEE Winter Conference on Applications of Computer Vision (WACV). IEEE, 2018: 1451-1460.

    [8]

    HUANG H, LIN L, TONG R, et al. Unet 3+: A full-scale connected unet for medical image segmentation[C]//ICASSP 2020-2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2020: 1055-1059.

    [9]

    Shreyamsha Kumar B K. Image fusion based on pixel significance using cross bilateral filter[J]. Signal, Image and Video Processing, 2015, 9(5): 1193-1204. DOI: 10.1007/s11760-013-0556-9

    [10]

    LI H, WU X J, Kittler J. Infrared and visible image fusion using a deep learning framework[C]//2018 24th International Conference on Pattern Recognition (ICPR). IEEE, 2018: 2705-2710.

    [11]

    MA J, WEI Y, LIANG P, et al. FusionGAN: A generative adversarial network for infrared and visible image fusion[J]. Information Fusion, 2019, 48: 11-26. DOI: 10.1016/j.inffus.2018.09.004

    [12]

    ZHAO Z, XU S, ZHANG C, et al. Bayesian fusion for infrared and visible images[J]. Signal Processing, 2020, 177: 107734. DOI: 10.1016/j.sigpro.2020.107734

    [13]

    MA J, XU H, JIANG J, et al. DDcGAN: a dual-discriminator conditional generative adversarial network for multi-resolution image fusion[J]. IEEE Transactions on Image Processing, 2020, 29: 4980-4995. DOI: 10.1109/TIP.2020.2977573

    [14]

    WANG Z, Bovik A C, Sheikh H R, et al. Image quality assessment: from error visibility to structural similarity[J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612. DOI: 10.1109/TIP.2003.819861

    [15]

    HAN Y, CAI Y, CAO Y, et al. A new image fusion performance metric based on visual information fidelity[J]. Information Fusion, 2013, 14(2): 127-135. DOI: 10.1016/j.inffus.2011.08.002

    [16]

    Toet Alexander. TNO Image Fusion Dataset [EB/OL]. 2014, https://doi.org/10.6084/m9.figshare.1008029.v1.

    [17]

    INO. INO's Video Analytics Dataset[EB/OL]. [2022-06-07]. https://www.ino.ca/en/technologies/video-analytics-dataset/.

    [18]

    Conaire C Ó, O'Connor N E, Cooke E, et al. Comparison of fusion methods for thermo-visual surveillance tracking[C]//2006 9th International Conference on Information Fusion. IEEE, 2006: 1-7.

  • 期刊类型引用(1)

    1. 姚雪峰,高毅,龙兵,于晨阳,李文昊,于宏柱,张靖,李晓天. 数字微镜器件(DMD)杂散光特性测试方法及装置. 中国光学. 2022(02): 339-347 . 百度学术

    其他类型引用(0)

图(7)  /  表(4)
计量
  • 文章访问数:  185
  • HTML全文浏览量:  75
  • PDF下载量:  46
  • 被引次数: 1
出版历程
  • 收稿日期:  2022-06-06
  • 修回日期:  2022-08-09
  • 刊出日期:  2023-07-19

目录

/

返回文章
返回