基于多尺度对比度增强和跨维度交互注意力机制的红外与可见光图像融合

邸敬, 梁婵, 任莉, 郭文庆, 廉敬

邸敬, 梁婵, 任莉, 郭文庆, 廉敬. 基于多尺度对比度增强和跨维度交互注意力机制的红外与可见光图像融合[J]. 红外技术, 2024, 46(7): 754-764.
引用本文: 邸敬, 梁婵, 任莉, 郭文庆, 廉敬. 基于多尺度对比度增强和跨维度交互注意力机制的红外与可见光图像融合[J]. 红外技术, 2024, 46(7): 754-764.
DI Jing, LIANG Chan, REN Li, GUO Wenqing, LIAN Jing. Infrared and Visible Image Fusion Based on Multi-Scale Contrast Enhancement and Cross-Dimensional Interactive Attention Mechanism[J]. Infrared Technology , 2024, 46(7): 754-764.
Citation: DI Jing, LIANG Chan, REN Li, GUO Wenqing, LIAN Jing. Infrared and Visible Image Fusion Based on Multi-Scale Contrast Enhancement and Cross-Dimensional Interactive Attention Mechanism[J]. Infrared Technology , 2024, 46(7): 754-764.

基于多尺度对比度增强和跨维度交互注意力机制的红外与可见光图像融合

基金项目: 

国家自然科学基金 62061023

甘肃省科技计划资助项目 22JR5RA360

甘肃省杰出青年基金 21JR7RA345

详细信息
    作者简介:

    邸敬(1979-),女,甘肃兰州人,硕士,副教授,硕士生导师,主要从事图像检测识别、信号处理技术和宽带无线通信方面的研究

    通讯作者:

    梁婵(2001-),女,甘肃金昌人,硕士研究生,主要从事图像融合,通信技术方面的研究。E-mail: 2431413505@qq.com

  • 中图分类号: TP391.9

Infrared and Visible Image Fusion Based on Multi-Scale Contrast Enhancement and Cross-Dimensional Interactive Attention Mechanism

  • 摘要:

    针对目前红外与可见光图像融合存在特征提取不足、融合图像目标区域不显著、细节信息缺失等问题,提出了一种多尺度对比度增强和跨维度交互注意力机制的红外与可见光图像融合方法。首先,设计了多尺度对比度增强模块,以增强目标区域强度信息利于互补信息的融合;其次,采用密集连接块进行特征提取,减少信息损失最大限度利用信息;接着,设计了一种跨维度交互注意力机制,有助于捕捉关键信息,从而提升网络性能;最后,设计了从融合图像到源图像的分解网络使融合图像包含更多的场景细节和更丰富的纹理细节。在TNO数据集上对提出的融合框架进行了评估实验,实验结果表明本文方法所得融合图像目标区域显著,细节纹理丰富,具有更优的融合性能和更强的泛化能力,主观性能和客观评价优于其他对比方法。

    Abstract:

    Addressing the issues of inadequate feature extraction, lack of saliency in fused image regions, and missing detailed information in infrared-visible image fusion, this paper proposes a method for infrared-visible image fusion based on multi-scale contrast enhancement and a cross-modal interactive attention mechanism. The main components of the proposed method are as follows. 1) Multi-scale contrast enhancement module: Designed to strengthen the intensity information of target regions, facilitating the fusion of complementary information from both infrared and visible images. 2) Dense connection block: Employed for feature extraction to minimize information loss and maximize information utilization. 3) Cross-modal interactive attention mechanism: Developed to capture crucial information from both modalities and enhance the performance of the network. 4) Decomposition network: Designed to decompose the fused image back into source images, incorporating more scene details and richer texture information into the fused image. The proposed fusion framework was experimentally evaluated on the TNO dataset. The results show that the fused images obtained by this method feature significant target regions, rich detailed textures, better fusion performance, and stronger generalization ability. Additionally, the proposed method outperforms other compared algorithms in both subjective performance and objective evaluation.

  • 对于红外焦平面探测器,噪声等效温差是一个很重要的指标参数,与信噪声比相关,直观地反映了器件的灵敏度,也是热像仪设计考虑的关键参数,影响系统的作用距离与目标识别[1-6]

    在较早期文献资料中,单元探测器与信噪比相关的主要指标参数包括探测率、噪声等效功率等,而NETD只是一个表征热像仪系统温度灵敏度的重要指标,直到20世纪八九十年代开始红外焦平面探测器快速发展后,NETD才逐渐出现在探测器的主要性能指标中[7-13]

    探测器的NETD与热像仪系统的NETD基本定义是相同的[14]:噪声电压Vn与目标温差ΔT产生的信号电压ΔVs相等时的温差称为噪声等效温差,即信噪比为1时,目标与背景的温差。定义公式如下:

    $$ NETD = \frac{{\Delta T}}{{\Delta {V_{\rm s}}/{V_n}}} $$ (1)

    实际应用中,红外焦平面探测器的NETD与多种因素有关,如像元面积、光谱响应范围、量子效率、冷屏F数、背景温度等。除此之外,从定义公式可以看到,NETD并未像探测率一样对积分时间进行归一化处理,实际中器件的信噪比并不随着积分时间的加长而按比例增加,因此同一器件在不同的积分时间条件下,NETD在理论上也不同。另一方面,器件的响应与黑体温度也并不是线性关系,选择的背景温度和ΔT不同,NETD在理论上也会不同,同一背景温度条件下ΔT越小越接近实际应用情况,但由于受黑体精度的影响,ΔT很难控制得很小,采集到的响应信号也很容易受到其他因素的干扰,因此一般取较大的温差进行测试,如中长波探测器测试时温差ΔT通常取10℃~15℃[15-17],这样带来的问题是,与实际情况可能存在的差异。理论上,NETD与电荷存储量无关,但在某些特定条件下,如应用的背景温度或固定的势阱填充量,需要采取一些措施来满足使用或测试要求,此时NETD会受到一定的限制。

    在热像仪系统应用中,有的文献还提出了由于焦平面探测器像元之间响应不均匀性引起的空间NETD[18-21],为了简化计算,本文不考虑空间NETD,仅从NETD的测试方法和流程出发,通过黑体辐射及探测器的理论公式,对HgCdTe、InSb等常用光伏型红外焦平面探测器NETD的理论计算公式进行推导,分析影响器件NETD的主要因素,通过典型640×512 HgCdTe中波红外焦平面探测器对不同条件下的背景限NETD进行理论计算及分析,并对固定背景温度但不同测试温差下的NETD进行理论推算及对比测试。

    与探测率等性能指标测试方法一样,红外焦平面探测器NETD在测试时也是测出一定条件下噪声和温差响应信号,再根据式(1)进行计算,其测试系统示意图如图 1,包括辐射源、驱动电路、数据采集模块、计算机及控制软件等。一般情况下,采用面源黑体作为红外辐射源,设置温度T0模拟背景温度,T1模拟目标温度;驱动电路提供器件正常工作所必须的电源、偏置和脉冲时序等,并对器件的输出信号进行调理;数据采集模块对调理后的器件输出信号进行自动采集,并送至计算机中;计算机及控制软件对驱动电路、数据采集模块等进行控制,并对采集数据进行处理计算。

    图  1  红外焦平面探测器NETD测试系统
    Figure  1.  NETD test system for infrared FPA detectors

    具体测试流程如下:

    ① 连接测试系统与被测器件,使面源黑体面充满器件视场,器件达到工作温度后,通过驱动电路给被测器件加电,在规定的测试条件下使器件正常工作;

    ② 分别在黑体温度为T0T1条件下采集器件中每个像元的输出信号电压V0V1,连续采集F帧(F≥100)取平均值,并计算T0条件下F帧输出信号电压的均方根偏差为该像元的噪声电压Vn

    ③ 计算每个像元的输出信号电压差ΔVs,即V1V0

    ④ 根据Vn、ΔVs、黑体温差ΔT及式(1)计算出器件中每个像元的NETD。

    对于红外焦平面探测器,一般规定的主要测试条件为积分时间或势阱填充量。势阱填充量是指探测器光电转换产生的电子数占读出电路总电荷存储量的百分比,也就是探测器输出信号电压占输出动态范围的百分比,可以通过调整积分时间达到。

    根据普朗克黑体辐射公式,黑体温度为T时在λon~λoff光谱范围内的光子辐亮度为:

    $$L_{\mathrm{p}}(\lambda, T)=\int_{\lambda_{\mathrm{on}}}^{\lambda_{\text {off }}} \frac{2 c}{\lambda^4\left(\mathrm{e}^{\frac{h c}{\lambda k T}}-1\right)} \mathrm{d} \lambda$$ (2)

    式中:Lp(λ, T)为单位面积黑体在单位时间、单位立体角的光子辐亮度,个/(s·sr·cm2);λonλoff为探测器的前后截止波长,μm;c为光速,3×108 m/s;h为普朗克常数,6.63×10-34 Js;k为玻耳兹曼常数,1.38×10-23 J/K。

    面源黑体可以看成一个均匀大面积的朗伯源,当面源黑体充满探测器的整个视场时,探测器光电转换产生的电子数为:

    $$N=\eta A_{\mathrm{d}} t_{\mathrm{int}} \varOmega L_{\mathrm{p}}(\lambda, T)$$ (3)

    式中:N为探测器光电转换产生的电子数,个;η为探测器总量子效率,无量纲;Ad为像元的光敏面积,cm2tint为积分时间,s;Ω为探测器的视场角,sr,Ω=π/(4F2+1),F为探测器冷屏所限制的F数。

    假设探测器的暗电流为Idark,通过读出电路后,探测器的输出信号电压:

    $$V=\frac{Q}{C_{\mathrm{R}}}=\frac{q N+I_{\mathrm{dark}} t_{\mathrm{int}}}{C_{\mathrm{R}}}$$ (4)

    式中:q为电子电量,1.6×10-19 C;CR为读出电路的积分电容,F。

    T0T1黑体温度下,探测器的暗电流基本不发生改变,可得到这两个温差下响应电压ΔVs的计算公式:

    $$\Delta V_{\mathrm{s}}=\frac{\eta q A_{\mathrm{d}} t_{\mathrm{int}} \varOmega\left[L_{\mathrm{p}}\left(\lambda, T_1\right)-L_{\mathrm{p}}\left(\lambda, T_0\right)\right]}{C_{\mathrm{R}}}$$ (5)

    假设在T0温度下其总噪声为Vn(T0),根据式(1)可得到NETD的理论计算公式:

    $$\mathrm{NETD}=\frac{C_{\mathrm{R}} V_n\left(T_0\right)}{\eta q A_{\mathrm{D}} t_{\mathrm{int}} \varOmega\left[L_{\mathrm{P}}\left(\lambda, T_1\right)-L_{\mathrm{P}}\left(\lambda, T_0\right)\right]}\left(T_1-T_0\right)$$ (6)

    为了便于分析,温度T0T1下探测器光电转换产生的电子数记为N0N1,则N0ηAdtintΩLP(λ, T0)、N1ηAdtintΩLP(λ, T1)。探测器的总噪声包括背景辐射、暗电流、读出电路、测试系统等引起的噪声。其中背景辐射到达探测器上光子数目的均方起伏等于其光子到达率的平均值[22],因此T0温度下背景辐射噪声电压Vn-B为:

    $$V_{\mathrm{n}-\mathrm{B}}=q \sqrt{N_0} / C_{\mathrm{R}}$$ (7)

    假设探测器除了背景辐射噪声以外其他噪声电子数为Nde,则:

    $$V_{\mathrm{n}}\left(T_0\right)=\frac{q}{C_{\mathrm{R}}} \sqrt{N_0+N_{\mathrm{de}}^2}$$ (8)

    式(6)可简化为文献[23]中NETD的表达形式:

    $$\mathrm{NETD}=\frac{1}{K \sqrt{N_0}} \sqrt{1+\frac{N_{\mathrm{de}}^2}{N_0}}$$ (9)

    式中:K定义为T0温度下单位温差的光子数变化百分比,$K = ({N_1}/{N_0} - 1)/({T_1} - {T_0})$。

    对式(9)分析可以得到以下结果:

    当暗电流、读出电路等引起的其他噪声电子数Nde相对于背景T0产生的噪声电子数$\sqrt {{N_0}} $较大,即(Nde2/N0)≫1时,NETD主要受限于Nde大小,即为探测器噪声所限制的NETD。

    当(Nde2/N0)≪1时,NETD受探测器的其他噪声影响可以忽略,此时NETD主要受限于N0,即达到背景限的NETD。

    对于焦平面探测器,由于受读出电路积分电容设计尺寸的限制,能处理的电荷数不可能无限制地大,在上述两种情况下,当读出电路最大电荷存储量小于(Nde2+N0)时,NETD则受限于读出电路的电荷存储量,此时需要通过一些措施来减少探测器产生的电子数,例如减小像元尺寸、缩短积分时间、增大F数、降低暗电流等。另一种情况是,读出电路电荷存储量足够但受应用或测试条件的限制,例如要求在固定的势阱填充量条件下进行NETD测试,此时读出电路的电荷存储量越大,NETD就可以越小。

    由于探测器受光子辐照产生的电子数与温度不成比例关系,即使T0相同,选择不同的T1进行测试,K值发生变化,NETD也会有所不同。

    当只考虑背景辐射噪声时,根据式(9)可得到探测器在T0温度下背景限NETD的理论公式:

    $$\mathrm{NETD}=\frac{1}{K \sqrt{N_0}}$$ (10)

    代入KN0,即:

    $$\mathrm{NETD}=\frac{\sqrt{L_{\mathrm{P}}\left(\lambda, T_0\right)}}{\left[L_P\left(\lambda, T_1\right)-L_{\mathrm{P}}\left(\lambda, T_0\right)\right] \sqrt{\eta A_{\mathrm{D}} t_{\mathrm{int}} \Omega}}\left(T_1-T_0\right)$$ (11)

    从式(10)、(11)可以看出,T0T1不变的情况下,背景限NETD与$\sqrt {{N_0}} $成反比例关系,即与量子效率、像元面积、积分时间的平方根成反比例关系,与视场角平方根$\sqrt \varOmega $成反比例关系,即正比于$\sqrt {\frac{{4{F^2} + 1}}{\pi }} $,当F数较大时,与F数成近似正比例关系。

    从式(11)得到的另一个结论是,背景限NETD与读出电路的积分电容无关。实际中,当测试系统或热像仪系统带来的噪声不可忽略时,NETD与积分电容相关,其在他条件不变的情况下,随着积分电容变大,NETD也变大,但此时如果再采取增加积分时间、减小F数等方法达到相同的势阱填充量,由于测试系统或热像仪系统噪声在总噪声中占的比例减小,那么NETD则相对是变小的。

    根据上面的理论公式,NETD与测试温度相关,根据NETD定义,温度T1越接近T0,NETD越接近实际情况,但通常红外焦平面探测器在NETD测试时采用的都是较大温差。理论上,只要积分时间及T0保持不变,通过大温差下NETD的测试结果可推算出小温差下NETD的结果。下面是推算过程:

    T0T1温差下NETD实测结果记为${\rm NETD}_{{({T_1} - {T_0})}}$,T0T2温差下NETD的推算结果记为${\rm NETD}_{{({T_2} - {T_0})}}$,背景T0下探测器的总噪声为${V_{n - {T_0}}}$,在这两个条件下,温差响应信号分别$\Delta {V_{\rm s}}_{({T_1} - {T_0})}$和$ \Delta {V_{\rm s}}_{({T_2} - {T_0})} $。由式(1)有:

    $$ {\rm NETD}_{{({T_1} - {T_0})}} = \frac{{{V_{n - {T_0}}}}}{{\varDelta {V_{\rm s}}_{({T_1} - {T_0})}}}{\text{(}}{T_1} - {T_0}{\text{)}} $$ (12)
    $$ {\rm NETD}_{{({T_2} - {T_0})}} = \frac{{{V_{n - {T_0}}}}}{{\Delta {V_{\rm s}}_{({T_2} - {T_0})}}}({T_2} - {T_0}) $$ (13)

    可以得到:

    $$ {\rm NETD}_{{({T_2} - {T_0})}} = \frac{{({T_2} - {T_0})}}{{({T_1} - {T_0})}}\frac{{\Delta {V_{\rm s}}_{({T_1} - {T_0})}}}{{\Delta {V_{\rm s}}_{({T_2} - {T_0})}}}{\rm NETD}_{{({T_1} - {T_0})}} $$ (14)

    将式(5)代入上式得到T0T2温差下的NETD:

    $$ \begin{array}{l} {\rm NETD}_{{({T_2} - {T_0})}} = \hfill \\ \frac{{({T_2} - {T_0})}}{{({T_1} - {T_0})}}\frac{{[{L_P}(\lambda , {T_1}) - {L_P}(\lambda , {T_0})]}}{{[{L_P}(\lambda , {T_2}) - {L_P}(\lambda , {T_0})]}}{\rm NETD}_{{({T_1} - {T_0})}} \hfill \\ \end{array} $$ (15)

    通过上式,只需计算出两个温差条件下理论光子辐亮度差的比值,即可推算出另一温差下的NETD值。

    选择目前典型640×512 HgCdTe中波红外焦平面探测器,像元面积2.25×10-6 cm2,响应波段范围为3.7~4.9 μm,器件在整个响应范围内的量子效率为0.7,背景黑体温度范围250~350 K,温差取1 K,对其常用条件下NETD进行理论计算及分析。

    1)不同积分时间条件下背景限NETD

    冷屏F数为4,探测器读出电路电荷存储量不受限制时,不同积分时间下背景限NETD的理论计算结果如图 2(a),若读出电路电荷存储量为6.4 Me,实际应用中考虑势阱填充量为10%~90%,背景限NETD实际能达到的值如图 2(b)

    图  2  背景限NETD与背景温度、积分时间的关系
    Figure  2.  BLIP NETD with the background temperature and integration time

    从理论计算结果可以看出,随着背景温度和积分时间的降低,NETD均是增大的,但其前提条件是积分时间或背景温度不变,在较低背景温度下,只要系统可接受的积分时间足够长,NETD理论上可达到较小的值,但事实上,由于系统帧频限制,且由于暗电流的影响,在低背景条件下积分时间也不可能达到很大的值,NETD也会受到一定程度的限制。而高背景温度条件下,由于读出电路电荷存储量的限制,积分时间也不可能很长,需根据实际情况确定,在某些条件下,低背景温度下的NETD可能小于高背景温度下的NETD。从图 2(b)明显看出,当读出电路电荷存储量固定且势阱填充量在一定范围时,NETD受到较大限制,有些条件不可能达到理想状态,图中的标记为“半阱输出”的圆点位置是指某一背景度下,势阱填充量为50%时对应的积分时间和NETD,随着背景温度的升高,达到半阱时需要的积分时间减小,半阱NETD有增大的趋势。在本例中积分时间为1 ms和2 ms时,即使在高温350 K背景条件下也仍达不到半阱输出,此时NETD的值较大。

    2)不同电荷存储量条件下背景限NETD

    仍然是在冷屏F数为4条件下,假设读出电路电荷存储量变化范围为1 Me~12.8 Me,为了使NETD的评价更为客观,在不同背景温度下、调整积分时间使输出均达到半阱状态,NETD的理论计算结果图 3,图中实线和虚线分别为不同条件下半阱NETD和半阱积分时间。背景温度不变的情况下,随着电荷存储量的增加,半阱积分时间增大,半阱NETD减小。图中250 K背景温度下,12.8 Me电荷存储量时,半阱积分时间已超过200 ms,除特殊情况外已不具备实用的条件。

    图  3  背景限半阱NETD与背景温度、电荷存储量、半阱积分时间关系
    Figure  3.  Half well fill BLIP NETD with the background temperature, charge capacity and integration time

    3)不同F数条件下背景限NETD

    冷屏的F数直接决定了入射光子数量,假设F数范围为2~5,背景温度和积分时间不变,只改变F数,根据式(11),F数=5的背景限NETD近似为F数=2背景限NETD的2.5倍,但此时探测器输出势阱填充量差别较大,若调整积分时间使输出均达到半阱状态,在电荷存储量为6.4 Me时,不同背景温度下NETD的理论计算结果图 4。从结果可以看到,随着F数的增加,半阱积分时间增大,但相同背景温度下的NETD保持不变,不同F数下的NETD曲线均重合在一起,只要电荷存储量不变,半阱输出的电子数就已经固定,不论F数是否相同,半阱积分时间下的NETD都保持不变。

    图  4  背景限半阱NETD与背景温度、F数、半阱积分时间关系
    Figure  4.  Half well fill BLIP NETD with the background temperature, F number and integration time

    对典型640×512 HgCdTe中波红外焦平面探测器固定背景温度下的NETD进行实测及推算。取背景温度T0为293 K、F数为4、电荷存储量6.4 Me、积分时间为8 ms时,选择不同的T1,温差从±0.0001~±15 K,背景限NETD的理论计算值如图 5。从图中可以看出,T1T0时,采用的温差越大NETD越小;T1T0时,采用的温差越大NETD越大。在这两种情况下,绝对温差小于1 K时,NETD的变化都很小,绝对温差小于0.1 K时,NETD基本都不再发生变化。

    图  5  不同温差下NETD的变化曲线
    Figure  5.  NETD variation curves under the different temperature difference

    选取一只上述典型器件,采用不同的温差进行NETD实测,按常规测试方法T1T0,积分时间仍为8 ms,并按式(15)进行NETD推算,结果如表 1图 6。由于未扣除器件暗电流、读出电路、测试系统等噪声,NETD实测结果略高于背景限理论计算结果,但不影响推算结果。

    表  1  640×512中波探测器NETD实测结果与推算结果比较
    Table  1.  Comparison between test results and calculation results of 640×512 MW detector
    T0
    /mK
    T1
    /mK
    Tested NETD
    (T0T1)/mK
    Calculation
    NETD/mK
    293 308 21.3 /
    293 303 23.1 23.0
    293 298 24.7 24.8
    293 295 25.8 26.0
    293 294 26.3 26.4
    293 293.5 26.4 26.6
    293 293.2 / 26.7
    293 293.1 / 26.7
    293 293.01 / 26.8
    293 293.001 / 26.8
    293 293.0001 / 26.8
    下载: 导出CSV 
    | 显示表格
    图  6  640×512中波探测器NETD实测结果与推算结果比较
    Figure  6.  Comparison between test results and calculation results of 640×512 MW detector

    当温差小于0.5 K时,由于黑体控温、采集精度等的影响,响应信号基本不再发生变化,NETD测试已无意义。从已测的这组数据来看,随着与293 K温差的逐渐缩小,NETD逐渐增加,通过293~308 K常规测试结果推算出的NETD也呈同样规律,且两者结果非常接近,温差等于1 K时,推算结果和实测结果均比293~308 K常规结果大了约24%,温差小于1 K时,不管是实测结果还是推算结果,NETD都变化很小。由此可以得到如下结论,通过推算可以达到与实测相近的结果,在不改变目前探测器NETD测试规则的前提下,采用1 K温差进行推算,可以得到固定背景温度下更接近实际应用情况的NETD。

    HgCdTe、InSb等光伏型红外焦平面探测器的NETD除了和器件本身的像元面积、光谱响应范围、F数、量子效率、暗电流、读出电路等因素相关以外,也受限于各种实际应用条件,如帧频、背景温度等要求的限制,还与测试条件,如测试温度温差、积分时间等各种因素相关,这些因素相互影响和制约,不同的应用条件和测试条件可能导致NETD不同,需要根据具体情况结合理论计算进行分析。由于目前焦平面探测器常规NETD测试都是采用较大温差进行,与实际情况存在差异,本文推导的理论公式可在固定背景温度下从常规测试的NETD推算出较小温差的NETD,通过典型器件验证,不同温差的推算结果与实测结果符合较好,采用1K温差的NETD推算结果已非常接近实际情况,可为热像仪系统应用提供参考。本文虽以中波探测器为例进行验证,其分析方法适用于所有波长的红外焦平面探测器。

  • 图  1   多尺度对比度增强和跨维度交互注意力机制网络整体框架

    Figure  1.   Overall network framework of multi-scale contrast enhancement and cross-dimensional interactive attention mechanisms

    图  2   多尺度对比度增强模块

    Figure  2.   Multi-scale contrast enhancement module

    图  3   密集连接块

    Figure  3.   Dense connection block

    图  4   跨维度交互注意力机制

    Figure  4.   Cross-dimensional interactive attention mechanisms

    图  5   分解网络框架

    Figure  5.   Decomposition network framework

    图  6   自适应权重原理图

    Figure  6.   Schematic diagram of adaptive weighting

    图  7   消融实验结果

    Figure  7.   Results of ablation experiments

    图  8   六组场景的融合结果

    Figure  8.   Fusion results for six groups of scenes

    图  9   不同方法的7种客观指标对比

    Figure  9.   Comparison of 7 objective metrics for different algorithms

    表  1   10组场景消融实验客观评价指标均值

    Table  1   Mean values of objective evaluation indexes in 10 groups of ablation experiment scenes

    Experiments Index
    AG SF QAB/F
    Experiment 1 3.8619 16.9474 0.3435
    Experiment 2 5.2188 19.4560 0.4054
    Experiment 3 5.0563 18.0114 0.4096
    Experiment 4 3.9564 17.5561 0.3078
    Proposed 5.4976 19.7360 0.4288
    下载: 导出CSV

    表  2   6组图像的客观评价指标均值

    Table  2   Mean value of objective evaluation index for 6 groups of images

    Methods Evaluation indicators
    AG EN CC MS-SSIM SD VIFF SF
    ResNet 3.5661 5.9922 0.5708 0.8681 4.3923 0.2375 9.2758
    Nest Fusion 5.8888 6.9124 0.5982 0.8529 6.3274 0.4076 16.8701
    IVIFBF 4.3408 6.1802 0.6755 0.8676 4.7672 0.1780 11.2212
    AUIF 6.2377 6.6338 0.6576 0.9201 5.7228 0.5296 17.1550
    RFN-Nest 4.2341 6.9792 0.6744 0.9177 6.1445 0.5784 11.4769
    FL fusion 3.3678 5.9282 0.4349 0.7823 4.2301 0.2926 9.1551
    CCFL 6.1237 6.7197 0.4392 0.8857 5.6265 0.3542 16.9962
    PIAF 5.6041 6.6416 0.6891 0.8681 5.7763 0.6056 15.4443
    Proposed 7.3095 6.8959 0.7972 0.9207 6.0486 0.6501 20.2498
    下载: 导出CSV

    表  3   20组图像不同方法的平均运行时间

    Table  3   Average running time of different algorithms for 20 sets of images

    Methods ResNet NestFuse IVIFBF AUIF RFN-Nest FL fusion CCFL PIAF Proposed
    Time/s 0.1845 0.2512 0.4121 1.1456 0.1789 1.2514 0.6584 0.2816 0.1245
    Calculated amount /GFLOPs 2.8741 3.2456 3.8970 4.1257 3.4578 4.2125 3.8974 3.2141 3.1242
    下载: 导出CSV
  • [1] 唐霖峰, 张浩, 徐涵, 等. 基于深度学习的图像融合方法综述[J]. 中国图象图形学报, 2023, 28(1): 3-36. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGTB202301002.htm

    TANG Linfeng, ZHANG Hao, XU Han, et al. A review of image fusion methods based on deep learning[J]. Journal of Image and Graphics, 2023, 28(1): 3-36. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGTB202301002.htm

    [2]

    SUN Haijiang, LIU Qiaoyuan, WANG Jiacheng, et al. Fusion of infrared and visible images for remote detection of low-altitude slow-speed small targets[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021, 14: 2971-2983.

    [3]

    SHUAI Xincheng, JING Zhongliang, TUO Hongya. SAFuseNet: integration of fusion and detection for infrared and visible images[J]. Aerospace Systems, 2022, 5(4): 655-661.

    [4]

    LI H, WU X J. CrossFuse: A novel cross attention mechanism based infrared and visible image fusion approach[J]. Information Fusion, 2024, 103: 102147.

    [5]

    ZHOU Tao, LI Qi, LU Huiling, et al. GAN review: models and medical image fusion applications[J]. Information Fusion, 2023, 91: 134-148. DOI: 10.1016/j.inffus.2022.10.017

    [6]

    HU Ke, SUN Wenhao, NIE Zhongbo, et al. Real-time infrared small target detection network and accelerator design[J]. Integration, 2022, 87: 241-252. DOI: 10.1016/j.vlsi.2022.07.008

    [7] 孙彬, 诸葛吴为, 高云翔, 等. 基于潜在低秩表示的红外和可见光图像融合[J]. 红外技术, 2022, 44(8): 853-862. http://hwjs.nvir.cn/cn/article/id/7fc3a60d-61bb-454f-ad00-e925eeb54576

    SUN Bin, ZHUGE Wuwei, GAO Yunxiang, et al. Infrared and visible image fusion based on potential low-rank representation[J]. Infrared Technology, 2022, 44(8): 853-862. http://hwjs.nvir.cn/cn/article/id/7fc3a60d-61bb-454f-ad00-e925eeb54576

    [8]

    TAN W, ZHOU H, SONG J, et al. Infrared and visible image perceptive fusion through multi-level Gaussian curvature filtering image decomposition[J]. Applied Optics, 2019, 58(12): 3064-3073.

    [9]

    Archana R, Jeevaraj P S E. Deep learning models for digital image processing: a review[J]. Artificial Intelligence Review, 2024, 57(1): 11. DOI: 10.1007/s10462-023-10631-z

    [10]

    WANG Chang, WU Yang, YU Yi, et al. Joint patch clustering-based adaptive dictionary and sparse representation for multi-modality image fusion[J]. Machine Vision and Applications, 2022, 33(5): 69. DOI: 10.1007/s00138-022-01322-w

    [11]

    CHEN Yudan, WANG Yuanbo, HUANG Fuyu, et al. Infrared and Visible Images Fusion base on Wavelet Transform[J]. Sixth Symposium on Novel Optoelectronic Detection Technology and Applications, 2020, 11455: 875-882.

    [12]

    LI Hui, WU Xiaojun, Kittler Josef. MDLatLRR: A novel decomposition method for infrared and visible image fusion. [J]. IEEE Transactions on Image Processing, 2020, 29: 4733-4746. DOI: 10.1109/TIP.2020.2975984

    [13]

    LIU Yu, CHEN Xun, CHENG Juan, et al. Infrared and visible image fusion with convolutional neural networks[J]. International Journal of Wavelets, Multiresolution and Information Processing, 2018, 16(3): 1850018.

    [14]

    ZHAO Z, XU S, ZHANG J, et al. Efficient and model-based infrared and visible image fusion via algorithm unrolling[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2021, 32(3): 1186-1196.

    [15]

    LI Hui, WU Xiaojun, Kittler Josef. RFN-Nest: An end-to-end residual fusion network for infrared and visible images[J]. Information Fusion, 2021, 73: 72-86. DOI: 10.1016/j.inffus.2021.02.023

    [16]

    TANG Linfeng, YUAN Jiteng, ZHANG Hao, et al. PIAFusion: a progressive infrared and visible image fusion network based on illumination aware[J]. Information Fusion, 2022, 83: 79-92.

    [17]

    TANG Linfeng, XIANG Xinyu, ZHANG Hao, et al. DIVFusion: Darkness-free infrared and visible image fusion[J]. Information Fusion, 2023, 91: 477-493. http://www.nstl.gov.cn/paper_detail.html?id=c2c499247ee68b7a6ee8622c95b62724

    [18]

    Kayadibi İsmail, Güraksın Gür Emre. An explainable fully dense fusion neural network with deep support vector machine for retinal disease determination[J]. International Journal of Computational Intelligence Systems, 2023, 16(1): 28. DOI: 10.1007/s44196-023-00210-z

    [19]

    LI H, WU X J, DURRANI T S. Infrared and visible image fusion with ResNet and zero-phase component analysis[J]. Infrared Physics & Technology, 2019, 102: 103039.

    [20]

    LI Hui, WU Xiaojun, Tariq Durrani. NestFuse: an infrared and visible image fusion architecture based on nest connection and spatial/channel attention models[J]. IEEE Transactions on Instrumentation and Measurement, 2020, 69(12): 9645-9656.

    [21]

    ZHAO Zixiang, XU Shuang, ZHANG Chunxia, et al. Bayesian fusion for infrared and visible images[J]. Signal Processing, 2020, 177: 107734. DOI: 10.1016/j.sigpro.2020.107734

    [22]

    XUE Weimin, WANG Anhong, ZHAO Lijun. FLFuse-Net: A fast and lightweight infrared and visible image fusion network via feature flow and edge compensation for salient information[J]. Infrared Physics and Technology, 2022, 127: 104383.

    [23]

    Veshki Farshad G, Ouzir Nora, Vorobyov Sergiy A, et al. Multimodal image fusion via coupled feature learning[J]. Signal Processing, 2022, 200: 108637.

图(9)  /  表(3)
计量
  • 文章访问数:  142
  • HTML全文浏览量:  27
  • PDF下载量:  62
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-08-14
  • 修回日期:  2023-09-24
  • 网络出版日期:  2024-07-24
  • 刊出日期:  2024-07-19

目录

/

返回文章
返回