基于BEMD改进的视觉显著性红外和可见光图像融合

崔晓荣, 沈涛, 黄建鲁, 王笛

崔晓荣, 沈涛, 黄建鲁, 王笛. 基于BEMD改进的视觉显著性红外和可见光图像融合[J]. 红外技术, 2020, 42(11): 1061-1071.
引用本文: 崔晓荣, 沈涛, 黄建鲁, 王笛. 基于BEMD改进的视觉显著性红外和可见光图像融合[J]. 红外技术, 2020, 42(11): 1061-1071.
CUI Xiaorong, SHEN Tao, HUANG Jianlu, WANG Di. Infrared and Visible Image Fusion Based on BEMD and Improved Visual Saliency[J]. Infrared Technology , 2020, 42(11): 1061-1071.
Citation: CUI Xiaorong, SHEN Tao, HUANG Jianlu, WANG Di. Infrared and Visible Image Fusion Based on BEMD and Improved Visual Saliency[J]. Infrared Technology , 2020, 42(11): 1061-1071.

基于BEMD改进的视觉显著性红外和可见光图像融合

详细信息
    作者简介:

    崔晓荣(1995-),男,硕士研究生,主要从事红外图像处理方面研究。E-mail: cur1601645438@163.com

  • 中图分类号: TP391.41

Infrared and Visible Image Fusion Based on BEMD and Improved Visual Saliency

  • 摘要: 针对视觉显著性融合过程中目标对比度低,图像不够清晰的问题,本文提出一种基于二维经验模态分解(bidimensional empirical mode decomposition,BEMD)改进的Frequency Tuned算法。首先利用BEMD捕获红外图像的强点、轮廓信息用于指导生成红外图像的显著性图,然后将可见光图像和增强后的红外图像进行非下采样轮廓波变换(nonsubsampled contourlet transform,NSCT),对低频部分采用显著性图指导的融合规则,对高频部分采用区域能量取大并设定阈值的融合规则,最后进行逆NSCT变换生成融合图像并进行主观视觉和客观指标评价,结果表明本文方法实现了对原图像多层次、自适应的分析,相较于对比的方法取得了良好的视觉效果。
    Abstract: Aiming at the problems of low target contrast and insufficiently clear images in the process of visual saliency fusion, this paper proposes an improved frequency Tuned algorithm based on bi-dimensional empirical mode decomposition (BEMD). First, the strong points and contour information of the infrared image captured by BEMD is used to guide the generation of saliency maps of the infrared image. Then, the visible image and the enhanced infrared image are subjected to a non-subsampled contourlet transform(NSCT). The saliency map-guided fusion rule is used for the low-frequency part. The high-frequency part is used to set the area energy to be large and rely on the threshold value rules. Finally, the inverse NSCT transform is used to generate a fused image and subjective visual and objective index evaluations are performed to it. The results show that the method in this paper achieves a multi-level and adaptive analysis of the original image, and achieves good vision compared to the contrast methods.
  • 偏振成像[1]是一种新型的光学成像手段,能够获取多个偏振方向图像,通过偏振信息解析,能够实现同场景多个不同偏振方向图像来表征目标的偏振信息,从而实现对目标的检测。偏振信息解析是偏振成像中的重要环节,目前有很多学者针对不同的应用场景提出了多种偏振信息解析的方法[2-5],其中,沈洁[6]等人根据螳螂虾的复眼能充分利用偏振信息实现水下复杂环境的猎物捕获,提出了基于拮抗机制的偏振仿生信息解析方法,将0°、45°、90°、135°四个偏振方向图像分成2组拮抗图像,通过使2组图像的拮抗信息熵最大来获得偏振方向图像的加权系数,得到偏振拮抗图像,从而实现水下目标探测。但这种方法本质是偏振方向图像间的线性操作,存在计算效率低、解析结果不确定、目标不够突出等问题。

    深度学习具有强大的表征能力,可以从高维、复杂以及非线性数据中提取有用的特征,目前在很多领域都有着广泛的应用,如自然语言处理[7]、语音识别[8]、图像处理[9]等。Li[10]等人提出一种基于卷积神经网络(Convolutional Neural Networks,CNN)和残差神经网络(Residual Networks,ResNets)的深度学习架构,用于红外和可见光图像的融合,较好地突显了目标信息,并解决了传统的基于CNN中随着网络深度增加特征信息退化的问题。

    偏振图像拮抗过程属于偏振方向图像融合的范畴,本文充分利用深度学习在图像处理上的优势,提出了一种偏振方向图像的双支路拮抗融合网络,主要包括特征提取、特征融合和特征转化3个模块,输入4个不同方向的偏振图像,分成两个支路,低频支路通过合成图像来减少能量的损失,高频支路通过差分图像来突显图像的细节信息。将两个支路处理的结果分别通过深度融合网络进行处理,获取效果更好的融合图像,提高后续目标检测与识别效果。

    偏振成像需要获取多个偏振方向图像,常用的获取方式可以分为:分时型、分振幅型、分孔径型和分焦平面型。相对于其他的成像方式,分焦平面型偏振成像具有体积小、重量轻、成本低、能同时获取多个偏振方向图像等优点,成为目前偏振成像获取方法的主流。其基本原理是:在探测器的芯片上集成微型偏振分析器(如图 1所示),在探测器的每4个像元上,耦合0°、45°、90°、135°等4个线偏振方向的偏振分析器,利用4个像元实现1个像素的偏振信息采集。按照微型偏振分析器排列顺序,对探测器输出图像进行重新整合,即可得到0°、45°、90°、135°四个偏振方向图像,如图 2(a)~(d)所示。

    图  1  分焦片面型偏振成像原理
    Figure  1.  Polarization image split-focus planar principle
    图  2  0°、45°、90°和135°的偏振方向图和合成强度图
    Figure  2.  Polarization and intensity pictures of 0°, 45°, 90°and 135°

    利用偏振成像理论,可以得到合成强度图像I[6],如图 2(e)所示:

    $$ I=I\left(0^{\circ}\right)+I\left(90^{\circ}\right) $$ (1)

    根据螳螂虾复眼的偏振拮抗机制[6],一对正交偏振图像的输入可以形成一个拮抗,如0°和90°偏振方向图像、45°和135°偏振方向图像,将采集到的4组正交偏振图像形成4个偏振拮抗通道,每个通道由相互正交的一对偏振信号组成,各组拮抗信号通过拮抗运算方式可以得到偏振拮抗图像,如下所示:

    $$ S_{\mathrm{d}}=k_1 \times I\left(45^{\circ}\right)-k_2 \times I\left(135^{\circ}\right) $$ (2)
    $$ S_{\mathrm{dd}}=k_3 \times I\left(135^{\circ}\right)-k_4 \times I\left(45^{\circ}\right) $$ (3)
    $$ S_{\mathrm{h}}=k_5 \times I\left(0^{\circ}\right)-k_6 \times I\left(90^{\circ}\right) $$ (4)
    $$ S_{\mathrm{v}}=k_7 \times I\left(90^{\circ}\right)-k_8 \times I\left(0^{\circ}\right) $$ (5)

    式中:I(0°)、I(90°)、I(45°)和I(135°)分别表示0°、90°、45°和135°的偏振方向图像,ki(i=1, …, 8)为拮抗系数,起到对图像的增强和抑制作用,k的取值范围由人为设定,km≥1(m=1, 3, 5, 7),0<kn≤1(n=2, 4, 6, 8),文献[6]中k是通过遍历所有范围内可能的值,求取偏振拮抗图像信息熵最大来确定,存在计算效率低、结果不确定的问题,使得求取的偏振拮抗图像目标可能不够突出。

    图像融合就是通过处理不同传感器所拍摄的源图像,提取有用的信息或特征,将其整合来改善图像的品质和清晰度[11]。传统图像融合需要人工提取特征,指定融合规则,而基于深度学习的图像融合,利用深度网络对输入图像进行卷积,提取出目标高层特征,再利用卷积将融合后特征转换为融合图像,如图 3所示。相对于可监督图像融合的方法,无监督的方法通过约束融合图像和原图像之间的相似性,克服了大多数图像融合中无参考度量的普遍问题。

    图  3  深度学习图像融合网络一般过程
    Figure  3.  General process of deep learning image fusion network

    由偏振成像机理可知,每个偏振方向图像能量损失一半。为了提高融合后的图像的亮度,如图 4所示,我们设计了一个低频支路,将4个偏振方向图像通过Concat操作进行连接输入,用于提取每个偏振方向图像的低频特征;根据Tyo[12]的研究结论,偏振差分成像可以突显目标细节信息,因此本文设计了另一个高频支路,将2组拮抗图像进行差分输入,用于提取差分图像的目标高频特征。Huang[13]等人提出了一种密集块结构,其中使用了从任何层到所有后续层的直接连接。这种体系结构可以保存尽可能多的信息,该模型可以改善网络中的信息流和梯度,使网络易于训练,同时,密集连接具有正则化效果,减少了任务的过拟合。受此启发,本文将密集连接加入到差分图像细节特征提取中,用于降低细节信息的损失。设计的网络结构主要包括特征提取、特征融合和特征转化3个模块。

    图  4  偏振拮抗融合网络
    Figure  4.  Polarization antagonistic fusion network

    图 4中,特征融合模块将两个支路提取的特征图进行对应像素融合,得到融合特征,特征转化模块利用1×1卷积将融合的特征整合得到输出图像。低频和高频支路均有3个3×3的卷积层,网络参数如表 1所示。

    表  1  网络参数
    Table  1.  Network parameters
    Layer Input channel Output channel
    Feature extraction Low frequency Conv1 4 128
    Conv2 128 64
    Conv3 64 50
    High frequency Conv4 2 16
    Conv5 18 16
    Conv6 34 50
    Feature fusion Fusion 50 50
    Feature transformation Conv7 50 1
    下载: 导出CSV 
    | 显示表格

    在偏振拮抗图像获取中,利用信息熵最大作为评价标准[6],因此本文将信息熵损失Lentropy加入到损失函数中,用于增大融合图像的信息量;结构相似性度量方法作为图像领域使用最广泛的指标之一,该方法基于图像的亮度、对比度和结构3部分来衡量图像之间的相似性,本文将结构相似性损失Lssim加入到损失函数中,用于保持融合图像结构特征;感知损失通常用于图像重建中,恢复出来的图像视觉效果较好,本文将感知损失Lperceptural加入到损失函数中,用于提高融合图像的人眼视觉效果。因此,本文的损失函数L计算公式如下:

    $$ L=L_{\text {entropy }} \times \sigma+L_{\text {ssim}} \times \beta+L_{\text {perceptural }} \times \gamma $$ (6)

    式中:σβγ为各损失的权重,本文分别取0.1、10、0.1。

    1)信息熵损失Lentropy

    信息熵(Information Entropy,IE)越大,图像包含的信息越多,为使融合图像信息熵最大,信息熵损失Lentropy定义为:

    $$ {L_{{\text{entropy}}}} = \frac{1}{{{\text{IE}} + \varepsilon }} $$ (7)
    $$ {\text{IE}} = - \sum\limits_{i = 1}^n {p\left( {{x_i}} \right)\log p\left( {{x_i}} \right)} $$ (8)

    式中:ε为极小量;xi为随机变量;p(xi)为输出概率函数;n为灰度等级。

    2)结构相似性损失Lssim

    结构相似性(structural similarity index,SSIM)用于度量两幅图像的相似度,结构相似性损失Lssim定义为:

    $$ L_{\text {ssim }}=1-\operatorname{SSIM}(\text { output, } I \text { ) } $$ (9)

    式中:SSIM(⋅)表示结构相似性运算;output为输出图像;I为强度图像。

    3)感知损失Lperceptural

    $$ {L_{{\text{perceptural}}}} = \left\| {{\varPhi _i}\left( {{\text{output}}} \right), {\varPhi _i}\left( I \right)} \right\|_2^2 $$ (10)

    式中:Φi(⋅)为VGG16网络第i层特征图。

    实验环境如下:训练与测试图像集采用处理器为11th Gen Intel(R) Core(TM) i7-11800H @ 2.30 GHz,系统运行内存为32 GB,GPU显卡为8 GB显存容量的NVIDIA GeForce RTX3080的图形工作站。训练软件运行环境为Python3.9,编程框架为Torch 1.11.0,搭建Cuda10.0用于实验加速。

    本文采用LUCID公司的分焦平面型偏振相机(型号:PHX050S-P),如图 5所示。该相机能够同时获取0°、45°、90°、135°四个偏振方向图像,图像分辨率为2448×2048。我们拍摄采集了多种场景目标的9320组偏振方向图像,构建出本文的数据集。

    图  5  LUCID的分焦平面型偏振相机
    Figure  5.  LUCID 's split-focus planar polarization camera

    本文采用主观定性和客观定量相结合的方法对融合图像进行综合评价,主观评价主要通过人眼观察图像亮度和细节信息,客观评价采用平均梯度[14]、信息熵[15]、空间频率[16]、均值[17]等4个评价指标,定量评估融合效果。

    1)平均梯度(Average Gradient,AG)

    平均梯度能有效反映出图像层次信息,其值越大,图像层次越丰富,其计算公式为:

    $$ \begin{array}{l} {\text{AG}} = \frac{1}{{\left( {M - 1} \right)\left( {N - 1} \right)}} \times \hfill \\ \quad \quad \sum\limits_{i = 1}^{M - 1} {\sum\limits_{j = 1}^{N - 1} {\sqrt {\frac{{{{\left[ {F\left( {i, j} \right) - F\left( {i + 1, j} \right)} \right]}^2} + {{\left[ {F\left( {i, j} \right) - F\left( {i, j + 1} \right)} \right]}^2}}}{2}} } } \hfill \\ \end{array} $$ (11)

    式中:F(i, j)为图像的第i行、第j列的灰度值;MN分别为图像的总行数和总列数。

    2)空间频率(Spatial Frequency,SF)

    空间频率是图像质量经典的标准之一,其值越大,代表图像质量越高,越清晰,其计算公式为:

    $$ {\text{SF}} = \sqrt {{\text{R}}{{\text{F}}^2} + {\text{C}}{{\text{F}}^2}} $$ (12)
    $$ {\text{RF}} = \sqrt {\frac{1}{{MN}}\sum\limits_{i = 1}^M {\sum\limits_{j = 2}^N {\left[ {{I_{\text{p}}}\left( {i, j} \right) - {I_{\text{p}}}\left( {i, j - 1} \right)} \right]} } } $$ (13)
    $$ {\text{CF}} = \sqrt {\frac{1}{{MN}}\sum\limits_{i = 2}^M {\sum\limits_{j = 1}^N {\left[ {{I_{\text{p}}}\left( {i, j} \right) - {I_{\text{p}}}\left( {i - 1, j} \right)} \right]} } } $$ (14)

    式中:RF是行频率;CF是列频率;MN为图片的宽高;Ip(i, j)为图像在(i, j)处的像素值。

    3)图像均值(Image Mean,IM)

    均值即图像像素的平均值,反应图像的平均亮度,平均亮度越大,能量越高,其计算公式为:

    $$ {\text{IM}} = \sum\limits_{k = 0}^{L - 1} {{z_k}p\left( {\frac{{{n_k}}}{{MN}}} \right)} $$ (15)

    式中:zk为图像的第k个灰度级;L表示图像的灰度等级数目;nkzk在图像中出现的次数。

    本文数据集共计9320组,其中训练集和测试集按照9:1划分,算法的模型由Adam optimizer训练,训练轮次为20,初始学习率为1e-4,每训练4轮学习率衰减一半,详细参数如表 2所示。

    表  2  训练参数
    Table  2.  Training parameters
    Parameters Values
    Training set 8388
    Testing set 932
    Training round 20
    Epoch 4
    Optimizer Adam
    Activation function ReLU
    Initial learning rate 1e-4
    Learning rate decay rate 0.5*lr/4 round
    下载: 导出CSV 
    | 显示表格

    为了验证本文算法的有效性,从测试集中随机选取了4组数据,每组数据包含0°、45°、90°和135°偏振方向图像,第1组为室内沙地伪装板目标,第2组为室内标定装置目标,第3组为室外草地伪装板,第4组为水下珊瑚目标,如图 6所示。

    图  6  输入的0°、45°、90°和135°偏振方向图像
    Figure  6.  0°, 45°, 90° and 135° polarization direction images of input

    将上述数据输入到本文训练好的模型中,得到对应的融合图像,根据公式(1)~(5)分别得到合成强度图像I、偏振拮抗图像SdSddShSv,如图 7所示。

    图  7  结果对比图
    Figure  7.  Results comparison diagram

    图 7可以看出,本文的融合图像亮度最高,能量最大,说明网络中的低频支路对图像能量的提升效果明显,有效解决了偏振成像中能量降低的问题。从图像细节来说,融合图像的细节效果有较为明显的提升,如第1组本文融合图像中的沙粒更加有颗粒感,伪装板的边缘更加突出,第2组本文融合图像中标定装置的线缆显现出来,背景板的线条更加清晰,而其他图像不太明显,第3组本文融合图像的3块伪装板全部从背景中区分出来,而其他图像只有部分能够区分开,第4组本文融合图像中,珊瑚整体目更亮,珊瑚边缘也更明晰。由于图像能量提升较为明显,可能会造成目标的对比度有所下降,如第一组本文融合图像的伪装板的对比度相较于Sd图和Sh图有所下降,但不影响目标整体的检测效果。

    本文将测试集中932组图像输入到模型中,得到对应的932幅融合图像,并根据公式(1)~(5)分别得到932幅合成强度图像I和相应的偏振拮抗图像SdSddShSv。利用平均梯度(AG)、信息熵(IE)、空间频率(SF)和图像灰度均值(IM)指标对其计算均值并进行评价,如表 3所示。

    表  3  输出结果的各项评价指标
    Table  3.  Evaluation indexes of the output results
    I Sd Sdd Sh Sv DANet
    AG 0.0099 0.0128 0.0119 0.0144 0.0126 0.0185
    IE 6.06 6.18 6.08 6.15 6.39 7.04
    SF 0.35 0.49 0.40 0.46 0.45 0.64
    IM 41 49 47 46 57 93
    下载: 导出CSV 
    | 显示表格

    表 3中可以看出,在4个评价指标上,本文的方法都是最高的,在平均梯度上最少提高了22.16%,最多提高了46.49%;在信息熵上最少提高了9.23%,最多提高了13.92%;在空间频率上最少提高了23.44%,最多提高了45.31%;在图像灰度均值上最少提高了38.71%,最多提高了55.91%。实验结果表明,本文方法得到的融合图像亮度更高,包含的信息量更丰富,可以显现出更多的细节信息。

    针对偏振方向图像融合效果不明显的问题,本文提出了一种基于双支路拮抗融合网络的偏振信息解析方法,可以解决现有基于拮抗机制的仿生偏振信息解析方法中存在计算效率低、解析结果不确定、目标不够突出等问题,为偏振信息解析提供了一个新的技术途径。本文设计的DANet主要包括特征提取、特征融合和特征转化3个模块。首先,特征提取模块由低频支路和高频支路组成,将0°、45°、90°和135°偏振方向图像连接输入到低频支路,提取能量特征,将2组拮抗图像差分输入到高频支路,提取图像细节特征;其次,将得到的能量特征和细节特征进行特征融合;最后,将融合后的特征转化整合为融合图像。实验表明,通过DANet得到的融合图像在视觉效果和评价指标上均有较为显著提升,在平均梯度、信息熵、空间频率和图像灰度均值上分别至少提升了22.16%、9.23%、23.44%、38.71%。下一步,我们将进一步优化网络结构,以平衡能量支路和细节支路,改善融合图像的对比度;加大水下偏振方向图像在数据集中的比重,优化数据集。

  • 图  1   原始红外图像

    Figure  1.   The original infrared image

    图  2   不同显著性算法检测结果

    Figure  2.   Detection results of different saliency algorithms

    图  3   灰度因子处理前后对比

    Figure  3.   Comparison before and after gray factor processing

    图  4   NSCT分解结构示意图

    Figure  4.   NSCT decomposition structure diagram

    图  5   基于多尺度变换的红外与可见光图像融合方案

    Figure  5.   Multi-scale transform based infrared and visible image fusion scheme

    图  6   UN camp融合后图像

    Figure  6.   UN camp fusion image

    图  7   Duck融合后图像

    Figure  7.   Duck fusion image

    图  8   Quad融合后图像

    Figure  8.   Quad fusion image

    图  9   Road融合后图像

    Figure  9.   Road fusion image

    图  10   Meting融合后图像

    Figure  10.   Meting fusion image

    表  1   指标1~4客观评价结果

    Table  1   Objective evaluation results of indicators 1-4

    Fusion methods DWT NSCT NSCT-FT Refs[10] Refs[11] Ours
    AG Camp 5.3124 6.4413 6.3130 6.3847 6.2933 7.0430
    Duck 12.1330 13.009 13.9004 13.9823 15.9637 24.9317
    Quad 2.9931 3.1687 3.2143 3.2211 5.2103 11.2350
    Road 4.1854 6.0509 6.1220 6.1268 6.1220 10.7534
    SF Camp 10.0328 12.3317 12.0787 12.2163 12.0412 13.0310
    Duck 23.7788 25.8573 27.6482 27.824 30.7837 45.5664
    Quck 8.3171 9.2165 9.3217 9.3416 13.3127 25.3463
    Road 8.7663 12.9879 13.0910 13.1050 13.0910 22.0065
    NMI Camp 0.1265 0.1073 0.1737 0.1757 0.1737 0.1346
    Duck 0.2172 0.1913 0.3194 0.3200 0.3197 0.1639
    Quck 0.2524 0.1451 0.1186 0.1187 0.1185 0.1000
    Road 0.1957 0.1453 0.2052 0.2211 0.2052 0.2419
    MSSIM Camp 0.5182 0.5739 0.564 0.5639 0.5638 0.5386
    Duck 0.4098 0.4187 0.4637 0.4660 0.4655 0.3500
    Quck 0.4285 0.4247 0.373 0.3738 0.3726 0.1745
    Road 0.4539 0.5201 0.518 0.5181 0.5180 0.4906
    下载: 导出CSV

    表  2   指标5~7客观评价结果

    Table  2   Objective evaluation results of indicators 5-7

    Fusion methods DWT NSCT NSCT-FT Refs[10] Refs[11] Ours
    QAB/F Camp 0.3666 0.4466 0.4438 0.444 0.4439 0.4472
    Duck 0.6608 0.7185 0.7412 0.7417 0.7415 0.5835
    Quad 0.4914 0.5191 0.5014 0.5028 0.5005 0.2608
    Road 0.4807 0.6067 0.6107 0.6125 0.6107 0.6146
    IE Camp 6.4526 6.5352 6.9886 7.0117 6.9853 6.5968
    Duck 7.245 7.0741 7.3985 7.4071 7.4045 7.7774
    Quck 6.1265 5.7455 5.5744 5.5742 5.5721 7.4564
    Road 6.689 7.044 7.2423 7.2373 7.2423 7.7609
    CE Camp 1.2799 0.6569 0.5848 0.5448 0.5979 0.6171
    Duck 2.7133 2.9619 2.6941 2.7170 2.7157 2.5487
    Quck 4.6854 5.2318 5.8247 5.8408 5.8195 3.9693
    Road 1.2912 0.7181 0.8772 0.9025 0.8772 0.8917
    下载: 导出CSV

    表  3   图 10客观评价结果

    Table  3   Objective evaluation results of figure 10

    Fusion methods DWT NSCT NSCT-FT Refs[10] Refs[11] Ours (h) Ours (i)
    AG 4.0168 5.5897 5.6484 5.5434 5.6784 9.8212 9.9087
    SF 8.7041 12.4437 12.6046 12.6607 12.7046 12.7175 12.7999
    NMI 0.1675 0.1056 0.2298 0.1872 0.2098 0.2335 0.2269
    MSSIM 0.4607 0.529 0.5197 0.5189 0.5267 0.4995 0.4888
    QAB/F 0.4044 0.529 0.565 0.5332 0.545 0.5753 0.554
    IE 6.6467 6.6998 7.3041 7.0408 7.4043 7.298 7.2845
    CE 1.1031 0.7952 0.7704 1.1443 0.8704 0.9406 1.0687
    下载: 导出CSV
  • [1]

    MA C, MIAO Z, ZHANG X P, et al. A saliency prior context model for real-time object tracking[J]. IEEE Transactions on Multimedia, 2017, 19(11): 2415-2424. DOI: 10.1109/TMM.2017.2694219

    [2]

    HU W, YANG Y, ZHANG W, et al. Moving Object Detection Using Tensor Based Low-Rank and Saliently Fused-Sparse Decomposition[J]. IEEE Transactions on Image Processing, 2016, 7149(c): 1-1. http://www.ncbi.nlm.nih.gov/pubmed/27849530

    [3]

    Da Cunha A L, ZHOU Jianping, Do M N. The nonsubsampled contourlet transform: theory, design, and applications[J]. IEEE Transactions on Image Processing, 2006, 15(10): 3089-3101. DOI: 10.1109/TIP.2006.877507

    [4]

    KONG W, ZHANG L, LEI Y. Novel fusion method for visible light and infrared images based on nsst-sf-pcnn[J]. Infrared Physics & Technology , 2014, 65: 103-112. DOI: 10.1007/BF03346396

    [5]

    BHUIYANS M A, ADHAMI R R, KHAN J F. Fast and Adaptive bidimensional empirical mode decomposition using order-statistics filter based envelope estimation[J]. Eurasip Journal on Advances in Signal Processing, 2008(1): 1-18. DOI: 10.1155/2008/728356

    [6]

    A Toet. Computational versus psychophysical bottom-up image saliency: A comparative evaluation study[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence , 2011, 33(11): 2131-2146. DOI: 10.1109/TPAMI.2011.53

    [7]

    HAREL J, KOCH C, PERONA P. Graph-based visual saliency[C]// Advances in neural information processing systems, 2006: 545-552.

    [8]

    HOU X, ZHANG L. Saliency detection: A spectral residual approach[C]// Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2007: 1–8.

    [9]

    ACHANTA R, HEMAMI S, ESTRADA F, et al.Frequency-tuned salient region detection[C]//2009 IEEE Conference on Computer Vision and Pattern Recognition, 2009: 1597-1604.

    [10] 傅志中, 王雪, 李晓峰, 等.基于视觉显著性和NSCT的红外与可见光图像融合[J].电子科技大学学报, 2017, 46(2): 357-363. http://d.wanfangdata.com.cn/Periodical/dzkjdxxb201702007

    FU Zhizhong, WANG Xue, LI Xiaofeng, et al. Infrared and Visible Image Fusion Based on Visual Saliency and NSCT[J]. Journal of University of Electronic Science and Technology of China, 2017, 46(2): 357-363. http://d.wanfangdata.com.cn/Periodical/dzkjdxxb201702007

    [11] 林子慧, 魏宇星, 张建林, 等.基于显著性图的红外与可见光图像融合[J].红外技术, 2019, 41(7): 640-646. http://www.cnki.com.cn/Article/CJFDTotal-HWJS201907009.htm

    LIN Zihui, WEI Yuxin, ZHANG Jianlin, et al. Image Fusion of Infrared and Visible Images Based on Saliency Map[J]. Infrared Technology, 2019, 41(7): 640-646. http://www.cnki.com.cn/Article/CJFDTotal-HWJS201907009.htm

    [12] 安影, 范训礼, 陈莉, 等.结合FABEMD和改进的显著性检测的图像融合[J].系统工程与电子技术, 2020, 42(2): 292-300. http://d.wanfangdata.com.cn/periodical/xtgcydzjs202002006

    AN Ying, FAN Xunli, CHEN Li, et al. Image fusion combining with FABEMD and improved saliency detection[J]. Systems Engineering and Electronics, 2020, 42(2): 292-300. http://d.wanfangdata.com.cn/periodical/xtgcydzjs202002006

    [13]

    Nunes J C, Bouaoune Y, Delechelle E, et al. Image analysis by bidimensional empirical mode decomposition[J]. Image & Vision Computing, 2003, 21(12): 1019-1026. http://www.sciencedirect.com/science/article/pii/S0262885603000945

    [14]

    HUANG N E, SHEN Z, LONG S R, et al. The empirical mode de-composition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences, 1998, 454(1971): 903-995. DOI: 10.1098/rspa.1998.0193

    [15]

    Bidimensional empirical model decomposition method for image processing in sensing system[J]. Computers and Electrical Engineering, 2018, 68: 215 -224.

    [16] 王笛, 沈涛, 孙宾宾, 等.基于大气灰度因子的红外图像增强算法[J].激光与红外, 2019, 49(9): 1135-1140. http://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFD&filename=JGHW201909019

    WANG Di, SHEN Tao, SUN Binbin, et al. Infrared image enhancement algorithm based on atmospheric gray factor[J]. Laser & Infrared, 2019, 49(9): 1135-1140. http://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CJFD&filename=JGHW201909019

    [17]

    MA J, ZHOU Z, WANG B, et al. Infrared and visible image fusion based on visual saliency map and weighted least square optimization[J]. Infrared Physics & Technology, 2017, 82: 8-17. http://www.sciencedirect.com/science/article/pii/S1350449516305928

    [18]

    ZHAI Y, SHAH M. Visual attention detection in video sequences using spatiotemporal cues[C]//Proceedings of the 14th Annual ACM International Conference on Multimedia, 2006: 815-824.

    [19] CHENG Mingming, Niloy J Mitra, HUANG Xiaolei, et al. Global Contrast based Salient Region Detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37: 569-582. http://ieeexplore.ieee.org/document/6871397
    [20]

    Achanta R, Estrada F, Wils P, et al. Salient region detection and segmentation[C]//International Conference on Computer Vision Systems, 2008: 66-75.

    [21] 杨爱萍, 王海新, 王金斌, 等.基于透射率融合与多重导向滤波的单幅图像去雾[J].光学学报, 2019, 38(12): 104-114. http://www.cnki.com.cn/Article/CJFDTotal-GXXB201812014.htm

    YANG Aiping, WANG Haixin, WANG Jinbin, et al. Image Dehazing Based on Transmission Fusion and Multi-Guided Filtering[J]. Acta Optica Sinica, 2019, 38(12): 104-114. http://www.cnki.com.cn/Article/CJFDTotal-GXXB201812014.htm

    [22]

    CUI G, FENG H, XU Z, et al. Detail preserved usion of visible and infrared images using regional saliency extraction and multi-scale image decomposition[J]. Optics Communications, 2015, 341: 199-209. DOI: 10.1016/j.optcom.2014.12.032

    [23]

    Piella G, Heijmans H. A new quality metric for image fusion[C]// Proceedings of the International Conference on Image Processing, 2003: 173-176.

    [24]

    QU G, ZHANG D, YAN P. Information measure for performance of image fusion[J]. Electronics Letters, 2002, 38(7): 313-315. DOI: 10.1049/el:20020212

    [25]

    WANG Z, A C Bovik, H R Sheikh, et al. Image quality assessment: from error visibility to structural similarity[J]. IEEE Transactions on Image Processing, 2004, 13(4): 600-612. http://jamia.bmj.com/external-ref?access_num=10.1109/TIP.2003.819861&link_type=DOI

    [26]

    Xydeas CS, Petrovic V. Objective image fusion performance measure[J]. Electronics Letters, 2000, 36(4): 308-309. DOI: 10.1049/el:20000267

    [27]

    J W Roberts, J Van Aardt, F Ahmed. Assessment of image fusion procedures using entropy, image quality, and multispectral classification[J]. Journal of Applied Remote Sensing, 2008, 2(1): 023522. DOI: 10.1117/1.2945910

图(10)  /  表(3)
计量
  • 文章访问数: 
  • HTML全文浏览量: 
  • PDF下载量: 
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-01-22
  • 修回日期:  2020-10-27
  • 刊出日期:  2020-11-19

目录

/

返回文章
返回