基于边缘感知的深度神经网络红外装甲目标检测

盛大俊, 张强

盛大俊, 张强. 基于边缘感知的深度神经网络红外装甲目标检测[J]. 红外技术, 2021, 43(8): 784-791.
引用本文: 盛大俊, 张强. 基于边缘感知的深度神经网络红外装甲目标检测[J]. 红外技术, 2021, 43(8): 784-791.
SHENG Dajun, ZHANG Qiang. Infrared Armored Target Detection Based on Edge-perception in Deep Neural Network[J]. Infrared Technology , 2021, 43(8): 784-791.
Citation: SHENG Dajun, ZHANG Qiang. Infrared Armored Target Detection Based on Edge-perception in Deep Neural Network[J]. Infrared Technology , 2021, 43(8): 784-791.

基于边缘感知的深度神经网络红外装甲目标检测

基金项目: 

装备预研基金资助课题 

详细信息
    作者简介:

    盛大俊(1981-),男,讲师,研究方向:制导测试技术,计算机视觉应用

    通讯作者:

    张强(1975-),男,高工,研究方向:光电系统维修与测试,红外制导技术等,E-mail:x0376y@163.com

  • 中图分类号: TP753

Infrared Armored Target Detection Based on Edge-perception in Deep Neural Network

  • 摘要: 装甲目标自动检测一直是红外制导领域的研究热点与难点。解决该问题的传统方法是提取目标的低层次特征,并对特征分类器进行训练。然而,由于传统的检测算法不能覆盖所有的目标模式,在实际应用中的检测性能受到限制。本文受边缘感知模型的启发,提出了一种基于边缘感知的改进深度网络,该网络是通过边缘感知融合模块提升装甲轮廓精度,利用特征提取模块和上下文聚合模块的优势,能够更好地适应目标的形态变化,具有较高的检测与识别的精度。验证结果表明,本文提出的装甲检测网络模型可以有效地提高红外图像中装甲的检测与定位精度。
    Abstract: Automatic detection of armored targets has always been the most challenging problem in the field of infrared guidance. Traditional models address this problem by extracting the low-level features of an object and then training the feature classifier. However, because traditional detection algorithms can not cover all object patterns, the detection performance in practical applications is limited. Inspired by the edge-aware model, this study proposes an improved deep network based on edge perception. The network improves the accuracy of the armored contour through an edge-aware fusion module. By exploiting he advantages of the feature extraction module and context aggregation module, it can better adapt to the shape changes of objects and has high detection and recognition accuracy. The results show that the proposed armored detection network model can effectively improve the accuracy of detection and positioning in infrared images.
  • 多模态图像融合[1]是指从不同模态的源图像中提取重要信息,合成一幅比单一源图像更清晰、内容更全面的图像,便于人眼的观察和计算机的处理。

    近年来,随着多尺度几何分析[2]、稀疏表示[3]、深度学习[4]等理论的发展,多模态图像融合技术取得了很大的进展。Bulanon等[5]采用拉普拉斯金字塔变换将源图像中的特征按照不同的尺度分解到不同的分解层上,由此来融合源图像中的显著特征;Zhan等人[6]提出了基于离散小波变换(discrete wavelet transform, DWT)的红外与可见光图像融合方法,虽然DWT在保留图像细节方面具有良好的性能,但缺乏平移不变性,导致融合图像的边界不连续。Liu等[7]提出了一种基于自适应稀疏表示(adaptive sparse representation,ASR)的多模态图像融合算法,融合的高频子带中保留了源图像的结构特征,但融合结果对比度极低、细节丢失严重。文献[8]提出了一种基于卷积神经网络(convolutional neural network,CNN)的图像融合算法,能同时实现显著性水平测评和权重分配,但融合结果中丢失了较多的细节信息。文献[9]提出了一种基于自适应脉冲耦合神经网络(adaptive pulse coupled neural network,APCNN)的非下采样轮廓波变换(non-subsampled contourlet transform,NSCT)域图像融合算法,由于APCNN模型中的连接强度设置为常数影响了融合结果的精度,且NSCT对各向异性的信息表示能力较弱,导致融合图像中丢失了边缘信息,针对此问题,文献[10]将非下采样剪切波变换(non-subsampled shearlet transform, NSST)和APCNN相结合,解决了NSCT方向有限的问题,且具有平移不变性[11],因此被广泛应用[10-13]。以上算法虽然在一定程度上提高了融合图像的质量,但都存在图像的边缘细节丢失、视觉效果差等问题。

    为了增加融合图像中的细节信息,提出了一种基于NSST-DWT-ICSAPCNN的多模态图像融合方法。采用NSST对源图像进行多尺度、多方向的分解得到高频和低频子带图像。考虑到NSST对细节处理精度仍不够高,而DWT在保留图像细节方面具有良好的性能,因此采用DWT进一步分解低频子带,提取源图像中容易被NSST分解忽略的细节信息。此外,为了增强中心神经元受到周围神经元的影响程度,将局部标准差的Sigmoid函数作为连接强度来构建改进型连接强度自适应脉冲耦合神经网络(improved connection strength adaptive pulse coupled neural network, ICSAPCNN),由于APCNN具有全局耦合特性和脉冲同步特性[14],因此能更好地利用高频子带图像的全局特征。本文结合NSST、DWT、ICSAPCNN的互补特性融合多模态图像,通过实验验证了所提算法的有效性。

    NSST分解过程有两步,第一步采用非下采样金字塔滤波器组(NSPF)对待融合的源图像进行n级尺度分解,实现图像的多尺度化。第二步采用剪切滤波器(SFB)实现高频子带的多方向化,第k级方向分解个数为2k。最终得到n+1个子带图像[11],即1个低频和n个高频子带图像,均与源图像的大小相同。

    NSST不仅可以在多方向和多尺度上表示图像,还具有平移不变性,并且其分解过程中没有使用下采样运算,消除了伪吉布斯现象。NSST二级分解过程如图 1所示,本文中NSST分解的级数设置为4,方向数设为[8, 8, 16, 16]。

    图  1  NSST二级分解过程
    Figure  1.  The two-level decomposition process of NSST

    DWT可以将源图像分解成一系列的能量子带和细节子带图像,分解过程使用一组高通、低通滤波器来执行,如图 2所示:先对图像ai中每行构成的一维数据进行一维小波分解,得到高、低频信息。再对每列构成的一维数据做相同的操作,最终得到4个子带图像:ai-1hj-11hj-12hj-13。其中,ai-1由行低通、列低通得到,包含图像的近似信息,hj-11由行低通、列高通得到,hj-12由行高通、列低通得到,hj-13由行高通、列高通得到。hj-11hj-12hj-13分别包含水平、垂直、对角方向上的边缘细节信息[15]

    图  2  DWT分解过程
    Figure  2.  The decomposition process of DWT

    APCNN模型是通过模拟猫的大脑视觉皮层中同步脉冲发放现象而建立起来的一个简化模型[16],它不需要任何的训练过程,而是基于迭代计算,其数学方程描述如式(1)~(5)所示:

    $$ F_{ij}[n]=S_{ij} $$ (1)
    $$ {L_{ij}}[n] = {V_L}\sum\limits_{kl} {{W_{ijkl}}{Y_{kl}}[n - 1]} $$ (2)
    $$ {U_{ij}}[n] = {{\text{e}}^{ - {\alpha _{\text{F}}}}}{U_{ij}}[n - 1] + {F_{ij}}[n](1 + \beta {L_{ij}}[n]) $$ (3)
    $$ {Y_{ij}}[n] = \left\{ {\begin{array}{*{20}{c}} {1,\quad {U_{ij}}[n] \gt {E_{ij}}[n - 1]} \\ {0,\quad {U_{ij}}[n] \leqslant {E_{ij}}[n - 1]} \end{array}} \right. $$ (4)
    $$ {E_{ij}}[n] = {{\text{e}}^{ - {\alpha _{\text{E}}}}}{E_{ij}}[n - 1] + {V_E}{Y_{ij}}[n] $$ (5)

    输入图像中的像素点(i, j)与APCNN模型中的神经元之间存在一一对应的关系[17],神经元获取外部刺激输入的通道有两个,一个是反馈输入Fij,由像素点(i, j)的灰度绝对值Sij决定,另一个是连接输入Lij,其中VL是放大系数,Wijkl为突触连接矩阵。将FijLij进行非线性相乘调制后得到神经元的内部活动项Uij,其中αF为反馈输入的衰减时间常数。当Uij大于动态阈值Eij时发放脉冲Yij,神经元产生一次点火。当神经元点火时,Eij立刻增大,然后又按照指数逐渐衰减,直到神经元再次发放脉冲,其中αE为动态阈值的衰减常数,VE为脉冲的放大系数。当迭代结束时,得到点火频率映射图。

    基于本文方法的图像融合流程如图 3所示,采用NSST对源图像IAIB进行分解得到高低频子带;再对低频子带进行DWT分解得到低频能量子带和细节子带,并采用最大值选择规则融合能量子带,利用ICSAPCNN分别对细节子带和高频子带进行融合;对能量子带和细节子带进行DWT逆变换得到融合的低频子带;最后采用NSST逆变换重构出融合图像IF

    图  3  基于NSST-DWT-ICSAPCNN的融合流程图
    Figure  3.  The fusion diagram based on NSST-DWT-ICSAPCNN

    本文结合区域能量(RE)和梯度能量(EOG)融合低频系数,选择M×N区域窗口,具体步骤如下:

    Step 1    根据式(6)分别计算两幅低频能量子带图像的区域能量RE1和RE2

    $$ {\text{R}}{{\text{E}}_X}(i,j) = \sum\nolimits_{i \leqslant M} {\sum\nolimits_{j \leqslant N} {{L_X}{{(i,j)}^2}} } $$ (6)

    Step 2    根据式(7)分别计算两幅低频能量子带图像的梯度能量EOG1和EOG2

    $$ {\text{EO}}{{\text{G}}_X}(i,j) = \sum\nolimits_{i \leqslant M} {\sum\nolimits_{j \leqslant N} {{{\left| {{G_X}(i,j)} \right|}^2}} } $$ (7)

    式中:LX(i, j)和GX(i, j)分别表示(i, j)位置的低频能量子带系数值和梯度值。

    $$ {G_X}(i,j) = \sqrt {{{({L_X}(i,j) - {L_X}(i + 1,j))}^2} + {{({L_X}(i,j) - {L_X}(i,j + 1))}^2}} $$ (8)

    Step 3    将RE和EOG相乘作为低频的显著性水平度量(ALM),定义如式(9)所示:

    $$ {\text{AL}}{{\text{M}}_X}(i,j) = {\text{R}}{{\text{E}}_X}(i,j) * {\text{EO}}{{\text{G}}_X}(i,j) $$ (9)

    上式(6)~(9)中,X∈{1, 2}。

    Step 4    根据极大值规则选择ALM较大的点所对应的低频系数作为融合的低频系数LF(i, j):

    $$ {L_{\text{F}}}(i,j) = \left\{ {\begin{array}{*{20}{c}} {{L_1}(i,j),}&{{\text{AL}}{{\text{M}}_1}(i,j) \geqslant {\text{AL}}{{\text{M}}_2}(i,j)} \\ {{L_2}(i,j),}&{{\text{AL}}{{\text{M}}_1}(i,j) \lt {\text{AL}}{{\text{M}}_2}(i,j)} \end{array}} \right. $$ (10)

    连接强度取值范围为(0, 1),调节着神经元之间的相互影响程度。本文利用Sigmoid函数表示APCNN模型的连接强度βij,避免了将连接强度设置为常数时模型的不灵活性。考虑到人眼视觉神经系统中各个神经元的连接强度不会完全相同,令连接强度由输入图像的局部标准差决定,标准差越大的区域对应的高频子带中包含更多的显著特征,连接强度随之增大,从而增强神经元受到周围神经元的影响程度,提高了ICSAPCNN对高频子带全局信息的利用程度。

    $$ {\beta _{ij}} = \frac{1}{{(1 + \exp ( - {\sigma _{ij}}))}} $$ (11)

    式中:σij为局部标准差,其定义如式(12)所示;$ \overline {{x_{ij}}} $为区域内以神经元(i, j)为中心的灰度均值;xkl为周围神经元(k, l)的灰度值;m为区域内神经元的总数。

    $$ {\sigma _{ij}} = \sqrt {\frac{1}{m}\sum\nolimits_{k = 1}^3 {\sum\nolimits_{l = 1}^3 {{{({x_{kl}} - \overline {{x_{ij}}} )}^2}} } } $$ (12)

    ICSAPCNN模型中各神经元由某一高频子带刺激后,将得到对应的点火频率映射图,点火次数表征高频系数中包含细节信息的显著程度,次数越大,对应位置所包含的细节信息越丰富。因此选择点火次数较大的点所对应的系数作为融合的高频系数,高频子带和低频细节子带具体的融合步骤如下:

    Step 1    初始化ICSAPCNN模型,将输入激励Sij设为高频子带(低频细节子带)图像像素点(i, j)的灰度值,并令Lij[n]=Uij[n]=Yij[n]=Eij[n]=0。

    Step 2    根据式(11)计算改进的连接强度βij,其余参数根据文献[9]设定。

    Step 3    根据式(13)计算模型每次迭代结束后的点火次数:

    $$ T_{ij}^{s,l}[n] = T_{ij}^{s,l}[n - 1] + Y_{ij}^{s,l}[n] $$ (13)

    Step 4    根据式(14)选择融合的高频系数(低频细节子带系数)。

    $$ H_{\text{F}}^{s,l}(i,j) = \left\{ {\begin{array}{*{20}{c}} {H_{\text{A}}^{s,l}(i,j),}&{T_{\text{A}}^{s,l}(i,j) \geqslant T_{\text{B}}^{s,l}(i,j)} \\ {H_{\text{B}}^{s,l}(i,j),}&{T_{\text{A}}^{s,l}(i,j) \lt T_{\text{B}}^{s,l}(i,j)} \end{array}} \right. $$ (14)

    式(13)~(14)中:sl分别对应高频子带(低频细节子带)的第s层、第l个方向。式(14)中A、B分别对应两幅高频子带图像或两幅低频细节子带图像。

    本文所有实验均在Windows10,MATLAB 2019a软件上运行。为了验证本文方法的有效性,实验所用到的多模态图像包括6组红外图像(Infrared)与可见光图像(Visible),8组计算机断层扫描图像(CT)与核磁共振图像(MRI)。与近几年的4种图像融合方法做对比,文献[7]采用基于ASR的融合方法,文献[8]采用基于CNN的融合方法,文献[9]和文献[10]均采用基于多尺度变换和APCNN的融合方法(分别记为NSCT-APCNN、NSST-APCNN),本文实验分析中展示了部分多模态源图像的融合结果。

    Zheng等人在文献[18]中总结了很多评估融合图像质量的客观指标,本文选取的评估指标包括熵QEN,互信息QMI,标准差QSD,视觉信息保真度QVIFF,非线性相关信息熵QIE,基于Tsallis的熵QTE。对于本文所有的客观评估指标,其值越大,融合后的图像质量越高,融合效果越好。

    本文列出了部分源图像的融合结果,图 4(a)图 4(b)分别是“road”可见光和红外源图像,图 4(c)~(g)为对两幅源图像应用不同方法得到的融合结果。观察可知:使用ASR和CNN方法的融合结果中能量严重丢失,公路上的行人分辨率极低,视觉效果差;使用NSCT-APCNN和NSST-APCNN方法的融合结果中人物边缘模糊,细节信息丢失;本文利用Sigmoid函数表示连接强度,在两幅高频子带对应位置的标准差相差较小时ICSAPCNN模型也能表现出较好的效果。由局部放大图可知,基于本文方法的结果中人物清晰,辨识度高,保留了源图像中的重要信息。图 5(a)图 5(b)~(g)分别是“tree”可见光和红外源图像,图 5(c)为对两幅源图像应用不同方法得到的融合结果。观察融合结果可知基于本文方法的融合结果最清晰,融合效果最好。由不同方法融合“road”和“tree”两组红外与可见光源图像的客观评估指标值如表 1所示,显然,由本文方法得到的客观评估指标值均较高。由不同方法融合6组红外和可见光源图像的客观评估指标结果的平均值如表 2所示,由表 2可知,除了QSDQTE,其余4个指标QENQMIQVIFFQIE均为最优,与主观视觉效果保持一致,验证了本文方法对于红外与可见光图像融合的有效性。

    图  4  “road”红外和可见光图像以及融合结果
    Figure  4.  The "road" infrared and visible source images and fusion results
    图  5  “tree”红外和可见光图像以及融合结果
    Figure  5.  The "tree" infrared and visible source images and fusion results
    表  1  两组红外与可见光图像客观评估指标值
    Table  1.  Values of objective evaluation index for 2 groups of infrared and visible images
    Images Metrics ASR[7] CNN[8] NSCT-APCNN[9] NSST-APCNN[10] NSST-DWT-ICSAPCNN
    Road QEN 7.1339 7.4964 7.3703 7.331 7.4247
    QMI 3.0046 3.2051 3.0786 3.2336 3.0167
    QSD 38.3922 48.4964 45.5887 44.5039 51.7009
    QVIFF 0.4469 0.5842 0.5206 0.5078 0.6275
    QIE 0.8055 0.8054 0.8052 0.8053 0.8062
    QTE 0.5749 0.5207 0.5401 0.5454 0.5886
    Tree QEN 6.3464 7.1022 6.9596 6.9152 7.1043
    QMI 1.2234 1.1755 1.3188 1.7535 2.1287
    QSD 24.3398 37.2648 32.8565 31.4357 34.8227
    QVIFF 0.3177 0.4706 0.3822 0.3798 0.4261
    QIE 0.8033 0.8043 0.8035 0.8035 0.8040
    QTE 0.4090 0.2861 0.2981 0.3279 0.3282
    下载: 导出CSV 
    | 显示表格
    表  2  六组红外与可见光图像客观评估指标平均值
    Table  2.  Average values of objective evaluation index for 6 groups of infrared and visible images
    Metrics ASR[7] CNN[8] NSCT-APCNN[9] NSST-APCNN[10] NSST-DWT-ICSAPCNN
    QEN 6.2345 6.8978 6.9633 6.9094 7.0247
    QMI 2.8656 3.2917 3.6756 4.1826 4.3438
    QSD 24.7236 38.7514 37.0670 35.4332 38.6467
    QVIFF 0.3761 0.5399 0.5445 0.5032 0.5514
    QIE 0.8063 0.8076 0.8086 0.8090 0.8097
    QTE 0.7311 0.6582 0.6534 0.6971 0.6841
    下载: 导出CSV 
    | 显示表格

    图 6(a)图 6(b)分别为致死性脑卒中CT和MRI源图像,图 6(c)~(g)为对两幅医学源图像应用不同方法得到的融合结果。观察仿真结果图可知:使用ASR方法的融合结果亮度较暗,对比度严重丢失,视觉效果差;使用CNN方法的融合结果存在能量丢失现象;使用NSCT-APCNN和NSST-APCNN的融合方法是直接对低频子带图像进行融合,这种做法不能充分提取到源图像的细节信息;本文利用DWT进一步分解低频子带图像,提取源图像中容易被NSST分解忽略的信息,由局部放大图可知,得到的融合结果(图 6(g))中保留了源图像较多的细节信息,且对比度与源图像保持一致,视觉效果最好。图 7(a)~(b)分别为脑膜瘤CT和MRI源图像,图 7(c)~(g)为融合结果,观察可知,基于本文方法的融合结果细节信息最丰富,融合效果最好。由不同方法融合两组医学源图像的客观评估值如表 3所示,显然,由本文方法得到的客观评估指标值均较高。由不同融合方法融合8组医学图像的客观评估指标结果的平均值如表 4所示,由表 4可知,除了QSD,其他5个评估指标均为最优,与主观视觉效果一致,验证了本文方法对于多模态医学图像融合的有效性。

    图  6  致死性脑卒中CT和MRI图像以及融合结果
    Figure  6.  The fatal stroke CT and MRI source images and fusion results
    图  7  脑膜瘤CT和MRI图像以及融合结果
    Figure  7.  The meningoma CT and MRI source images and fusion results
    表  3  两组医学图像客观评估指标值
    Table  3.  Values of objective evaluation index for 2 groups of medical images
    Images Metrics ASR[7] CNN[8] NSCT-APCNN[9] NSST-APCNN[10] NSST-DWT-ICSAPCNN
    fatal stroke QEN 4.5440 4.8244 5.0632 4.8747 5.1693
    QMI 2.5170 2.8593 2.7118 2.8665 2.7618
    QSD 72.3351 90.2448 90.0339 84.2365 88.4652
    QVIFF 0.2691 0.3333 0.3259 0.3100 0.3131
    QIE 0.8051 0.8055 0.8054 0.8051 0.8054
    QTE 0.6663 0.7252 0.7277 0.7102 0.7896
    meningoma QEN 4.1794 4.2013 4.3485 4.6852 4.6013
    QMI 2.5408 2.9163 2.9516 3.0001 3.0665
    QSD 72.0789 88.7470 92.8914 90.2904 91.3901
    QVIFF 0.4940 0.6192 0.6279 0.5624 0.6292
    QIE 0.8056 0.8059 0.8062 0.8064 0.8064
    QTE 0.7907 0.7923 0.8445 0.8733 0.8804
    下载: 导出CSV 
    | 显示表格
    表  4  八组医学图像客观评估指标平均值
    Table  4.  Average values of objective evaluation index for 8 groups of medical images
    Metrics ASR[7] CNN[8] NSCT-APCNN[9] NSST-APCNN[10] NSST-DWT-ICSAPCNN
    QEN 4.3242 4.6515 4.7943 4.7715 4.8254
    QMI 2.6843 2.9002 2.8697 2.8998 2.9848
    QSD 66.6290 83.3568 85.9244 85.7634 85.7755
    QVIFF 0.3561 0.4417 0.4562 0.4491 0.4647
    QIE 0.8057 0.8061 0.8061 0.8062 0.8062
    QTE 0.7033 0.7494 0.7608 0.7593 0.7818
    下载: 导出CSV 
    | 显示表格

    为了在融合过程中提取更多的图像信息,提出了一种基于NSST-DWT-ICSAPCNN的多模态图像融合方法。对源图像经NSST分解得到的低频子带图像做DWT分解,解决了部分源图像细节丢失的问题。此外,将低频子带图像的区域能量和梯度能量相结合作为显著性水平度量,有效地保留了图像的能量和边缘细节信息。采用ICSAPCNN获取低频细节子带图像和高频子带图像的点火频率映射图,提高了对低频细节子带和高频子带图像全局信息的利用程度。实验结果显示所提算法相比于其他4种多模态图像融合算法,在主观视觉和客观评估指标方面均表现最优,同时验证了本文方法对于多模态红外和可见光图像与多模态医学图像均有较好的融合效果。下一步将继续研究双树复小波变换(Dual Tree Complex Wavelet Transform,DTCWT)、双密度双树复小波变换(Double Density Dual Tree Complex Wavelet Transform,DDDTCWT)对低频子带图像做进一步分解的效果。

  • 图  1   基于边缘感知的目标检测模型框架

    Figure  1.   Model frameworks of object detection based on edge-aware

    图  2   上下文聚合模块

    Figure  2.   Context aggregation module

    图  3   边缘感知融合模块

    Figure  3.   Edge-aware fusion module

    图  4   检测率与FPPI的关系曲线

    Figure  4.   Relationship-curves between detection rate and FPPI

    图  5   不同对比算法的性能对比

    Figure  5.   Performance comparison for different detection algorithms

    图  6   不同对比算法对不同红外图像的装甲检测的结果,其中(a)-(f)分别代表不同图像

    Figure  6.   Results of different comparison algorithms for different images, where (a)-(f) respectively represent the different images

    表  1   装甲检测结果统计

    Table  1   Statistics of detection results

    Classification Result
    Positive TP(True Positive) FP(False Positive)
    Negative FN(False Negative) TN(True Negative)
    下载: 导出CSV

    表  2   不同测试子集的特点

    Table  2   Characteristics of different test subsets

    Subset Characteristic
    A The target is fuzzy, the contrast is low, and some turrets are covered.
    B The armored target is small, and there are many bright areas in the background.
    C The armor area is large and full of the whole infrared image.
    D The armor boundary is not obvious and the background is super saturation.
    E The noise is very large and the internal details of the target are uneven.
    F The armored target is fuzzy and partially occlused, and some caterpillar bands are coved by weeds.
    下载: 导出CSV

    表  3   不同测试数据集下检测精度

    Table  3   Detection Rates under Different Testing Data Sets

    Datasets Models
    SDD DenseNet ResNet ConvNet YOLO-v2 Proposed
    A 73.32% 84.34% 86.61% 85.90% 89.15% 90.06%
    B 62.41% 65.43% 72.15% 77.00% 77.59% 77.14%
    C 69.12% 73.22% 74.35% 72.24% 77.09% 78.07%
    D 78.28% 87.08% 89.40% 86.01% 88.36% 89.44%
    E 51.91% 52.90% 59.75% 59.11% 58.69% 59.58%
    F 48.65% 51.55% 60.11% 52.17% 60.20 60.21%
    下载: 导出CSV
  • [1] 陈国胜, 胡福东, 周成宝, 等. 基于BIRD网络的智能红外全景识别系统[J]. 红外技术, 2018, 40(8): 765-770. http://hwjs.nvir.cn/article/id/hwjs201808008

    CHEN Guosheng, HU Fudong, ZHOU Chenbao, et al. Intelligent infrared panoramic recognition system based on BIRD network[J]. Infrared Technology, 2018, 40(8): 765-770. http://hwjs.nvir.cn/article/id/hwjs201808008

    [2] 刘博文, 戴永寿, 金久才, 等. 基于空间分布与统计特性的海面远景目标检测方法[J]. 海洋科学, 2018, 42(1): 88-92. DOI: 10.3969/j.issn.1671-6647.2018.01.008

    LIU B, DAI Y, JIN J, et al. Long-range object detection on sea surface based on spatial distribution and statistical characteristics[J]. Marine Science, 2018, 42 (1): 88-92 DOI: 10.3969/j.issn.1671-6647.2018.01.008

    [3] 骆清国, 赵耀, 俞长贺, 等. 某型装甲车辆红外辐射信号的建模与仿真[J]. 装甲兵工程学院学报, 2019, 33(1): 31-36. DOI: 10.3969/j.issn.1672-1497.2019.01.006

    LUO Q, ZHAO Y, YUC, et al. Modeling and simulation of infrared radiation signal of an armored vehicle[J]. Journal of Armored Force Engineering College, 2019, 33(1): 31-36. DOI: 10.3969/j.issn.1672-1497.2019.01.006

    [4]

    DONG X, HUANG X, ZHENG Y, et al. A novel infrared small moving target detection method based on tracking interest points under complicated background[J]. Infrared Phys. Technol., 2014, 65: 36-42. DOI: 10.1016/j.infrared.2014.03.007

    [5]

    HE Y, LI M, ZHANG J, et al. Small infrared target detection based on low-rank and sparse representation[J]. Infrared Phys. Technol. , 2015, 68: 98-109. DOI: 10.1016/j.infrared.2014.10.022

    [6]

    GUO J, Hsia C, LIU Y, et al. Fast background subtraction based on a multilayer codebook model for moving object detection[C]//IEEE Transactions on Circuits and Systems for Video Technology, 2013, 23(10): 1809-1821.

    [7] 彭博, 臧笛. 基于深度学习的红外车辆识识别方法研究[J]. 计算机科学, 2015, 42(4): 268-273.

    PENG Bo, ZANG Di. Vehicle logo recognition based on deep learning[J]. Computer Science, 2015, 42(4): 268-273.

    [8]

    XIA K J, CHENG J, TAO D, et al. Liver detection algorithm based on an improved deep network combined with edge perception[J]. IEEE ACCESS, 2019, 12: 175135-17514. http://ieeexplore.ieee.org/document/8901142

    [9]

    Redmon J, Farhadi A. YOLO9000: Better, Faster, Stronger[C]//IEEE Conference on Computer Vision and Pattern Recognition, 2017: 6517-6525.

    [10]

    YU Z, FENG C, LIU M Y, et al. CASENet: Deep category-aware semantic edge detection[C]// Computer Vision & Pattern Recognition of IEEE, 2017: 1761-1770(doi: 10.1109/CVPR.2017.191).

    [11]

    Neubeck A, Gool L V. Efficient non-maximum suppression[C]// International Conference on Pattern Recognition, IEEE Computer Society, 2006: 850-855.

    [12] 焦安波, 何淼, 罗海波. 一种改进的HED网络及其在边缘检测中的应用[J]. 红外技术, 2019, 41(1): 72-77. http://hwjs.nvir.cn/article/id/hwjs201901011

    JIAO Anbo, HE Miao, LUO Haibo. Research on significant edge detection of infrared image based on deep learning[J]. Infrared Technology, 2019, 41(1): 72-77. http://hwjs.nvir.cn/article/id/hwjs201901011

    [13] 杨眷玉. 基于卷积神经网络的物体识别研究与实现[D]. 西安: 西安电子科技大学, 2016.

    YANG J. Research and Implementation of Object Detection Based on Convolutional Neural Networks[D]. Xi'an: Xidian University, 2016.

    [14] 丁文秀, 孙悦, 闫晓星. 基于分层深度学习的鲁棒行人分类[J]. 光电工程, 2015, 42(9): 21-27. https://www.cnki.com.cn/Article/CJFDTOTAL-GDGC201509005.htm

    DING W, SUN Y, YAN Xiaoxing. Robust pedestrian classification based on hierarchical deep learning[J]. Opto-Electronic Engineering, 2015, 42(9): 21-27. https://www.cnki.com.cn/Article/CJFDTOTAL-GDGC201509005.htm

    [15]

    CHEN S, CHEN Z, XU X, et al. Nv-Net: efficient infrared image segmentation with convolutional neural networks in the low illumination environment[J]. Infrared Physics & Technology, 2020, 105: 103184. http://www.sciencedirect.com/science/article/pii/S1350449519310357

    [16]

    HOSANG J, BENENSON R, SCHIELE B. A convnet for non-maximum suppression[C]//German Conference on Pattern Recognition, Cham: Springer, 2016: 192-204.

    [17]

    REDMON J, FARHADI A. YOLO9000: Better, faster, stronger[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, New York: IEEE Press, 2017: 7263-7271.

    [18]

    LIU W, ANGUELOV D, ERHAN D, et al. SSD: single shot multibox detector[C]//European Conference on Computer Vision. Cham: Springer, 2016: 21-37.

    [19]

    HUANG G, LIU Z, VAN DER MAATEN L, et al. Densely connected convolutional networks[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017: 4700-4708.

    [20]

    HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016: 770-778.

  • 期刊类型引用(2)

    1. 武凌霄,康家银,姬云翔. NSST域下基于引导滤波与稀疏表示的红外与可见光图像融合. 红外技术. 2023(09): 915-924 . 本站查看
    2. 卜文华,孙学景. 基于PCANet网络和偏最小二乘回归的大米鉴别和水分检测. 粮食与饲料工业. 2023(05): 58-63 . 百度学术

    其他类型引用(3)

图(6)  /  表(3)
计量
  • 文章访问数: 
  • HTML全文浏览量: 
  • PDF下载量: 
  • 被引次数: 5
出版历程
  • 收稿日期:  2020-05-09
  • 修回日期:  2020-09-02
  • 刊出日期:  2021-08-19

目录

/

返回文章
返回