基于全卷积网络的红外弱小目标检测算法

杨其利; 周炳红; 郑伟; 李明涛

基于全卷积网络的红外弱小目标检测算法

杨其利^{1, 2,},
周炳红^1, ,,
郑伟¹,
李明涛¹

1.
中国科学院国家空间科学中心，北京 100190
2.
中国科学院大学，北京 100049

基金项目:

北京市重大科技专项 Z181100002918004

详细信息

作者简介:
杨其利（1992-），男，硕士研究生，从事深度学习/弱小目标检测方面的研究。E-mail：yangqili17@mails.ucas.ac.cn

通讯作者:
周炳红（1976-），男，研究员，博士生导师，从事飞行器设计/小天体探测与防御研究。E-mail：bhzhou@nssc.ac.cn

中图分类号: TP391.4
计量
- 文章访问数: 629
- HTML全文浏览量: 88
- PDF下载量: 119
出版历程
- 收稿日期: 2020-02-12
- 修回日期: 2020-03-25
- 刊出日期: 2021-04-19

Small Infrared Target Detection Based on Fully Convolutional Network

1.
National Space Science Center, Chinese Academy of Sciences, Beijing 100190, China
2.
University of Chinese Academy of Sciences, Beijing 100049, China

摘要

摘要: 在小天体探测、导弹制导和战场侦察等航空航天领域，由于目标信号较弱，占有像素数少，缺少目标形状和纹理信息，使用手工特征提取的传统算法容易出现大量虚警，而拥有强大特征提取能力的深度学习算法无法对微小且缺乏轮廓信息的目标训练。本文采用了滑动窗口取样训练，它源自基于人类视觉特性的传统目标检测算法中嵌套结构的思想，设计了一种使用递归卷积层的全卷积网络，在不增加额外训练参数的情况下，扩展了模型的网络深度，该网络的并行卷积结构的多个分支网络模拟了传统算法的多尺度操作，有利于在复杂环境中增强目标和背景之间的对比度，并且设计使用了多种损失函数的组合，以对抗正负样本严重不平衡的问题。实验结果表明：该方法实现了比传统方法更好的检测效果，为此领域的研究者们提供了一个新的思路和解决途径。
- 红外图像 /
- 弱小目标检测 /
- 递归卷积 /
- 全卷积网络 /
- 背景抑制
Abstract: In the field of aerospace research, such as in small celestial body detection, missile guidance, and battlefield reconnaissance, because the target signal is weak, the number of pixels occupied is small, and the target lacks shape structure and texture information, traditional algorithms with manual feature extraction are prone to false alarms, whereas deep learning methods with powerful feature extraction capabilities cannot train tiny targets that lack contour information. In this context, a sliding window sampling training method is adopted, which originates from the idea of nested structures in traditional algorithms based on human visual characteristics. A fully convolutional network using recursive convolutional layers is designed to extend the depth of the network without increasing the training parameters. The multi-branch structure of the network's parallel convolution structure simulates the multi-scale operation of the traditional algorithm, which can enhance the contrast between the target and the background. Additionally, various loss functions are designed to combat the serious imbalance between positive and negative samples. The results show that the algorithm achieves a better detection performance than the traditional algorithms.
- infrared image /
- dim and small target detection /
- recursive convolutional layers /
- fully convolutional network /
- background suppression

HTML全文

0. 引言

偏振成像^[1]是一种新型的光学成像手段，能够获取多个偏振方向图像，通过偏振信息解析，能够实现同场景多个不同偏振方向图像来表征目标的偏振信息，从而实现对目标的检测。偏振信息解析是偏振成像中的重要环节，目前有很多学者针对不同的应用场景提出了多种偏振信息解析的方法^[2-5]，其中，沈洁^[6]等人根据螳螂虾的复眼能充分利用偏振信息实现水下复杂环境的猎物捕获，提出了基于拮抗机制的偏振仿生信息解析方法，将0°、45°、90°、135°四个偏振方向图像分成2组拮抗图像，通过使2组图像的拮抗信息熵最大来获得偏振方向图像的加权系数，得到偏振拮抗图像，从而实现水下目标探测。但这种方法本质是偏振方向图像间的线性操作，存在计算效率低、解析结果不确定、目标不够突出等问题。

深度学习具有强大的表征能力，可以从高维、复杂以及非线性数据中提取有用的特征，目前在很多领域都有着广泛的应用，如自然语言处理^[7]、语音识别^[8]、图像处理^[9]等。Li^[10]等人提出一种基于卷积神经网络（Convolutional Neural Networks，CNN）和残差神经网络（Residual Networks，ResNets）的深度学习架构，用于红外和可见光图像的融合，较好地突显了目标信息，并解决了传统的基于CNN中随着网络深度增加特征信息退化的问题。

偏振图像拮抗过程属于偏振方向图像融合的范畴，本文充分利用深度学习在图像处理上的优势，提出了一种偏振方向图像的双支路拮抗融合网络，主要包括特征提取、特征融合和特征转化3个模块，输入4个不同方向的偏振图像，分成两个支路，低频支路通过合成图像来减少能量的损失，高频支路通过差分图像来突显图像的细节信息。将两个支路处理的结果分别通过深度融合网络进行处理，获取效果更好的融合图像，提高后续目标检测与识别效果。

1. 基本原理

1.1 分焦平面型偏振成像

偏振成像需要获取多个偏振方向图像，常用的获取方式可以分为：分时型、分振幅型、分孔径型和分焦平面型。相对于其他的成像方式，分焦平面型偏振成像具有体积小、重量轻、成本低、能同时获取多个偏振方向图像等优点，成为目前偏振成像获取方法的主流。其基本原理是：在探测器的芯片上集成微型偏振分析器（如图 1所示），在探测器的每4个像元上，耦合0°、45°、90°、135°等4个线偏振方向的偏振分析器，利用4个像元实现1个像素的偏振信息采集。按照微型偏振分析器排列顺序，对探测器输出图像进行重新整合，即可得到0°、45°、90°、135°四个偏振方向图像，如图 2(a)~(d)所示。

图 1 分焦片面型偏振成像原理

Figure 1. Polarization image split-focus planar principle

下载: 全尺寸图片幻灯片

图 2 0°、45°、90°和135°的偏振方向图和合成强度图

Figure 2. Polarization and intensity pictures of 0°, 45°, 90°and 135°

下载: 全尺寸图片幻灯片

利用偏振成像理论，可以得到合成强度图像I^[6]，如图 2(e)所示：

$$ I=I\left(0^{\circ}\right)+I\left(90^{\circ}\right) $$

(1)

1.2 仿生偏振拮抗图像

根据螳螂虾复眼的偏振拮抗机制^[6]，一对正交偏振图像的输入可以形成一个拮抗，如0°和90°偏振方向图像、45°和135°偏振方向图像，将采集到的4组正交偏振图像形成4个偏振拮抗通道，每个通道由相互正交的一对偏振信号组成，各组拮抗信号通过拮抗运算方式可以得到偏振拮抗图像，如下所示：

$$ S_{\mathrm{d}}=k_1 \times I\left(45^{\circ}\right)-k_2 \times I\left(135^{\circ}\right) $$

(2)

$$ S_{\mathrm{dd}}=k_3 \times I\left(135^{\circ}\right)-k_4 \times I\left(45^{\circ}\right) $$

(3)

$$ S_{\mathrm{h}}=k_5 \times I\left(0^{\circ}\right)-k_6 \times I\left(90^{\circ}\right) $$

(4)

$$ S_{\mathrm{v}}=k_7 \times I\left(90^{\circ}\right)-k_8 \times I\left(0^{\circ}\right) $$

(5)

式中：I(0°)、I(90°)、I(45°)和I(135°)分别表示0°、90°、45°和135°的偏振方向图像，k_i(i＝1, …, 8)为拮抗系数，起到对图像的增强和抑制作用，k的取值范围由人为设定，k_m≥1(m＝1, 3, 5, 7)，0＜k_n≤1(n＝2, 4, 6, 8)，文献[6]中k是通过遍历所有范围内可能的值，求取偏振拮抗图像信息熵最大来确定，存在计算效率低、结果不确定的问题，使得求取的偏振拮抗图像目标可能不够突出。

1.3 基于深度学习的图像融合

图像融合就是通过处理不同传感器所拍摄的源图像，提取有用的信息或特征，将其整合来改善图像的品质和清晰度^[11]。传统图像融合需要人工提取特征，指定融合规则，而基于深度学习的图像融合，利用深度网络对输入图像进行卷积，提取出目标高层特征，再利用卷积将融合后特征转换为融合图像，如图 3所示。相对于可监督图像融合的方法，无监督的方法通过约束融合图像和原图像之间的相似性，克服了大多数图像融合中无参考度量的普遍问题。

图 3 深度学习图像融合网络一般过程

Figure 3. General process of deep learning image fusion network

下载: 全尺寸图片幻灯片

2. DANet网络设计

2.1 网络结构

由偏振成像机理可知，每个偏振方向图像能量损失一半。为了提高融合后的图像的亮度，如图 4所示，我们设计了一个低频支路，将4个偏振方向图像通过Concat操作进行连接输入，用于提取每个偏振方向图像的低频特征；根据Tyo^[12]的研究结论，偏振差分成像可以突显目标细节信息，因此本文设计了另一个高频支路，将2组拮抗图像进行差分输入，用于提取差分图像的目标高频特征。Huang^[13]等人提出了一种密集块结构，其中使用了从任何层到所有后续层的直接连接。这种体系结构可以保存尽可能多的信息，该模型可以改善网络中的信息流和梯度，使网络易于训练，同时，密集连接具有正则化效果，减少了任务的过拟合。受此启发，本文将密集连接加入到差分图像细节特征提取中，用于降低细节信息的损失。设计的网络结构主要包括特征提取、特征融合和特征转化3个模块。

图 4 偏振拮抗融合网络

Figure 4. Polarization antagonistic fusion network

下载: 全尺寸图片幻灯片

图 4中，特征融合模块将两个支路提取的特征图进行对应像素融合，得到融合特征，特征转化模块利用1×1卷积将融合的特征整合得到输出图像。低频和高频支路均有3个3×3的卷积层，网络参数如表 1所示。

表 1 网络参数

Table 1. Network parameters

	Layer		Input channel	Output channel
Feature extraction	Low frequency	Conv1	4	128
		Conv2	128	64
		Conv3	64	50
	High frequency	Conv4	2	16
		Conv5	18	16
		Conv6	34	50
Feature fusion	Fusion		50	50
Feature transformation	Conv7		50	1

下载: 导出CSV

| 显示表格

2.2 损失函数

在偏振拮抗图像获取中，利用信息熵最大作为评价标准^[6]，因此本文将信息熵损失L_entropy加入到损失函数中，用于增大融合图像的信息量；结构相似性度量方法作为图像领域使用最广泛的指标之一，该方法基于图像的亮度、对比度和结构3部分来衡量图像之间的相似性，本文将结构相似性损失L_ssim加入到损失函数中，用于保持融合图像结构特征；感知损失通常用于图像重建中，恢复出来的图像视觉效果较好，本文将感知损失L_perceptural加入到损失函数中，用于提高融合图像的人眼视觉效果。因此，本文的损失函数L计算公式如下：

$$ L=L_{\text {entropy }} \times \sigma+L_{\text {ssim}} \times \beta+L_{\text {perceptural }} \times \gamma $$

(6)

式中：σ、β、γ为各损失的权重，本文分别取0.1、10、0.1。

1）信息熵损失L_entropy

信息熵（Information Entropy，IE）越大，图像包含的信息越多，为使融合图像信息熵最大，信息熵损失L_entropy定义为：

$$ {L_{{\text{entropy}}}} = \frac{1}{{{\text{IE}} + \varepsilon }} $$

(7)

$$ {\text{IE}} = - \sum\limits_{i = 1}^n {p\left( {{x_i}} \right)\log p\left( {{x_i}} \right)} $$

(8)

式中：ε为极小量；x_i为随机变量；p(x_i)为输出概率函数；n为灰度等级。

2）结构相似性损失L_ssim

结构相似性（structural similarity index，SSIM）用于度量两幅图像的相似度，结构相似性损失L_ssim定义为：

$$ L_{\text {ssim }}=1-\operatorname{SSIM}(\text { output, } I \text { ) } $$

(9)

式中：SSIM(⋅)表示结构相似性运算；output为输出图像；I为强度图像。

3）感知损失L_perceptural

$$ {L_{{\text{perceptural}}}} = \left\| {{\varPhi _i}\left( {{\text{output}}} \right), {\varPhi _i}\left( I \right)} \right\|_2^2 $$

(10)

式中：Φ_i(⋅)为VGG16网络第i层特征图。

3. 实验与分析

3.1 实验环境与数据

实验环境如下：训练与测试图像集采用处理器为11th Gen Intel(R) Core(TM) i7-11800H @ 2.30 GHz，系统运行内存为32 GB，GPU显卡为8 GB显存容量的NVIDIA GeForce RTX3080的图形工作站。训练软件运行环境为Python3.9，编程框架为Torch 1.11.0，搭建Cuda10.0用于实验加速。

本文采用LUCID公司的分焦平面型偏振相机（型号：PHX050S-P），如图 5所示。该相机能够同时获取0°、45°、90°、135°四个偏振方向图像，图像分辨率为2448×2048。我们拍摄采集了多种场景目标的9320组偏振方向图像，构建出本文的数据集。

图 5 LUCID的分焦平面型偏振相机

Figure 5. LUCID 's split-focus planar polarization camera

下载: 全尺寸图片幻灯片

3.2 评价指标及训练参数

本文采用主观定性和客观定量相结合的方法对融合图像进行综合评价，主观评价主要通过人眼观察图像亮度和细节信息，客观评价采用平均梯度^[14]、信息熵^[15]、空间频率^[16]、均值^[17]等4个评价指标，定量评估融合效果。

1）平均梯度（Average Gradient，AG）

平均梯度能有效反映出图像层次信息，其值越大，图像层次越丰富，其计算公式为：

$$ \begin{array}{l} {\text{AG}} = \frac{1}{{\left( {M - 1} \right)\left( {N - 1} \right)}} \times \hfill \\ \quad \quad \sum\limits_{i = 1}^{M - 1} {\sum\limits_{j = 1}^{N - 1} {\sqrt {\frac{{{{\left[ {F\left( {i, j} \right) - F\left( {i + 1, j} \right)} \right]}^2} + {{\left[ {F\left( {i, j} \right) - F\left( {i, j + 1} \right)} \right]}^2}}}{2}} } } \hfill \\ \end{array} $$

(11)

式中：F(i, j)为图像的第i行、第j列的灰度值；M、N分别为图像的总行数和总列数。

2）空间频率（Spatial Frequency，SF）

空间频率是图像质量经典的标准之一，其值越大，代表图像质量越高，越清晰，其计算公式为：

$$ {\text{SF}} = \sqrt {{\text{R}}{{\text{F}}^2} + {\text{C}}{{\text{F}}^2}} $$

(12)

$$ {\text{RF}} = \sqrt {\frac{1}{{MN}}\sum\limits_{i = 1}^M {\sum\limits_{j = 2}^N {\left[ {{I_{\text{p}}}\left( {i, j} \right) - {I_{\text{p}}}\left( {i, j - 1} \right)} \right]} } } $$

(13)

$$ {\text{CF}} = \sqrt {\frac{1}{{MN}}\sum\limits_{i = 2}^M {\sum\limits_{j = 1}^N {\left[ {{I_{\text{p}}}\left( {i, j} \right) - {I_{\text{p}}}\left( {i - 1, j} \right)} \right]} } } $$

(14)

式中：RF是行频率；CF是列频率；M、N为图片的宽高；I_p(i, j)为图像在(i, j)处的像素值。

3）图像均值（Image Mean，IM）

均值即图像像素的平均值，反应图像的平均亮度，平均亮度越大，能量越高，其计算公式为：

$$ {\text{IM}} = \sum\limits_{k = 0}^{L - 1} {{z_k}p\left( {\frac{{{n_k}}}{{MN}}} \right)} $$

(15)

式中：z_k为图像的第k个灰度级；L表示图像的灰度等级数目；n_k是z_k在图像中出现的次数。

本文数据集共计9320组，其中训练集和测试集按照9:1划分，算法的模型由Adam optimizer训练，训练轮次为20，初始学习率为1e^－4，每训练4轮学习率衰减一半，详细参数如表 2所示。

表 2 训练参数

Table 2. Training parameters

Parameters	Values
Training set	8388
Testing set	932
Training round	20
Epoch	4
Optimizer	Adam
Activation function	ReLU
Initial learning rate	1e^－4
Learning rate decay rate	0.5*lr/4 round

下载: 导出CSV

| 显示表格

3.3 实验结果分析

为了验证本文算法的有效性，从测试集中随机选取了4组数据，每组数据包含0°、45°、90°和135°偏振方向图像，第1组为室内沙地伪装板目标，第2组为室内标定装置目标，第3组为室外草地伪装板，第4组为水下珊瑚目标，如图 6所示。

图 6 输入的0°、45°、90°和135°偏振方向图像

Figure 6. 0°, 45°, 90° and 135° polarization direction images of input

下载: 全尺寸图片幻灯片

将上述数据输入到本文训练好的模型中，得到对应的融合图像，根据公式(1)~(5)分别得到合成强度图像I、偏振拮抗图像S_d、S_dd、S_h、S_v，如图 7所示。

图 7 结果对比图

Figure 7. Results comparison diagram

下载: 全尺寸图片幻灯片

从图 7可以看出，本文的融合图像亮度最高，能量最大，说明网络中的低频支路对图像能量的提升效果明显，有效解决了偏振成像中能量降低的问题。从图像细节来说，融合图像的细节效果有较为明显的提升，如第1组本文融合图像中的沙粒更加有颗粒感，伪装板的边缘更加突出，第2组本文融合图像中标定装置的线缆显现出来，背景板的线条更加清晰，而其他图像不太明显，第3组本文融合图像的3块伪装板全部从背景中区分出来，而其他图像只有部分能够区分开，第4组本文融合图像中，珊瑚整体目更亮，珊瑚边缘也更明晰。由于图像能量提升较为明显，可能会造成目标的对比度有所下降，如第一组本文融合图像的伪装板的对比度相较于S_d图和S_h图有所下降，但不影响目标整体的检测效果。

本文将测试集中932组图像输入到模型中，得到对应的932幅融合图像，并根据公式(1)~(5)分别得到932幅合成强度图像I和相应的偏振拮抗图像S_d、S_dd、S_h、S_v。利用平均梯度（AG）、信息熵（IE）、空间频率（SF）和图像灰度均值（IM）指标对其计算均值并进行评价，如表 3所示。

表 3 输出结果的各项评价指标

Table 3. Evaluation indexes of the output results

	I	S_d	S_dd	S_h	S_v	DANet
AG	0.0099	0.0128	0.0119	0.0144	0.0126	0.0185
IE	6.06	6.18	6.08	6.15	6.39	7.04
SF	0.35	0.49	0.40	0.46	0.45	0.64
IM	41	49	47	46	57	93

下载: 导出CSV

| 显示表格

从表 3中可以看出，在4个评价指标上，本文的方法都是最高的，在平均梯度上最少提高了22.16%，最多提高了46.49%；在信息熵上最少提高了9.23%，最多提高了13.92%；在空间频率上最少提高了23.44%，最多提高了45.31%；在图像灰度均值上最少提高了38.71%，最多提高了55.91%。实验结果表明，本文方法得到的融合图像亮度更高，包含的信息量更丰富，可以显现出更多的细节信息。

4. 结论

针对偏振方向图像融合效果不明显的问题，本文提出了一种基于双支路拮抗融合网络的偏振信息解析方法，可以解决现有基于拮抗机制的仿生偏振信息解析方法中存在计算效率低、解析结果不确定、目标不够突出等问题，为偏振信息解析提供了一个新的技术途径。本文设计的DANet主要包括特征提取、特征融合和特征转化3个模块。首先，特征提取模块由低频支路和高频支路组成，将0°、45°、90°和135°偏振方向图像连接输入到低频支路，提取能量特征，将2组拮抗图像差分输入到高频支路，提取图像细节特征；其次，将得到的能量特征和细节特征进行特征融合；最后，将融合后的特征转化整合为融合图像。实验表明，通过DANet得到的融合图像在视觉效果和评价指标上均有较为显著提升，在平均梯度、信息熵、空间频率和图像灰度均值上分别至少提升了22.16%、9.23%、23.44%、38.71%。下一步，我们将进一步优化网络结构，以平衡能量支路和细节支路，改善融合图像的对比度；加大水下偏振方向图像在数据集中的比重，优化数据集。

图 1 滑动窗口为3，滑动步长为2的取样窗口示意图

Figure 1. The illustration of sampling window with size 3 and sliding step with 2

下载: 全尺寸图片幻灯片

图 2 普通网络（左）和残差块网络^[10]（右）

Figure 2. Left: general network, Right: residual network^[10]

下载: 全尺寸图片幻灯片

图 3 递归模块的展开结构，相同卷积参数应用不同递归层

Figure 3. Unfolding recursive module, the same filter W is applied to feature maps recursively

下载: 全尺寸图片幻灯片

图 4 F-CNN网络结构图

Figure 4. An illustration of the F-CNN architecture

下载: 全尺寸图片幻灯片

图 5 弱小目标仿真数据集

Figure 5. Simulated dataset of infrared small targets

下载: 全尺寸图片幻灯片

图 6 不同检测方法在5张测试图像上的滤波结果，矩形框表示目标，圆圈表示滤波后的噪声

Figure 6. The representative results of different methods on five test images, the rectangles denote the targets and the circles are representative examples of noise

下载: 全尺寸图片幻灯片

图 7 不同检测方法在红外图像上的滤波结果，矩形框表示目标，圆圈表示滤波后的噪声

Figure 7. Different methods on infrared images, the rectangles denote the targets and the circles are representative examples of noise

下载: 全尺寸图片幻灯片

表 1 本文使用的F-CNN网络结构

Table 1 F-CNN architecture for semantic segmentation

Layers	Output size	Layer configurations
Feature extraction	48×48	$\begin{gathered} \left[ {\begin{array}{*{20}{c}} {3 \times 3, 32} \\ {3 \times 3, 16} \end{array}} \right] \times 2 \\ \left[ {3 \times 3, 32} \right] \times 1 \\ \end{gathered} $
Recursive block	48×48	$\left[ {3 \times 3, 32} \right] \times 4$
Reconstruction module	48×48	$\left[ {\begin{array}{*{20}{c}} {3 \times 3, 32} \\ {3 \times 3, 32} \\ {3 \times 3, 16} \\ {3 \times 3, 2} \end{array}} \right] \times 1$

下载: 导出CSV

表 2 无人机测试图像的SCR值和目标像素数

Table 2 The SCR and target size of UAV test images.

Test images	Image 1	Image 2	Image 3	Image 4	Image 5
SCR	4.009	2.337	8.378	4.411	2.976
Target size/Pixel	15	25	12	13	28

下载: 导出CSV

表 3 不同方法对图 6第一列测试图像滤波结果的SCRG和BSF值

Table 3 The evaluation results of SCRG and BSF of different methods for images in the first column in Fig. 6

Methods	Image 1		Image 2		Image 3		Image 4		Image 5
Methods	BSF	SCRG	BSF	SCRG	BSF	SCRG	BSF	SCRG	BSF	SCRG
MS-AAGD	0.596	6.908	0.639	5.272	0.298	3.440	0.690	6.764	0.952	6.178
LoG	0.193	1.526	0.773	4.517	0.099	1.030	0.243	1.791	0.306	2.379
MPCM	0.793	8.577	1.395	8.202	0.358	3.547	0.732	7.201	0.985	6.401
F-CNN	0.875	8.655	1.419	13.684	0.305	3.694	0.764	8.821	1.195	11.137

下载: 导出CSV

表 4 不同方法对图 7中红外图像滤波结果的SCRG和BSF值

Table 4 The evaluation results of SCRG and BSF of different methods for infrared images in Fig. 7

Methods	Image 1		Image 2		Image 3				Image 4
Methods	BSF	SCRG	BSF	SCRG	BSF	SCRG	BSF	SCRG	BSF	SCRG
MS-AAGD	2.110	11.483	0.712	18.757	1.872	3.998	2.56	6.298	1.091	16.575
LoG	0.853	4.967	0.473	15.559	1.279	3.042	1.358	3.408	0.241	4.298
MPCM	1.758	12.399	2.011	96.279	1.984	4.088	4.142	8.333	0.966	18.781
F-CNN	2.485	16.337	3.314	63.100	1.710	5.407	2.465	10.528	2.404	15.440

下载: 导出CSV

参考文献(14)

[1]	DESHPANDE S D, ER M H, VENKATESWARLU R, et al. Max-mean and max-median filters for detection of small targets[C]//Proceedings of SPIE, 1999, 3809: 74-83.
[2]	ZENG M, LI J X, PENG Z, et al. The design of top-hat morphoLoGical filter and application to infrared target detection[J]. Infrared Physics and Technology, 2006, 48(1): 67-76. DOI: 10.1016/j.infrared.2005.04.006
[3]	YANG L, YANG J, YANG K, et al. Adaptive detection for infrared small target under sea–sky complex background[J]. Electronics Letters, 2004, 40(17): 1083-1085. DOI: 10.1049/el:20045204
[4]	HILLIARD C I. Selection of a clutter rejection algorithm for real-time target detection from an airborne platform[C]//Proceedings of SPIE, 2000, 4048: 74-84.
[5]	REED I, GAGLIARDI R, STOTTS L, et al. Optical Moving Target Detection with 3-D Matched Filtering[J]. IEEE Transactions on Aerospace and Electronic Systems, 1988, 24(4): 327–336. DOI: 10.1109/7.7174
[6]	WEI Y T, YOU X G, LI H, et al. Multiscale patch-based contrast measure for small infrared target detection[J]. Pattern Recognition, 2016, 58: 216-226. DOI: 10.1016/j.patcog.2016.04.002
[7]	DENG H, SUN X P, LIU M L, et al. Infrared small-target detection using multiscale graydiﬀerence weighted image entropy[J]. IEEE Transactions on Aerospace and Electronic Systems, 2016, 52(1): 60-72. DOI: 10.1109/TAES.2015.140878
[8]	KIM S H, LEE J Y. Scale invariant small target detection by optimizing signal-to-clutter ratio in heterogeneous background for infrared search and track[J]. Pattern Recognition, 2012, 45: 393-406. DOI: 10.1016/j.patcog.2011.06.009
[9]	沈旭, 程小辉, 王新政. 结合视觉注意力机制基于尺度自适应局部对比度增强的红外弱小目标检测算法[J]. 红外技术, 2019, 41(8): 764-771. http://hwjs.nvir.cn/article/id/hwjs201908012 SHEN X, CHENG X H, WANG X ZH. Infrared dim-small object detection algorithm based on adaptive scale local constrast enhancement combined with visual attention mechanism[J]. Infrared Technology, 2019, 41(8): 764-771. http://hwjs.nvir.cn/article/id/hwjs201908012
[10]	HE K M, ZHANG X Y, REN S Q, et al. Deep residual learning for image recognition[C]//Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition, New York: 2016: 770-778.
[11]	KIM J, LEE J K, Lee K M, et al. Deeply-recursive convolutional network for image super-resolution[C]//Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition, New York: 2016: 1637-1645.
[12]	LI J, YE D H, CHUNG T, et al. Multi-target detection and tracking from a single camera in unmanned aerial vehicles (UAVs)[C] //Proceedings of 2016 IEEE/RSJ International Conference on Intelligent Robots and Systems, 2016: 4992-4997.
[13]	GAO C, ZHANG T, LI Q, et al. Small infrared target detection using sparsering representation[J]. IEEE Aerospace and Electronic Systems Magazine, 2012, 27(3): 21-30. DOI: 10.1109/MAES.2012.6196254
[14]	QU X J, CHEN H, PENG G H, et al. Novel detection method for infrared smalltargets using weighted information entropy[J]. Journal of Systems Engineering and Electronics, 2012, 23(6): 838-842. DOI: 10.1109/JSEE.2012.00102

施引文献(2)

期刊类型引用(2)

1.	肖文健，王彦斌，蒋成龙，周旋风，张德锋. 复杂场景下红外探测系统性能分析与建模. 红外技术. 2025(01): 29-35+43 . 本站查看
2.	黄振，江伦，胡赫，张明，李奇，宋延嵩，董科研. 气动热辐射对超音速状态下的导引头红外成像的影响分析. 激光与光电子学进展. 2023(02): 55-62 . 百度学术

其他类型引用(0)

资源附件(0)

图(7) / 表(4)

计量

文章访问数: 629
HTML全文浏览量: 88
PDF下载量: 119
被引次数: 2

0. 引言
1. 基本原理
1.1 分焦平面型偏振成像
1.2 仿生偏振拮抗图像
1.3 基于深度学习的图像融合
2. DANet网络设计
2.1 网络结构
2.2 损失函数
3. 实验与分析
3.1 实验环境与数据
3.2 评价指标及训练参数
3.3 实验结果分析
4. 结论

基于全卷积网络的红外弱小目标检测算法

作者简介: 杨其利（1992-），男，硕士研究生，从事深度学习/弱小目标检测方面的研究。E-mail：yangqili17@mails.ucas.ac.cn

通讯作者: 周炳红（1976-），男，研究员，博士生导师，从事飞行器设计/小天体探测与防御研究。E-mail：bhzhou@nssc.ac.cn

计量

出版历程