Infrared-PV:面向监控应用的红外目标检测数据集

陈旭, 吴蔚, 彭冬亮, 谷雨

陈旭, 吴蔚, 彭冬亮, 谷雨. Infrared-PV:面向监控应用的红外目标检测数据集[J]. 红外技术, 2023, 45(12): 1304-1313.
引用本文: 陈旭, 吴蔚, 彭冬亮, 谷雨. Infrared-PV:面向监控应用的红外目标检测数据集[J]. 红外技术, 2023, 45(12): 1304-1313.
CHEN Xu, WU Wei, PENG Dongliang, GU Yu. Infrared-PV: an Infrared Target Detection Dataset for Surveillance Application[J]. Infrared Technology , 2023, 45(12): 1304-1313.
Citation: CHEN Xu, WU Wei, PENG Dongliang, GU Yu. Infrared-PV: an Infrared Target Detection Dataset for Surveillance Application[J]. Infrared Technology , 2023, 45(12): 1304-1313.

Infrared-PV:面向监控应用的红外目标检测数据集

基金项目: 

浙江省自然科学基金资助项目 LY21F030010

详细信息
    作者简介:

    陈旭(1997-),男,硕士研究生,主要从事图像目标识别、检测与模型优化研究

    通讯作者:

    谷雨(1982-),男,博士,副教授,主要从事多源信息融合、遥感图像目标检测与识别方面的研究。E-mail: guyu@edu.hdu.cn

  • 中图分类号: TP391.9

Infrared-PV: an Infrared Target Detection Dataset for Surveillance Application

  • 摘要: 红外摄像机虽然能够全天候24 h工作,但是相比于可见光摄像机,其获得的红外图像分辨率和信杂比低,目标纹理信息缺乏,因此足够的标记图像和进行模型优化设计对于提高基于深度学习的红外目标检测性能具有重要意义。为解决面向监控应用场景的红外目标检测数据集缺乏的问题,首先采用红外摄像机采集了不同极性的红外图像,基于自研图像标注软件实现了VOC格式的图像标注任务,构建了一个包含行人和车辆两类目标的红外图像数据集(Infrared-PV),并对数据集中的目标特性进行了统计分析。然后采用主流的基于深度学习的目标检测模型进行了模型训练与测试,定性和定量分析了YOLO系列和Faster R-CNN系列等模型对于该数据集的目标检测性能。构建的红外目标数据集共包含图像2138张,场景中目标包含白热、黑热和热力图3种模式。当采用各模型进行目标检测性能测试时,Cascade R-CNN模型性能最优,mAP0.5值达到了82.3%,YOLO v5系列模型能够兼顾实时性和检测精度的平衡,推理速度达到175.4帧/s的同时mAP0.5值仅降低2.7%。构建的红外目标检测数据集能够为基于深度学习的红外图像目标检测模型优化研究提供一定的数据支撑,同时也可以用于目标的红外特性分析。
    Abstract: Although infrared cameras can operate day and night under all-weather conditions compared with visible cameras, the infrared images obtained by them have low resolution and signal-to-clutter ratio, lack of texture information, so enough labeled images and optimization model design have great influence on improving infrared target detection performance based on deep learning. First, to solve the lack of an infrared target detection dataset used for surveillance applications, an infrared camera was used to capture images with multiple polarities, and an image annotation task that outputted the VOC format was performed using our developed annotation software. An infrared image dataset containing two types of targets, person and vehicle, was constructed and named infrared-PV. The characteristics of the targets in this dataset were statistically analyzed. Second, state-of-the-art target detection models based on deep learning were adopted to perform model training and testing. Target detection performances for this dataset were qualitatively and quantitatively analyzed for the YOLO and Faster R-CNN series detection models. The constructed infrared dataset contained 2138 images, and the targets in this dataset included three types of modes: white hot, black hot, and heat map. In the benchmark test using several models, Cascade R-CNN achieves the best performance, where mean average precision when intersection over union exceeding 0.5 (mAP0.5) reaches 82.3%, and YOLOv5 model can achieve the tradeoff between real-time performance and detection performance, where inference time achieves 175.4 frames per second and mAP0.5 drops only 2.7%. The constructed infrared target detection dataset can provide data support for research on infrared image target detection model optimization and can also be used to analyze infrared target characteristics.
  • 随着红外制导技术的不断发展,装有红外传感器的导弹是飞机的最主要威胁,据统计,1973-2001年有49%的飞机损失来自红外导弹,其中1984-2001年90%的飞机损失来自红外导弹[1-2]。为保护飞机免受红外制导导弹的攻击,红外干扰弹应运而生,现今发展的红外干扰弹包括多点源红外干扰弹和面源红外干扰弹。多点源红外干扰弹依靠烟火药柱产生一个与飞机红外辐射特性类似,但能量大于飞机辐射能量2~10倍的热源,以质心干扰的方式达到欺骗来袭红外制导导弹的目的[3];面源红外干扰弹依靠在空间形成大面积红外辐射云团,使飞机“淹没”在红外辐射云团中,以掩盖飞机自身的红外辐射特征,导致红外导引头无法分辨飞机红外辐射源和面源红外干扰弹辐射源[4-5],飞机采用机动规避的方式逃逸出导引头视场,从而免遭红外制导导弹的攻击;多点源红外干扰弹在空中形成强红外辐射源诱骗红外导引头,面红外辐射源在空中形成大面积红外辐射源掩盖飞机自身的红外辐射源,两者结合,可有效迷惑红外制导导引头,提高载机的自卫对抗能力。

    飞机的红外辐射特性是红外制导导弹识别、捕获、跟踪、摧毁飞机的信号来源,飞机的红外辐射信号主要由机身蒙皮、尾喷管和尾焰组成[4],其中尾焰和尾喷管是飞机红外辐射的主要来源,红外制导导弹从不同方向攻击飞机时,由于方向不同,导致导引头探测目标的辐射强度和辐射面积差异很大,飞机投放干扰弹的时机和种类也不同。因此,探测飞机在不同方向的辐射特征对干扰弹弹种选择具有重要意义。

    本文采用光谱辐射计、中波红外热像仪、长波红外热像仪对飞机在不同方向上的红外辐射性能进行测试,研究飞机发动机工作时在不同方向上的红外辐射性能,指导飞机应对不同方向来袭的红外制导导弹时红外干扰弹投放使用策略。

    选择飞机0°、正侧向90°、尾后180°三个测试角度,选择合适测试点,飞机发动机处于正常工作状态,测试场景示意图如图 1所示,测试距离300 m,飞机包络尺寸为不大于50 m×50 m×10 m,飞机发动机直径不大于1 m,因此,在测试场景下飞机可当作点目标。

    图  1  测试场景示意图
    Figure  1.  Schematic diagram of test scenario

    试验前应对光谱辐射计进行标定,在同一测试条件下,对黑体和被测试目标进行测试,标定对应温度下的黑体温度。

    $$ I(\lambda )=\frac{({V}_{\rm{s}}-{V}_{\rm{b}}){R}^{2}}{({V}_{\rm{BB}}-{V}_{\rm{Bb}}){L}^{2}}\times M({T}_{\rm{BB}})\times \frac{\rm{π}{D}^{4}}{4}$$ (1)

    式中:VsVb分别为飞机的信号、飞机附近的背景信号;VBBVBb分别为黑体的信号、背景信号;R为测试距离;L为黑体标定距离;TBB为黑体温度;M(TBB)为黑体在TBB的光谱辐射出射度;D为光阑口径。

    选定不同方位(迎头、正侧向、尾后),架好仪器设备,发动机处于正常工作状态下,测试飞机的中/长波红外辐射强度、辐射面积。

    辐射计测试时,首先采用标准黑体源对光谱辐射计进行标定,得到光谱辐射计的光谱响应曲线;随后,采用标定后的光谱辐射计对待测对象进行测试,经过光谱强度积分和大气修正得到测试飞机的辐射强度曲线[6]

    按式(2)计算光谱响应系数:

    $$K\left( \lambda \right) = \frac{{\Delta {V_{\rm{c}}}\left( \lambda \right) \cdot {{\left( {{L_{\rm{c}}}} \right)}^2}}}{{{A_{{\rm{bb}}}} \cdot P\left( {\lambda ,{T_{\rm{c}}}} \right)}}$$ (2)

    式中:K(λ)为标定系数,V/(W/(μm·m2));ΔVc(λ)为标定电压,V;Lc为标定距离,m;Abb为黑体腔口面积,m2P(λ, Tc)为黑体的光谱辐亮度,W/(μm·sr·m2);Tc为黑体温度,K。

    按式(3)计算红外辐射强度:

    $$I = \frac{1}{{{\tau _{\rm{a}}}}}\int_{{\lambda _{\min }}}^{{\lambda _{\max }}} {\frac{{\Delta {V_{\rm{m}}}\left( \lambda \right) \cdot {{\left( {{L_{{\rm{ob}}}}} \right)}^2}}}{{K\left( \lambda \right)}}} {\rm{d}}\lambda $$ (3)

    式中:I为辐射强度,W/sr;ΔVm(λ)为测试电压,V;Lob为测试距离,m;λminλmax分别为波段的波长下限和上限,μm;τa为大气透过率(采用Lowtran大气模型根据实时气象条件计算)。

    热像仪测试时,首先采用标准黑体源对热像仪进行标定,得到热像仪的辐射响应定标文件(定期进行);采用热像仪对待测对象进行测试,得到飞机在不同方向上的温度分布图像,根据测试距离、视场角分辨率及图像像元数计算特征辐射面积S

    $$ \mathit{S}{\rm{ = }}{\mathit{n}_{\rm{T}}}{\rm{\cdot}}\mathit{\gamma }{\rm{\cdot}}\mathit{d} $$ (4)

    式中:nT为视场内温度为某特定值或特定范围内的像元数目;γ为仪器角分辨率,rad/像元;d为测试距离,m。可根据需要,提取热像中目标的温度分布特征和目标图像特征。

    1)光谱辐射计测试结果(迎头)

    按照上述测试方法和数据处理方法,对光谱辐射计测试数据进行处理,得到飞机在中长波红外的辐射强度随时间的关系如图 2所示。

    图  2  迎头测试中长波红外辐射强度随时间的关系图
    Figure  2.  Plot of middle-long wave infrared radiation intensity over time in head-on test

    图 2可知,测试时,3~5 μm的光谱辐射强度和8~14 μm的光谱辐射强度值均较低,这是由于测试时,机身遮挡,导致尾焰的辐射强度大部分被遮挡。

    2)中红外热像仪测试结果(迎头)

    按照1.3.2测试方法和数据处理方法,对中红外热像仪测试数据进行处理,得到飞机在中红外的特征辐射面积时间变化关系如图 3所示。

    图  3  中波红外特征辐射面积随时间的变化关系图
    Figure  3.  Middle wave infrared characteristic radiation area over time

    图 3可知,中红外热像仪测试得到辐射面积最大为3.68 m2,且辐射面积随时间变化。这是由两种原因造成的,第一是飞行员操作时,不可能保证飞机发动机一直处于同一种工作状态,而是在某一工作状态附近波动;第二是由于气候原因,由于风速、风向等时刻变化,导致发动机尾焰在与大气环境传热传质过程中一直处于变化状态,从而导致特征辐射面积发生变化。

    3)长波红外热像仪测试结果(迎头)

    按照1.3.2测试方法和数据处理方法,对长波红外热像仪测试数据进行处理,得到飞机在长波红外的辐射面积随时间变化关系如图 4所示。

    图  4  长波红外辐射面积随时间的变化关系图
    Figure  4.  Long wave infrared characteristic radiation area over time

    图 4可知,长波红外热像仪测试得飞机的最大红外特征辐射面积约为5.4 m2,比中红外辐射面积高,这也是由于飞机发动机尾焰的大部分红外辐射被飞机机身遮挡,而机身蒙皮在长波红外的辐射特征比中红外的辐射特征明显。

    用同样的方式测试飞机在同样工作状态下,正测向、尾向的红外辐射特征。将测试数据用同样的方式处理,得到测试结果如表 1所示。

    表  1  飞机红外辐射特征测试结果汇总
    Table  1.  Summary of aircraft radiation characteristics test results
    Test direction and angle Wave length Radiation intensity/(W/Sr) Radiation area/m2
     Head-on 0°  3 to 5 μm 50.00 3.68
     8 to 14 μm 50.00 5.40
     Lateral 90°  3 to 5 μm 68.00 25.90
     8 to 14 μm 150.00 12.53
     Stern 180°  3 to 5 μm 140.00 8.85
     8 to 14 μm 80.00 1.05
    下载: 导出CSV 
    | 显示表格

    测试数据可得如下结论:①飞机正侧向的中长波红外辐射面积比迎头和尾后都高,这是由于正侧向时,飞机最大截面与红外热像仪视场垂直,导致红外辐射面积最大;②飞机尾后的中长波红外辐射强度远远高于正侧向和迎头,尤其是中红外辐射强度达到最高,说明发动机工作时,尾焰和尾喷管能显著提高飞机的红外辐射特征,但是辐射面积较小;③由于飞机机身的遮挡作用,飞机的红外辐射强度和面积均最小。

    面源红外干扰弹投放后在载机附近迅速扩散开来形成红外干扰云团,其与被保护载机的红外图像相似,或改变载机的红外图像特征,欺骗红外成像制导导弹,继而诱使红外成像制导导弹偏离被保护的载机。面源红外干扰弹对抗红外成像制导导弹,各个阶段可以采用不同的方式进行干扰[7]

    目标搜索阶段,导弹距离目标通常很远,目标机形成的红外图像很小,处于点目标阶段,当面源红外干扰弹连续投放后,在真目标附近形成大面积红外辐射云团,掩盖目标的红外辐射特征,使红外成像制导导弹导引头无法锁定真目标,面源红外干扰弹起到“隐真示假”的作用。

    目标跟踪阶段初期,弹目距离逐渐缩短,目标形成的红外图像逐渐变大,且逐渐显示目标的外形特征,此时,红外成像制导导弹使用形心跟踪或是质心跟踪方式跟踪目标。当连续投放面源红外干扰弹后,在目标附近形成大面积红外辐射云团,其红外特征与目标相似,并与目标融合在一起形成共同的目标信息,甚至完全掩盖目标的红外辐射特征,从而改变导弹视场内的目标红外辐射特征,常用的灰度、面积、长宽比、圆度等识别特征均发生较大变化,制导系统难以识别出真目标,此时,实际目标的特征或运动参数将以不稳定或“非目标”的方式变化(如机动逃逸),而面源红外干扰弹的特征保持稳定(持续燃烧或连续投放),此时,成像导弹的识别系统将会锁定假目标,而达到干扰目的。

    目标跟踪阶段后期,弹目距离很近,目标在导引头视场内外形特征清楚,导引头可根据目标的外形特征(面积、长宽比、圆度等)对目标进行跟踪。此时,连续投放面源红外干扰弹后,面源红外干扰弹形成大面积红外辐射云团,与目标红外辐射特征融合,增大了整个红外辐射云团的辐射面积,改变目标的外形特征,增大导引头识别算法的运算量和识别难度,使其难以识别真目标,导致成像导引头无法通过目标的面目标特征识别出目标,从而有效降低其命中目标概率。

    点源红外干扰弹发射后形成单个热点目标,连续投放后形成多个点目标,通过质心干扰的方式诱骗红外制导导引头哦。由于点源红外干扰弹能量高,远大于飞机的红外辐射强度,在对抗早期第一代、第二代红外制导导引头时有效;随着具有辐射强度阈值鉴别能力的第三代、第四代红外制导导引头的装备,点源红外干扰弹由于能量太高,且干扰源数量少,干扰效能不高的缺点越来越明显。因此,点源红外干扰弹逐步被多点源红外干扰弹取代。

    多点源红外干扰弹发射后形成多个分散的点源红外干扰弹,连续投放后形成多个点状发热体。采用多发齐射或多方位齐射时,可迅速在一定空域形成红外高辐射区,在导引头瞬时视场内形成持续的多个干扰源,将目标信号淹没,且多点源红外干扰弹的辐射能量比点源红外干扰弹的小,略高于飞机,导引头无法通过强度阈值鉴别滤除干扰,导引头必须处理多组脉冲信号,降低了其检测目标的概率,红外导引头即使启动了抗干扰措施,但因探测器的噪声几何级数增大,而难以提取有效的制导信号,从而起到保护载机的作用[8]

    根据飞机发动机工作时,飞机不同方向上的红外辐射特征数据,以及多点源红外干扰弹、面源红外干扰弹的特点,可分析出飞机在面临不同方向成像红外导弹导引头时红外干扰弹的使用策略[9]

    1)当来袭红外制导导弹从尾后攻击飞机时,开始导弹距飞机较远,飞机在红外导引头中显示为一个热点,此时采用多点源红外干扰弹,以质心干扰的方式诱骗红外导引头;随着来袭导弹与飞机距离缩短,飞机在导引头中面积逐渐增大,采用面源红外干扰弹,其红外辐射云团与飞机融合,改变目标的红外辐射特征和在导引头视角下的面目标特征,使导引头分辨不出目标,从而形成有效干扰。多点源红外干扰弹和面源红外干扰弹组合使用,两者结合可有效干扰红外导引头。

    2)当来袭红外制导导弹侧向攻击飞机时,由于飞机在红外导引头中显示的面积较大,且能量较高,此时可采用面源红外干扰弹有效掩盖目标的红外辐射特征,干扰来袭导弹导引头。

    3)当来袭红外制导导弹迎头攻击飞机时,由于此时飞机在红外导引头中显示的面积和能量均很低,此时采用多点源红外干扰弹和面源红外干扰弹组合使用,通过多点源红外干扰弹的质心干扰,形成假目标,结合面源红外干扰弹的大面积特征,掩盖目标的红外辐射特征,隐藏真实目标特征,点和面结合,达到“隐真示假”的效果,可有效干扰红外制导导弹导引头。

    本文以飞机为研究对象,采用光谱辐射计、中长波红外热像仪测试了飞机发动机工作时,飞机迎头、正侧向、尾向3个不同方向上的红外辐射特征,根据红外辐射特征,结合多点源红外干扰弹、面源红外干扰弹的特点,分析了飞机在面临不同方向来袭红外制导导弹时干扰弹的投放策略。当来袭导弹从尾后攻击时,远距时采用多点源红外干扰弹、中近距时采用面源红外干扰弹;侧向攻击时,采用面源红外干扰弹;迎头攻击时,采用点源、面源组合使用,可形成有效干扰。

  • 图  1   红外公开数据集样本示例

    Figure  1.   Samples of infrared public datasets

    图  2   不同极性目标图像

    Figure  2.   Images of targets with different polarities

    图  3   标注软件界面

    Figure  3.   Interface diagram of labeling software

    图  4   Infrared-PV数据集图像

    Figure  4.   Images in Infrared-PV dataset

    图  5   目标统计分析

    Figure  5.   Statistical analysis diagrams of targets

    图  6   YOLO v5模型架构

    Figure  6.   Models architecture of YOLO v5

    图  7   各基准模型检测效果对比(置信度:0.25)

    Figure  7.   Comparison of detection results for benchmark algorithms(confidence: 0.25)

    表  1   Infrared-PV数据集不同极性图像统计

    Table  1   Statistics of the number of images with different polarities in infrared-PV dataset

    Images White-hot target Black-hot target Heat map
    2138 1000 838 300
    下载: 导出CSV

    表  2   标注信息

    Table  2   Annotation Information

    <annotation>
    <folder>D: /infrared_all/DVD_162025_0/X2</folder>
    <filename>img00009754.jpg</filename>
    <path>D: /infrared_all/DVD_162025_0/X2/JPEGImages/img00009754.jpg</path>
    <source>
    <database>Unknown</database>
    </source>
    <size>
    <width>720</width>
    <height>576</height>
    <depth>3</depth>
    </size>
    <segmented>0</segmented>
    <polarity>black</polarity>
    <date>2019-11-9</date>
    <weather>sun</weather>
    <time>afternoon</time>
    <object>
    <name>vehicle</name>
    <xmin>328</xmin>
    <ymin>402</ymin>
    <xmax>488</xmax>
    <ymax>521</ymax>
    </bndbox>
    </object>
    </annotation>
    <pose>Unspecified</pose>
    <truncated>0</truncated>
    <difficult>0</difficult>
    <bndbox>
    下载: 导出CSV

    表  3   Infrared-PV数据集类别统计

    Table  3   Category statistics of Infrared-PV dataset

    Class Person Vehicle
    Number 27910 18372
    下载: 导出CSV

    表  4   模型配置

    Table  4   Model configuration

    Algorithm Framework Configuration file
    YOLO v3 Darknet-53 yolov3.cfg
    YOLO v4 Darknet-53 yolov4.cfg
    YOLO v5(L) yolov5 yolov5l.yaml
    Faster R-CNN mmdetection faster_rcnn_r50_fpn_1x.py
    下载: 导出CSV

    表  5   608×608分辨率下Infrared-PV目标锚框

    Table  5   Anchors of targets in Infrared-PV dataset under 608×608 resolution

    Scale Small Middle Large
    Feature map 76×76 38×38 19×19
    Receptive filed 165×165 437×437 725×725
    Anchors 6, 23
    50, 3
    10, 25
    9, 31
    12, 36
    11, 87
    23, 54
    67, 59
    237, 179
    下载: 导出CSV

    表  6   Infrared-PV数据集各检测模型性能基准(置信度:0.05)

    Table  6   Performance benchmark of several detection algorithms for Infrared-PV dataset (confidence: 0.05)

    Algorithm Rating Backbone Size FPS AP0.5(vehicle)/Recall AP0.5(person)/Recall mAP0.5(%)
    Faster R-CNN 5 Resnet50 1333×800 16.08 0.775/0.868 0.536/0.792 65.6
    YOLO v3 4 Darketnet53 416×416 48.9 0.797/0.8588 0.581/0.806 68.9
    YOLO v3 3 Darketnet53 608×608 32.8 0.8666/0.9049 0.6278/0.81676 74.7
    YOLO v4 2 CSPDarknet53 608×608 29.0 0.87/0.93 0.71/0.889 78.97
    YOLO v5-l 1 - 608×608 99.22 0.882/0.911 0.732/0.853 80.7
    注:加粗字体为该列最优值   Note: Bold font is the optimal value
    下载: 导出CSV

    表  7   其他模型在红外数据集的测试结果(置信度: 0.05)

    Table  7   Test results of other models on Infrared-PV datasets (confidence: 0.05)

    Algorithm Backbone Size FPS AP0.5(vehicle) /Recall AP0.5(person) /Recall mAP0.5/%
    Cascade R-CNN ResNet50 1333×800 11.80 0.788/0.870 0.552/0.803 67.0
    Cascade R-CNN ResNest50 1333×800 10.18 0.901/0.944 0.744/0.914 82.3
    Faster R-CNN ResNet50 1333×800 16.08 0.775/0.868 0.536/0.792 65.6
    Faster R-CNN ResNest50 1333×800 15.09 0.888/0.935 0.700/0.884 79.4
    YOLOv5s - 608×608 175.4 0.87/0.899 0.722/0.854 79.6
    YOLOv5m - 608×608 125.36 0.889/0.921 0.728/0.849 80.0
    YOLOv5x - 608×608 37.32 0.8754/0.9029 0.7297/0.8541 80.3
    YOLOv4-kd CSPDarknet53 608×608 66.7 0.882/0.9433 0.7380/0.8987 81.0
    FCOS ResNet50 1333×800 18.79 0.755/0.893 0.494/0.787 62.4
    注:加粗字体为该列最优值   Note: Bold font is the optimal value
    下载: 导出CSV
  • [1] 陈钱, 隋修宝. 红外图像处理理论与技术[M]. 北京: 电子工业出版社, 2018.

    CHEN Qian, SUI Xiubao. Infrared Image Processing Theory and Technology[M]. Beijing: Electronic Industry Press, 2018.

    [2] 刘让, 王德江, 贾平, 等. 红外图像弱小目标探测技术综述[J]. 激光与光电子学进展, 2016, 53(5): 050004. https://www.cnki.com.cn/Article/CJFDTOTAL-JGDJ201605004.htm

    LIU Rang, WANG Dejiang, JIA Ping, et al. Overview of detection technology for small and dim targets in infrared images[J]. Progress in Laser and Optoelectronics, 2016, 53(5): 050004. https://www.cnki.com.cn/Article/CJFDTOTAL-JGDJ201605004.htm

    [3] 武斌. 红外弱小目标检测技术研究[D]. 西安: 西安电子科技大学. 2009.

    WU Bing. Research on Infrared Dim Target Detection Technology[D]. Xi'an: Xidian University, 2009.

    [4]

    Rawat S S, Verma S K, Kumar Y. Review on recent development in infrared small target detection algorithms[J]. Procedia Computer Science, 2020, 167: 2496-2505. DOI: 10.1016/j.procs.2020.03.302

    [5] 李俊宏, 张萍, 王晓玮, 等. 红外弱小目标检测算法综述[J]. 中国图象图形学报, 2020, 25(9): 1739-1753. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGTB202009002.htm

    LI Junhong, ZHANG Ping, WANG Xiaowei, et al. Infrared small-target detection algorithms: a survey[J]. Journal of Image and Graphics, 2020, 25(9): 1739-1753. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGTB202009002.htm

    [6] 谷雨, 刘俊, 沈宏海, 等. 基于改进多尺度分形特征的红外图像弱小目标检测[J]. 光学精密工程, 2020, 28(6): 1375-1386. https://www.cnki.com.cn/Article/CJFDTOTAL-GXJM202006016.htm

    GU Yu, LIU Jun, SHEN Honghai, et al. Infrared image dim target detection based on improved multi-scale fractal features[J]. Optics and Precision Engineering, 2020, 28(6): 1375-1386. https://www.cnki.com.cn/Article/CJFDTOTAL-GXJM202006016.htm

    [7]

    LIU L, OUYANG W, WANG X G, et al. Deep learning for generic object detection: a survey[J]. International Journal of Computer Vision, 2020, 128(2): 261-318. DOI: 10.1007/s11263-019-01247-4

    [8]

    REN S Q, HE K M, Girshick R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149. DOI: 10.1109/TPAMI.2016.2577031

    [9]

    LIU W, Anguelov D, Erhan D, et al. Ssd: single shot multibox detector[C]//European Conference on Computer Vision, 2016: 21-37.

    [10]

    Redmon J, Divvala S, Girshick R, et al. You only look once: unified, real-time object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016: 779-788.

    [11] 王文秀, 傅雨田, 董峰, 等. 基于深度卷积神经网络的红外船只目标检测方法[J]. 光学学报, 2018, 38(7): 0712006. https://www.cnki.com.cn/Article/CJFDTOTAL-GXXB201807020.htm

    WANG W X, FU Y T, DONG F, et al. Infrared ship target detection method based on deep convolutional neural network[J]. Acta Optics, 2018, 38(7): 0712006. https://www.cnki.com.cn/Article/CJFDTOTAL-GXXB201807020.htm

    [12]

    Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[J]. Communications of the ACM, 2017, 60(6): 84-90. DOI: 10.1145/3065386

    [13] 蒋志新. 基于深度学习的海上红外小目标检测方法研究[D]. 大连: 大连海事大学, 2019.

    JIANG Z X. Research on the Detection Method of Marine Infrared Small Target Based on Deep Learning[D]. Dalian: Dalian Maritime University, 2019.

    [14] 陈铁明, 付光远, 李诗怡, 等. 基于YOLO v3的红外末制导典型目标检测[J]. 激光与光电子学进展, 2019, 56(16): 155-162. https://www.cnki.com.cn/Article/CJFDTOTAL-JGDJ202222030.htm

    CHEN T M, FU G Y, LI S Y, et al. Infrared terminal guidance typical target detection based on YOLOv3[J]. Progress in Laser and Optoelectronics, 2019, 56(16): 155-162. https://www.cnki.com.cn/Article/CJFDTOTAL-JGDJ202222030.htm

    [15] 赵琰, 刘荻, 赵凌君. 基于Yolo v3的复杂环境红外弱小目标检测[J]. 航空兵器, 2020, 26(6): 29-34. https://www.cnki.com.cn/Article/CJFDTOTAL-HKBQ201906006.htm

    ZHAO Y, LIU D, ZHAO L J. Infrared small target detection in complex environment based on Yolo v3[J]. Aviation Weaponry, 2020, 26(6): 29-34. https://www.cnki.com.cn/Article/CJFDTOTAL-HKBQ201906006.htm

    [16] 吴双忱, 左峥嵘. 基于深度卷积神经网络的红外小目标检测[J]. 红外与毫米波学报, 2019, 38(3): 371-380. https://www.cnki.com.cn/Article/CJFDTOTAL-HWYH201903019.htm

    WU S C, ZUO Z G. Infrared small target detection based on deep convolutional neural network[J]. Journal of Infrared and Millimeter Waves, 2019, 38(3): 371-380. https://www.cnki.com.cn/Article/CJFDTOTAL-HWYH201903019.htm

    [17]

    HU J, SHEN L, SUN G. Squeeze-and-excitation networks[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018: 7132-7141.

    [18] 李慕锴, 张涛, 崔文楠. 基于Yolo v3的红外行人小目标检测技术研究[J]. 红外技术, 2020, 42(2): 176-181. http://hwjs.nvir.cn/article/id/hwjs202002012

    LI M K, ZHANG T, CUI W N. Research on infrared pedestrian small target detection technology based on Yolo v3[J]. Infrared Technology, 2020, 42(2): 176-181. http://hwjs.nvir.cn/article/id/hwjs202002012

    [19]

    Everingham M, Eslami S A, Van Gool L, et al. The pascal visual object classes challenge: a retrospective[J]. International Journal of Computer Vision, 2015, 111(1): 98-136. DOI: 10.1007/s11263-014-0733-5

    [20]

    LIN T Y, Maire M, Belongie S, et al. Microsoft coco: common objects in context[C]//European Conference on Computer Vision, 2014: 740-755.

    [21]

    XIA G S, BAI X, DING J, et al. DOTA: a large-scale dataset for object detection in aerial images[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018: 3974-3983.

    [22]

    LI K, WAN G, CHENG G, et al. Object detection in optical remote sensing images: a survey and a new benchmark[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2020, 159: 296-307. DOI: 10.1016/j.isprsjprs.2019.11.023

    [23]

    ZHU H, CHEN X, DAI W, et al. Orientation robust object detection in aerial images using deep convolutional neural network[C]//2015 IEEE International Conference on Image Processing (ICIP), 2015: 3735-3739.

    [24]

    TAN M, PANG R, LE Q V. Efficientdet: scalable and efficient object detection[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2020: 10781-10790.

    [25]

    Hwang S, Park J, Kim N, et al. Multispectral pedestrian detection: Benchmark dataset and baseline[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2015: 1037-1045.

    [26]

    Teledyne FLIR Systems. FLIR ADAS Dataset[DB/OL] [2023-11-27]. https://www.flir.com/oem/adas/adas-dataset-form/.

    [27]

    Davis J W, Keck M A. A two-stage template approach to person detection in thermal imagery[C]//2005 Seventh IEEE Workshops on Applications of Computer Vision, 2005, 1: 364-369.

    [28]

    CAI Z, Vasconcelos N. Cascade r-cnn: delving into high quality object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018: 6154-6162.

    [29]

    PANG J, CHEN K, SHI J, et al. Libra r-cnn: Towards balanced learning for object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2019: 821-830.

    [30]

    WU Y, CHEN Y, YUAN L, et al. Rethinking classification and localization for object detection[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2020: 10186-10195.

    [31]

    Redmon J, Farhadi A. Yolov3: an incremental improvement [EB/OL] [2018-04-08]. https://arxiv.org/pdf/1804.02767.pdf.

    [32]

    HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016: 770-778.

    [33]

    LINT Y, Dollár P, Girshick R, et al. Feature pyramid networks for object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017: 2117-2125.

    [34]

    Bochkovskiy A, WANG C Y, LIAO H Y M. YOLOv4: Optimal speed and accuracy of object detection[EB/OL] [2020-04-22]. https://arxiv.org/pdf/2004.10934.pdf.

    [35]

    HE K, ZHANG X, REN S, et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(9): 1904-1916.

    [36]

    WANG K, LIEW J H, ZOU Y, et al. PaNet: Few-shot image semantic segmentation with prototype alignment[C]//Proceedings of the IEEE International Conference on Computer Vision, 2019: 9197-9206.

    [37]

    ZHENG Z, WANG P, LIU W, et al. Distance-IoU loss: faster and better learning for bounding box regression[C]//Proceedings of 2020 Association for the Advancement of Artificial Intelligence, 2020: 12993-13000.

    [38]

    TIAN Z, SHEN C, CHEN H, et al. FCOS: Fully convolutional one-stage object detection[C]//Proceedings of the 2019 IEEE International Conference on Computer Vision, 2019: 9627-9636.

    [39]

    CHEN K, WANG J Q, PANG J M, et al. Mmdetection: open mmlab detection toolbox and benchmark[EB/OL][2019-06-17]. https://arxiv.org/pdf/1906.07155.pdf.

    [40]

    ZHANG H, WU C R, ZHANG Z Y, et al. Resnest: Split-attention networks[EB/OL] [2020-04-19]. https://arxiv.org/pdf/2004.08955.pdf.

  • 期刊类型引用(2)

    1. 高程,唐超,童安炀,王文剑. 基于CNN和LSTM混合模型的红外人体行为识别. 合肥学院学报(综合版). 2023(05): 77-85 . 百度学术
    2. 赵普,武一. 面向社区医疗的跌倒检测算法. 中国医学物理学杂志. 2023(12): 1486-1493 . 百度学术

    其他类型引用(12)

图(7)  /  表(7)
计量
  • 文章访问数:  244
  • HTML全文浏览量:  52
  • PDF下载量:  54
  • 被引次数: 14
出版历程
  • 收稿日期:  2021-01-14
  • 修回日期:  2021-02-23
  • 刊出日期:  2023-12-19

目录

/

返回文章
返回
x 关闭 永久关闭

尊敬的专家、作者、读者:

端午节期间因系统维护,《红外技术》网站(hwjs.nvir.cn)将于2024年6月7日20:00-6月10日关闭。关闭期间,您将暂时无法访问《红外技术》网站和登录投审稿系统,给您带来不便敬请谅解!

预计6月11日正常恢复《红外技术》网站及投审稿系统的服务。您如有任何问题,可发送邮件至编辑部邮箱(irtek@china.com)与我们联系。

感谢您对本刊的支持!

《红外技术》编辑部

2024年6月6日