YOLO Infrared Target Detection Algorithm Combining Parallel Pooling and Self-Distillation
-
摘要:
针对红外目标检测中对比度低和尺度差异导致的检测精度低的问题,本文提出了一种PPSD-YOLO(parallel pooling and self distillation-YOLO)红外目标检测算法。首先,构建了并行池化模块Fusion-P,使目标附近的像素点更为平滑,防止目标像素缺失。其次,针对红外小目标检测精度低的问题,在网络中增加小目标检测层,并采用K-means++算法优化其初始化锚框大小及比例。然后,在Neck层中引入多尺度特征感知模块(SA-RFE),通过多分支空洞卷积结构融合目标的多尺度上下文信息。最后,在训练过程中构建了一种修正自蒸馏框架,动态修正教师模型中的误检目标从而提高学生模型检测精度。在FLIR红外数据集上的结果表明,改进后的PPSD-YOLO较YOLO v7算法mAP提高了2.7%。
Abstract:This study addresses low accuracy in infrared object detection, which is often caused by low contrast and scale discrepancies. A parallel-pooling and self-distillation-YOLO (PPSD-YOLO) algorithm that incorporates several crucial features was proposed to solve this challenge. One of the main contributions of this study is the Fusion-P parallel pooling module, which smoothes the surrounding pixels and avoids overlooking important details. In addition, a small infrared object detection layer was added to enhance the detection accuracy of such objects. The initialization anchor frame for this layer was optimized using the K-means++ algorithm. The proposed algorithm includes a multiscale feature perception module (SA-RFE) in the neck layer, which fuses contextual information from various scales of the target for more accurate detection. During the training process, a modified self-distillation framework was used to rectify misdetected targets in the teacher model, leading to improved detection accuracy in the student model. Tests were conducted using the FLIR dataset to evaluate the proposed algorithm. The results show that PPSD-YOLO outperformed YOLOv7 by 2.7% in terms of mAP. This improvement can be attributed to the incorporation of a parallel pooling module, small-object detection layer, SA-RFE module, and a self-distillation framework. This study presents a comprehensive solution to the challenge of low detection accuracy in infrared object detection. The proposed PPSD-YOLO algorithm integrates advanced features that enhance accuracy and improve the overall performance of the detection system. These findings will be useful for researchers and practitioners in computer vision.
-
Keywords:
- infrared target detection /
- YOLO v7 /
- self distillation /
- dilated convolution
-
0. 引言
对于红外焦平面探测器,噪声等效温差是一个很重要的指标参数,与信噪声比相关,直观地反映了器件的灵敏度,也是热像仪设计考虑的关键参数,影响系统的作用距离与目标识别[1-6]。
在较早期文献资料中,单元探测器与信噪比相关的主要指标参数包括探测率、噪声等效功率等,而NETD只是一个表征热像仪系统温度灵敏度的重要指标,直到20世纪八九十年代开始红外焦平面探测器快速发展后,NETD才逐渐出现在探测器的主要性能指标中[7-13]。
探测器的NETD与热像仪系统的NETD基本定义是相同的[14]:噪声电压Vn与目标温差ΔT产生的信号电压ΔVs相等时的温差称为噪声等效温差,即信噪比为1时,目标与背景的温差。定义公式如下:
$$ NETD = \frac{{\Delta T}}{{\Delta {V_{\rm s}}/{V_n}}} $$ (1) 实际应用中,红外焦平面探测器的NETD与多种因素有关,如像元面积、光谱响应范围、量子效率、冷屏F数、背景温度等。除此之外,从定义公式可以看到,NETD并未像探测率一样对积分时间进行归一化处理,实际中器件的信噪比并不随着积分时间的加长而按比例增加,因此同一器件在不同的积分时间条件下,NETD在理论上也不同。另一方面,器件的响应与黑体温度也并不是线性关系,选择的背景温度和ΔT不同,NETD在理论上也会不同,同一背景温度条件下ΔT越小越接近实际应用情况,但由于受黑体精度的影响,ΔT很难控制得很小,采集到的响应信号也很容易受到其他因素的干扰,因此一般取较大的温差进行测试,如中长波探测器测试时温差ΔT通常取10℃~15℃[15-17],这样带来的问题是,与实际情况可能存在的差异。理论上,NETD与电荷存储量无关,但在某些特定条件下,如应用的背景温度或固定的势阱填充量,需要采取一些措施来满足使用或测试要求,此时NETD会受到一定的限制。
在热像仪系统应用中,有的文献还提出了由于焦平面探测器像元之间响应不均匀性引起的空间NETD[18-21],为了简化计算,本文不考虑空间NETD,仅从NETD的测试方法和流程出发,通过黑体辐射及探测器的理论公式,对HgCdTe、InSb等常用光伏型红外焦平面探测器NETD的理论计算公式进行推导,分析影响器件NETD的主要因素,通过典型640×512 HgCdTe中波红外焦平面探测器对不同条件下的背景限NETD进行理论计算及分析,并对固定背景温度但不同测试温差下的NETD进行理论推算及对比测试。
1. 红外焦平面探测器NETD测试方法及流程
与探测率等性能指标测试方法一样,红外焦平面探测器NETD在测试时也是测出一定条件下噪声和温差响应信号,再根据式(1)进行计算,其测试系统示意图如图 1,包括辐射源、驱动电路、数据采集模块、计算机及控制软件等。一般情况下,采用面源黑体作为红外辐射源,设置温度T0模拟背景温度,T1模拟目标温度;驱动电路提供器件正常工作所必须的电源、偏置和脉冲时序等,并对器件的输出信号进行调理;数据采集模块对调理后的器件输出信号进行自动采集,并送至计算机中;计算机及控制软件对驱动电路、数据采集模块等进行控制,并对采集数据进行处理计算。
具体测试流程如下:
① 连接测试系统与被测器件,使面源黑体面充满器件视场,器件达到工作温度后,通过驱动电路给被测器件加电,在规定的测试条件下使器件正常工作;
② 分别在黑体温度为T0、T1条件下采集器件中每个像元的输出信号电压V0、V1,连续采集F帧(F≥100)取平均值,并计算T0条件下F帧输出信号电压的均方根偏差为该像元的噪声电压Vn;
③ 计算每个像元的输出信号电压差ΔVs,即V1-V0;
④ 根据Vn、ΔVs、黑体温差ΔT及式(1)计算出器件中每个像元的NETD。
对于红外焦平面探测器,一般规定的主要测试条件为积分时间或势阱填充量。势阱填充量是指探测器光电转换产生的电子数占读出电路总电荷存储量的百分比,也就是探测器输出信号电压占输出动态范围的百分比,可以通过调整积分时间达到。
2. NETD的理论计算
2.1 理论公式
根据普朗克黑体辐射公式,黑体温度为T时在λon~λoff光谱范围内的光子辐亮度为:
$$L_{\mathrm{p}}(\lambda, T)=\int_{\lambda_{\mathrm{on}}}^{\lambda_{\text {off }}} \frac{2 c}{\lambda^4\left(\mathrm{e}^{\frac{h c}{\lambda k T}}-1\right)} \mathrm{d} \lambda$$ (2) 式中:Lp(λ, T)为单位面积黑体在单位时间、单位立体角的光子辐亮度,个/(s·sr·cm2);λon、λoff为探测器的前后截止波长,μm;c为光速,3×108 m/s;h为普朗克常数,6.63×10-34 Js;k为玻耳兹曼常数,1.38×10-23 J/K。
面源黑体可以看成一个均匀大面积的朗伯源,当面源黑体充满探测器的整个视场时,探测器光电转换产生的电子数为:
$$N=\eta A_{\mathrm{d}} t_{\mathrm{int}} \varOmega L_{\mathrm{p}}(\lambda, T)$$ (3) 式中:N为探测器光电转换产生的电子数,个;η为探测器总量子效率,无量纲;Ad为像元的光敏面积,cm2;tint为积分时间,s;Ω为探测器的视场角,sr,Ω=π/(4F2+1),F为探测器冷屏所限制的F数。
假设探测器的暗电流为Idark,通过读出电路后,探测器的输出信号电压:
$$V=\frac{Q}{C_{\mathrm{R}}}=\frac{q N+I_{\mathrm{dark}} t_{\mathrm{int}}}{C_{\mathrm{R}}}$$ (4) 式中:q为电子电量,1.6×10-19 C;CR为读出电路的积分电容,F。
在T0和T1黑体温度下,探测器的暗电流基本不发生改变,可得到这两个温差下响应电压ΔVs的计算公式:
$$\Delta V_{\mathrm{s}}=\frac{\eta q A_{\mathrm{d}} t_{\mathrm{int}} \varOmega\left[L_{\mathrm{p}}\left(\lambda, T_1\right)-L_{\mathrm{p}}\left(\lambda, T_0\right)\right]}{C_{\mathrm{R}}}$$ (5) 假设在T0温度下其总噪声为Vn(T0),根据式(1)可得到NETD的理论计算公式:
$$\mathrm{NETD}=\frac{C_{\mathrm{R}} V_n\left(T_0\right)}{\eta q A_{\mathrm{D}} t_{\mathrm{int}} \varOmega\left[L_{\mathrm{P}}\left(\lambda, T_1\right)-L_{\mathrm{P}}\left(\lambda, T_0\right)\right]}\left(T_1-T_0\right)$$ (6) 为了便于分析,温度T0、T1下探测器光电转换产生的电子数记为N0、N1,则N0=ηAdtintΩLP(λ, T0)、N1=ηAdtintΩLP(λ, T1)。探测器的总噪声包括背景辐射、暗电流、读出电路、测试系统等引起的噪声。其中背景辐射到达探测器上光子数目的均方起伏等于其光子到达率的平均值[22],因此T0温度下背景辐射噪声电压Vn-B为:
$$V_{\mathrm{n}-\mathrm{B}}=q \sqrt{N_0} / C_{\mathrm{R}}$$ (7) 假设探测器除了背景辐射噪声以外其他噪声电子数为Nde,则:
$$V_{\mathrm{n}}\left(T_0\right)=\frac{q}{C_{\mathrm{R}}} \sqrt{N_0+N_{\mathrm{de}}^2}$$ (8) 式(6)可简化为文献[23]中NETD的表达形式:
$$\mathrm{NETD}=\frac{1}{K \sqrt{N_0}} \sqrt{1+\frac{N_{\mathrm{de}}^2}{N_0}}$$ (9) 式中:K定义为T0温度下单位温差的光子数变化百分比,$K = ({N_1}/{N_0} - 1)/({T_1} - {T_0})$。
对式(9)分析可以得到以下结果:
当暗电流、读出电路等引起的其他噪声电子数Nde相对于背景T0产生的噪声电子数$\sqrt {{N_0}} $较大,即(Nde2/N0)≫1时,NETD主要受限于Nde大小,即为探测器噪声所限制的NETD。
当(Nde2/N0)≪1时,NETD受探测器的其他噪声影响可以忽略,此时NETD主要受限于N0,即达到背景限的NETD。
对于焦平面探测器,由于受读出电路积分电容设计尺寸的限制,能处理的电荷数不可能无限制地大,在上述两种情况下,当读出电路最大电荷存储量小于(Nde2+N0)时,NETD则受限于读出电路的电荷存储量,此时需要通过一些措施来减少探测器产生的电子数,例如减小像元尺寸、缩短积分时间、增大F数、降低暗电流等。另一种情况是,读出电路电荷存储量足够但受应用或测试条件的限制,例如要求在固定的势阱填充量条件下进行NETD测试,此时读出电路的电荷存储量越大,NETD就可以越小。
由于探测器受光子辐照产生的电子数与温度不成比例关系,即使T0相同,选择不同的T1进行测试,K值发生变化,NETD也会有所不同。
2.2 NETD背景限的理论公式
当只考虑背景辐射噪声时,根据式(9)可得到探测器在T0温度下背景限NETD的理论公式:
$$\mathrm{NETD}=\frac{1}{K \sqrt{N_0}}$$ (10) 代入K及N0,即:
$$\mathrm{NETD}=\frac{\sqrt{L_{\mathrm{P}}\left(\lambda, T_0\right)}}{\left[L_P\left(\lambda, T_1\right)-L_{\mathrm{P}}\left(\lambda, T_0\right)\right] \sqrt{\eta A_{\mathrm{D}} t_{\mathrm{int}} \Omega}}\left(T_1-T_0\right)$$ (11) 从式(10)、(11)可以看出,T0、T1不变的情况下,背景限NETD与$\sqrt {{N_0}} $成反比例关系,即与量子效率、像元面积、积分时间的平方根成反比例关系,与视场角平方根$\sqrt \varOmega $成反比例关系,即正比于$\sqrt {\frac{{4{F^2} + 1}}{\pi }} $,当F数较大时,与F数成近似正比例关系。
从式(11)得到的另一个结论是,背景限NETD与读出电路的积分电容无关。实际中,当测试系统或热像仪系统带来的噪声不可忽略时,NETD与积分电容相关,其在他条件不变的情况下,随着积分电容变大,NETD也变大,但此时如果再采取增加积分时间、减小F数等方法达到相同的势阱填充量,由于测试系统或热像仪系统噪声在总噪声中占的比例减小,那么NETD则相对是变小的。
2.3 固定背景温度下NETD的推算
根据上面的理论公式,NETD与测试温度相关,根据NETD定义,温度T1越接近T0,NETD越接近实际情况,但通常红外焦平面探测器在NETD测试时采用的都是较大温差。理论上,只要积分时间及T0保持不变,通过大温差下NETD的测试结果可推算出小温差下NETD的结果。下面是推算过程:
将T0、T1温差下NETD实测结果记为${\rm NETD}_{{({T_1} - {T_0})}}$,T0、T2温差下NETD的推算结果记为${\rm NETD}_{{({T_2} - {T_0})}}$,背景T0下探测器的总噪声为${V_{n - {T_0}}}$,在这两个条件下,温差响应信号分别$\Delta {V_{\rm s}}_{({T_1} - {T_0})}$和$ \Delta {V_{\rm s}}_{({T_2} - {T_0})} $。由式(1)有:
$$ {\rm NETD}_{{({T_1} - {T_0})}} = \frac{{{V_{n - {T_0}}}}}{{\varDelta {V_{\rm s}}_{({T_1} - {T_0})}}}{\text{(}}{T_1} - {T_0}{\text{)}} $$ (12) $$ {\rm NETD}_{{({T_2} - {T_0})}} = \frac{{{V_{n - {T_0}}}}}{{\Delta {V_{\rm s}}_{({T_2} - {T_0})}}}({T_2} - {T_0}) $$ (13) 可以得到:
$$ {\rm NETD}_{{({T_2} - {T_0})}} = \frac{{({T_2} - {T_0})}}{{({T_1} - {T_0})}}\frac{{\Delta {V_{\rm s}}_{({T_1} - {T_0})}}}{{\Delta {V_{\rm s}}_{({T_2} - {T_0})}}}{\rm NETD}_{{({T_1} - {T_0})}} $$ (14) 将式(5)代入上式得到T0、T2温差下的NETD:
$$ \begin{array}{l} {\rm NETD}_{{({T_2} - {T_0})}} = \hfill \\ \frac{{({T_2} - {T_0})}}{{({T_1} - {T_0})}}\frac{{[{L_P}(\lambda , {T_1}) - {L_P}(\lambda , {T_0})]}}{{[{L_P}(\lambda , {T_2}) - {L_P}(\lambda , {T_0})]}}{\rm NETD}_{{({T_1} - {T_0})}} \hfill \\ \end{array} $$ (15) 通过上式,只需计算出两个温差条件下理论光子辐亮度差的比值,即可推算出另一温差下的NETD值。
3. 应用实例及分析
3.1 背景限NETD的计算
选择目前典型640×512 HgCdTe中波红外焦平面探测器,像元面积2.25×10-6 cm2,响应波段范围为3.7~4.9 μm,器件在整个响应范围内的量子效率为0.7,背景黑体温度范围250~350 K,温差取1 K,对其常用条件下NETD进行理论计算及分析。
1)不同积分时间条件下背景限NETD
冷屏F数为4,探测器读出电路电荷存储量不受限制时,不同积分时间下背景限NETD的理论计算结果如图 2(a),若读出电路电荷存储量为6.4 Me-,实际应用中考虑势阱填充量为10%~90%,背景限NETD实际能达到的值如图 2(b)。
从理论计算结果可以看出,随着背景温度和积分时间的降低,NETD均是增大的,但其前提条件是积分时间或背景温度不变,在较低背景温度下,只要系统可接受的积分时间足够长,NETD理论上可达到较小的值,但事实上,由于系统帧频限制,且由于暗电流的影响,在低背景条件下积分时间也不可能达到很大的值,NETD也会受到一定程度的限制。而高背景温度条件下,由于读出电路电荷存储量的限制,积分时间也不可能很长,需根据实际情况确定,在某些条件下,低背景温度下的NETD可能小于高背景温度下的NETD。从图 2(b)明显看出,当读出电路电荷存储量固定且势阱填充量在一定范围时,NETD受到较大限制,有些条件不可能达到理想状态,图中的标记为“半阱输出”的圆点位置是指某一背景度下,势阱填充量为50%时对应的积分时间和NETD,随着背景温度的升高,达到半阱时需要的积分时间减小,半阱NETD有增大的趋势。在本例中积分时间为1 ms和2 ms时,即使在高温350 K背景条件下也仍达不到半阱输出,此时NETD的值较大。
2)不同电荷存储量条件下背景限NETD
仍然是在冷屏F数为4条件下,假设读出电路电荷存储量变化范围为1 Me-~12.8 Me-,为了使NETD的评价更为客观,在不同背景温度下、调整积分时间使输出均达到半阱状态,NETD的理论计算结果图 3,图中实线和虚线分别为不同条件下半阱NETD和半阱积分时间。背景温度不变的情况下,随着电荷存储量的增加,半阱积分时间增大,半阱NETD减小。图中250 K背景温度下,12.8 Me-电荷存储量时,半阱积分时间已超过200 ms,除特殊情况外已不具备实用的条件。
3)不同F数条件下背景限NETD
冷屏的F数直接决定了入射光子数量,假设F数范围为2~5,背景温度和积分时间不变,只改变F数,根据式(11),F数=5的背景限NETD近似为F数=2背景限NETD的2.5倍,但此时探测器输出势阱填充量差别较大,若调整积分时间使输出均达到半阱状态,在电荷存储量为6.4 Me-时,不同背景温度下NETD的理论计算结果图 4。从结果可以看到,随着F数的增加,半阱积分时间增大,但相同背景温度下的NETD保持不变,不同F数下的NETD曲线均重合在一起,只要电荷存储量不变,半阱输出的电子数就已经固定,不论F数是否相同,半阱积分时间下的NETD都保持不变。
3.2 固定背景温度下NETD实测及推算结果比较
对典型640×512 HgCdTe中波红外焦平面探测器固定背景温度下的NETD进行实测及推算。取背景温度T0为293 K、F数为4、电荷存储量6.4 Me-、积分时间为8 ms时,选择不同的T1,温差从±0.0001~±15 K,背景限NETD的理论计算值如图 5。从图中可以看出,T1>T0时,采用的温差越大NETD越小;T1<T0时,采用的温差越大NETD越大。在这两种情况下,绝对温差小于1 K时,NETD的变化都很小,绝对温差小于0.1 K时,NETD基本都不再发生变化。
选取一只上述典型器件,采用不同的温差进行NETD实测,按常规测试方法T1>T0,积分时间仍为8 ms,并按式(15)进行NETD推算,结果如表 1及图 6。由于未扣除器件暗电流、读出电路、测试系统等噪声,NETD实测结果略高于背景限理论计算结果,但不影响推算结果。
表 1 640×512中波探测器NETD实测结果与推算结果比较Table 1. Comparison between test results and calculation results of 640×512 MW detectorT0
/mKT1
/mKTested NETD
(T0−T1)/mKCalculation
NETD/mK293 308 21.3 / 293 303 23.1 23.0 293 298 24.7 24.8 293 295 25.8 26.0 293 294 26.3 26.4 293 293.5 26.4 26.6 293 293.2 / 26.7 293 293.1 / 26.7 293 293.01 / 26.8 293 293.001 / 26.8 293 293.0001 / 26.8 当温差小于0.5 K时,由于黑体控温、采集精度等的影响,响应信号基本不再发生变化,NETD测试已无意义。从已测的这组数据来看,随着与293 K温差的逐渐缩小,NETD逐渐增加,通过293~308 K常规测试结果推算出的NETD也呈同样规律,且两者结果非常接近,温差等于1 K时,推算结果和实测结果均比293~308 K常规结果大了约24%,温差小于1 K时,不管是实测结果还是推算结果,NETD都变化很小。由此可以得到如下结论,通过推算可以达到与实测相近的结果,在不改变目前探测器NETD测试规则的前提下,采用1 K温差进行推算,可以得到固定背景温度下更接近实际应用情况的NETD。
4. 结束语
HgCdTe、InSb等光伏型红外焦平面探测器的NETD除了和器件本身的像元面积、光谱响应范围、F数、量子效率、暗电流、读出电路等因素相关以外,也受限于各种实际应用条件,如帧频、背景温度等要求的限制,还与测试条件,如测试温度温差、积分时间等各种因素相关,这些因素相互影响和制约,不同的应用条件和测试条件可能导致NETD不同,需要根据具体情况结合理论计算进行分析。由于目前焦平面探测器常规NETD测试都是采用较大温差进行,与实际情况存在差异,本文推导的理论公式可在固定背景温度下从常规测试的NETD推算出较小温差的NETD,通过典型器件验证,不同温差的推算结果与实测结果符合较好,采用1K温差的NETD推算结果已非常接近实际情况,可为热像仪系统应用提供参考。本文虽以中波探测器为例进行验证,其分析方法适用于所有波长的红外焦平面探测器。
-
表 1 优化后Anchor
Table 1 Optimized Anchor
Feature map size YOLO v7-Anchor Optimized Anchor 20×20 [12, 16 19, 36 40, 28] [14, 14 12, 23 23, 20] 40×40 [36, 75 76, 55 72, 146] [17, 40 34, 31 28, 66] 80×80 [142, 110 192, 243 459, 401] [53, 39 74, 59 52, 119] 160×160 [107, 84 105, 167 190, 140] 表 2 实验环境配置
Table 2 Experimental environment configuration
Training environment Configuration CPU AMD Ryzen 7 3700X GPU RTX 4090-24G Operating system Ubuntu 20.04.3 LTS Training framework Pytorch 1.12.0 Development environment CUDA 11.3, Python 3.8 表 3 消融实验结果
Table 3 Ablation results
Models Fusion-P P4 detection layer SA-RFE Self distillation AP@0.5/(%) YOLO v7 89.7 A √ 90.5 B √ 91.7 C √ 90.2 D √ 90.2 E √ √ √ √ 92.5 表 4 对比实验结果
Table 4 Comparative experimental results
Methods mAP/% Person/% Bicycle/% Car/% Parameters FLOPs/B SMG-YI[18] 77.0 78.5 65.8 86.6 43.8M 54.7 PMBW 77.3 81.2 64.0 86.5 36.0M 120.0 RGBT 82.9 80.1 76.7 91.8 82.7M 130.0 YOLO v5m 81.6 78.0 78.1 89.2 35.7M 50.2 YOLO-ACN[19] 82.1 79.1 57.9 85.1 34.5M 111.5 YOLOX[20] 85.9 89.1 77.6 91.2 54.2M 155.6 YOLO v7 89.7 88.6 87.2 92.8 36.9M 104.7 Ours 92.5 90.3 90.1 97.0 43.8M 126.8 -
[1] JIAO L, ZHANG F, LIU F, et al. A survey of deep learning-based object detection[J]. IEEE Access, 2019, 7: 128837-128868. DOI: 10.1109/ACCESS.2019.2939201
[2] ZOU Z, CHEN K, SHI Z, et al. Object detection in 20 years: a survey[J]. Proceedings of the IEEE, 2023, 111(3): 257-276. DOI: 10.1109/JPROC.2023.3238524
[3] KOU R, WANG C, PENG Z, et al. Infrared small target segmentation networks: a survey[J]. Pattern Recognition, 2023, 143: 109788. DOI: 10.1016/j.patcog.2023.109788
[4] ZHANG M, ZHANG R, YANGY, et al. ISNet: shape matters for infrared small target detection[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2022: 877-886.
[5] DAI Y, WU Y, ZHOU F, et al. Attentional local contrast networks for infrared small target detection[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 59(11): 9813-9824. DOI: 10.1109/TGRS.2020.3044958
[6] LI S, LI Y, LI Y, et al. Yolo-firi: improved yolo v5 for infrared image object detection[J]. IEEE Access, 2021, 9: 141861-141875. DOI: 10.1109/ACCESS.2021.3120870
[7] BAI Y, LI R, GOU S, et al. Cross-connected bidirectional pyramid network for infrared small-dim target detection[J]. IEEE Geoscience and Remote Sensing Letters, 2022, 19: 1-5.
[8] LIU Y, PENG Z. Infrared small target detection based on resampling-guided image model[J]. IEEE Geoscience and Remote Sensing Letters, 2021, 19: 1-5.
[9] CHEN Y, ZHANG G, MA Y, et al. Small infrared target detection based on fast adaptive masking and scaling with iterative segmentation[J]. IEEE Geoscience and Remote Sensing Letters, 2021, 19: 1-5.
[10] WANG C Y, Bochkovskiy A, LIAO H Y M. YOLO v7: trainable bag-of-freebies sets new state-of-the-art for real-time object detectors[C] //Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023: 7464-7475.
[11] LI Y, CHEN Y, WANG N, et al. Scale-aware trident networks for object detection[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision, 2019: 6054-6063.
[12] JI M, SHIN S, HWANG S, et al. Refine myself by teaching myself: feature refinement via self-knowledge distillation[C]//Proceedings of the IEEE/ CVF Conference on Computer Vision and Pattern Recognition, 2021: 10664-10673.
[13] GOU J, YU B, Maybank S J, et al. Knowledge distillation: a survey[J]. International Journal of Computer Vision, 2021, 129: 1789-1819. DOI: 10.1007/s11263-021-01453-z
[14] Hinton G, Vinyals O, Dean J. Distilling the knowledge in a neural network[J]. arXiv preprint arXiv: 1503.02531, 2015.
[15] Redmon J, Divvala S, Girshick R, et al. You only look once: unified, real-time object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016: 779-788.
[16] Vadidar M, Kariminezhad A, Mayr C, et al. Robust environment perception for automated driving: a unified learning pipeline for visual-infrared object detection[C]//2022 IEEE Intelligent Vehicles Symposium (Ⅳ), 2022: 367-374.
[17] Kera S B, Tadepalli A, Ranjani J J. A paced multi-stage block-wise approach for object detection in thermal images[J]. The Visual Computer, 2022: 1-17.
[18] CHEN R, LIU S, MU J, et al. Borrow from source models: efficient infrared object detection with limited examples[J]. Applied Sciences, 2022, 12(4): 1896. DOI: 10.3390/app12041896
[19] LI Y, LI S, DU H, et al. YOLO-ACN: Focusing on small target and occluded object detection[J]. IEEE Access, 2020, 8: 227288-227303. DOI: 10.1109/ACCESS.2020.3046515
[20] GE Z, LIU S, WANG F, et al. Yolox: Exceeding yolo series in 2021[J]. arXiv preprint arXiv: 2107.08430, 2021.