Similar HED-Net for Salient Human Detection in Thermal Infrared Images
-
摘要: 热红外图像中的人体目标易于观察显著性强,应用广泛,但受限于热红外设备的硬件,往往图像中的人体目标边缘模糊,检测效果较差,同时因为热红外的特殊成像原理,人体目标检测时极易受到发热物和遮挡物的干扰,检测的精度也无法得到保证。针对上述问题,本文提出了一种类HED(holistically nested edge detection)的热红外显著性人体检测网络。网络采用类HED网络形式,通过将不同比例的空洞卷积编解码模块进行残差相加形式,完成人体目标的检测任务。实验证明该网络可以有效地检测人体目标,准确地预测边缘结构,同时在发热物及遮挡物等环境下也具有较高的检测精度。Abstract: Human targets in thermal infrared images are easy to observe and have a wide range of applications. However, they are limited by the hardware of thermal infrared devices. The edges of human targets in the images are often blurred and the detection efficiency is poor. Simultaneously, because of the special imaging principle of thermal infrared, human target detection is vulnerable to the interference of heating and occlusion objects and the detection accuracy cannot be guaranteed. In response to the above issues, this study proposes a type of holistically nested edge detection (HED)-thermal infrared saliency human detection network. The network adopted the form of a similar HED network and detected human targets by adding the residuals of different proportions of the hole convolutional codec module. Experiments showed that the network can effectively detect human targets, accurately predict the edge structure, and also have high detection accuracy in an environments with heating objects and obstructions.
-
0. 引言
制冷型红外探测器(以下简称红外探测器)具有响应速度更快、画质细节更细腻、灵敏度更高、探测距离更远及性能更稳定等诸多优点,已经越来越多地应用在目标搜索、目标识别、目标跟踪和目标定位等光电装备领域[1-4]。然而红外探测器在实际应用场景中一般会经历冲击激励,引起冲击响应,为了确保其能够在复杂多变的苛刻环境中通过考验,在设计阶段进行冲击环境适应性研究显得尤为重要。
杜瓦封装是红外探测器实现产品化、实用化及工程化的关键,其可靠性直接决定了红外探测器能否正常工作。在实际服役过程中,杜瓦封装中的键合引线处于无规律振动及冲击的复杂动力学环境中,一旦振动或冲击量级过大,将产生一定程度的应力应变甚至断裂。印度国防研发组织(defence research and development organization,DRDO)从武装直升机战场实际应用环境出发,以机身振动、爆炸冲击等角度对武装直升机红外探测设备进行了理论研究[5]。中国空空导弹研究院对空空导弹的新研元器件进行了振动试验分析,并进一步提高了其元器件随机振动试验条件[6]。中国科学院微小卫星创新研究院在研究新一代北斗卫星时发现,卫星与火箭分离界面冲击响应达到了4000~12000g[7]。吴大方等[8]设计石英灯红外辐射式大热流冲击试验系统,并研究脆性试验件表面应变与热冲击之间的关系,为高超声速飞行器的透波天线窗等部件在高速大热流冲击下的安全可靠性设计提供重要依据。袁名松等[9]以巡飞攻击导弹红外成像导引头为研究对象,对系统的半正弦波冲击响应进行了有限元分析,结果表明红外成像导引头能承受住发射及分离过程中的冲击激励作用。因此,提高杜瓦封装的冲击可靠性使其更好地应用于军事及航空航天领域迫在眉睫。
目前,少有对红外探测器中引线键合在大量级冲击环境尤其是冲击响应谱下的研究。本文针对红外探测器引线键合技术,建立有限元模型进行模态分析引线弧形,综合考虑引线材料特性选择最佳引线材料,并进行一系列工艺优化及杜瓦加固,最后通过冲击响应谱试验对引线键合质量进行评估。
1. 冲击响应谱试验条件
冲击试验一般分为经典冲击和冲击响应谱试验两种。经典冲击一般有半正弦波、梯形波和锯齿波3种,大量研究表明试件即使通过了经典冲击试验,在实际使用环境中仍会损坏,因此不适合采用经典冲击作为检测条件的试验规范[10]。GJB 150A[11]中也明确规定只有证明测量数据在经典脉冲的容差内,才允许采用梯形波和锯齿波的经典冲击试验,其他均以冲击响应谱作为瞬态冲击的试验标准。与经典冲击相比,冲击响应谱试验不仅研究冲击波本身,而且更加关注冲击作用与系统的效果,估计冲击对结构的损伤大小,更加接近真实的冲击环境。因此,本研究以冲击响应谱试验作为衡量红外探测器中引线键合质量的检测条件。
考虑到冲击响应谱是针对不同频率的响应进行计算,可将红外探测器的耦合作用分解为多个线性单自由度系统,对于每个单自由度系统进行冲击响应谱计算,取系统响应的最大值,然后结合红外探测器的固有频率便可得出整个系统的冲击响应谱。图 1为单自由度(single degree of freedom,SDOF)系统的冲击响应振动模型。
图中,a为输入运动,b为响应运动,m为载荷质量,k、c分别为SDOF的刚度系数与阻尼系数。设载荷关于时间t的位移函数为x(t),基座关于时间t的位移函数为y(t)。则在外部的加速度激励下,系统的运动方程为:
$$ m\ddot x + c\dot x + kx = ky + c\dot y $$ (1) 式中:$\dot x$为x(t)的一阶求导,即时间为t时载荷的速度;$\ddot x$为x(t)的二阶求导,即时间为t时载荷的加速度。$\dot y$同上。令固有角频率${\omega _{\rm{n}}} = \sqrt {\frac{k}{m}} $,阻尼因子$\xi = \frac{c}{{2\sqrt {mk} }}$,则式x变为:
$$ \ddot x + 2\xi {\omega _{\rm{n}}}\dot x + {\omega _{\rm{n}}}^2x = {\omega _{\rm{n}}}^2y + 2\xi {\omega _{\rm{n}}}\dot y $$ (2) 接着采用递归数值滤波法求解系统响应,其递推公式[12]如下:
$$ {\ddot x_i} = {h_0}{p_i} + {h_1}{p_{i - 1}} + {h_2}{p_{i - 2}} + {q_1}{\ddot x_{i - 1}} + {q_2}{\ddot x_{i - 2}}, i \geqslant 3 $$ (3) $$ {h_0} = 1 - {{\rm{e}}^{( - A)}}\frac{{\sin B}}{B} $$ (4) $$ {h_1} = 2{{\rm{e}}^{( - A)}}(\frac{{\sin B}}{B} - \cos B) $$ (5) $$ {h_2} = {{\rm{e}}^{( - A)}}[{{\rm{e}}^{( - A)}} - \frac{{\sin B}}{B}] $$ (6) $$ {q_1} = 2{{\rm{e}}^{( - A)}}\cos B $$ (7) $$ {q_2} = - {{\rm{e}}^{( - 2A)}} $$ (8) $$ A=ω_{j}Δtη $$ (9) $$ B = {\omega _j}\Delta t\sqrt {1 - {\eta ^2}} $$ (10) $$ \eta = \frac{1}{{2Q}} $$ (11) 式中:ωj=2πfj,ωj为系统第j阶的固有圆频率;fj为系统第j阶的固有频率;pi、η、Δt、Q分别为系统在时间i点受到的加速度激励值、临界阻尼比、采样间隔时间、放大系数。根据冲击响应谱的频率范围和取样间隔,得到各个小波分量频率,该频率即为各个SDOF的固有频率,然后计算各SDOF在激励下的响应曲线,取其峰值并结合各小波分量频率即得到冲击响应谱。
基于应用需求,为研制能适应冲击响应谱为1000g量级(试验参数如图 2)的高可靠红外探测器,本研究重点攻关杜瓦封装中的引线键合加固设计与工艺优化。
2. 引线键合设计
红外探测器在运输、试验和使用中会经历各种振动和热环境,封装杜瓦也同样受到环境的影响。杜瓦内部引线键合一般分为同一水平面的和不同水平面的键合,后者由于引线弧形不对称及受力不平衡,更容易产生过大应力应变甚至断裂的风险。如图 3所示,杜瓦封装内基板与引线环键合时,第一、二焊点间隔距离远且不在同一水平面上,其中,引线水平方向跨距为ΔL、垂直方向跨高为ΔH。
图 3中,引线弧形是由劈刀运动轨迹决定的,在键合第一焊点后,劈刀先向上运动高度h1;然后向左运动距离l1;最后向下运动高度h2并键合第二焊点形成最终的引线弧形。其中第一焊点与第二焊点高度差为h1-h2,ΔH=h1-h2,ΔL=l1。为了分析键合引线弧形在1000g冲击响应谱试验条件下的应力分布及位移情况,我们固定ΔL为2000 μm并设计了10种ΔH不同的弧形,弧形的ΔL与ΔH满足如下公式:
$$ \frac{{{X^2}}}{{\Delta {L^2}}} + \frac{{{Z^2}}}{{\Delta {H^2}}} = 1 $$ (12) 通过引线弧形各点数据建立模型并进行有限元分析,建立的红外探测器模型中,底部法兰面进行固定支撑约束,其余各部件进行绑定约束,仿真的引线材料为30 μm的铂丝,设定1000g冲击响应谱试验条件,分别沿X、Y、Z三轴正方向进行仿真,最终得到3个方向的单轴冲击仿真结果。图 4中ΔH为7000 μm时,Y轴正方向引线位移的仿真结果,最大位移为0.2672 mm。将10根引线弧形的仿真结果整合后得到图 5。
图 5中结果显示,在1000g冲击响应谱试验条件下,Y轴正方向冲击对弧形的位移与应力影响最大,Z轴正方向的冲击对其影响最小,X轴居中。且随着弧高逐渐增大,弧形应力与位移也逐渐变大。因此为了减小1000g冲击响应谱条件下引线形变及断裂的可能,需要弧高尽可能小。
此外,在冲击响应谱试验下,键合引线所受力可由以下公式计算得出:
$$ F=ma $$ (13) $$ m=πr^{2}Lρ $$ (14) 式中:a为引线最大加速度;m、r、L、ρ分别为引线的质量、半径、长度和密度。以铂丝为例,已知其密度为21.34 g/cm3,直径30 μm,长度6.5 mm,当冲击最大加速度为1000g时,计算得出铂丝整体受力为9.805×10-5 N,故键合引线自身受力可以忽略不计。
除了考虑键合引线弧形外,键合引线的材料对键合质量也有直接关系,并影响红外探测器组件长期使用的可靠性和稳定性。红外探测器封装对引线材料的要求是:低电阻的欧姆连接、漏热小、可塑性好、键合处的机械强度高以及键合完成后对杜瓦真空度影响小。常用的引线材料有:金丝、银丝、铂丝、硅铝丝、铝丝和铜丝等,表 1列出了常用引线材料的部分物理参数[13]。
红外探测器为了获得可以接受的制冷时间,必须相应地降低杜瓦组件的静态热负载。因此红外探测器的引线选择除了考虑键合性能外,还要兼顾引线漏热。
由以下公式进行理论分析:
$$ {Q_1} = {I^2}R = {I^2}\rho \frac{L}{\mathit{\Phi }}$$ (15) $$ {Q_2} = - \lambda {\mathit{\Phi }} \frac{{{\rm{d}}T}}{{{\rm{d}}L}} $$ (16) 式中:Q1为引线焦耳热;Q2为引线传导热;I、R、ρ、λ、L、Φ分别为引线的电流、电阻、电阻率、热导率、长度及横截面积。由式(15)与式(16)可得:
$$\mathit{d}{Q_1} = \frac{{\rho \lambda {I^2}}}{Q}{\rm{d}}T $$ (17) $$ {({Q_2})_{\min }} = I\sqrt {2\int_{{T_i}}^{{T_j}} {\rho (\tau )\lambda (\tau ){\rm{d}}\tau } } $$ (18) $$ \frac{L}{\mathit{\Phi }} = \frac{1}{{\sqrt 2 I}}\int_{{T_i}}^{{T_j}} {\frac{{\lambda (\tau )}}{{\sqrt {\int_{{T_i}}^{{T_j}} {\rho (\tau )\lambda (\tau ){\rm{d}}\tau } } }}} {\rm{d}}\tau $$ (19) 式中:Tj为引线上端温度,Ti为引线冷端温度。当Tj=300 K,Ti=77 K时,得到最小漏热的引线长截比。为减小引线固体传导漏热,常选用热导率小的材料、增加引线长度、减小引线线径,但会使得引线电阻增大导致信号引出及焦耳热耗两方面的问题。通过式(15)~式(19)的理论分析,综合考虑键合引线热导率、电阻率、引线直径、长度等诸多因素,从而选出最佳的键合引线材料及其长截比。
此外,为避免红外探测器在实际应用过程中发生共振现象导致红外探测器损坏,材料的固有频率则需要被考虑。材料的固有频率计算公式[14]为:
$$ f = \frac{1}{{2\pi }}\sqrt {\frac{k}{m}} $$ (20) $$ K = \frac{F}{\delta } = \frac{1}{{\frac{{{L^3}}}{{48EI}} + \frac{{{H^3}}}{{6EI}} + \frac{{H{L^2}}}{{8GJ}}}} $$ (21) 式中:f为固有频率;m为质量;K为键合引线刚度;E为弹性模量;G为剪切模量;I为惯性矩;J为极惯性矩;H与L为键合引线弧高与弧长。考虑到红外探测器组件振动要求为0~2000 Hz,键合引线固有频率应尽可能避开红外探测器共振频率范围,因此键合引线材料自身的弹性模量、剪切模量、惯性矩、极惯性矩、弧高及弧长等因素也需要被综合考虑。
通过对键合引线受力分析及综合考虑材料多种特性之后,最终优选30 μm铂丝为键合材料且确定了其键合弧形参数。
3. 引线键合工艺优化
引线键合的可靠性受多种因素影响,如键合表面材质、键合表面状态、引线材料、键合参数及杜瓦整体抗振性能等。在基板、引线环及键合引线材料确定的前提下,引线键合的质量则只与键合表面状态、键合参数和杜瓦整体抗振性能有关。我们将键合表面状态因素设定为A,键合参数因素设定为B,杜瓦整体抗振性能因素为C,则键合引线发生各种断裂等失效的概率为P(ABC)。以珏芯微电子的制冷型红外探测器为例,在过去30个制冷型红外探测器共计900根引线1000g冲击响应谱试验中,存在26根为键合参数不适合导致失效,存在25根因键合表面状态问题导致的失效,存在11根因杜瓦整体抗振性能差导致的引线断裂失效。故A、B、C各自独立发生的概率分别为P(A)≈0.029,P(B)≈0.028,P(C)≈0.012。P(ABC)为A、B、C发生的集合,约等于0.069。因此当存在N根键合引线时,不发生引线断裂失效的概率P(N)由以下公式计算得出:
$$ P(N) = \prod\nolimits_{i = 1}^N {(1 - {P_i}(ABC))} $$ (22) 当N=30时,P(N)≈0.1171。可以看出在1000g冲击响应谱试验条件下,30根引线即单个红外探测器通过试验的概率并不高,即键合工艺仍然有较大的优化空间。在以铂丝作为键合引线材料后,为了进一步提高键合强度,主要采用直接加固和间接加固的方式。直接加固方式包括对键合表面的洁净处理、键合工艺参数的优化以及植球等方式。其中,键合表面洁净处理在一般清洁表面污染方式的基础上增加了等离子清洗工艺;键合工艺参数的优化可通过设计正交试验,取键合三要素键合压力、超声功率、超声时间构成3因素4水平的正交实验,并对结果进行极差分析从而得出最佳的键合工艺参数;植球则是指在第二焊点键合结束后,再对第二焊点进行球焊操作,植球后的引线强度往往比未植球时高。间接加固方式为对杜瓦冷指顶端辅助加固从而对悬臂梁结构进行力学强化,在减少其振动的同时而间接减少键合引线的受力。中国科学院上海技术物理研究所也提出了一种杜瓦冷指顶端辅助加固的力学强化方式[15]。
采用推拉力试验机对工艺优化后的键合引线进行测试,测试速度为500 μm/s,设定负载40g。图 6为工艺优化前后键合引线拉力强度值对比。
4. 冲击响应谱试验
对引线键合优化后的红外探测器进行1000g冲击试验,试验参数如图 2,加载方向±X、±Y、±Z每向3次。图 7为冲击响应谱(shock response spectrum,SRS)试验样品,图 8为试验流程。
冲击响应谱试验一般包括图中9个步骤,试验开始前首先调节设备冲击响应谱,使其输出与试验条件一致,接着确认红外探测器试验前状态,然后就可以开始试验。试验时按X、-X、Y、-Y、Z、-Z的顺序进行冲击响应谱试验,试验完成后确认探测器的状态。
试验结束后分析得到:4个红外探测器试验样品经过1000g量级冲击响应谱试验后未发现明显的缺陷,键合引线亦保持正常的电气连接功能。因此,对键合引线受力进行理论分析、综合考虑键合引线材料及工艺优化这一体系措施对于提高键合引线在冲击响应谱试验下的可靠性是有效且可行的。
5. 结论与展望
本研究通过建立有限元模型对红外探测器杜瓦封装中的键合引线进行模态分析,综合考虑键合材料的物性参数,最终选定了铂丝作为键合材料并确定了其弧形参数。在对引线键合工艺进行优化后得到了符合期望的引线键合质量,且通过了1000g量级冲击响应谱试验。本研究给基于冲击响应谱试验条件下如何提高键合引线可靠性提供了新的思路。然而,该研究仍然有优化的空间:
1)由于缺少高速摄像设备,对于键合引线在冲击环境下的实际运动轨迹未能捕捉到;
2)下一步,可通过设备升级及采用多种检测方法来更好地把控键合一致性;
3)建立多变量系统性的仿真平台,获得更接近真实情况的引线键合仿真数据;
4)完善键合引线材料数据库,做到针对不同情况快速筛选合适的引线材料。
-
表 1 主干VGG16网络结构
Table 1 Backbone VGG16 network structure table
Operation Input Size Output Size Output Input Data 224×224×3 No Conv_1 (3×3) 224×224×3 224×224×64 No Conv_2 (3×3) 224×224×64 224×224×64 No MaxPool(2×2) 224×224×64 112×112×64 No Conv_3 (3×3) 112×112×64 112×112×128 No Conv_4 (3×3) 112×112×128 112×112×128 Yes MaxPool (2×2) 112×112×128 56×56×128 No Conv_5 (3×3) 56×56×128 56×56×256 No Conv_6 (3×3) 56×56×256 56×56×256 No Conv_7 (3×3) 56×56×256 56×56×256 Yes MaxPool(2×2) 56×56×256 28×28×256 No Conv_8 (3×3) 28×28×256 28×28×512 No Conv_9 (3×3) 28×28×512 28×28×512 No Conv_10(3×3) 28×28×512 28×28×512 Yes MaxPool(2×2) 28×28×512 14×14×512 No Conv_11 (3×3) 14×14×512 14×14×512 No Conv_12 (3×3) 14×14×512 14×14×512 No Conv_13 (3×3) 14×14×512 14×14×512 Yes MaxPool(2×2) 14×14×512 7×7×512 No Conv_add1(3×3) 7×7× 512 7×7×1024 No Conv_add2 (3×3) 7×7×1024 7×7×512 Yes 表 2 单一尺度U型编码网络结构
Table 2 Single-scale U-encoded network structure
Operation Parameters Conv_1 K=3, stride=1, padd=1 Dilation Conv_1 K=3, dilation=2*i, padd=2*(5-i) (i=1, 2, 3, 4) Dilation Conv_2 K=3, dilation=2*i,
padd=2* (5- i) (i =1, 2, 3, 4)Conv_2 K=3, stride=1, padd=1 Conv_3 K=1, stride=1 表 3 编解码网络优化实验对比
Table 3 Comparative experiment of encoder-decoder network optimization
Operation maxFβ MAE Conv 0.8279 0.01052 Dilation Conv
(Dlation=2)0.8526 0.00987 Dilation Conv+Conv
(Dlation=2)0.8884 0.00616 Dilation Conv+Conv
(Dlation=2, 2, 4, 6, 8)0.8934 0.00607 Dilation Conv+Conv
(Dilation=4, 4, 16, 32, 64)0.7891 0.01421 Dilation Conv+Conv
(Dilation =2, 2, 8, 16, 32)0.8491 0.00979 表 4 多层特征融合对比实验
Table 4 Multilayer feature fusion contrast experiment
Fusion operation BCE MFSO 0.85367 MFMO-layer1 0.92691 MFMO-layer2 0.89786 MFMO-layer3 0.87981 MFMO-layer4 0.86286 MFMO-layer5 0.84326 表 5 多算法验证对比
Table 5 Multialgorithm validation comparison
Models Evaluation metrics maxFβ MAE Model size /MB Running time/ms BASNet(ResNet 34) 0.88087 0.01154 348.5 467.3 PICNet(VGG16) 0.88732 0.00633 153.3 178.2 PoolNet(ResNet50) 0.89066 0.00623 273.3 578.7 Ours(VGG16) 0.89146 0.00603 101.2 111.7 Ours(MobileNet-V2) 0.84066 0.01325 19.4 86.1 -
[1] ZHAO Z Q, ZHANG P, XU S T, et al. Object detection with deep learning: a review[J]. IEEE Transactions on Neural Networks and Learning Systems of IEEE, 2018, 30(11): 3212-3232.
[2] ZHANG Y, GUO L, CHENG G. Improved salient objects detection based on salient points[C]//35th Chinese Control Conference (CCC) of IEEE, 2016. DOI. : 10.1109/ChiCC. 2016.7554008.
[3] ZHAN Jin, HU Bo. Salient object contour detection based on boundary similar region[C]//Fourth International Conference on Digital Home IEEE Computer Society, 2012. DOI: 10.1109/ICDH.2012.74.
[4] Yuna Seo, Donghoon Lee, Yoo C D. Salient object detection using bipartite dictionary[C]//IEEE International Conference on Image Processing, 2014. DOI: 10.1109/ICIP.2014.7025228.
[5] Nouri F, Kazemi K, Danyali H. Salient object detection via global contrast graph[C]//2015 Signal Processing and Intelligent Systems Conference (SPIS) Of IEEE, 2016. DOI: 10.1109/SPIS.2015.7422332.
[6] Long J, Shelhamer E, Darrell T. Fully convolutional networks for semantic segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 39(4): 640-651.
[7] Simonyan K, Zisserman A. Very deep convolutional networks for large-sale image recognition[J]. Computer Science, 2014. DOI: 10.48550/arXiv.1409.1556.
[8] Sewak M. Practical Convolution Neural Networks[M]. Birmingham: Published by Packt Publishing Ltd. 2018.
[9] LIU Wei, Dragomir Anguelov, Dumitru Erhan, et al. SSD: single shot multiBox detector[C]//IEEE European Conference on Computer Vision (ECCV), 2016, DOI: 10.1007/978-3-319-46448-0_2.
[10] HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition[C]//IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, DOI: 10.1109/CVPR.2016.90.
[11] HUANG G, LIU Z, Laurens V D M, et al. Densely connected convolutional networks[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition, 2017, DOI: 10.1109/CVPR.2017.243.
[12] REN Qinghua, HU Renjie. Densely connected refinement network for salient object detection[C]//International Symposium on Intelligent Signal Processing and Communication Systems (ISPACS), 2018, DOI: 10.1109/ISPACS.2018.8923354.
[13] Ronneberger O, Fischer P, Brox T. U-Net: convolutional networks for biomedical image segmentation[C]//2015 MICCAI, DOI: 10.1109/ACCESS.2021.3053408.
[14] LIU N, HAN J, YANG M H. PiCANet: learning pixel-wise contextual attention for saliency detection[C]//IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR) of IEEE, 2018: DOI: 10.48550/arXiv.1708.06433.
[15] FENG M, LU H, DING E. Attentive feedback network for boundary-aware salient object detection[C]//IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2019, DOI: 10.1109/CVPR.2019.00172.
[16] QIN Xuebin, ZHANG Zichen, HUANG Chenyang. et al. BASNet: boundary-aware salient object detection[C]//IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR) of IEEE, 2019, DOI: 10.1109/CVPR.2019.00766.
[17] LIU Jiangjiang, HOU Qibin, et al. A simple pooling-based design for real-time salient object detection[C]//IEEE/CVF Conference on Computer Vision and Pattern Recognition of IEEE, 2019, DOI: 10.1109/CVPR.2019.00404..
[18] XIE S, TU Z. Holistically-nested edge detection[J]. International Journal of Computer Vision, 2017, 125(5): 3-18.
[19] Mark Sandler, Andrew Howard, et al. MobileNet V2: inverted residuals and linear bottlenecks[C]//IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2018: 4510-4520, DOI: 10.1109/CVPR.2018.00474.
[20] Andrew Howard, M Zhu, B Chen, et al. MobileNets: efficient convolution neural networks for mobile vision application[J/OL]//Computer Science, arXiv: 1704.04861, https://arxiv.org/abs/1704.04861.
[21] YU Fisher, Koltun V. Multi-scale context aggregation by dilated convolutions[C]//The International Conference on Learning Representations, 2016, DOI: 10.48550/arXiv.1511.07122.
[22] CHEN L C, Papandreou G, Schroff F, et al. Rethinking atrous convolution for semantic image segmentation[C]//Computer Science, 2017. arXiv: 1706.05587, https://arxiv.org/abs/1706.05587.
[23] CHEN Q, XU J, Koltun V. Fast image processing with fully convolutional networks[C]//ICCV of IEEE, 2017, DOI: 10.1109/ICCV.2017.273.
[24] LIN Tsungyi, Piotr Dollar, R Girshick, et al. Feature pyramid networks for object detection[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) of IEEE, 2017, DOI: 10.1109/CVPR.2017.106.
-
期刊类型引用(4)
1. 党宁,李世峰,于坤義. 基于多尺度伸缩卷积与注意力机制的光伏组件缺陷分割算法. 电子技术应用. 2025(04): 66-71 . 百度学术
2. 黄志海,邓耀华,吴光栋. IC器件表面缺陷多光谱图像特征融合检测方法. 仪器仪表学报. 2024(09): 24-33 . 百度学术
3. 韩自强,岳明凯,张骢,高棋. 基于孪生网络的无人机目标多模态融合检测. 红外技术. 2023(07): 739-745 . 本站查看
4. 骆元鹏,付江缺,李双江,李红明,张奇,张文成. 基于机器学习算法的光伏组串故障诊断技术研究. 电力大数据. 2023(10): 34-41 . 百度学术
其他类型引用(2)