Infrared Image Recognition Method of Substation Equipment Based on Improved YOLOv7
-
摘要:
变电站电气设备红外图像识别是其进行缺陷与故障诊断的重要前提,能保障电力系统的安全稳定运行。为达到变电站设备高精准、高效率的识别效果,本文提出了一种基于改进YOLOv7网络的变电站设备红外图像识别方法。变电站采集到的红外图像作为YOLOv7网络的输入,在红外图像的识别中,采用CoordConv卷积层增加图像坐标信息,增强网络层的信息细节,丰富图像特征内容;引入注意力机制排除其他信息干扰,增强模型的特征表达能力,提高网络训练精度;为进一步提高识别精度,不同于传统损失函数的构建,采用WIoU损失函数加速网络收敛,提高模型的准确性。通过对变电站采集的实际红外图像进行分析,实验结果表明,所提出的基于改进YOLOv7网络的变电站设备红外图像识别模型识别精度能达到97.1%。相较于YOLOv7网络和其他几种典型网络,所提模型具有较高的准确性和鲁棒性,可以有效应用于变电站设备的智能监测和维护,为后续故障诊断工作提供基础条件。
Abstract:Infrared image recognition of substation electrical equipment is an important prerequisite for defect and fault diagnosis to ensure the safe and stable operation of power systems. To realize high-precision and high-efficiency recognition of substation equipment, in this study, an infrared image recognition method of substation equipment is proposed based on an improved YOLOv7 network. The infrared image acquired by the substation is used as the input for the YOLOv7 network. In the recognition of infrared images, a CoordConv convolution layer is used to increase the image coordinate information, enhance the information details of the network layer, and enrich the image feature content. The attention mechanism is introduced to eliminate other information interference, enhance the feature expression ability of the model, and improve the accuracy of network training. To further improve the recognition accuracy, unlike the traditional loss function, the WIoU loss function is used to accelerate the network convergence and improve the model accuracy. By analyzing the actual infrared images acquired by the substation, the experimental results show that the recognition accuracy of the infrared image recognition model of the substation equipment based on the improved YOLOv7 network can reach 97.1%. Compared with the YOLOv7 network and other typical networks, the proposed model has higher accuracy and robustness and can be effectively applied to intelligent monitoring and maintenance of substation equipment, providing basic conditions for subsequent fault diagnosis.
-
Keywords:
- substation equipment /
- infrared image recognition /
- YOLOv7 /
- CoordConv /
- attention mechanisms /
- WIoU
-
0. 引言
微通道板(microchannel plate,MCP)是由数百万个孔径微米级的通道式电子倍增器排列而成的二维电子倍增器阵列,因其出色的位置分辨及时间分辨性能,广泛应用于微光像增强器、微通道板光子探测器、微通道板型光电倍增管、质谱分析、空间粒子探测等领域[1-7]。开口面积比是微通道板的一项重要指标,指的是微通道板工作区的通道开口面积与整个工作区面积之比,开口面积比决定微通道板的探测效率,并在一定程度上影响微通道板的噪声因子[1]。近年来,随着微通道板制造技术进步,像增强器用小孔径MCP的开口面积比可超过65%,部分探测级微通道板开口面积比可达到70%,进一步追求大的开口面积比给微通道板的工艺制造带来非常大的困难。
在常规MCP制造工艺之外,提升微通道板开口面积比的另一个途径为MCP扩口技术,即将微通道板输入面的通道口处理成漏斗状,使开口面积比显著提升,达到80%甚至90%以上,在微光夜视仪、粒子探测器等军用、民用领域具有巨大的应用潜力。美国Galileo、日本Hamamatsu、南京理工大学等国内外单位在MCP扩口方向开展了研究工作,使用湿法腐蚀制作出的扩口MCP在电流增益、噪声因子、离子探测效率等方面性能优于常规MCP,但是由于工艺难度大,这项技术目前仅日本Hamamatsu能够提供孔径12μm科研用MCP,并没有得到大批量的实质性应用[8-11]。提高MCP对电子的探测效率方面,通过在MCP表面镀制具有二次电子发射能力的膜层也是一种有效措施,在微通道板型光电倍增管以及微光像增强器中均能够得到应用,但是同时也会带来一定的负面影响,如:微光像增强器中分辨力和调制传递函数性能会有一定的降低、微通道板型光电倍增管中会有延时脉冲等,扩口MCP有利于提高微通道板的时间和空间分辨能力,为解决以上问题提供可能[12-15]。
针对湿法腐蚀扩口技术所存在的工艺一致性差、选择性腐蚀造成锥度尺寸难以达标等问题,本文提出一种新的MCP扩口技术:利用微纳加工领域已成熟应用的干法刻蚀技术进行MCP扩口,通过建立理想模型研究刻蚀工艺对于扩口MCP开口面积比、锥形深度以及形状等参数的影响,为开展实验研究及可能的批量应用奠定基础。
1. 干法刻蚀技术实现MCP扩口原理
干法刻蚀技术是目前工业上最成熟也是应用最广泛的刻蚀技术。广义上讲,所有不涉及化学溶液腐蚀的刻蚀技术都称为干法刻蚀,干法刻蚀具有可控性好、精度高、可流水线批量刻蚀等优点,已成为半导体工业微纳制造工艺中主要的刻蚀技术。常用的干法刻蚀技术包括反应离子刻蚀(reaction ion etching, RIE)、感应耦合等离子体刻蚀(inductively coupled plasma, ICP)、离子束刻蚀(ion beam etching, IBE)、聚焦离子束刻蚀(focused ion beam, FIB)等[16]。实现MCP扩口需要具有定向刻蚀能力的干法刻蚀,如ICP、RIE、IBE,本文以IBE为例进行理论模型研究。离子束刻蚀技术是利用一定能量的离子撞击固体表面原子,使材料表面原子发生溅射,达到刻蚀的目的,属于纯物理过程,离子束刻蚀的优点在于:各向异性、方向性好、刻蚀控制精度高、可刻蚀材料种类多、离子束入射角度调节方便等[17]。
与湿法腐蚀的选择性腐蚀不同,干法刻蚀的方向性好但选择性很差,因此干法刻蚀形成MCP扩口的原理与湿法腐蚀有本质的不同。采用干法刻蚀形成扩口MCP示意图如图 1所示,离子束以一定的角度入射至MCP输入面,示意图中看向通道内壁的视线角度与离子束入射至MCP表面的角度相同,即离子束在通道内能够刻蚀的最深处为d点、d′点,在非剖面图中,视线看到的通道内的最深处也是d点。为便于计算,本文中MCP斜切角以0°计算:
① A为MCP表面,离子束刻蚀对于A面为均匀的刻蚀,对于锥形通道的形成没有作用;
② B为通道内壁表面,MCP通道相对于离子束不进行自转时,a′、b′、c′、d′四个点刻蚀掉的材料厚度相同,不会形成差别,而a、b、c、d四个点离子束并未能够刻蚀到;
③ 如果MCP通道相对于离子束实现以通道指向为轴进行自转,则a′、b′、c′、d′四个点与a、b、c、d四个点均能够被离子束刻蚀到,且a′与a、b′与b、c’与c、d′与d因两两处于完全对称的位置,刻蚀情况分别相同;
④ 由于微通道板圆形通道的特殊形状对于一定角度入射离子束的局部遮挡作用,不同深度处的位置点暴露于离子束中的时间不同,造成了刻蚀材料厚度的差异,以示意图中的4个点为例,a→b→c→d暴露于离子束的时间依次减短,而通道内比d点位置更深的地方,不会暴露于离子束,随着刻蚀时间的延长,会形成如图中虚线所示的有锥度的扩口。
2. 刻蚀工艺对扩口MCP性能参数的影响
2.1 模型建立
离子束以与MCP表面呈角度θ入射,MCP以通道指向为轴进行自转,构建模型如图 2,其中:D为微通道板孔间距;R为微通道板孔径;θ为离子束与MCP表面角度;h为通道内刻蚀深度;x为刻蚀厚度;Vα为离子束与刻蚀表面法线角度为α时的刻蚀速率。
在离子束刻蚀如石英玻璃、BK7玻璃时,刻蚀速率会随着入射角度的变化而有明显变化,随着入射角度的增大,刻蚀速率先增大再降低,在40°~65°之间有最大值出现[18]。由于微通道板在自转时,离子束与通道内不同位置处的入射角度时刻在变化中,为便于计算,理想模型中设定刻蚀速率不随着入射角度而变化,均为V。
2.2 刻蚀工艺条件对于开口面积比的影响
刻蚀工艺对于开口面积比的影响主要是刻蚀时间,开口面积比随着刻蚀时间的延长为非线性增加,主要分为3个阶段:阶段1:相邻通道边界尚未接触,如图 3(b)所示;阶段2:相邻通道边界已接触,相邻的3个通道边界尚未接触,如图 3(c)所示;阶段3:相邻的3个通道边界已接触,输入面已无平面,如图 3(d)所示。
图 3 不同刻蚀阶段开口面积比:(a) 未刻蚀,OAR=60%;(b) 刻蚀,OAR=75%;(c) 刻蚀至相邻通道接触,OAR=90.7%;(d)刻蚀至输入面无平面,OAR=100%Figure 3. Open area ratio at different etching stages: (a) Unetched, OAR=60%; (b) Etched, OAR=75%; (c) Etched until adjacent channel contact, OAR=90.7%; (d) Etch until there is no plane on the input surface, OAR=100%分阶段计算开口面积比随刻蚀时间的变化:
阶段1:$ 0 \leqslant t \leqslant \frac{{D - R}}{V} $时,
$$ \mathrm{OAR}=\frac{\sqrt{3} \pi}{6} \times\left(\frac{R+V t}{D}\right)^{2} $$ (1) 阶段2:$ \frac{{D - R}}{V} < t \leqslant \frac{{2D - \sqrt 3 R}}{{\sqrt 3 V}} $时,
$$ \text { OAR }=\frac{\left[\pi-6 \cos ^{-1}\left(\frac{D}{R+V t}\right)\right](R+V t)^{2}+6 D \sqrt{(R+V t)^{2}-D^{2}}}{2 \sqrt{3} D^{2}} $$ (2) 阶段3:$ t > \frac{{2D - \sqrt 3 R}}{{\sqrt 3 V}} $之后,
$$ \mathrm{OAR}=100 \% $$ (3) 如图 4所示,随着刻蚀时间的增加,开口面积初始以基本线性的规律增大,在达到90.7%之后,增大速度逐渐减缓,在阶段2的末期开口面积比接近100%,在阶段3中,开口面积比不再发生变化,也并未再引入其他问题,允许过刻蚀对于工艺控制非常有利。在开口面积比达到90%以上的前提下,影响干法刻蚀工艺时间的因素主要是通道之间的壁厚,壁厚越厚所需刻蚀时间越长,因此,干法刻蚀工艺对于小孔径微通道板的扩口效率更高。
2.3 刻蚀工艺条件对刻蚀深度影响
通道内刻蚀深度与离子束入射角度直接相关:
$$ h=R \times \tan \theta $$ (4) 理论计算结果如图 5所示。考虑到可实现性,离子入射角度太小时,工装夹具容易对离子束形成遮挡,且扩口深度较浅时对于扩口MCP性能也有一定的影响[9];离子入射角度太大时,离子束对于通道内壁的刻蚀效率显著下降[18],不利于扩口MCP的实现。综合考虑多种影响因素,离子束入射角度在30°~70°之间比较合适,对应的刻蚀深度范围为0.6倍~2.7倍通道孔径。
2.4 刻蚀工艺条件对刻蚀锥度影响
通道的锥度对于扩口MCP应用在不同领域时的性能有很大的影响,锥度不合适时无法获得最佳的效果。使用干法刻蚀进行MCP扩口,对于锥度有很强的可控性。求解通道刻蚀的锥度,可以转化为通道内不同深度处暴露于离子束的空间在圆周范围内的占比。在MCP表面的平面建立如下坐标系进行计算,β是E点与坐标系中心点的连线与角度0位置的夹角,如图 6所示:在[-π/2,-π]、[π/2,π]区间内均未暴露于离子束中,仅需计算[-π/2,π/2]区间,且为对称结构。
在角度为β处,E、F分别为通道内壁能够暴露于离子束中的最上与最下的位置,深度为:
$$ f(\beta)=h_{\mathrm{EF}}=R \cos \beta \tan \theta $$ (5) 将通道进行平面展开,不同角度处暴露于离子束中的最大深度分布如图 7所示。
根据通道内一周不同位置暴露于离子束最大深度的不同,计算不同深度h处刻蚀厚度相较于通道口入口处刻蚀厚度的比例:
$$ f(h)=\frac{2 \arccos \left(\frac{h}{R \tan \theta}\right)}{\pi} $$ (6) 式中:h∈[0, Rtanθ]。
如图 8所示,随着深度的增加,刻蚀厚度的减小并非线性,在MCP通道内壁成一个不规则的向内壁凹陷的弧面,此种形状下,进入到通道内的信号有更高的比例与更深处的通道内壁发生作用,对于扩口MCP在各类应用中都是更加有利的。
3. 结论
通过建立模型进行理论计算,验证采用干法刻蚀技术进行MCP扩口,在输入面形成漏斗形通道口可行性,计算了干法刻蚀工艺参数如刻蚀角度、刻蚀时间等对扩口MCP开口面积比、刻蚀深度、通道口锥度等参数的影响:
① MCP在自转状态下,由于其圆形通道结构的自遮挡效应,均匀的面离子源能够在圆形通道上制作出非均匀的结构,即实现MCP通道的扩孔。
② MCP开口面积比随着刻蚀时间的延长而增大,达到90%之前基本线性,后期逐步趋近于100%的极限,允许过刻蚀,对于工艺控制有利;工艺的时间主要受通道之间壁厚影响,通道壁越厚,所需加工时间越长,因此干法刻蚀技术对于小孔径微通道板的扩口效率更高。
③ 刻蚀角度决定了通道内刻蚀深度,综合考虑各种影响因素,离子束入射角度在30°~70°之间比较合适,对应的刻蚀深度范围为0.6倍~2.7倍通道孔径。
④ 通道口的锥度受到刻蚀时间与刻蚀角度的双重影响,计算出了不同深度处刻蚀的厚度。随着深度的增加,刻蚀厚度的减小并非线性,在MCP通道内壁成一个不规则的向内壁凹陷的弧面,此种形状下,进入到通道内的信号有更高的比例与更深处的通道内壁发生作用,对于扩口MCP在各类应用中都是更加有利。
本文开展的理论模型研究结果,为开展干法刻蚀进行MCP扩口实验研究奠定了的基础,下一步工作的重点是在理论模型的基础上,开展相应的试验研究。
-
表 1 变电站设备红外数据集构成
Table 1 Composition of infrared data set of substation equipment
Target equipment Number/sheet Ratio/% Transformer HV bushing 308 18.7 Current transformer 351 21.3 Voltage transformer 287 17.4 Lightning arrester 336 20.4 Insulator 365 22.2 表 2 各类设备识别结果
Table 2 Identification results of various types of equipment
Type of equipment P/% R/% mAP/% Lightning arrester 93.5 95.6 95.5 Transformer HV bushing 94.5 89.6 96.3 Current transformer 96.9 95.3 98.4 Voltage transformer 96.9 93.1 98.4 Insulator 87.5 95.5 97.0 All types 92.8 94.2 97.1 表 3 消融实验
Table 3 Ablation experiment
Models CoordConv C3CA WIoU P/% mAP/% FPS YOLOv7 86.0 87.3 35.7 YOLOv7-A √ 90.4 95.2 28.5 YOLOv7-B √ 93.5 94.9 30.1 YOLOv7-C √ 89.8 91.9 36.7 YOLOv7-D √ √ 91.4 95.1 31.8 Improved-YOLOv7 √ √ √ 92.8 97.1 32.7 表 4 不同注意力机制对比实验结果
Table 4 Comparative experimental results of different attention mechanisms
Attention mechanisms P/% R/% mAP0.5/% SE 89.1 81.4 89.8 CBAM 89.3 83.5 90.5 ECA 90.8 87.7 92.1 C3CA 93.5 90.2 94.9 表 5 不同方法对比实验结果
Table 5 Comparison of experimental results by different methods
Target detection methods P/% R/% mAP0.5/% SSD 92.1 72.1 89.7 Faster R-CNN 62.8 93.9 92.4 YOLOv5 83.1 67.8 83.3 YOLOv7 86.0 80.8 87.3 YOLOv7-tiny 90.9 90.8 93.1 YOLOv7-W6 92.3 92.5 94.5 Ours 92.8 94.2 97.1 -
[1] 李文璞, 毛颖科, 廖逍, 等. 基于旋转目标检测的变电设备红外图像电压致热型缺陷智能诊断方法[J]. 高电压技术, 2021, 47(9): 3246-3253. LI Wenpu, MAO Yingke, LIAO Xiao, et al. Intelligent diagnosis method of infrared image for substation equipment voltage type thermal defects based on rotating target detection[J]. High Voltage Engineering, 2021, 47(9): 3246-3253.
[2] 邹辉, 黄福珍. 基于FAsT-Match算法的电力设备红外图像多目标定位[J]. 中国电机工程学报, 2017, 37(2): 591-599. ZOU Hui, HUANG Fuzhen. Multi-target localization for infrared images of electrical equipment based on improved FAST-Match algorithm[J]. Proceeding of the CSEE, 2017, 37(2): 591-599.
[3] 马鹏, 樊艳芳. 基于深度迁移学习的小样本智能变电站电力设备部件检测[J]. 电网技术, 2020, 44(3): 1148-1159. MA Peng, FAN Yanfang. Small sample smart substation power equipment component detection based on deep transfer learning[J]. Power System Technology, 2020, 44(3): 1148-1159.
[4] LIU Wei, Anguelov D, Erhan D, et al. SSD: single shot multibox detector[C]//Proceedings of the 14th European Conference on Computer Vision, 2016: 21-37.
[5] Redmon J, DivvalaI S, Girshick R, et al. You only look once: unified, real-time object detection [C]//Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition, 2016: 779-788.
[6] Girshick R, Donahue J, Darrell T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//Proceedings of 2014 IEEE Conference on Computer Vision and Pattern Recognition, 2014: 580-587.
[7] Girshick R. Fast R-CNN[C]//Proceedings of 2015 IEEE International Conference on Computer Vision, 2015: 1440-1448.
[8] REN Shaoqing, HE Kaiming, Girshick R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[C]//Proceedings of the 28th International Conference on Neural Information Processing Systems, 2015: 91-99.
[9] 李文璞, 谢可, 廖逍, 等. 基于Faster RCNN变电设备红外图像缺陷识别方法[J]. 南方电网技术, 2019, 13(12): 79-84. LI Wenpu, XIE Ke, LIAO Xiao, et al. Intelligent diagnosis method of infrared image for transformer equipment based on improved faster RCNN[J]. Southern Power System Technology, 2019, 13(12): 79-84.
[10] 谭宇璇, 樊绍胜. 基于图像增强与深度学习的变电设备红外热像识别方法[J]. 中国电机工程学报, 2021, 41(23): 7990-7998. TAN Yuxuan, FAN Shaosheng. Infrared thermal image recognition of substation equipment based on image enhancement and deep learning[J]. Proceedings of the CSEE, 2021, 41(23): 7990-7998.
[11] 王媛彬, 李媛媛, 段誉, 等. 基于轻量骨干网络和注意力结构的变电设备红外图像识别[J]. 电网技术, 2023, 47(10): 4358-4369. WANG Yuanbin, LI Yuanyuan, DUAN Yu, et al. Infrared image recognition of substation equipment based on lightweight backbone network and attention mechanism[J]. Power System Technology, 2023, 47(10): 4358-4369.
[12] WANG C Y, Bochkovskiy A, LIAO H Y M. YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors[J]. arXiv preprint arXiv: 2207.02696, 2022.
[13] LIU R, Lehman J, Molino P, et al. An intriguing failing of convolutional neural networks and the coordconv solution[J]. Advances in Neural Information Processing Systems, 2018, 31(18): 9628-9639.
[14] HOU Q, ZHOU D, FENG J. Coordinate attention for efficient mobile network design[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2021: 13713-13722.
[15] HU J, SHEN L, SUN G. Squeeze-and-excitation networks[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018, 10: 7132-7141.
[16] WANG Q, WU B, ZHU P, et al. ECA-Net: Efficient channel attention for deep convolutional neural networks[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2020, 11: 11534-11542.
[17] Woo S, Park J, Lee J Y, et al. Cbam: Convolutional block attention module[C]//Proceedings of the European Conference on Computer Vision (ECCV). 2018, 16: 3-19.
[18] TONG Z, CHEN Y, XU Z, et al. Wise-IoU: bounding box regression loss with dynamic focusing mechanism[J]. arXiv preprint arXiv: 2301.10051, 2023.
[19] Rezatofighi H, Tsoi N, Gwak J Y, et al. Generalized intersection over union: A metric and a loss for bounding box regression[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2019: 658-666.
[20] ZHENG Z, WANG P, LIU W, et al. Distance-IoU loss: faster and better learning for bounding box regression[C]//Proceedings of the AAAI Conference on Artificial Intelligence, 2020, 34(7): 12993-13000.
-
期刊类型引用(1)
1. 邱祥彪,杨晓明,孙建宁,王健,丛晓庆,金戈,曾进能,张正君,潘凯,陈晓倩. 高空间分辨微通道板现状及发展. 红外技术. 2024(04): 460-466 . 本站查看
其他类型引用(0)