基于深度学习与域自适应的工件涡流热成像的缺陷检测

张毅, 范玉刚

张毅, 范玉刚. 基于深度学习与域自适应的工件涡流热成像的缺陷检测[J]. 红外技术, 2024, 46(3): 347-353.
引用本文: 张毅, 范玉刚. 基于深度学习与域自适应的工件涡流热成像的缺陷检测[J]. 红外技术, 2024, 46(3): 347-353.
ZHANG Yi, FAN Yugang. Defect Detection of Eddy Current Thermal Imaging of Workpiece Based on Deep Learning and Domain Adaptation[J]. Infrared Technology , 2024, 46(3): 347-353.
Citation: ZHANG Yi, FAN Yugang. Defect Detection of Eddy Current Thermal Imaging of Workpiece Based on Deep Learning and Domain Adaptation[J]. Infrared Technology , 2024, 46(3): 347-353.

基于深度学习与域自适应的工件涡流热成像的缺陷检测

基金项目: 

云南省科技厅项目 KKPT202203010

详细信息
    作者简介:

    张毅(1997-),男,四川眉山人,硕士研究生,主要从事涡流热成像缺陷检测、图像处理。E-mail:1946552068@qq.com

    通讯作者:

    范玉刚(1973-),男,山东省威海市人,副教授,主要从事涡流热成像检测技术、图像处理。E-mail:km72905566372@qq.com

  • 中图分类号: TP391

Defect Detection of Eddy Current Thermal Imaging of Workpiece Based on Deep Learning and Domain Adaptation

  • 摘要: 机械设备运行过程中,标记的故障样本量小,导致建立的模型故障诊断准确率低,为此本文提出一种结合深度学习与域自适应的工件涡流热成像的缺陷检测方法。首先将注意力机制引入深度残差网络ResNet50中,加强模型的特征提取能力;然后将源域和目标域数据送入改进的ResNet50网络中提取深度特征,并且在网络的全连接层中引入局部最大均值差异,用于缩小两域特征间的分布差异,以此实现相关子域的分布对齐;最后在网络的Softmax分类器中实现对工件金属材料的缺陷检测。在公开的磁瓦数据集和本文实验采集的金属板涡流红外图像数据集上进行实验,结果表明,本文方法对涡流红外图像的裂纹缺陷检测识别准确率较高,通过t分布随机邻居嵌入方法对分析结果可视化,验证了本文方法的优越性。
    Abstract: When operating mechanical equipment, the number of fault samples marked is small, which leads to low accuracy of the fault diagnosis of the established model. Therefore, this study proposes a defect detection method for eddy current thermal imaging of a workpiece that combines depth learning and domain adaptation. First, the attention mechanism is introduced into the deep residual network ResNet50 to enhance the feature extraction capability of the model. Then, the source and target domain data are sent into the improved ResNet50 network to extract the depth features. The local maximum mean difference is introduced into the full connection layer of the network to reduce the distribution difference between the two domain features to achieve the distribution alignment of related sub-domains. Finally, workpiece metal material defects were detected in the Softmax classifier of the network. The experiment was conducted on the open magnetic tile dataset and eddy current infrared image dataset of the metal plate collected during the experiment. The results show that the method proposed in this paper is highly accurate in detecting and recognizing crack defects in eddy current infrared images. The advantages of the method in this study were verified by visualizing the analysis results using the t-distribution random neighbor embedding method.
  • 偏振成像[1]是一种新型的光学成像手段,能够获取多个偏振方向图像,通过偏振信息解析,能够实现同场景多个不同偏振方向图像来表征目标的偏振信息,从而实现对目标的检测。偏振信息解析是偏振成像中的重要环节,目前有很多学者针对不同的应用场景提出了多种偏振信息解析的方法[2-5],其中,沈洁[6]等人根据螳螂虾的复眼能充分利用偏振信息实现水下复杂环境的猎物捕获,提出了基于拮抗机制的偏振仿生信息解析方法,将0°、45°、90°、135°四个偏振方向图像分成2组拮抗图像,通过使2组图像的拮抗信息熵最大来获得偏振方向图像的加权系数,得到偏振拮抗图像,从而实现水下目标探测。但这种方法本质是偏振方向图像间的线性操作,存在计算效率低、解析结果不确定、目标不够突出等问题。

    深度学习具有强大的表征能力,可以从高维、复杂以及非线性数据中提取有用的特征,目前在很多领域都有着广泛的应用,如自然语言处理[7]、语音识别[8]、图像处理[9]等。Li[10]等人提出一种基于卷积神经网络(Convolutional Neural Networks,CNN)和残差神经网络(Residual Networks,ResNets)的深度学习架构,用于红外和可见光图像的融合,较好地突显了目标信息,并解决了传统的基于CNN中随着网络深度增加特征信息退化的问题。

    偏振图像拮抗过程属于偏振方向图像融合的范畴,本文充分利用深度学习在图像处理上的优势,提出了一种偏振方向图像的双支路拮抗融合网络,主要包括特征提取、特征融合和特征转化3个模块,输入4个不同方向的偏振图像,分成两个支路,低频支路通过合成图像来减少能量的损失,高频支路通过差分图像来突显图像的细节信息。将两个支路处理的结果分别通过深度融合网络进行处理,获取效果更好的融合图像,提高后续目标检测与识别效果。

    偏振成像需要获取多个偏振方向图像,常用的获取方式可以分为:分时型、分振幅型、分孔径型和分焦平面型。相对于其他的成像方式,分焦平面型偏振成像具有体积小、重量轻、成本低、能同时获取多个偏振方向图像等优点,成为目前偏振成像获取方法的主流。其基本原理是:在探测器的芯片上集成微型偏振分析器(如图 1所示),在探测器的每4个像元上,耦合0°、45°、90°、135°等4个线偏振方向的偏振分析器,利用4个像元实现1个像素的偏振信息采集。按照微型偏振分析器排列顺序,对探测器输出图像进行重新整合,即可得到0°、45°、90°、135°四个偏振方向图像,如图 2(a)~(d)所示。

    图  1  分焦片面型偏振成像原理
    Figure  1.  Polarization image split-focus planar principle
    图  2  0°、45°、90°和135°的偏振方向图和合成强度图
    Figure  2.  Polarization and intensity pictures of 0°, 45°, 90°and 135°

    利用偏振成像理论,可以得到合成强度图像I[6],如图 2(e)所示:

    $$ I=I\left(0^{\circ}\right)+I\left(90^{\circ}\right) $$ (1)

    根据螳螂虾复眼的偏振拮抗机制[6],一对正交偏振图像的输入可以形成一个拮抗,如0°和90°偏振方向图像、45°和135°偏振方向图像,将采集到的4组正交偏振图像形成4个偏振拮抗通道,每个通道由相互正交的一对偏振信号组成,各组拮抗信号通过拮抗运算方式可以得到偏振拮抗图像,如下所示:

    $$ S_{\mathrm{d}}=k_1 \times I\left(45^{\circ}\right)-k_2 \times I\left(135^{\circ}\right) $$ (2)
    $$ S_{\mathrm{dd}}=k_3 \times I\left(135^{\circ}\right)-k_4 \times I\left(45^{\circ}\right) $$ (3)
    $$ S_{\mathrm{h}}=k_5 \times I\left(0^{\circ}\right)-k_6 \times I\left(90^{\circ}\right) $$ (4)
    $$ S_{\mathrm{v}}=k_7 \times I\left(90^{\circ}\right)-k_8 \times I\left(0^{\circ}\right) $$ (5)

    式中:I(0°)、I(90°)、I(45°)和I(135°)分别表示0°、90°、45°和135°的偏振方向图像,ki(i=1, …, 8)为拮抗系数,起到对图像的增强和抑制作用,k的取值范围由人为设定,km≥1(m=1, 3, 5, 7),0<kn≤1(n=2, 4, 6, 8),文献[6]中k是通过遍历所有范围内可能的值,求取偏振拮抗图像信息熵最大来确定,存在计算效率低、结果不确定的问题,使得求取的偏振拮抗图像目标可能不够突出。

    图像融合就是通过处理不同传感器所拍摄的源图像,提取有用的信息或特征,将其整合来改善图像的品质和清晰度[11]。传统图像融合需要人工提取特征,指定融合规则,而基于深度学习的图像融合,利用深度网络对输入图像进行卷积,提取出目标高层特征,再利用卷积将融合后特征转换为融合图像,如图 3所示。相对于可监督图像融合的方法,无监督的方法通过约束融合图像和原图像之间的相似性,克服了大多数图像融合中无参考度量的普遍问题。

    图  3  深度学习图像融合网络一般过程
    Figure  3.  General process of deep learning image fusion network

    由偏振成像机理可知,每个偏振方向图像能量损失一半。为了提高融合后的图像的亮度,如图 4所示,我们设计了一个低频支路,将4个偏振方向图像通过Concat操作进行连接输入,用于提取每个偏振方向图像的低频特征;根据Tyo[12]的研究结论,偏振差分成像可以突显目标细节信息,因此本文设计了另一个高频支路,将2组拮抗图像进行差分输入,用于提取差分图像的目标高频特征。Huang[13]等人提出了一种密集块结构,其中使用了从任何层到所有后续层的直接连接。这种体系结构可以保存尽可能多的信息,该模型可以改善网络中的信息流和梯度,使网络易于训练,同时,密集连接具有正则化效果,减少了任务的过拟合。受此启发,本文将密集连接加入到差分图像细节特征提取中,用于降低细节信息的损失。设计的网络结构主要包括特征提取、特征融合和特征转化3个模块。

    图  4  偏振拮抗融合网络
    Figure  4.  Polarization antagonistic fusion network

    图 4中,特征融合模块将两个支路提取的特征图进行对应像素融合,得到融合特征,特征转化模块利用1×1卷积将融合的特征整合得到输出图像。低频和高频支路均有3个3×3的卷积层,网络参数如表 1所示。

    表  1  网络参数
    Table  1.  Network parameters
    Layer Input channel Output channel
    Feature extraction Low frequency Conv1 4 128
    Conv2 128 64
    Conv3 64 50
    High frequency Conv4 2 16
    Conv5 18 16
    Conv6 34 50
    Feature fusion Fusion 50 50
    Feature transformation Conv7 50 1
    下载: 导出CSV 
    | 显示表格

    在偏振拮抗图像获取中,利用信息熵最大作为评价标准[6],因此本文将信息熵损失Lentropy加入到损失函数中,用于增大融合图像的信息量;结构相似性度量方法作为图像领域使用最广泛的指标之一,该方法基于图像的亮度、对比度和结构3部分来衡量图像之间的相似性,本文将结构相似性损失Lssim加入到损失函数中,用于保持融合图像结构特征;感知损失通常用于图像重建中,恢复出来的图像视觉效果较好,本文将感知损失Lperceptural加入到损失函数中,用于提高融合图像的人眼视觉效果。因此,本文的损失函数L计算公式如下:

    $$ L=L_{\text {entropy }} \times \sigma+L_{\text {ssim}} \times \beta+L_{\text {perceptural }} \times \gamma $$ (6)

    式中:σβγ为各损失的权重,本文分别取0.1、10、0.1。

    1)信息熵损失Lentropy

    信息熵(Information Entropy,IE)越大,图像包含的信息越多,为使融合图像信息熵最大,信息熵损失Lentropy定义为:

    $$ {L_{{\text{entropy}}}} = \frac{1}{{{\text{IE}} + \varepsilon }} $$ (7)
    $$ {\text{IE}} = - \sum\limits_{i = 1}^n {p\left( {{x_i}} \right)\log p\left( {{x_i}} \right)} $$ (8)

    式中:ε为极小量;xi为随机变量;p(xi)为输出概率函数;n为灰度等级。

    2)结构相似性损失Lssim

    结构相似性(structural similarity index,SSIM)用于度量两幅图像的相似度,结构相似性损失Lssim定义为:

    $$ L_{\text {ssim }}=1-\operatorname{SSIM}(\text { output, } I \text { ) } $$ (9)

    式中:SSIM(⋅)表示结构相似性运算;output为输出图像;I为强度图像。

    3)感知损失Lperceptural

    $$ {L_{{\text{perceptural}}}} = \left\| {{\varPhi _i}\left( {{\text{output}}} \right), {\varPhi _i}\left( I \right)} \right\|_2^2 $$ (10)

    式中:Φi(⋅)为VGG16网络第i层特征图。

    实验环境如下:训练与测试图像集采用处理器为11th Gen Intel(R) Core(TM) i7-11800H @ 2.30 GHz,系统运行内存为32 GB,GPU显卡为8 GB显存容量的NVIDIA GeForce RTX3080的图形工作站。训练软件运行环境为Python3.9,编程框架为Torch 1.11.0,搭建Cuda10.0用于实验加速。

    本文采用LUCID公司的分焦平面型偏振相机(型号:PHX050S-P),如图 5所示。该相机能够同时获取0°、45°、90°、135°四个偏振方向图像,图像分辨率为2448×2048。我们拍摄采集了多种场景目标的9320组偏振方向图像,构建出本文的数据集。

    图  5  LUCID的分焦平面型偏振相机
    Figure  5.  LUCID 's split-focus planar polarization camera

    本文采用主观定性和客观定量相结合的方法对融合图像进行综合评价,主观评价主要通过人眼观察图像亮度和细节信息,客观评价采用平均梯度[14]、信息熵[15]、空间频率[16]、均值[17]等4个评价指标,定量评估融合效果。

    1)平均梯度(Average Gradient,AG)

    平均梯度能有效反映出图像层次信息,其值越大,图像层次越丰富,其计算公式为:

    $$ \begin{array}{l} {\text{AG}} = \frac{1}{{\left( {M - 1} \right)\left( {N - 1} \right)}} \times \hfill \\ \quad \quad \sum\limits_{i = 1}^{M - 1} {\sum\limits_{j = 1}^{N - 1} {\sqrt {\frac{{{{\left[ {F\left( {i, j} \right) - F\left( {i + 1, j} \right)} \right]}^2} + {{\left[ {F\left( {i, j} \right) - F\left( {i, j + 1} \right)} \right]}^2}}}{2}} } } \hfill \\ \end{array} $$ (11)

    式中:F(i, j)为图像的第i行、第j列的灰度值;MN分别为图像的总行数和总列数。

    2)空间频率(Spatial Frequency,SF)

    空间频率是图像质量经典的标准之一,其值越大,代表图像质量越高,越清晰,其计算公式为:

    $$ {\text{SF}} = \sqrt {{\text{R}}{{\text{F}}^2} + {\text{C}}{{\text{F}}^2}} $$ (12)
    $$ {\text{RF}} = \sqrt {\frac{1}{{MN}}\sum\limits_{i = 1}^M {\sum\limits_{j = 2}^N {\left[ {{I_{\text{p}}}\left( {i, j} \right) - {I_{\text{p}}}\left( {i, j - 1} \right)} \right]} } } $$ (13)
    $$ {\text{CF}} = \sqrt {\frac{1}{{MN}}\sum\limits_{i = 2}^M {\sum\limits_{j = 1}^N {\left[ {{I_{\text{p}}}\left( {i, j} \right) - {I_{\text{p}}}\left( {i - 1, j} \right)} \right]} } } $$ (14)

    式中:RF是行频率;CF是列频率;MN为图片的宽高;Ip(i, j)为图像在(i, j)处的像素值。

    3)图像均值(Image Mean,IM)

    均值即图像像素的平均值,反应图像的平均亮度,平均亮度越大,能量越高,其计算公式为:

    $$ {\text{IM}} = \sum\limits_{k = 0}^{L - 1} {{z_k}p\left( {\frac{{{n_k}}}{{MN}}} \right)} $$ (15)

    式中:zk为图像的第k个灰度级;L表示图像的灰度等级数目;nkzk在图像中出现的次数。

    本文数据集共计9320组,其中训练集和测试集按照9:1划分,算法的模型由Adam optimizer训练,训练轮次为20,初始学习率为1e-4,每训练4轮学习率衰减一半,详细参数如表 2所示。

    表  2  训练参数
    Table  2.  Training parameters
    Parameters Values
    Training set 8388
    Testing set 932
    Training round 20
    Epoch 4
    Optimizer Adam
    Activation function ReLU
    Initial learning rate 1e-4
    Learning rate decay rate 0.5*lr/4 round
    下载: 导出CSV 
    | 显示表格

    为了验证本文算法的有效性,从测试集中随机选取了4组数据,每组数据包含0°、45°、90°和135°偏振方向图像,第1组为室内沙地伪装板目标,第2组为室内标定装置目标,第3组为室外草地伪装板,第4组为水下珊瑚目标,如图 6所示。

    图  6  输入的0°、45°、90°和135°偏振方向图像
    Figure  6.  0°, 45°, 90° and 135° polarization direction images of input

    将上述数据输入到本文训练好的模型中,得到对应的融合图像,根据公式(1)~(5)分别得到合成强度图像I、偏振拮抗图像SdSddShSv,如图 7所示。

    图  7  结果对比图
    Figure  7.  Results comparison diagram

    图 7可以看出,本文的融合图像亮度最高,能量最大,说明网络中的低频支路对图像能量的提升效果明显,有效解决了偏振成像中能量降低的问题。从图像细节来说,融合图像的细节效果有较为明显的提升,如第1组本文融合图像中的沙粒更加有颗粒感,伪装板的边缘更加突出,第2组本文融合图像中标定装置的线缆显现出来,背景板的线条更加清晰,而其他图像不太明显,第3组本文融合图像的3块伪装板全部从背景中区分出来,而其他图像只有部分能够区分开,第4组本文融合图像中,珊瑚整体目更亮,珊瑚边缘也更明晰。由于图像能量提升较为明显,可能会造成目标的对比度有所下降,如第一组本文融合图像的伪装板的对比度相较于Sd图和Sh图有所下降,但不影响目标整体的检测效果。

    本文将测试集中932组图像输入到模型中,得到对应的932幅融合图像,并根据公式(1)~(5)分别得到932幅合成强度图像I和相应的偏振拮抗图像SdSddShSv。利用平均梯度(AG)、信息熵(IE)、空间频率(SF)和图像灰度均值(IM)指标对其计算均值并进行评价,如表 3所示。

    表  3  输出结果的各项评价指标
    Table  3.  Evaluation indexes of the output results
    I Sd Sdd Sh Sv DANet
    AG 0.0099 0.0128 0.0119 0.0144 0.0126 0.0185
    IE 6.06 6.18 6.08 6.15 6.39 7.04
    SF 0.35 0.49 0.40 0.46 0.45 0.64
    IM 41 49 47 46 57 93
    下载: 导出CSV 
    | 显示表格

    表 3中可以看出,在4个评价指标上,本文的方法都是最高的,在平均梯度上最少提高了22.16%,最多提高了46.49%;在信息熵上最少提高了9.23%,最多提高了13.92%;在空间频率上最少提高了23.44%,最多提高了45.31%;在图像灰度均值上最少提高了38.71%,最多提高了55.91%。实验结果表明,本文方法得到的融合图像亮度更高,包含的信息量更丰富,可以显现出更多的细节信息。

    针对偏振方向图像融合效果不明显的问题,本文提出了一种基于双支路拮抗融合网络的偏振信息解析方法,可以解决现有基于拮抗机制的仿生偏振信息解析方法中存在计算效率低、解析结果不确定、目标不够突出等问题,为偏振信息解析提供了一个新的技术途径。本文设计的DANet主要包括特征提取、特征融合和特征转化3个模块。首先,特征提取模块由低频支路和高频支路组成,将0°、45°、90°和135°偏振方向图像连接输入到低频支路,提取能量特征,将2组拮抗图像差分输入到高频支路,提取图像细节特征;其次,将得到的能量特征和细节特征进行特征融合;最后,将融合后的特征转化整合为融合图像。实验表明,通过DANet得到的融合图像在视觉效果和评价指标上均有较为显著提升,在平均梯度、信息熵、空间频率和图像灰度均值上分别至少提升了22.16%、9.23%、23.44%、38.71%。下一步,我们将进一步优化网络结构,以平衡能量支路和细节支路,改善融合图像的对比度;加大水下偏振方向图像在数据集中的比重,优化数据集。

  • 图  1   领域自适应示意图

    Figure  1.   Schematic diagram of domain adaptation

    图  2   CBAM模块结构图

    Figure  2.   Structure diagram of CBAM module

    图  3   CBAM_ResNet50和子域自适应网络模型

    Figure  3.   CBAM_ResNet50 and subdomain adaptive network model

    图  4   涡流加热设备(左)和缺陷金属板(右)

    Figure  4.   Eddy current heating equipment (left) and defective metal plate (right)

    图  5   实验数据集示例

    Figure  5.   Example of experimental data set

    图  6   训练集和测试集精度对比图

    Figure  6.   Accuracy comparison diagram of training set and test set

    图  7   不同方法的精确度对比图

    Figure  7.   Accuracy comparison chart of different methods

    Magnetic tile data set→sheet metal data set

    图  8   不同方法的t-SNE特征可视化

    Figure  8.   Visualization of t-SNE features by different methods

    表  1   添加CBAM的ResNet50网络结构

    Table  1   ResNet50 network structure with CBAM added

    Network layer Parameters Activation function
    Conv1 64×7×7 Relu
    CBAM 64×1×1
    7×7
    Sigmoid
    Conv2_x $ \left. {\begin{array}{*{20}{c}} {64 \times 1 \times 1} \\ {64 \times 3 \times 3} \\ {256 \times 1 \times 1} \end{array}} \right\} \times 3 $ Relu
    Conv3_x $ \left. {\begin{array}{*{20}{c}} {128 \times 1 \times 1} \\ {128 \times 3 \times 3} \\ {512 \times 1 \times 1} \end{array}} \right\} \times 4 $ Relu
    Conv4_x $ \left. {\begin{array}{*{20}{c}} {256 \times 1 \times 1} \\ {256 \times 3 \times 3} \\ {1024 \times 1 \times 1} \end{array}} \right\} \times 6 $ Relu
    Conv5_x $ \left. {\begin{array}{*{20}{c}} {512 \times 1 \times 1} \\ {512 \times 3 \times 3} \\ {2048 \times 1 \times 1} \end{array}} \right\} \times 3 $ Relu
    CBAM 2048×1×1
    7×7
    Sigmoid
    FC 2 Softmax
    下载: 导出CSV

    表  2   不同模型的检测精度

    Table  2   Detection accuracy of different models %

    Methods Magnetic tile→sheet metal Sheet metal→magnetic tile Average accuracy
    ResNet50 63.93 59.18 61.56
    DAN 78.19 73.53 75.86
    ResNet50_LMMD 88.29 86.10 87.20
    This paper 90.11 86.93 88.52
    下载: 导出CSV
  • [1] 李宝芸, 范玉刚, 高阳. 基于OTSU和Canny算子的红外图像特征提取[J]. 陕西理工大学学报: 自然科学版, 2019, 35(6): 33-40. https://www.cnki.com.cn/Article/CJFDTOTAL-SXGX201906007.htm

    LI Baoyun, FAN Yugang, GAO Yang. Infrared image feature extraction based on OTSU and Canny operator[J]. Journal of Shaanxi University of Technology: Natural Science Edition, 2019, 35(6): 33-40. https://www.cnki.com.cn/Article/CJFDTOTAL-SXGX201906007.htm

    [2]

    PENG Y, HUANG S, HE Y, et al. Eddy current pulsed thermography for noncontact nondestructive inspection of motor winding defects[J]. IEEE Sensors Journal, 2020, 20(5): 2625-2634. DOI: 10.1109/JSEN.2019.2952691

    [3]

    YI Q, Malekmohammadi H, TIAN G Y, et al. Quantitative evaluation of crack depths on thin aluminum plate using eddy current pulse-compression thermography[J]. IEEE Transations on Industrial Informatics, 2021, 16(6): 3963-3973.

    [4] 董绍江, 朱朋, 裴雪武, 等. 基于子领域自适应的变工况下滚动轴承故障诊断[J]. 吉林大学学报: 工学版, 2022, 52(2): 288-295. https://www.cnki.com.cn/Article/CJFDTOTAL-JLGY202202004.htm

    DONG Shaojiang, ZHU Peng, PEI Xuewu, et al. Fault diagnosis of rolling bearing under variable operating conditions based on subdomain adaptation[J]. Journal of Jilin University: Engineering and Technology Edition, 2022, 52(2): 288-295. https://www.cnki.com.cn/Article/CJFDTOTAL-JLGY202202004.htm

    [5] 姜万录, 岳毅, 张淑清, 等. 基于特征迁移学习的变工况下轴向柱塞泵故障诊断[J]. 农业工程学报, 2022, 38(5): 45-55. https://www.cnki.com.cn/Article/CJFDTOTAL-NYGU202205005.htm

    JIANG Wanlu, Yue Yi, ZHANG Shuqing, et al. Axial piston pump fault diagnosis under variable working conditions based on feature transfer learning[J]. Transactions of the Chinese Society of Agricultural Engineering, 2022, 38(5): 45-55. https://www.cnki.com.cn/Article/CJFDTOTAL-NYGU202205005.htm

    [6]

    LONG M S, CAO Y, WANG J, et al. Learning transferable features with deep adaptation networks[C]//International Conference on Machine Learning, 2015: 97-105.

    [7]

    Ganin Y, Ustinova E, Ajakan H, et al. Domain-adversarial training of neural networks[J]. Journal of Machine Learning Research, 2016, 17(1): 2096-2030.

    [8] 陈佛计, 朱枫, 吴清潇, 等. 生成对抗网络及其在图像生成中的应用研究综述[J]. 计算机学报, 2021, 44(2): 347-369. https://www.cnki.com.cn/Article/CJFDTOTAL-JSJX202102007.htm

    CHEN Foji, ZHU Feng, WU Qingxiao, et al. A survey about image generation with generative adversarial nets[J]. Chinese Journal of Computers, 2021, 44(2): 347-369. https://www.cnki.com.cn/Article/CJFDTOTAL-JSJX202102007.htm

    [9] 王格格, 郭涛, 余游, 等. 基于生成对抗网络的无监督域适应分类模型[J]. 电子学报, 2020, 48(6): 1190-1197. https://www.cnki.com.cn/Article/CJFDTOTAL-DZXU202006021.htm

    WANG Gege, GUO Tao, YU You, et al. Unsupervised domain adaptation classification model based on generative adversarial network[J]. Acta Electronica Sinica, 2020, 48(6): 1190-1197. https://www.cnki.com.cn/Article/CJFDTOTAL-DZXU202006021.htm

    [10]

    ZHU Y C, ZHUANG F Z, WANG J D, et al. Deep subdomain adaptation network for image classification[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020(99): 1-10.

    [11]

    Gretton A, Borgwardt K M, Rasch M J, et al. A kernel two-sample test[J]. Journal of Machine Learning Research, 2012, 13: 723-773.

    [12]

    Woo S, Park J, Lee J Y, et al. CBAM: Convolutional block attention module[C]//Proceedings of the European Conference on Computer Vision, 2018: 3-19.

    [13] 郝帅, 张旭, 马旭, 等. 基于CBAM-YOLOv5的煤矿输送带异物检测[J]. 煤炭学报, 2021, 1644: 1-11. https://www.cnki.com.cn/Article/CJFDTOTAL-MTXB202211026.htm

    HAO Shuai, ZHANG Xu, MA Xu, et al. Foreign object detection in coal mine conveyor belt based on CBAM-YOLOv5[J]. Journal of China Coal Society, 2021, 1644: 1-11. https://www.cnki.com.cn/Article/CJFDTOTAL-MTXB202211026.htm

    [14]

    HE K M, ZHANG X Y, REN S Q, et al. Deep residual learning for image recognition[C]//IEEE Conference on Computer Vision & Pattern Recognition, 2016: 770-778.

    [15] 吴静然, 刘建华, 崔冉. 子域适应无监督轴承故障诊断[J]. 振动与冲击, 2021, 40(15): 34-40. https://www.cnki.com.cn/Article/CJFDTOTAL-ZDCJ202115005.htm

    WU Jingran, LIU Jianhua, CUI Ran. Sub-domain adaptive unsupervised bearing fault diagnosis[J]. Journal of Vibration and Shock, 2021, 40(15): 34-40. https://www.cnki.com.cn/Article/CJFDTOTAL-ZDCJ202115005.htm

    [16]

    HUANG Y B, QIU C Y, YUAN K. Surface defect saliency of magnetic tile[J]. The Visual Computer, 2020, 36(1): 85-96. DOI: 10.1007/s00371-018-1588-5

    [17]

    Laurens V D M, Hinton G. Visualizing data using t-SNE[J]. Journal of Machine Learning Research, 2008, 9(2605): 2579-2605.

  • 期刊类型引用(0)

    其他类型引用(1)

图(8)  /  表(2)
计量
  • 文章访问数:  87
  • HTML全文浏览量:  26
  • PDF下载量:  27
  • 被引次数: 1
出版历程
  • 收稿日期:  2022-11-14
  • 修回日期:  2023-01-30
  • 刊出日期:  2024-03-19

目录

/

返回文章
返回