深度迁移学习预训练对红外尾流成像识别的影响

钟睿, 杨立, 杜永成

钟睿, 杨立, 杜永成. 深度迁移学习预训练对红外尾流成像识别的影响[J]. 红外技术, 2021, 43(10): 979-986.
引用本文: 钟睿, 杨立, 杜永成. 深度迁移学习预训练对红外尾流成像识别的影响[J]. 红外技术, 2021, 43(10): 979-986.
ZHONG Rui, YANG Li, DU Yongcheng. The Influence of Deep Transfer Learning Pre-training on Infrared Wake Image Recognition[J]. Infrared Technology , 2021, 43(10): 979-986.
Citation: ZHONG Rui, YANG Li, DU Yongcheng. The Influence of Deep Transfer Learning Pre-training on Infrared Wake Image Recognition[J]. Infrared Technology , 2021, 43(10): 979-986.

深度迁移学习预训练对红外尾流成像识别的影响

基金项目: 

"十三五"海军预研项目 

详细信息
    作者简介:

    钟睿(1996-),男,硕士,主要研究方向:传热、热流体及其应用。E-mail:243225679@qq.com

    通讯作者:

    杨立(1962-),男,教授,主要研究方向:传热、热流体及其应用

  • 中图分类号: TP391.41

The Influence of Deep Transfer Learning Pre-training on Infrared Wake Image Recognition

  • 摘要: 随着水下航行器噪声水平的不断降低,水下航行器形成的尾流红外成像特征就成为其主要可探测的特征源之一,利用水下航行器尾流的水面红外特征来探测水下航行器的踪迹逐渐发展成为一种新的探测方式。由于人工判别尾流特征的效率低,准确性不高,采用人工智能深度学习的方式能够得到较大的改善。本文以水下航行器尾流红外特征识别为研究核心,通过图像分类制作了混合类的样本集,利用迁移学习比较不同预训练网的对尾流的训练效果,讨论预训练网内部参数对尾流训练效果的影响,结合Faster-RCNN算法,最终测试对尾流的识别精度,在45个2类尾流的小样本集下,预训练之后的网络在识别准确度上增加了21.43%,误检率下降了2.14%,带有红外特征的图像在定位精准率上比可见光图像高18.18%。该预训练测试对未来研究尾流探测结合卷积神经网络的识别有一定的应用潜力。
    Abstract: With lower underwater vehicle noise levels, the infrared imaging characteristics of underwater vehicle wake have become one of the main detectable sources. Using the infrared characteristics of underwater vehicle wakes to detect underwater vehicle traces has gradually developed into a popular detection method. Because of the low efficiency and inaccuracy of artificial wake characteristics identification, the adopted artificial intelligence deep learning method can be greatly improved. In this study, the infrared feature recognition of underwater vehicle wake is the primary focus. A sample set of mixed classes was made by image classification. The training effect of different pre-training networks was compared using migration learning. The influence of the internal parameters of the pre-training networks on the training effect of the wake was discussed. Finally, in the small sample set of 45 two kinds of wake, the recognition accuracy of the network after pre-training increased by 21.43%, the false detection rate decreased by 2.14%, and the positioning accuracy of the image with infrared characteristics was 18.18% higher than that of the visible image. This pre-training test has a certain application potential for future research on wake detection combined with convolution neural network recognition.
  • 红外成像技术是根据辐射原理成像而得到红外图像,图像的亮度表征物体表面的温度。由于具有隐蔽性好、全天候、适应雨雾等特殊气象条件等优良特性,因此得到了广泛应用[1-4]。然而受制于红外图像的成像机理、成像系统特性的影响,红外图像通常具有信噪比低、分辨率低和边缘模糊的特点,图像中往往缺少细节,这限制了红外图像的进一步应用。因此,如何提高图像分辨率并增强红外图像中的细节,成为了重要需求。

    超分辨率(super resolution, SR)算法[5]是指从同一场景的一个或多个低分辨率观测结果中恢复高分辨率图像的任务。根据输入的低分辨率图像(low resolution,LR)的数量,可以将超分辨率算法(super resolution, SR)分为单图像超分辨率(single-image-super-resolution, SISR)和多图像超分辨率(multiple-image-super-resolution, MISR)。与MISR相比,SISR因其高效而广受欢迎。由于具有高感知质量的HR(high resolution, HR)图像具有更多有价值的细节,因此它被广泛用于许多领域,例如医学成像,卫星成像和安全成像[6-8]。典型的SISR框架中,LR图像建模如下:

    $$ I_{\mathrm{LR}}=\boldsymbol{D}_k \boldsymbol{M}_k I_{\mathrm{HR}}+n $$ (1)

    式中:IHR是对应的是模型输入的原始场景高分辨率图像;Mk表示运动位移矩阵;Dk为降采样矩阵;n表示噪声向量。图像的超分辨率重建就是根据图像的退化模型进行的逆过程。通常低分辨图像可以被认为是降质模型的输出;在超分辨率算法中,研究者们试图从ILR中恢复出高分辨图像ISR尽可能地接近原始的退化前的高分辨图像IHR,过程如公式表示为:

    $$ I_\text{SR}=F(I_\text{LR}, θ) $$ (2)

    式中:F代表超分辨率重建模型;θ是模型中的参数。但该等式并不是唯一的,因为高分辨图像的退化可能同时受到多个退化因素的影响,图像超分辨率重构过程中也无法确定退化因素的种类,因此该公式的解不是唯一的,即在图像超分辨率重建过程中一个低分辨的输出可能获取多个高分辨的输入。因而超分辨率重构问题也被看作是一个病态问题。

    传统SISR的算法主要分为3类:基于插值的超分辨率方法、基于重构的超分辨率方法和基于学习的超分辨率方法。基于插值的超分辨率方法原理简单,其重构效果不是很好,在超分辨率领域应用有限。基于重构的超分辨率方法是从输入图像中提取所有有用信息,整个超分辨率过程等于信息提取和信息融合过程,以输入图像先验知识和全局重构限制作为正则项,构建代价函数求解逆运算,此方法能保持清晰的图像边缘,但不能有效恢复纹理细节信息。基于学习的超分辨率技术是借助机器学习知识,以大量的训练图像学习先验模型,用学习过程中获得的知识对低分辨率图像中丢失的高频细节信息进行预测和补充,它能生成丰富的高频细节部分和纹理信息,但难以控制伪像失真。

    随着深度学习的发展,基于深度学习[8]的SISR算法显示出优于其他基于学习的方法的性能。SRCNN[9]是第一种使用深度学习方法的超分辨率算法,该方法表现出远超传统方法的学习能力,但该算法是先将图像进行上采样而后再利用卷积层进行学习,因而其结果中可能会出现将噪声和有价值信号同时放大的情况,影响重构结果的信噪比。VDSR(very deep super resolution)[10]是SISR算法中第一种深层网络,该网络由20层VGG组成,通过学习插值结果和高分图像之间的残差,以代替原来的直接映射。SRGAN(semi-supervised learning with generative adversarial networks)[11]将GAN网络应用超分辨网络,构建一个具有感知损失的更深层网络的生成对抗网络以构造逼真的超分图像。

    EDSR(enhanced deep residual networks)[12]在ResNet[13]基础上设计了一种新的模块,扩大模型的尺寸来提升结果质量。ESPCN(efficient sub-pixel convolutional neural network)[14]使用亚像素上采样的方法对图像进行快速的超分辨率重建,仅在最后阶段将低分辨率图像放大为高分辨率图像,是一种高效、快速的像素重排列的超分辨率算法。

    上述方法对SISR表现出良好的效果,但应用于红外图像时仍需改进:

    一方面,卷积层提取特征时会很好地保留低频信息,高频信息会作为冗余信息舍弃,进而在重构图像中造成细节缺失,由于红外图像中信息量少相比可见光图像影响更大;另一方面,大多数的SISR中的网络模块对其他层的特征利用较少,无法避免卷积层在使用过程中的信息损失。

    根据以上分析,本文针对红外图像特点提出深度残差神经网络的超分辨率重构算法,结合密集网络、残差结构以及亚像素上采样等结构优点,得到高质量红外重构图像,为后续的语义分割、目标识别等创造条件。

    基于深度学习的超分辨率模型专注于研究低分辨率图像与原始高分辨率图像之间的差异,虽然网络模型之间差异巨大,但本质上是一些模块的组合,比如模型框架、上采样方法等。因此,我们可以根据特定用途将这些模块集成起来构造出一个超分辨率模型。本文设计的深度卷积残差网络结构由残差单元构成深度残差强化模块,上采样部分我们使用亚像素上采样层。

    红外图像信息量少,分辨率低,网络需要学习到足够的图像中的信息才能保证重构图像质量。即使是网络中少量信息损失都可能会影响最终的重构图像质量。对于超分辨率算法来说,网络深度增加意味着网络会损失更多的高频细节,在重构图像中图像细节会有相应的损失。在语义分割、目标识别等高级图像任务中,ResNet被用来解决卷积神经网络深度加深时会产生梯度爆炸的现象,但由于图像超分辨率任务是图像到图像的映射任务,仅需研究输入图像与目标图像高度相关仅学习它们之间的差异即可,一些模块在超分辨率任务中并不是必要的,因而不能直接套用到超分辨这种低级视觉问题上。比如BN层主要应用于输入图像的数据分布和输出数据的分布不一致的情况。对于超分辨率任务来说,输入和输出的数据分布非常接近。因此一些研究保留了ResNet的跳线结构并去掉了BN层,有效地降低了网络的计算量。如图 1所示,EDSR提出的这个残差块(residual block)没有应用池化层和批量归一化(batch normalization,BN)层,去掉后的网络就可以堆叠更多的网络层或者使每层提取更多的特征,从而得到更好的性能表现。由于大多数的残差区域接近零,模型的复杂性和学习难度大大降低。而跳线连接方式的保留本身就可以减轻由于网络深度不断增加而导致的降级问题,减少训练难度并提高学习能力。

    图  1  几种残差学习模块结构对比
    Figure  1.  Comparison of the several residual learning modules

    针对红外图像中信息量少的特点,我们改变原有ResNet中的激活函数。ReLU(可以按公式(3)计算)保留了阶跃函数的生物启发(即只有当输入超过阈值时神经元才会被激活),允许基于梯度的学习(尽管在x=0时,导数未定义)。因为函数及其导数都不包含复杂的数学运算,所以此函数计算过程非常快。但是当输入小于零或梯度为零时,其权重无法更新,此时ReLU的学习速度会变慢,甚至可能使神经元直接失效。Leaky ReLU函数(Leaky Rectified Linear Unit,LeakyReLU)(可按公式(4)计算)是经典ReLU激活函数的变体。其中a需人工设置,一般为0.01或0.001数量级的较小正数。当输入为负时,这个函数的输出仍然有一个小的斜率。当导数非零时,可以减少沉默神经元的出现,允许基于梯度的学习(虽然会很慢),从而解决ReLU函数进入负区间后神经元不学习的问题。与ReLU相比,LeakyReLU具有更大的激活范围。

    $$ \text{ReLU} x=\max (0, x)=\left\{\begin{array}{l} x, \text { if } x \geq 0 \\ 0, \text { if } x<0 \end{array}\right. $$ (3)
    $$ \text{LeakyReLU}(x)=\max (0, x)=\left\{\begin{array}{ll} a x, & \text { if } x \geq 0 \\ 0 & \text { if } x<0 \end{array}\right. $$ (4)

    红外探测器相比可见光探测器像元数量少,获取的红外图像的分辨率低,为便于显示多采用插值法以提高图像分辨率。一般插值法是通过目标函数在若干点的函数值或者导数值附近构造一个与目标函数相近似的低次插值多项式。该方法增加了图像的美观性,但在某种程度上丧失了部分数据的真实性,没有考虑到原有像素间的分布特点,仅能针对局部小区域进行运算并且运算量巨大,在某种程度上丧失了部分数据的真实性,因而在重构图像中可能会出现纹理条纹或者局部模糊甚至对求梯度优化有害。

    亚像素上采样层又称像素混合层(pixel-shuffle layer)不同于基于插值的上采样方法,该层的插值函数隐含在前一个卷积层中,可以自动学习。在本文中,亚像素层可以表示为:

    $$ I_\text{SR}=PS(W_\text{L}*f^{L-1}(I_\text{LR})+b_\text{L}) $$ (5)

    其中PS代表亚像素上采样运算,WL代表卷积操作。

    $$\text{PS}(T)_{x, y, c}=T_{[x /s], [y /s], C \cdot s \cdot {\rm{mod}} (y, s)+C \cdot {\rm{mod}}(x, s)+c}$$ (6)

    式中:mod()表示在最后一层的前一层进行的卷积操作;s是比例因子。

    亚像素上采样层是一个端到端的上采样层,执行上采样通过卷积产生多个通道然后重塑它们。在这一层中,假设输入尺寸为h×w×c,则输出尺寸为h×w×s2。之后,进行变形操作以产生大小sh×sw×c输出。这里的卷积操作是在低分辨率图像,因而亚像素上采样的效率将高于双三次上采样和反卷积。使用这种端到端的上采样方式得到的子像素层提供更多的上下文信息以帮助生成更多现实的细节。然而,因为构造亚像素点时利用的信息来源于同一卷积层,其感受野的大小是相同的,实现了相互独立的块状区域预测。但由于构造过程缺少全局信息,独立预测块状区域中的相邻像素可能会导致输出不平滑。

    在超分辨率重构过程中的信息损失可以分为两部分:一部分源于卷积层在进行卷积操作时造成的中心区域外的信息损失;另一部分是在超分辨率重构过程中,高频信息被作为冗余信息舍弃。在前文设计的深度残差模块可避免卷积层使用过程中的信息损失,可通过堆叠该模块增加网络深度。但是,模块仅能利用这个模块内部信息,其他模块的信息无法充分利用。并且结构中缺少对于低分辨率图像中信息的利用。

    在本文中,我们构建了深度密集残差结构。结构中包含6个改进的残差块,每个残差块用以提取局部特征。为了充分利用每个模块提取的信息,每个残差块的输出可以递进地传递到下一个残差块的各层并与那一层的特征进行融合,从而保证特征信息连续传递。这种局部特征融合策略通过自适应地保存信息来提取局部密集特征,在实现密集网络的同时用于解决梯度消失问题,有效地保证了网络对于红外图像的学习能力。

    在提取多层局部密集特征后,我们进一步进行全局特征融合以传输全局上下文特征,作为对重建图像的指导。通过连接输入和输出图像将全局特征传输到亚像素上采样层(即pixel-shuffle layer),实现对于全局残差特征的利用。如图 2所示,亚像素上采样层可以直接访问原始的低分辨率输入,避免由于卷积层大量使用造成的局部上下文信息缺失引起的重建错误。局部特征融合和全局特征融合也可以起到减少高频信息损失的作用。

    图  2  密集特征传递连接设计
    Figure  2.  Dense feature transfer connection

    在网络中,我们选用L2 loss(即最小化误差)作为网络的损失函数。该函数是真实值和预测值之间所有平方差的总和,公式如(7)所示:

    $$ \text{Loss}(x, y)=\frac{1}{n} \sum\limits_{i=1}^{n}\left(y_{\text {tros }}-y_{\text {probiciona }}\right)^{2} $$ (7)

    式中:ytrue代表真实值;ypredicted代表预测值。

    实验中我们使用中国科技大学提出的地/空背景下红外图像弱小飞机目标检测跟踪数据集[15]。红外数据集中每个红外数据段的原始数据为视频格式,为了后续数据加工的方便,在数据预处理阶段将每个数据段的视频格式数据转换为8 bit位深的Windows位图格式的多文件的图像序列。图像分辨率为10~100 m。

    测试集中我们使用了中波红外热像仪提取的图像,该热像仪能见度为8 km,视场角为17°×13°,图像原始分辨率为768×564。

    我们使用来自NVIDIA 1080Ti GPU的随机样本训练所有网络,为了优化,我们使用b=0.9、且学习率为10−4的ADAM。由于GPU内存限制,我们调整了数据集中图像的大小,我们将图像裁剪为512×512像素,这可以保证网络有足够的数据,防止模型过拟合,提高其鲁棒性。测试图像尺寸为256×256像素。为客观公平进行比较,所有基于深度学习模型的超分辨率算法都采用相同的训练集进行训练。

    为了模拟低分辨率图像,我们首先按比例因子图像进行下采样,将对应的图像大小改为原来的1/比例因子,作为超分辨率网络的输入。我们设置的比例因子为2、3和4。实验中使用PSNR和SSIM作为客观评价标准。

    PSNR的定义可以表示为:

    $$ \mathrm{MSE}=\frac{1}{H \times W} \sum\limits_{i=1}^{H} \sum\limits_{j=1}^{W}(X(i, j)-Y(i, j))^{2} $$ (8)
    $$ \text { PSNR }=10 \times \lg \left(\frac{\left(2^{n}-1\right)^{2}}{M S E}\right) $$ (9)

    式中:n是每个像素的位数;X是原始图像;Y是超分辨图像。HW是图像的宽度和高度。

    SSIM值的公式为:

    $$ \text{SSIM}(x, y)=\frac{\left(2 \mu_{x} \mu_{y}+c_{1}\right)\left(2 \sigma_{x y}+c_{2}\right)}{\left(\mu_{x}^{2}+\mu_{y}^{2}+c_{1}\right)\left(\sigma_{x}^{2}+\sigma_{y}^{2}+c_{2}\right)} $$ (10)

    式中:μx是图像x的平均值;μy是图像y的平均值;σx2x的方差;σy2y的方差;σxyxy的协方差。c1=(k1L)2c2=(k2L)2是维持稳定的函数;L是像素值动态范围,k1=0.01,k2=0.03。

    在对比实验中,采用了3种经典的基于深度学习的超分辨率算法与本文算法进行定性定量比较:EDSR(enhanced deep-networks for super-resolution),超分卷积神经网络(super-resolution convolutional neural network, SRCNN),ESPCN(efficient sub-pixel convolutional neural network)。本文同时选择了常用的双线性插值法(Bicubic)作为实验结果中主观评价的结果之一。为客观公平进行比较,所有基于深度学习模型的超分辨率算法都采用相同的训练集进行训练。

    对比的实验结果分别列在表 1~2以及图 3~4中。从表 1表 2的结果来看,本文设计的超分辨率方法在所有尺度因子下均获得较高的PSNR与SSIM。实验结果表明,本文提出的方法在PSNR和SSIM等客观评价指标上优于其他算法。相比于其他几种算法,本文设计的深度残差神经网络的重构红外图像效果明显优于其他几种算法,图像更加自然,与原图像相比改善了部分区域的纹理细节,实现了高质量的红外图像重构。

    表  1  使用4种方法对红外图像的PSNR与SSIM评价结果1
    Table  1.  PSNR evaluation results of infrared images using four methods
    Scale factor SRCNN EDSR ESPCN Proposed in this paper
    PSNR SSIM PSNR SSIM PSNR SSIM PSNR SSIM
    2 21.11 0.75 22.51 0.79 23.52 0.76 25.46 0.80
    3 21.55 0.79 23.08 0.81 25.21 0.83 26.31 0.84
    4 22.85 0.80 23.31 0.867 24.58 0.84 26.85 0.84
    下载: 导出CSV 
    | 显示表格
    表  2  使用4种方法对红外图像的PSNR与SSIM评价结果2
    Table  2.  PSNR evaluation results of infrared images using four methods
    Scale factor SRCNN EDSR ESPCN Proposed in this paper
    PSNR SSIM PSNR SSIM PSNR SSIM PSNR SSIM
    2 22.35 0.81 24.35 0.83 25.11 0.84 27.65 0.85
    3 25.31 0.841 27.35 0.85 28.37 0.88 28.42 0.88
    4 26.31 0.852 27.45 0.87 28.52 0.89 29.41 0.90
    下载: 导出CSV 
    | 显示表格
    图  3  红外图像的超分辨率重构图像对比1
    Figure  3.  Super-resolution reconstruction image comparison
    图  4  红外图像的超分辨率重构图像对比2
    Figure  4.  Super-resolution reconstruction image comparison of infrared images 1 of infrared images 2

    表 1表 2可以看出,本文算法的SSIM值与ESPCN的SSIM值非常接近,PSNR值提升相对较多。这表明本文设计的算法在增加网络深度的同时并没有造成超分辨率重构结果质量的降低。与EDSR算法的对比表明,本文提出的算法在SSIM和PSNR值上有所提高,这表明本文设计的密集网络结构中关于局部特征融合和全局特征融合的设计可以有效地改善重构图像质量。

    图 3图 4中可以看出,所有算法的重建质量相比双线性插值有一定的提升,对于具有明显边界的区域够得到清晰的纹理。所有算法的重建质量相比双线性插值有一定的提升,对于具有明显边界的区域能够得到清晰的纹理。

    图 3中,图 3(b)为双线性上采样方法,重建图像中部分匀质区域过于平滑,缺少细节真实感。图 3(c)是SRCNN的结果,由于网络只有3层,学习能力有限,图像中出现大量虚假纹理信息,在均匀区域容易出现伪影;图 3(d)是EDSR的结果,该网络堆叠更多的残差模块以提高网络学习能力,因此重构结果明显优于SRCNN,但是网络缺少对于其他层信息的利用,图像中出现大量纹理条纹;图 3(e)中的ESPCN算法采用了亚像素上采样层,其效果与EDSR近似,但相比EDSR层数较少,图像中的景物轮廓不够清晰,白点的无人机轮廓也并不清晰;图 3(f)是本文设计的方法,图像细节明显,尤其是林地、草地等具有不规则形状的区域重建效果较好。图 4中可以看出,本文提出的网络对复杂的杂乱纹理的重建效果较好,尤其是草地上的杂乱区域的重构图像比较清晰,细节丰富。

    得益于深度残差模块的使用以及亚像素上采样模块的引入,本文所提出的模型可以获得更加理想的高分辨图像,解决了不规则纹理的模糊问题。尤其是通过采用密集特征连接结构,该网络可以有效地加深网络结构,提高网络的学习能力。这表明我们提出的方法在提取信息和高频信息保留方面效果较好。

    针对红外图像特点,本文提出了一种基于深度残差神经网络的超分辨率重构算法。该模型利用改进的残差模块有效地增加了网络深度,提高了网络的学习能力,通过使用密集特征连接提高了网络对高频信息的利用,并有效地增加了对于网络结构中不同层的信息利用。仿真实验结果表明本文模型能够生成具有丰富细节并且目标轮廓边界清晰的图像,有效地补充了原图中的细节。总体来看,本文中设计的算法在保持较高精度的同时,还可以很好地处理目标的尺度变化和目标周围的环境,说明算法中加入的密集网络结构、深度残差强化模块等发挥了良好的作用。

  • 图  1   不同类型的尾流特征图像

    Figure  1.   Different types of wake feature images

    图  2   Faster-RCNN在识别红外尾流中的应用

    Figure  2.   Application of faster-RCNN in infrared wake identification

    图  3   Google、VGG19、AlexNet基本网络对比实验图

    Figure  3.   Comparison experiment of Google, VGG 19 and AlexNet

    图  4   Frequency参数对AlexNet网络的影响实验

    Figure  4.   Experiment on the influence of frequency parameters on AlexNet network

    图  5   Patience参数对AlexNet网络影响实验

    Figure  5.   Experiment of influence of patience parameters on AlexNet network

    图  6   成型网络尾流识别与定位测试结果展示

    Figure  6.   Test results display of wake identification and location of formed network

    图  7   两类尾流测试集下不同样本的实时数据记录

    Figure  7.   Real time data recording of different samples under two types of wake test sets

    表  1   3种基本网络对比结果

    Table  1   Comparison results of three basic networks

    Pre-training network Google VGG19 AlexNet
    Accuracy 83.33% 100% 100%
    Time 5min 34s 61min 49s 13min 13s
    Stability Bad Good Good
    下载: 导出CSV

    表  2   Frequency参数对AlexNet网络影响结果

    Table  2   Influence results of frequency parameters on AlexNet network

    Frequency 1 2 3 4 5
    Accuracy 83.33% 100% 100% 100% 100%
    Rounds 3 5 5 5 5
    Time 8min28s 19min21s 13min13s 12min21s 18min34s
    Stability Better Better Better Good Better
    下载: 导出CSV

    表  3   Patience参数对AlexNet网络影响结果

    Table  3   Results of influence of patience parameters on AlexNet network

    Patience 1 3 5 7
    Accuracy 100% 100% 100% 100%
    Rounds 2 5 5 5
    Time 6min 44s 15min 46s 12min 21s 16min 30s
    下载: 导出CSV

    表  4   45个样本集/14个测试集(2类)下的实验结果

    Table  4   Experimental results under 45 sample sets and 14 test sets (Category 2)

    Network type Accuracy Missed rate Error rate Periscope wake as positive
    (infrared image)
    Ship wake as positive
    (visible light image)
    Precise rate Recall rate Precise rate Recall rate
    Untrained 0.5714 35.71% 11.11% 66.67% 100% 100% 85.71%
    Transfer learning 0.7857 7.14% 8.97% 100% 75% 81.82% 100%
    下载: 导出CSV

    表  5   65个样本集/14个测试集下(2类)的实验结果

    Table  5   Experimental results of 65 sample sets and 14 test sets (Category 2)

    Network type Accuracy Missed rate Error rate Periscope wake as positive
    (infrared image)
    Ship wake as positive
    (visible light image)
    Precise rate Recall rate Precise rate Recall rate
    Untrained 0.7143 7.14% 16.67% 55.56% 100% 100% 87.5%
    Transfer learning 0.7857 7.14% 13.63% 71.43% 100% 100% 75%
    下载: 导出CSV

    表  6   85个样本集/14个测试集下(2类)的实验结果

    Table  6   Experimental results of 85 sample sets and 14 test sets (Category 2)

    Network type Accuracy Missed rate Error rate Periscope wake as positive
    (infrared image)
    Ship wake as positive
    (visible light image)
    Precise rate Recall rate Precise rate Recall rate
    Untrained 0.3571 14.29% 63.33% 33.33% 75% 83.33% 62.5%
    Transfer learning 0.6429 14.29% 14.29% 100% 100% 70% 100%
    下载: 导出CSV
  • [1] 王雨农. 基于视觉注意机制的神经网络模型研究及应用[D]. 合肥: 中国科学技术大学, 2017.

    WANG Yunong. Research on Visual Attention Based Neural Network Model and its Application[D]. Hefei: University of Science and Technology of China, 2017.

    [2]

    Rumelhart D, Mcclelland J. Learning internal representations by error propagation[M]//Parallel Distributed Processing: Explorations in the Microstructure of Cognition, Massachusetts: MIT Press, 1986: 318-362.

    [3] 尹勰, 闫磊. 基于深度卷积神经网络的图像目标检测[J]. 工业控制计算机, 2017, 30(4): 96-97. https://www.cnki.com.cn/Article/CJFDTOTAL-GYKJ201704040.htm

    YIN Xie, YAN Lei. Image target detection based on deep convolutional neural network [J]. Industrial Control Computer, 2017, 30(4): 96-97. https://www.cnki.com.cn/Article/CJFDTOTAL-GYKJ201704040.htm

    [4]

    Razavian A S, Azizpour H, Sullivan J, et al. CNN features off-the-shelf: an astounding baseline for recognition[C]//Proceedings of IEEE Conference on Computer Vision and Pattern Recognition Workshops, 2014: 512-519.

    [5]

    Zeiler M D, Fergus R. Visualizing and Understanding Convolutional Networks[M]//Computer Vision-ECCV, Springer International Publishing, 2014.

    [6] 胡炎, 单子力, 高峰. 基于Faster-RCNN和多分辨率SAR的海上舰船目标检测[J]. 无线电工程, 2018, 48(2): 96-100. https://www.cnki.com.cn/Article/CJFDTOTAL-WXDG201802005.htm

    HU Yan, SHAN Zili, GAO Feng. Ship target detection based on faster-RCNN and multi-resolution SAR[J]. Radio Engineering, 2018, 48(2): 96-100. https://www.cnki.com.cn/Article/CJFDTOTAL-WXDG201802005.htm

    [7] 李新. 基于红外热像技术连铸板坯裂纹预报方法研究[D]. 唐山: 华北理工大学, 2015.

    LI Xin. Research on Crack Prediction Method of Continuous Casting Slab Based on Infrared Thermography[D]. Tangshan : North China University of Technology, 2015.

    [8] 张健, 杨立, 袁江涛. 水下航行器热尾流试验研究[J]. 实验流体力学, 2008, 22(3): 9-15. https://www.cnki.com.cn/Article/CJFDTOTAL-LTLC200803002.htm

    ZHANG Jian, YANG Li, YUAN Jiangtao. Experimental study on thermal wake of underwater vehicles[J]. Experimental Fluid Mechanics, 2008, 22(3): 9-15. https://www.cnki.com.cn/Article/CJFDTOTAL-LTLC200803002.htm

    [9] 贺林. 水喷淋消声器设计与实验研究[D]. 哈尔滨: 哈尔滨工程大学, 2006.

    HE Lin. Design and Experimental Study of Water Spray Muffler[D]. Harbin : Harbin Engineering University, 2006.

    [10] 伍伟明. 基于Faster R-CNN的目标检测算法的研究[D]. 广州: 华南理工大学, 2018.

    WU Weiming. Research on Target Detection Algorithm Based on Faster R-CNN[D]. Guangzhou : South China University of Technology, 2018.

    [11] 刘万军, 梁雪剑, 曲海成. 自适应增强卷积神经网络图像识别[J]. 中国图象图形学报, 2019, 22(12): 1723-1736. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGTB201712008.htm

    LIU Wanjun, LIANG Xuejian, QU Haicheng. Adaptive enhanced convolutional neural network image recognition[J]. Chinese Journal of Image Graphics, 2019, 22(12): 1723-1736. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGTB201712008.htm

    [12]

    Lecun Y, Boser B, Denker J, et al. Back propagation applied to handwritten zip code recognition[J]. Neural Computation, 1989, 1(4): 541-551. DOI: 10.1162/neco.1989.1.4.541

    [13] 王红霞, 周家奇, 辜承昊, 等. 用于图像分类的卷积神经网络中激活函数的设计[J]. 浙江大学学报: 工学版, 2019, 53(7): 1363-1373. https://www.cnki.com.cn/Article/CJFDTOTAL-ZDZC201907016.htm

    WANG Hongxia, ZHOU Jiaqi, GU Chenghao, et al. Design of activation functions in convolutional neural networks for image classification[J]. Journal of Zhejiang University: Engineering Edition, 2019, 53(7): 1363-1373. https://www.cnki.com.cn/Article/CJFDTOTAL-ZDZC201907016.htm

  • 期刊类型引用(1)

    1. 郭亮. 基于CGAN的近红外关联成像高分辨率重构. 智能计算机与应用. 2024(05): 144-149 . 百度学术

    其他类型引用(9)

图(7)  /  表(6)
计量
  • 文章访问数:  132
  • HTML全文浏览量:  62
  • PDF下载量:  27
  • 被引次数: 10
出版历程
  • 收稿日期:  2020-03-07
  • 修回日期:  2020-04-26
  • 刊出日期:  2021-10-19

目录

/

返回文章
返回