昆明物理研究所大面积水平推舟液相外延碲镉汞薄膜技术进展

孔金丞, 宋林伟, 起文斌, 姜军, 丛树仁, 刘燕, 荣徽宇, 许江明, 方东, 赵鹏, 姬荣斌

孔金丞, 宋林伟, 起文斌, 姜军, 丛树仁, 刘燕, 荣徽宇, 许江明, 方东, 赵鹏, 姬荣斌. 昆明物理研究所大面积水平推舟液相外延碲镉汞薄膜技术进展[J]. 红外技术, 2023, 45(2): 111-122.
引用本文: 孔金丞, 宋林伟, 起文斌, 姜军, 丛树仁, 刘燕, 荣徽宇, 许江明, 方东, 赵鹏, 姬荣斌. 昆明物理研究所大面积水平推舟液相外延碲镉汞薄膜技术进展[J]. 红外技术, 2023, 45(2): 111-122.
KONG Jincheng, SONG Linwei, QI Wenbin, JIANG Jun, CONG Shuren, LIU Yan, RONG Huiyu, XU Jiangming, FANG Dong, ZHAO Peng, JI Rongbin. Progress in LPE Growth of HgCdTe at Kunming Institute of Physics[J]. Infrared Technology , 2023, 45(2): 111-122.
Citation: KONG Jincheng, SONG Linwei, QI Wenbin, JIANG Jun, CONG Shuren, LIU Yan, RONG Huiyu, XU Jiangming, FANG Dong, ZHAO Peng, JI Rongbin. Progress in LPE Growth of HgCdTe at Kunming Institute of Physics[J]. Infrared Technology , 2023, 45(2): 111-122.

昆明物理研究所大面积水平推舟液相外延碲镉汞薄膜技术进展

详细信息
    作者简介:

    孔金丞(1979-),男,云南南华人,正高级工程师,博士,主要从事红外探测器材料与器件技术研究。E-mail:kongjincheng@163.com

  • 中图分类号: TN215

Progress in LPE Growth of HgCdTe at Kunming Institute of Physics

  • 摘要: 报道了近年来昆明物理研究所在富碲水平推舟液相外延碲镉汞外延薄膜制备技术方面的进展。2019年以来,突破了ϕ120 mm碲锌镉晶体定向生长技术,使碲锌镉衬底沉积相和夹杂相密度≤5×103 cm-2,位错腐蚀坑密度(EPD)≤4.0×104 cm-2ϕ120 mm(111)晶圆衬底的Zn组份分布极差≤0.36%。基于碲锌镉衬底技术的进步,液相外延碲镉汞薄膜的最大生长尺寸达到了70 mm×75 mm,薄膜位错腐蚀坑密度均值为5×104 cm-2,X射线双晶回摆曲线半峰宽(DCRC-FWHM)≤35 arcsec,部分可控制到25 arcsec以下;50 mm×60 mm尺寸长波碲镉汞薄膜的厚度极差≤±1.25 μm,室温截止波长极差≤±0.1 μm,中波碲镉汞薄膜相应指标分别为≤±1 μm、≤±0.05 μm。材料技术的进展促进了制冷型碲镉汞探测器产能提升和成本的降低,也支撑了高性能长波/甚长波探测器、高工作温度(HOT)探测器以及2048×2048、4096×4096等甚高分辨率高性能探测器的研制。
    Abstract: The recent progress in the LPE growth of HgCdTe(MCT) epi-layer at the Kunming Institute of Physics (KIP) is reported. The precipitates and inclusion density of the CdZnTe substrate are less than 5×103 cm−2 and the etch pit density (EPD) is less than 4.0×104 cm−2. Owing to the oriented growth technology of the CdZnTe single crystal with ϕ=120 mm, the variation of the Zn components in the prepared substrate wafers with ϕ=120 mm (111) was less than 0.36%. The maximum size of the HgCdTe films grown by LPE was up to 70 mm×75 mm, with an etch pit density (EPD) of 5×104 cm−2 and DCRC-FWHM less than 35 arcsec (could be lower than 25 arcsec). Over a substrate area of 50 mm×60 mm, the thickness homogeneity of the LPE MCT epi-layer is better than Δd=±1.25 μm, and a cut-off wavelength homogeneity better than Δλ=±0.1 μm is achieved for the LWIR MCT epi-layers; that of the MWIR epi-layers are ±1 μm and ±0.05 μm, respectively. Due to the improvement of material technology, which effectively increases the yield of low-cost MCT IRFPAs at KIP, high-performance LW/VLW/HOT IRFPAs and large array detectors such as 2048×2048 and 4096×4096 based on MCT/CZT have been developed.
  • 红外舰船目标检测在海上救援、海上军事活动等方面都具有十分重要的意义,尤其在军事领域,由于红外成像系统受光照条件影响小、成像稳定以及工作距离远等优点,因此红外舰船目标检测对于海战场的战场监测与侦察具有深远的研究价值。目前基于深度学习的目标检测算法在近年来取得了很大的突破,检测精度与速度与传统算法相比都有着质的飞跃,并在各个方面都有着十分广泛的应用,因此提出一种基于深度学习目标检测算法的红外舰船目标检测方法,将深度学习的方法应用到红外成像领域。

    目前主流的目标检测算法可以分成两大类[1],One-stage算法与Two-stage算法,R-CNN[2]是最早被提出的Two-stage算法,同时也是将卷积神经网络应用到目标检测领域的开山之作,但检测速度较慢,随后提出的Fast R-CNN[3]、Mask-R-CNN[4]与Faster R-CNN[5],使目标检测的精度不断提高,Faster R-CNN还创新性地提出并使用了RPN(region proposal network)网络以生成候选区域,Two-stage类型的算法较之于One-stage算法速度相对较慢,但是优点在于精度较高。One-stage算法基于回归的思想,使用CNN卷积特征,直接产生物体的类别概率和位置坐标值(无region proposal),经过单次检测可以得到最终的检测结果,结构更加简洁,比较典型的算法有Redmon J.于2015年提出的YOLO V1[6]、2016年提出的YOLO V2[7]、Liu W.提出的SSD(single shot multi box detector)[8],2017年提出的DSSD(deconvolutional single shot multibox detector)[9]以及2018年提出的YOLO V3[10],不足之处在于小目标检测精度不高并会出现漏检误检的问题。

    深度学习目标检测算法发展迅速,在红外图像领域也有所应用,李慕锴在文献[11]中,提出了一种基于YOLO V3的红外行人目标检测算法,并在原有算法的基础上进行优化,准确率达到了85.89%;崔少华在文献[12]中提出了一种改进的卷积神经网络用于检测红外行人目标,选择LeNet-7作为检测网络,提高了检测效率; 但是针对红外舰船目标的检测,仍旧是基于传统方法,向涛在文献[13]中提出了一种基于显著区域提取和目标精确分割相结合的红外舰船目标检测方法,提升了检测的准确率; 邢莎在文献[14]中提出了基于局部边缘梯度特征分析的舰船目标检测方法,通过采用自适应滤波、多尺度搜索等方法进行红外舰船目标检测; 宫剑在文献[15]中提出了一种基于引导滤波和自适应尺度局部对比度的舰船目标检测方法,应用于红外偏振图像,具有较高的准确性和鲁棒性; 上述红外舰船目标检测方法虽然都取得了不错的效果,但是仍需手动提取特征,耗时耗力,因此本文提出了一种改进的Faster R-CNN目标检测算法,对红外舰船目标进行检测,并通过改进网络结构、基于数据集进行Anchor的改进以及优化损失函数的方法对原算法进行改进,使得改进后的算法更适用于红外舰船目标检测。

    Faster R-CNN是在R-CNN与Fast R-CNN的基础上进行改进得到的。在Faster R-CNN中,引进了Region Proposal Networks(RPN网络)代替Selective search生成候选区域检测框,同时引入Anchor box的概念。简言之就是采用一个卷积神经网络来提取候选区域,并将其与Fast R-CNN检测网络合并成一个网络进行训练和检测,提高速度。

    网络架构简图如图 1所示。

    图  1  Faster R-CNN网络结构图
    Figure  1.  Faster R-CNN network structure diagram

    具体的算法步骤为:

    1)使用一组基础卷积层提取待检测图片的feature map(特征图),该特征图同时被输入后续的网络与RPN网络,共享卷积特征;

    2)RPN网络根据特征图生成region proposals(候选区域),输出候选框矩阵及其得分;

    3)ROI pooling层收集前步得到的feature map以及RPN传输的region proposals,池化操作得到proposal feature map,送入后续的全连接层;

    4)全连接层利用proposal feature map进行分类,同时进行边框回归(Bounding box regression)得到最终检测框的位置以及得分信息。

    Faster R-CNN的主干网络是VGG-16,图 2是VGG-16的参数列表。

    图  2  VGG-16网络参数列表图
    Figure  2.  VGG-16 network parameter list diagram

    VGG16将卷积网络分成了5段,每一段由两至三个卷积层和池化层组成,MaxPool代表池化层,FC_4096代表全连接层,4096代表有4096个神经节点; Softmax代表最后的分类器。一般都选取VGG-16作为Faster R-CNN的特征提取网络,也可以采用Res Net、Inception Net等来代替。

    Faster R-CNN最大的创新点就是引入了RPN网络,其主要作用是目标物体的精确定位,利用VGG16的第五段卷积层Conv5-3上的特征图产生多个Anchor建议框,再利用Softmax函数判断属于目标物体或者属于背景的概率,引入Anchor的概念用以候选区域生成,Anchor是9个由代码生成的矩形框,涵盖了一张图片上的所有区域。RPN网络究其本质是通过卷积神经网络生成候选区域,输入任意尺寸的图像都可输出目标候选框矩阵及得分。具体示意图如图 3所示:主干网络VGG-16对原输入图片进行卷积操作,提取特征并在第五段卷积之后得到该输入图片的卷积特征图,然后使用一个滑动窗口(即3×3卷积核)在得到的特征图上进行滑动,得到一个512维的特征向量,并将此特征向量输入下一层的两个平行的全连接层进行分类和位置回归,由于每个滑动窗口的中心点对应k种Anchor(在Faster R-CNN中,k=9),因此对于分类层来说输出2k个结果,即每个候选框的目标以及背景概率,而边框回归层共输出4k个结果,即每个候选框的位置坐标信息{x, y, w, h},并对得分信息进行非极大抑制(non maximum suppression, NMS)后输出得分较高的边框信息。

    图  3  RPN网络结构示意图
    Figure  3.  Schematic diagram of RPN network structure

    而Anchor则是一组固定大小的参考窗口,分为3组,面积分别为1282、2562、5122; 而每种面积依据长宽比又分为3组,分别为2:1、1:2、1:1,共有9个,相当于一组模板,在任意图像的任意位置都采用这组模板,如图 4所示。

    图  4  Anchor示意图
    Figure  4.  Anchor schematic diagram

    对每个滑窗位置可计算滑窗中心点对应原图中心点,通过中心点和Anchor大小得到滑窗位置与原图位置的映射关系,继而让RPN网络学习此Anchor是否含有待检测物体。

    在Faster R-CNN中,采用边框回归来实现Anchor box到近似Ground truth box(GT)的过渡,示例图如图 5所示。图 5中,虚线矩形框A代表代表原始的预测Anchor,实线矩形框G代表目标的真实值GT,而边框回归的作用就是将红色的框进行微调,并寻找一种函数关系,使得原始预测框经过映射得到一个跟真实值G更加接近的回归窗口G',也就是图 5中的点划线预测框。

    图  5  Bounding box regression示例说明
    Figure  5.  Bounding box regression example description

    图 5中,给定A=(Ax, Ay, Aw, Ah),GT=(Gx, Gy, Gw, Gh),Bounding box regression则试图寻找一种映射关系f,使得f(Ax, Ay, Aw, Ah)=(Gx', Gy', Gw', Gh'),其中,(Gx', Gy', Gw', Gh')≈(Gx, Gy, Gw, Gh)。通过采取平移和缩放变换得到最终的结果:首先对A做平移操作:

    $$ \begin{array}{l} G{'_x}{\rm{ = }}{A_w}{\rm{d}}x(A) + {A_x}\\ G{'_y}{\rm{ = }}{A_h}{\rm{d}}y(A) + {A_y} \end{array} $$ (1)

    接下来做缩放:

    $$\begin{array}{l} G{'_w}{\rm{ = }}{A_w} \times {\rm{exp(d}}w(A))\\ G{'_h}{\rm{ = }}{A_w} \times {\rm{exp(d}}h(A)) \end{array}$$ (2)

    上述公式中,需要学习得到的是dx(A),dy(A),dw(A),dh(A)这4个变换,相应的平移因子(tx, ty)、(tx*, ty*)和缩放因子(tw, th)、(tw*, th*)如公式(3)所示:

    $$\begin{array}{l} {t_x} = \left( {x - {x_a}} \right)/{w_a},{t_y} = \left( {y - {y_a}} \right)/{h_a}\\ {t_w} = \lg \left( {w/{w_a}} \right),{t_h} = \lg \left( {h/{h_a}} \right)\\ t_x^* = \left( {{x^*} - {x_a}} \right)/{w_a},t_y^* = \left( {{y^*} - {y_a}} \right)/{h_a}\\ t_w^* = \lg \left( {{w^*}/{w_a}} \right),t_h^* = \lg \left( {{h^*}/{h_a}} \right) \end{array}$$ (3)

    式中:(x, y, w, h)、(xa, ya, wa, ha)、(x*, y*, w*, h*)分别对应预测框、Anchor box以及Ground truth box中心点的坐标及宽和高。上述公式的意义就在于将Anchor box拟合回归到附近的真实边界框GT,并将经过回归变换后的Anchor box输出成为预测框。

    在卷积神经网络中,低层卷积主要提取目标的细节信息,在网络位置中靠前,高层卷积主要用来提取抽象的语义信息[16],在网络结构中位置比较靠后,通过运行CNN解释器[17]得到卷积过程中的可视化特征图,不同层级的特征图对比如图 6所示。

    图  6  不同层级卷积后特征图对比
    Figure  6.  Comparison of characteristic graphs after convolution at different levels

    其中,图 6(a)为红外舰船原图,图 6(b)为VGG-16中经过第1段卷积Conv1后输出的特征图,图 6(c)为VGG-16中第3段卷积模块Conv3后输出的特征图,图 6(d)为VGG-16中第5段卷积模块Conv5后输出的特征图。从图 6可以明显得看出,低层卷积输出的特征图相比于高层卷积输出的特征图细节信息更加丰富,特征也要更加明显。

    基于此提出了一种多尺度提取特征的方法,选取VGG-16作为主干网络,去除全连接层,利用VGG-16中的卷积层进行特征提取,选取3段卷积后不同尺度的特征图进行特征拼接并输入RPN网络生成检测候选区域,改进后的网络结构如图 7所示。

    图  7  改进后网络结构图
    Figure  7.  Improved network structure diagram

    在改进后的Faster R-CNN网络结构中,选取Conv1、Conv3、Conv5卷积层后提取的特征图作为多尺度特征图,以Conv3特征图为基准,并对Conv1的特征图进行池化操作缩小至相同尺寸、Conv5的特征图进行反卷积增大至相同尺寸,再进行特征拼接,因为同一尺寸大小的特征图便于进行特征拼接,然后输入至RPN网络进行候选区域生成,拼接后特征图如图 8所示。

    图  8  特征拼接后特征图
    Figure  8.  Feature map after feature stitching

    图 8可以看出,特征拼接使得待检测目标的细节信息变得更加丰富。并且对于Conv5特征图所进行的反卷积操作是卷积的反向过程,也是一种上采样的方式,但不同于基于插值的上采样方法,反卷积操作可以在训练过程中反向传播学习、调整参数,使得上采样参数更加合理。因此放大图片的尺寸的同时,提供了一种最优的“上采样”方式,使得反卷积过后的特征图较之前相比,具有更加丰富的细节特征。

    图 7改进后的网络结构中,RPN网络则根据特征拼接后的多尺度特征图生成region proposals(候选区域),输出候选框矩阵及其得分,ROI pooling层收集前步得到的多尺度特征图以及RPN传输的region proposals,池化操作得到proposal feature map,送入后续的全连接层,全连接层利用proposal feature map进行分类,同时进行边框回归(Bounding box regression)得到最终检测框的位置以及得分信息。

    Faster R-CNN采用Anchor box作为每个滑窗位置的先验框并对目标物体进行检测,Anchor的本质其实就是一组矩形框模板,本文在此基础上,结合红外舰船目标的特性,对Anchor的尺寸和个数进行改进,由于红外图片与可见光图片相比,具有分辨率低、对比度低、目标反射特征少等特点,目标与背景中一些细微的差异很难被分辨,因此原算法中,针对可见光图片中通用目标而设置的9种尺寸比例大小的Anchor,并不适用于红外舰船目标的检测,对此本文针对红外舰船目标的特性,重新设置Anchor的尺寸和个数。

    在原算法中,Anchor的尺寸大小共有9种,考虑到过多的Anchor对于目标检测会带来多余的参数计算,为避免冗余参数计算带来检测速度的变慢,将改进后的Anchor尺寸比例大小减少为两个尺度,长宽比为3种,共6种不同的Anchor boxes:

    首先增大Anchor初始感受野大小,用以弥补红外舰船目标反射特征少的特点,将Anchor初始感受野base_size大小设置为32×32(原算法中为16×16),并将Anchor感受野进行23=8、24=16两种倍数的放大,参数设置为scales=2*np.arange(3, 5),此时16×16区域变成256×256与512×512,然后将宽高比例大小设置为0.5、1、3,参数设置为ratios=[0.5, 1, 3],将上述的两个区域按1:2、1:1、3:1进行变换,共得到改进后的6个不同的Anchor,如图 9所示。

    图  9  改进后的Anchor示意图
    Figure  9.  Improved Anchor schematic diagram

    依据Anchor box和Ground truthbox的IOU(Intersection over Union,意为交并比,即Anchor box与GT(Ground truth box)重叠面积与总面积的比例)来进行下一步操作,如果IOU>0.7,则认为此Anchor中大概率包含目标,如果IOU≤0.7,则认为此Anchor为背景,如果0.3>IOU≥0.7,则认为此Anchor没有作用,在检测及训练过程中丢弃,避免增加冗余计算参数。

    整个损失函数由分类损失与回归损失两部分构成,根据前文对网络结构的改进,借鉴主干网络VGG-16与R-CNN的损失函数,对Faster R-CNN的损失函数进行优化改进,在回归损失中加入平方项,使其在零点处导数变得更为平滑; 分类损失部分采用对数函数表达分类误差。改进后的损失函数具体如下所示:

    1)分类损失Lcls

    $$\begin{array}{l} {L_{{\rm{cls}}}} = \frac{1}{{{N_{{\rm{cls}}}}}}\sum\limits_i {{L_{{\rm{cls}}}}} \left( {{p_i},p_i^*} \right)\\ \;\quad \, = \frac{1}{{{N_{{\rm{cls}}}}}}\sum\limits_i { - {\rm{lg}}\left[ {p_i^*{p_i} + \left( {1 - p_i^*} \right)\left( {1 - {p_i}} \right)} \right]} \end{array}$$ (4)

    在公式(4)中Ncls代表Anchor个数,在网络训练过程中,会选取256个Anchor,因此Ncls=256;pi代表第i个Anchor为预测目标的概率,pi*是GT的预测概率,即当第i个Anchors与GT间IOU>0.7,认为该Anchor中大概率包含目标,pi*=1;Lcls(pi, pi*)是目标与背景的损失,选取对数函数表达这部分的误差。公式(4)的含义就是计算每一个Anchor的对数损失,然后除以训练中挑选的总Anchor数,得到平均损失。

    2)回归损失Lreg

    $$ {L_{{\rm{reg}}}}{\rm{ = }}\lambda \frac{1}{{{N_{{\rm{reg}}}}}}\sum\limits_i {p_i^*{L_{{\rm{reg}}}}} \left( {{t_i},t_i^*} \right) $$ (5)

    在公式(5)中,常见的回归误差一般选择平方损失函数,但该损失函数误差惩罚过高,因此在这里选择smooth L1 loss代表损失误差,计算公式为:

    $$ \begin{array}{l} {L_{{\rm{reg}}}}\left( {{t_i},t_i^*} \right){\rm{ = }}\sum\limits_{i \in \left\{ {x,y,w,h} \right\}} {{\rm{smoot}}{{\rm{h}}_{L1}}\left( {{t_i} - t_i^*} \right)} \\ = \sum\limits_{i \in \left\{ {x,y,w,h} \right\}} {\left\{ \begin{array}{l} {\left( {\sigma x} \right)^2} \times {\raise0.7ex\hbox{$1$} \!\mathord{\left/ {\vphantom {1 2}}\right.} \!\lower0.7ex\hbox{$2$}}\;\;\;\;\;{\rm{if}}\left| x \right| < {\raise0.7ex\hbox{$1$} \!\mathord{\left/ {\vphantom {1 {{\sigma ^2}}}}\right.} \!\lower0.7ex\hbox{${{\sigma ^2}}$}}\\ \left| x \right| - {\raise0.7ex\hbox{${0.5}$} \!\mathord{\left/ {\vphantom {{0.5} {{\sigma ^2}}}}\right.} \!\lower0.7ex\hbox{${{\sigma ^2}}$}}\;\;\;\;\;{\rm{otherwise}} \end{array} \right.} , \end{array} $$

    在RPN网络中σ=3,在Fast R-CNN中σ=1;而pi*Lreg(ti, ti*)这一项代表着只有当pi*=1,也就是有目标时,才有回归损失,其他情况下,这一项均为0;ti=(tx, ty, tw, th)是一个向量,代表预测框的4个坐标; ti*是预测框对应的真实值GT的4个坐标; 前面的参数λ则用来平衡回归损失与分类损失,使两者差距不宜过大,Nreg≈2400,Ncls≈256,因此λ=10,起到平衡权重的作用。

    将上述分类损失与回归损失相加便可得整个网络的损失函数:

    $$ {\rm{Loss}} = \frac{1}{{{N_{{\rm{cls}}}}}}\sum\limits_i {{L_{{\rm{cls}}}}} \left( {{p_i},p_i^*} \right) + \lambda \frac{1}{{{N_{{\rm{reg}}}}}}\sum\limits_i {p_i^*{L_{{\rm{reg}}}}} \left( {{t_i},t_i^*} \right)。 $$

    在这部分选用的训练集是从网上、工厂搜集的1000张包含舰船目标的红外图像,测试集为100张包含大小各类红外舰船目标的图片,分布在港口、码头、海洋等各个背景条件下。评价指标mAP(mean average precision)是对目标检测算法的检测精度进行效能评估的最常用的度量指标[18],FPS(frame per second)作为检测速度的评价指标,选择这两项对训练好的模型进行精度和速度的评估。

    由于搜集到的数据集数量有限,担心不足以支撑模型的训练,因此对搜集到的数据进行数据增强处理,通过左右镜像与上下镜像增强自己的训练数据集,数据增强后示例如图 10所示。

    图  10  数据增强示例图
    Figure  10.  Sample diagram of data enhancement

    图 10中,图 10(a)为红外舰船原图,图 10(b)为原图经过左右镜像后得到的图片,图 10(c)图 10(d)为将上述两张图片进行上下镜像后得到的图片。通过运行left_right.py与up-down.py对1000张数据集进行批量操作,共得到数据增强后的图片集4000张。

    实验环境的操作系统为Windows10,深度学习框架为tensorflow1.9.0。实验硬件环境的CPU为Intel(R) Core(R) i7 9700KF,内存为32 G。GPU为NVIDIA(R) GTX(R) 1080TI。训练过程中的参数设置:batch_size=16,预训练模型为VGG-16,初始学习率为0.001,衰减因子为0.0005。首先将学习率设置成0.001训练10000次,接下来在上一步训练的基础上将学习率设置成0.0001继续训练10000次,再接着将学习率设置为0.00001继续训练,使损失函数进一步收敛,得到训练好的最终训练模型,图 11为训练过程中的损失函数图像。

    图  11  改进的Faster R-CNN损失函数曲线
    Figure  11.  Improved Faster R-CNN loss function curve

    图 11中可以看出在训练迭代20000次时,损失函数已经收敛至0.2附近,继续训练至10000次左右发现损失函数已稳定收敛于0.2上下,由于改进后的网络结构增加了多尺度特征图从而引入了额外的参数,担心继续训练下去会产生模型过拟合的问题,于是在30000次停止训练,得到训练结束的最终模型。

    通过对不同包含舰船目标红外图像进行测试,测试效果如图 12所示,可以看到检测效果非常好,检测框上方是类别名称和置信度,训练好的模型可以准确识别出不同尺寸、不同大小、不同质量的图片的舰船目标。

    图  12  红外舰船图像检测结果
    Figure  12.  Detection result of infrared ship image

    在目标检测算法中,评价一个算法模型的优劣最客观的评价指标有召回率(Recall)、准确率(Precision)、平均准确率AP、均值平均准确率mAP,通常使用均值平均精度(即mAP)来评估一个检测算法的检测准确度,数值越大检测效果越好,在本次实验中,目标类别只有一类,因此mAP值就等于AP值。

    对于某一类问题,将分类的目标计为正例(positive)和负例(negtive),那么就有如下的指标:

    1)True positives(TP):被正确地划分为正例的个数,即实际为正例而且被分类器判别出正例的数目;

    2)False positives(FP):被错误地划分为正例的个数,即实际为负例但被分类器判别为正例的数目;

    3)False negatives(FN):被错误地划分为负例的个数,即实际为正例但被分类器判别为负例的数目;

    4)True negatives(TN):被正确地划分为负例的个数,即实际为负例并且被分类器判别为负例的数目。

    这些指标间的关系如表 1所示。

    表  1  分类结果判别表
    Table  1.  Classification result discriminant table
    Real situation Discriminant result
    Positive example Counter example
    Positive example TP(True positive example) FN(False Counter example)
    Counter example FP(False positive example) TN(True Counter example)
    下载: 导出CSV 
    | 显示表格

    召回率R以及准确率P的定义公式分别为:

    $$ R{\rm{ = }}\frac{{{\rm{TP}}}}{{{\rm{TP}} + {\rm{FN}}}},P{\rm{ = }}\frac{{{\rm{TP}}}}{{{\rm{TP + FP}}}} $$ (6)

    在公式(6)中,并在本次实验中,TP代表正确检测到舰的个数; FP代表误检测是舰船的个数; FN代表漏检测舰船的个数。AP值就为召回率与准确率所围成的R-P曲线面积,mAP值等于AP值;

    使用原Faster R-CNN算法在同一数据集进行30000次的训练,训练结束后,在测试数据集上进行测试,对比改进前后检测效果; 通过分别运行python工程文件mAP-master,对测试集进行计算得到改进前后的平均准确率AP值,并且得到R-P曲线,如图 13所示。

    图  13  改进前后Faster R-CNN在红外舰船测试集上的R-P曲线
    Figure  13.  R-P curves of Faster R-CNN on infrared ship test set before and after improvement

    图 13中横坐标为召回率,纵坐标为相应的准确率,原Faster R-CNN算法在红外舰船测试集上的平均准确率AP=80.03%,经过改进之后在同一测试集上的平均准确率AP=83.98%,在本次实验中mAP=AP。改进前后的检测效果对比如图 14所示。

    图  14  Faster R-CNN改进前后红外目标检测效果对比
    Figure  14.  Comparison of infrared target detection effect before Faster R-CNN improvement

    筛选出的这两组图像均可以很好地表现改进算法的相比于原有算法的改进成效,从图 14前4组对比图片中可以明显看出,改进后的算法在在选红外目标的位置准确性方面有了很大的提升,这是因为基于红外数据集改进的Anchor尺寸更适合红外舰船目标,从而使得最后输出的预测框能够更为准确地框选红外目标; 同时在检测红外目标精度方面也有了很大提升,如图 14最后两组对比图片所示,这是由于改进后网络结构中增加的多尺度特征图使得模型可以提取到更为丰富的红外目标特征信息; 原算法中容易出现重复检测的问题也得到了改善,如图 14第5、6组对比图片所示,一方面,这是由于网络结构中增加了多尺度特征图从而提高了特征提取能力,另一方面,对训练数据集所做的数据增强处理在某种程度上也使得重复检测的问题得到了缓解; 综上所述,改进后的算法在框选目标位置准确性、检测准确率上有了很大程度的提升,同时也改善了原算法中容易出现重复检测问题。

    对改进前后的两种算法,运行python工程文件mAP-master之后可得到检测100张图片所花费的时间,原Faster R-CNN检测100张图片所花费时间为31.28 s,改进后FasterR-CNN检测100张图片所花费时间为33.84 s,其具体的性能对比如表 2所示。

    表  2  改进前后算法性能对比
    Table  2.  Comparison of algorithm performance before and after improvement
    Model name AP/% mAP/% Time/s
    Faster R-CNN 80.03 80.03 0.3128
    Improved Faster R-CNN 83.98 83.98 0.3384
    下载: 导出CSV 
    | 显示表格

    从表中可以看出,原Faster R-CNN算法的mAP值为80.03%,而改进后算法的mAP值为83.98%,较之于改进前提升了3.95%,精度提高的同时,检测每张图片所花费的时间较之于改进前稍有变长,这是因为在网络结构中增加了3个特征图进行拼接形成多尺度特征图用于加强对红外目标的特征提取从而引入了额外的计算参数所导致的。

    提出了一种改进Faster R-CNN的红外舰船目标检测算法,对网络结构和Anchor进行改进,同时优化了损失函数。该算法应用于红外舰船目标检测时,检测精度可以达到83.98%,较原算法相比提高了3.95%;对比算法改进前后的红外图像检测结果,验证了改进方法的可行性。本文研究的改进方法使得红外舰船目标的检测效果大大提升,可将改进后的算法模型应用在军事及工业领域,工业领域方面可应用于夜晚或严重光照不足条件下的码头、港口过往船舶检测,对海上救援、海上交通都有着重要的应用研究价值; 在军事领域方面不仅可以应用于海上战场进行舰船目标检测,还可装备应用于红外反舰武器系统上,提升打击精度,从而提升部队战斗力。

  • 图  1   国内外MCT薄膜研发结果报道情况

    Figure  1.   Progress of state-of-the-art MCT growth technology

    图  2   液相外延MCT薄膜主要表面缺陷类型:(a) 为外延工艺引入的缺陷;(b) 为碲锌镉衬底引入的缺陷

    Figure  2.   Major surface defect types of the MCT epi-layers grown by LPE, including the surface defects introduced from the LPE process (a) and derived from CZT substrates (b)

    图  3   昆明物理研究所主流CZT晶锭尺寸(a)和衬底尺寸(b)

    Figure  3.   CZT crystal ingots (a) and substrates (b) size increase at KIP

    图  4   昆明物理所碲锌镉衬底沉积相尺寸和密度的优化:(a)优化前;(b)优化后

    Figure  4.   Size and density decrease of precipitates and inclusion in CZT substrates at KIP: (a) Before optimization, (b) After optimization

    图  5   通过生长工艺优化抑制碲锌镉衬底的位错腐蚀坑密度

    Figure  5.   Etch pit density(EPD) of CZT substrate obtained from KIP optimized process

    图  6   采用优化工艺后的ϕ120 mm碲锌镉晶圆Zn组分分布:(a) 优化前;(b)(c) 优化后

    Figure  6.   Zn content distribution over a ϕ120 mm CZT wafer made from optimized crystal growth process: (a) Before optimization; (b)(c) After optimization

    图  7   70 mm×75 mm面积CZT衬底面形典型测试结果(a)和工艺优化前后衬底PV值的变化(b)

    Figure  7.   Measurements of topography via an optical interferometry(Zygo) (a) and the variation of PV before and after optimization (b) for 70 mm×75 mm CZT substrates

    图  8   昆明物理研究所MCT外延薄膜的位错腐蚀坑密度(EPD)

    Figure  8.   Improvements of EPD values of MCT epi-layers grown by LPE at KIP

    图  9   昆明物理研究所MCT薄膜半峰宽与衬底Zn组分关系(a)及50 mm×60 mm MCT薄膜表面粗糙度改善(b)

    Figure  9.   Mean DCRC FWHM values measured as a function of zinc content (a) and surface roughness improvements(b) of MCT epi-layers prepared at KIP

    图  10   昆明物理研究所50 mm×60 mm MCT薄膜厚度和截止波长均匀性:(a)(b)长波MCT;(c)(d)中波MCT

    Figure  10.   Thickness and cut-off wavelength variation over the epi-layer area of 50 mm×60 mm MCT epi-layers at KIP: (a)(b)Long wavelength MCT; (c)(d) Middle wavelength MCT

    图  11   昆明物理研究所MCT薄膜材料的载流子浓度和迁移率:(a)(b)长波MCT;(c)(d)中波MCT

    Figure  11.   Carrier concentration and mobility measurements of hundreds of MCT epi-layers grown by LPE at KIP: (a)(b)Long wavelength MCT; (c)(d) Middle wavelength MCT

    图  12   LPE MCT尺寸的增大推动了探测器生产效率的提升,单片薄膜可制备24个640×512 (15 μm pitch)芯片(a),(b);同时实现了2048×2048(15 μm pitch)、2048×2048(18 μm pitch)、4096×4096(15 μm pitch)大面阵探测器芯片的研制(c),(d),(e)

    Figure  12.   LPE MCT epi-layers size increase enabled up to 24 640×512(15 μm pitch)infrared arrays on one single epi-layer (a), (b); shown in (c), (d), (e) were 2048×2048(15 μm pitch), 2048×2048(18 μm pitch), 4096×4096 (15 μm pitch) infrared sensor chip assemblies(SCAs)made from KIP LPE MCT on CZT respectively

    图  13   碲镉汞探测器R0A值与77 K截止波长的关系

    Figure  13.   MCT detector R0A product versus cutoff wavelength at 77 K, summarized with bibliographic data

    图  14   昆明物理研究所碲镉汞甚长波红外焦平面探测器性能测试结果:(a) 热响应分布图;(b) 盲元分布图;(c) NETD直方图;(d) 红外成像图[22]

    Figure  14.   The performance of VLWIR FPA prepared at KIP: (a) Thermal response mapping; (b) Bad pixel mapping; (c) NETD histogram; (d) Infrared image

    图  15   昆明物理研究所HOT中波红外焦平面探测器性能测试结果:(a) 80~200 K的NETD;(b) 80~180 K的盲元分布图[25]

    Figure  15.   The performance of HOT MWIR FPA prepared at KIP: (a) NETD from 80 K to 200 K; (b) Bad pixel mapping from 80 K to 180 K[25]

    图  16   昆明物理研究所1024×1280、2048×2048、4096×4096等规格焦平面探测器信号响应图

    Figure  16.   The responsivity mapping measurements of 1024×1280, 2048×2048 and 4096×4096 IRFPA prepared at KIP

  • [1] 杨建荣. 碲镉汞材料物理与技术[M]. 北京: 国防工业出版社, 2012.

    YANG Jianrong. Physics and Technology of HgCdTe Materials[M]. Beijing: National Industry Press, 2012.

    [2] 宋林伟, 孔金丞, 李东升, 等. 金掺杂碲镉汞红外探测材料及器件技术[J]. 红外技术, 2021, 43(2): 97-102. http://hwjs.nvir.cn/article/id/587d68b6-af54-476a-b0b8-5a5e4ef674fd

    SONG Linwei, KONG Jincheng, LI Dongsheng, et al. Au-doped HgCdTe infrared material and device technology[J]. Infrared Technology, 2021, 43(2): 97-103. http://hwjs.nvir.cn/article/id/587d68b6-af54-476a-b0b8-5a5e4ef674fd

    [3]

    Reddy M, Jin X, Lofgreen D D, et al. Demonstration of high-quality MBE HgCdTe on 8-Inch wafers[J]. Journal of Electronic Materials, 2019, 48(10): 6040-6044. DOI: 10.1007/s11664-019-07246-y

    [4]

    Smith E P G, Venzor G M, Newton M D, et al. Inductively coupled plasma etching for large format HgCdTe focal plane array fabrication[J]. Journal of Electronic Materials, 2005, 34(6): 746-753. DOI: 10.1007/s11664-005-0014-8

    [5]

    Bratt P R, Johnson S M, Rhiger D R, et al. Historical perspectives on HgCdTe material and device development at Raytheon Vision Systems[C]//Proceedings of SPIE, 2009, 7298: 1044-1078.

    [6]

    Vilela Mauro F, Hogan Jack, Fennell Brian T, et al. Infinite-melt vertical liquid-phase epitaxy of HgCdTe from Hg solution: from VLWIR to SWIR[J]. Journal of Electronic Materials, 2022, 51: 4731-4741. DOI: 10.1007/s11664-022-09810-5

    [7]

    Arkun F Erdem, Edwall Dennis D, Ellsworth Jon, et al. Characterization of HgCdTe films grown on large-area CdZnTe substrates by molecular beam epitaxy[J]. Journal of Electronic Materials, 2017, 46(9): 5374-5378. DOI: 10.1007/s11664-017-5441-9

    [8]

    Mosby G, Rauscher B J, Bennett C, et al. Properties and characteristics of the Nancy Grace Roman Space Telescope H4RG-10 detectors[J]. Journal of Astronomical Telescopes Instruments and Systems, 2020, 6(4): DOI: 10.1117/1.JATIS.6.4.046001.

    [9]

    Atkinson D, Bezawada N, Hipwood L G, et al. Operation and performance of new NIR detectors from SELEX[C]//Proceedings of SPIE, 2012, 8453: 84530U.

    [10]

    Santailler Jean-Louis, Gout Erik, Journot Timotée, et al. From 5" CdZnTe ingots to high quality (111) CdZnTe substrates for SWIR 2k2 15 µm pitch infrared focal plane arrays manufacturing[C]//Proceedings of SPIE, 2020: DOI: 10.1117/12.2561377.

    [11]

    Lovecchio P, Wong K, Parodos T, et al. Advances in liquid phase epitaxial growth of Hg1-xCdxTe for SWIR through VLWIR photodiodes [C]//Proceedings of SPIE, 2004, 5564: 65-72.

    [12]

    Wenisch J, Bitterlich H, Bruder M, et al. Large-format and long-wavelength infrared mercury cadmium telluride detectors[J]. Journal of Electronic Materials, 2013, 42(11): 3186-3190. DOI: 10.1007/s11664-013-2757-y

    [13] 孙权志, 孙瑞赟, 魏彦锋, 等. 50 mm×50 mm高性能HgCdTe液相外延材料的批生产技术[J]. 红外与毫米波学报, 2017, 36(1): 49-54. https://www.cnki.com.cn/Article/CJFDTOTAL-HWYH202102010.htm

    SUN Quanzhi, SUN Ruiyun, WEI Yanfen, et al. Batch production technology of 50 mm×50 mm HgCdTe LPE materials with high performance[J]. Journal of Infrared and Millimeter Waves, 2017, 36(1): 49-54. https://www.cnki.com.cn/Article/CJFDTOTAL-HWYH202102010.htm

    [14] 刘伟华, 刘帆, 吴正虎, 等. 12 μm像元间距1280×1024碲镉汞中波红外焦平面探测器的制备及性能研究[J]. 红外, 2020, 41(3): 9-15. https://www.cnki.com.cn/Article/CJFDTOTAL-HWAI202003002.htm

    LIU Weihua, LIU Fan, WU Zhenghu, et al. Study on preparation and performance of 1280×1024@12 μm HgCdTe MWIR focal plane detectors[J]. Infrared, 2020, 41(3): 9-15. https://www.cnki.com.cn/Article/CJFDTOTAL-HWAI202003002.htm

    [15] 高达, 李震, 王丹, 等. 大尺寸碲锌镉基碲镉汞材料分子束外延技术研究[J]. 激光与红外, 2022, 52(3): 388-391. https://www.cnki.com.cn/Article/CJFDTOTAL-JGHW202203013.htm

    GAO Da, LI Zhen, WANG Dan, et al. Research on molecular beam epitaxy growth of HgCdTe large CdZnTe substrate[J]. Laser & Infrared, 2022, 52(3): 388-391. https://www.cnki.com.cn/Article/CJFDTOTAL-JGHW202203013.htm

    [16]

    Koyama A, Hichiwa A, Hirano R. Recent progress in CdZnTe craystal[J]. Journal of Electronic Materials, 1999, 28(6): 683-687. DOI: 10.1007/s11664-999-0054-6

    [17] 袁绶章, 赵文, 孔金丞, 等. Cd饱和气氛退火对碲锌镉晶体导电类型转变界面的影响[J]. 红外技术, 2021, 43(6): 517-522. http://hwjs.nvir.cn/article/id/ebc94562-b5eb-4803-b866-53a3ed83d591

    YUAN Shouzhang, ZHAO Wen, KONG Jincheng, et al. Influence of Cd-rich annealing on position-dependent conductivity transition in Cd1-xZnxTe crystal[J]. Infrared Technology, 2021, 43(6): 517-522. http://hwjs.nvir.cn/article/id/ebc94562-b5eb-4803-b866-53a3ed83d591

    [18] 赵文, 孔金丞, 姜军, 等. Cd1-xZnxTe晶体中由本征缺陷引起的导电类型转变界面研究[J]. 红外技术, 2022, 44(6): 560-564. http://hwjs.nvir.cn/article/id/b83b7360-956e-4770-9595-8b1658deaa0b

    ZHAO Wen, KONG Jincheng, JIANG Jun, et al. Position-dependent conductivity transition by intrinsic defects in Cd1-xZnxTe crystal[J]. Infrared Technology, 2022, 44(6): 560-564. http://hwjs.nvir.cn/article/id/b83b7360-956e-4770-9595-8b1658deaa0b

    [19] 袁绶章, 赵文, 孔金丞, 等. 原位退火对碲锌镉晶体第二相夹杂缺陷的影响[J]. 红外技术, 2021, 43(7): 615-621. http://hwjs.nvir.cn/article/id/92499484-e5a1-4255-858b-0af603887888

    YUAN Shouzhang, ZHAO Wen, KONG Jincheng, et al. Effect of in-situ post-annealing on the second phase inclusion defects[J]. Infrared Technology, 2021, 43(7): 615-621. http://hwjs.nvir.cn/article/id/92499484-e5a1-4255-858b-0af603887888

    [20]

    Cathignol A, Brellier D, Gout E, et al. From CdZnTe bulk growth to HgCdTe infra-red detectors: mastering the chain for high-performance and reliable imaging[C]//Proceedings of SPIE, 2018, 10624, DOI: 10.1117/12.2304950.

    [21] 龚晓丹, 李红福, 杨超伟, 等. 大面阵短波碲镉汞红外焦平面器件研究[J]. 红外与激光工程, 2022, 51(9): DOI: 10.3788/IRLA20220079.

    GONG Xiaodan, LI Hongfu, YANG Chaowei, et al. Study on large-area array SW HgCdTe infrared focal plane device[J]. Infrared and Laser Engineering, 2022, 51(9): DOI: 10.3788/IRLA20220079.

    [22] 李立华, 熊伯俊, 杨超伟, 等. P-on-n长波、甚长波碲镉汞红外焦平面器件技术研究[J]. 红外与毫米波学报, 2022, 41(3): 534-539. https://www.cnki.com.cn/Article/CJFDTOTAL-HWYH202203001.htm

    LI Lihua, XIONG Bojun, YANG Chaowei, et al. Research on p-on-n LWIR and VLWIR HgCdTe infrared focal plane detectors technology[J]. Journal of Infrared and Millimeter Waves, 2022, 41(3): 534-539. https://www.cnki.com.cn/Article/CJFDTOTAL-HWYH202203001.htm

    [23]

    Wollrab R, Bauer A, Bitterlich H, et al. Planar n-on-p HgCdTe FPAs for LWIR and VLWIR applications[J]. Journal of Electronic Materials, 2011, 40(8): 1618-1623.

    [24]

    Tennant W E, Lee Donald, Zandian Majid, et al. MBE HgCdTe technology: a very general solution to IR detection, described by "Rule 07", a very convenient heuristic[J]. Journal of Electronic Materials, 2008, 37(9): 1406-1410.

    [25] 陈军, 习中立, 秦强, 等. 碲镉汞高温红外探测器组件进展[J]. 红外与激光工程, 2023, 52(1), DOI: 10.3788/IRLA20220462.

    CHEN Jun, XI Zhongli, QIN Qiang, et al. Advance in high operating temperature HgCdTe infrared detector[J]. Infrared and Laser Engineering, 2023, 52(1): DOI: 10.3788/IRLA20220462.

  • 期刊类型引用(3)

    1. 姚佳志,宋延嵩,宋建林,王伟,安岩. 滚仰式导引头跟踪策略研究. 兵工学报. 2024(11): 4031-4038 . 百度学术
    2. 叶斯哲. 基于飞刀车削的反射棱镜精密加工技术研究. 光电技术应用. 2023(01): 76-82 . 百度学术
    3. 周晓斌,张衡,文江华,吴妍,刘召庆,张向明,金明鑫. 长波红外光学系统混合被动无热化设计. 红外技术. 2021(09): 836-839 . 本站查看

    其他类型引用(2)

图(16)
计量
  • 文章访问数:  391
  • HTML全文浏览量:  175
  • PDF下载量:  197
  • 被引次数: 5
出版历程
  • 收稿日期:  2022-12-13
  • 修回日期:  2023-01-13
  • 刊出日期:  2023-02-19

目录

/

返回文章
返回