Analysis on the Relative Spectral Crosstalk of Dual-band IRFPA Detector
-
摘要: 提出了一种评价双色探测器的相对光谱串音的模型及测试方法。为验证模型及测试方法的可行性,采用分子束外延锗基叠层异质结构碲镉汞薄膜材料,研制了微台面结构短波/中波双色红外焦平面探测器原理器件,进行了相对光谱串音测试,归纳出3种主要的相对光谱串音模式,并结合材料、器件结构和工艺特点,分析了相对光谱串音的成因。
-
0. 引言
近年来,太赫兹时域光谱技术(Terahertz Time -D omain Spectroscopy,THz-TDS)已被广泛应用于食品检测、光谱分析、安全监测、生物医学等领域[1]。太赫兹光谱具有典型的高光谱数据特征,从海量的光谱数据中提取特征信息和建立统一指纹谱库是THz-TDS技术应用所面临的挑战。
在基于太赫兹光谱的定性识别技术发展的早期,定性多依赖于对光谱中特殊吸收峰峰位的指认。然而,当面对种类繁多且结构相似的待测物和测量过程中环境的不可抗力因素时,仅靠吸收峰峰位指认来鉴别物质种类已不再适用。后来,随着机器学习的不断发展和完善,基于太赫兹光谱数据的物质鉴别也多采用机器学习的方法。例如,胡晓华等人采用粒子群优化算法(Particle Swarm Optimization,PSO)结合支持向量机(Support Vector Machine,SVM),实现了咖啡豆产地的快速鉴别,识别率达到95%[2];周博等人针对不同烟草配方组分,利用其太赫兹时域光谱分别建立了SVM、K近邻(K-Nearest Neighbors,KNN)和袋装树分类模型,模型准确率均在90%以上,为太赫兹技术在烟草物料无损检测的应用上提供了参考[3]。但机器学习作为对数据依赖较强的方法,通常需要大量的训练集和较长时间来训练模型才能得到较好结果,且针对不同训练数据均需寻找特定的最优参数[4]。在实际检测中,所得数据大都为小样本数据,用其来训练模型可能存在过拟合或欠拟合问题[5],这在一定程度上限制了太赫兹时域光谱技术在物质定性鉴别领域的应用。
层次分析法(Analytic Hierarchy Process,AHP)是美国运筹学家、匹茨堡大学教授萨蒂研究“根据各个工业部门对国家福利的贡献大小而进行电力分配”课题时,提出的一种层次权重决策分析方法,主要用于解决评价类或者风险评估的问题[6]。在定性分析中,可利用其思想,综合光谱数据的整体趋势、峰位、峰值、峰数等多个吸收谱特征因素,将主观评价转化为基于数据的客观识别。这样不仅能够有效避免“一锤定音”式的判定,还可简化光谱数据的预处理过程,对于不同物质的相似光谱也能够根据上述4个因素有效区分。为此,本文以添加剂吸收谱数据为例,提出了一种综合多因素的层次分析定性识别方法,并验证了其有效性,为受多种因素影响的太赫兹吸收谱谱定性分析提供了新思路。
1. 方法理论及实验
1.1 算法简介
层次分析法(AHP)的分析思路是:将复杂分析对象分解为目标层、准则层和方案层,对同一层元素两两之间的重要程度做出判断,建立判断矩阵,并计算出每一因素对高一层指标重要程度的权重,得到判断矩阵对应的权重,为最优选择提供依据[7]。根据层次分析结构,首先从准则层开始,比较各个准则于目标层的相对重要程度。相对重要性尺度如表 1所示。
表 1 AHP相对重要性尺度Table 1. AHP relative importance scaleScale Define Clarification 1 Equally important Elements a and b are equally important for an attribute 3 Slightly important Element a is slightly more important than element b for an attribute 5 More important Element a is more important than element b for an attribute 7 Clearly important Element a is significantly more important than element b for an attribute 9 Special importance Element a is particularly more important than element b for an attribute 2, 4, 6, 8. Midpoint A compromise between the two neighbouring scales above The reciprocal of the above scales Inverse comparison For example, a compares to b as 3 and b compares to a as 1/3. 1.2 综合多因素的层次分析法定性识别
1.2.1 评价指标设计
定义1:设矩阵W=(wij)(n+1)×m,其中n为准则层个数,m为方案层个数。若有0≤wij≤1,则矩阵W为最终权重矩阵。
定义2:设矩阵A=(aij)n×n,若有0≤aij≤1,则矩阵A为准则层到目标层的判断矩阵,其中aij表示指标i相对于目标层的重要程度/指标j相对于目标层的重要程度。
1.2.2 模型设计
综合多因素的层次分析定性识别模型流程如图 1所示,具体步骤如下:
1)由判断矩阵A可得4个准则于目标层的初始权重AA=[0.6545, 0.2045, 0.0955, 0.0456],将其填入权重矩阵的第一列。
2)设单条测试数据矩阵为X=(x1, x2, x3, …, xj),j=1, 2, 3, …, z;对比库数据矩阵为Y=(yij)t×z,其中z表示数据的维度;t表示对比库中光谱的数量。由于对比库中每类数据随机取5条后取平均,故此处t=6。导入测试数据后,首先计算测试数据X与对比库数据Y关于每个准则的相似度,其中相似度用欧式距离表征,且与欧式距离成反比,如式(1)所示;其次,设固定权重向量R=[0.29, 0.24, 0.19, 0.14, 0.092, 0.048],依据测试数据在每个准则上与6类物质的相似度对R中元素进行排序,由此构成方案层关于各个准则层的权重矩阵B;最后将权重矩阵B填入最终权重矩阵W中。
$$ \operatorname{dist}=\sqrt{\sum\limits_{j=1}^z\left(x_j-y_{i j}\right)^2}, \quad j=1, 2, 3, \cdots, z $$ (1) 3)根据权重矩阵W得出单条测试数据的综合得分,结果为C=AAT×B,即W的第一列按列与其余列相乘求和。C数据存储形式为[c1, …, c6],向量C中最大值对应的列坐标即为最终识别结果。以此类推,得出所有测试数据的识别结果。
1.3 实验
1.3.1 实验设备及样品制备
本文中所采集的实验数据均来自于北京市工业波谱成像工程技术研究中心的透射式THz-TDS实验系统[8],实验环境湿度始终保持在5%以下。所用实验样品均购置于阿拉丁试剂网,其纯度≥99%。实验分别采集了L-丙氨酸、苯甲酸、三聚氰胺、山梨酸、苏丹红Ⅰ号、木糖醇这6种添加剂的单质太赫兹时域光谱,其中补偿样品为聚乙烯(PE)。为方便表述,下文使用S1~S6来指代这6类添加剂,每种添加剂样品有3种浓度,每种浓度各3个样片,共制备9个样片(见表 2),每个样片测量4次,共216条数据。
表 2 添加剂样片信息统计Table 2. Statistical of additives samplesSample name Category number Sample concentration /% Sample quantity L-Alanine S1 S1-1 S1-2 S1-3 10% 3 S1-4 S1-5 S1-6 25% 3 S1-7 S1-8 S1-9 35% 3 Benzoic acid S2 S2-1 S2-2 S2-3 10% 3 S2-4 S2-5 S2-6 25% 3 S2-7 S2-8 S2-9 35% 3 Melamine S3 S3-1 S3-2 S3-3 10% 3 S3-4 S3-5 S3-6 25% 3 S3-7 S3-8 S3-9 35% 3 2, 4-Hexadienoic acid S4 S4-1 S4-2 S4-3 10% 3 S4-4 S4-5 S4-6 25% 3 S4-7 S4-8 S4-9 35% 3 Sudan-Ⅰ S5 S5-1 S5-2 S5-3 10% 3 S5-4 S5-5 S5-6 25% 3 S5-7 S5-8 S5-9 35% 3 Xylitol S6 S6-1 S6-2 S6-3 10% 3 S6-4 S6-5 S6-6 25% 3 S6-7 S6-8 S6-9 35% 3 1.3.2 数据预处理
根据T. D. Dorney与L. Duvillaret提出的光学参数基本模型[9-10],计算各样片在太赫兹频段的吸收系数α(ω),公式如下:
$$ n(\omega)=\frac{\varphi(\omega) c}{\omega d}+1 $$ (2) $$ \alpha(\omega)=\frac{2}{d} \ln \left\{\frac{4 n(\omega)}{\rho(\omega)[n(\omega)+1]^2}\right\} $$ (3) 式中:c为真空光速;ω为振动频率;d为样品厚度;ϕ(ω)为样品信号与参考信号的相位差;ρ(ω)为样品信号与参考信号的振幅比;n(ω)为样品的复折射率。
首先,截取吸收光谱的0.6~2.6 THz作为特征频段,经S-G平滑和剔除含坏点数据后,得到203条有效光谱数据,每条数据632个数据点;其次,对光谱数据进行寻峰,并建立含4个因素的数据集;最后划分对比集和测试集。
2. 分析及优化
2.1 识别结果分析
基于太赫兹光谱中不同因素的添加剂定性识别结果如图 2所示。由图 2可知,基于单因素的定性识别结果并不理想(图(a)~(d))。原因可以归结为由于实验环境和样品厚度的非绝对一致,导致同类数据在某特征区间有差异,且不同类样品之间存在相似特征。图(e)中,由于基于多因素的层次分析算法按特定权重考虑了各因素对识别的影响,故识别准确率相较于仅考虑单一因素的识别结果有了较大的提升。
2.2 识别结果优化
2.2.1 数据模糊化表征
对比图 2的识别结果可知,吸收谱中谱线整体趋势在各个因素中重要程度较高。因此,本文提出将光谱整体趋势模糊化表征的方法,具体如下:
首先,记单条原始光谱为H=(h1, h2, h3, …, hj),j=1, 2, 3, …, g,其中g为原始光谱数据的维度;其次,H中相邻数据的差记为E=(ej)1×j=(h2-h1, h3-h2, …, hj-hj-1),当ej≥λ或-λ<ej<0时,令ej=1,代表上升;当ej<-λ或0<ej<λ时,令e=-1,代表下降。其中λ代表数据差的平均值,这样H就会转化成只有-1和1的数据集。
样品S5的部分原始吸收光谱数据与模糊表征后数据的对比如图 3所示。从图 3可知,S5在1.46 THz为一个特征点。原始数据中S5-1在1.46 THz右侧数据呈现上升趋势,与S5-2和S5-3在1.46 THz右侧的趋势并不匹配,这可能导致识别精度的降低。而模糊表征使3条数据在1.46 THz处均体现出了其特征,并在特征不明显的区域也有一定的特征表现。故该方法可突出光谱数据的整体趋势特征,且整数运算相比于小数运算节省了程序的运算时间。此外,在后续方案层对于整体趋势的相似度上,将不再依据欧氏距离来排序R,而用数据之间的重复率来做R排序的依据。
2.2.2 参数优化
结合层次分析法的定性识别算法的优化主要是针对整体趋势、峰值、峰位、峰数的权重指标比例进行参数寻优。从初始参数出发,寻参范围设为0.2~0.7,步长为0.05。采用枚举法对整体趋势分别用原始光谱数据表征和模糊表征后的层次分析定性识别模型进行参数寻优,寻优结果如图 4所示。
表 3展示了在结合层次分析法的定性识别模型下,整体趋势用模糊表征(记为MH)和原始数据表征(记为YS)各自的识别精度与对应参数。由表 3可知:YS+AHP的最优识别率为92.44%;MH+AHP的最优识别率为94.19%;仅考虑整体趋势时,使用YS法的识别率为80.23%,而使用MH法的识别率为93.60%。
表 3 识别精度及其对应参数统计表(AHP方法)Table 3. Identification accuracy and corresponding parameters statistical tableData represen-tation Parameter weighting Identification accuracy/% Overall trend Peak value Peak
positionPeak number YS 1 0 0 0 80.23 YS 0.6 0.1 0.2 0.1 92.44 MH 1 0 0 0 93.60 MH 0.8 0.1 0.1 0.0 94.19 对于YS法,依据欧氏距离来判定相似度。由于每个坐标对欧式距离的贡献是同等的,当两组数值某个坐标有较大偏差时,会造成最终欧式距离偏大,而影响判别结果;而对于MH法,在突出表示光谱数据整体趋势的同时,也会受阈值λ取值大小的影响。
3. 结论
随着太赫兹光谱数据库物质种类的不断充盈,“同物异谱”和“异物相似谱”的现象普遍存在。仅依靠峰位或峰值来定性已不能满足于识别精度的需求。本文提出的结合层次分析法的定性识别算法,综合考虑吸收光谱的整体趋势、峰值、峰位、峰数等多种影响因素及其对应的客观权重,对光谱进行定性识别。此方法无需复杂的光谱预处理和特征提取过程。
此外,本文验证了数据模糊表征法的有效性,有效避免了“同物异谱”现象造成的整体趋势不一致问题。通过对6类添加剂的识别结果分析可知,结合层次分析法的太赫兹时域光谱定性识别方法可有效对物质进行定性识别,其识别准确率最高可达94.19%。
然而,该方法的识别精度受对比库中标准数据和数据预处理时寻峰算法参数的影响。因此,后续研究中还需要建立更加标准、统一的光谱数据库和检测识别的一体化系统,进一步实现小样本数据的快速准确识别。
-
期刊类型引用(12)
1. 许霄霄,张昕,姚强,朱佳祥,王昕. 基于灰狼自适应阈值分割和改进模糊增强的红外图像NSCT增强算法. 电测与仪表. 2024(01): 46-51 . 百度学术
2. 王振,刘磊. 融合彩色模型空间的电力设备红外图像增强. 红外技术. 2024(02): 225-232 . 本站查看
3. 刘志坚,陶韵旭,刘航,罗灵琳,张德春,何蔚. 融合残差密集与生成对抗网络的红外巡检图像超分辨率重建. 昆明理工大学学报(自然科学版). 2023(05): 120-129 . 百度学术
4. 杨小龙,马超,姚陶,李静,栾士江. 基于可见光图像的变压器缺陷识别技术研究. 变压器. 2022(02): 13-18 . 百度学术
5. 康辉,杨庆江,冯新宇,李亚妮,刘晓磊. 基于融合算法的电力设备红外图像增强. 黑龙江科技大学学报. 2022(04): 545-549+562 . 百度学术
6. 隋宇,宁平凡,牛萍娟,王辰羽,赵地,张伟龙,韩抒真,梁立君,薛高建,崔颜军. 面向架空输电线路的挂载无人机电力巡检技术研究综述. 电网技术. 2021(09): 3636-3648 . 百度学术
7. 吴雪琼,孙保华,马洲俊. 配电网设备感知热像的自适应多阈值分割研究. 电力信息与通信技术. 2021(09): 70-76 . 百度学术
8. 裴璐,杜浩,黄照贺,黄焕强,吴钊铭. 基于红外检测的电力设备运行风险智能诊断. 电力设备管理. 2020(09): 121-122+132 . 百度学术
9. 陈静. 可见光图像检测方法在牵引变电设备故障诊断中的应用. 电气化铁道. 2020(S2): 87-89+94 . 百度学术
10. 缪希仁,刘志颖,鄢齐晨. 无人机输电线路智能巡检技术综述. 福州大学学报(自然科学版). 2020(02): 198-209 . 百度学术
11. 王小芳,康琛,程宏波,曾晗,辛建波,纪清照. 基于红外图像处理的变电设备热故障自动诊断方法. 华东交通大学学报. 2019(03): 111-118 . 百度学术
12. 王小芳,毛华敏. 一种复杂背景下的电力设备红外图像分割方法. 红外技术. 2019(12): 1111-1116 . 本站查看
其他类型引用(7)
计量
- 文章访问数: 125
- HTML全文浏览量: 23
- PDF下载量: 23
- 被引次数: 19