Improved Infrared Anomaly Target Detection Algorithm Based on Single Gaussian Model
-
摘要: 基于单高斯模型的红外异常目标检测算法是一种常见的能自适应更新背景模型的检测算法。该算法对各个像素的输出响应进行高斯建模,通过设定的阈值确定目标像素点是否为前景像素点,从而达到检测的目的。本文在单高斯模型的基础上,提出一种改进的异常检测算法,该算法利用奈曼-皮尔逊准则选取最佳阈值,克服了根据经验值选取阈值的局限性,为最佳判决阈值的选取奠定了理论基础,使得在虚假率一定的情况下,检测概率达到最高。实验证明,将常见的经验阈值与本文确定阈值进行比较,本文算法确定的阈值检测效果更佳。Abstract: An infrared anomaly target detection algorithm based on a single Gaussian model is a commonly used detection algorithm that can adaptively update the background model. The algorithm performs Gaussian modeling on the output response of each pixel and determines whether the target pixel is a foreground pixel through a defined threshold to realize detection. This paper proposes an improved anomaly detection algorithm based on a single Gaussian model. The algorithm uses the Neiman-Pearson criterion to define the optimal threshold, which overcomes the limitation of selecting the threshold based on empirical values. The paper lays a theoretical foundation for obtaining the best decision threshold so that under a certain false rate, the detection probability can reach the highest value. Experimental results show that, compared to the commonly experienced thresholds, the threshold determined in this study provides a much better detection effect.
-
0. 引言
红外热成像技术因不受昼夜影响、识别性高等优点已被广泛应用于安防监控、智能家居、异常监测等领域[1]。越来越多的系统基于过热目标与异常侵入目标的检测从而实现异常检测与报警的功能,达到预防灾难、规避风险的目的[2-3]。
根据不同的分类方式,热红外异常目标检测可得到不同的分类效果,其中最常见的一种分类方式是根据检测与跟踪的先后顺序进行划分,可分为先检测后跟踪DBT(Detect Before Track)和先跟踪后检测TBD(Track Before Detect)两大类[4-5]。常见的DBT算法包括背景减除法、帧间差分法、光流法、小波变换、形态学滤波、基于神经网络和遗传算法等方法[6-8]。TBD方法主要用于弱小目标检测[9],然而其需要基于多帧图像对潜在目标进行跟踪,算法复杂,实时性无法达到要求。因此,在实时性要求高的系统中最常用的方法为背景减除法与帧间差分法[10]。背景减除法常利用多帧数据构造背景模型,利用当前帧与背景帧的差值图像进行判决处理,确定是否存在目标。帧间差分法原理与背景减除法类似,该方法利用当前帧的前一帧作为背景,克服了背景变化的局限性,但该方法对静止目标检测时会造成空洞等现象。基于单高斯模型的检测算法利用高斯函数建立背景模型,既能自适应的更新背景模型,也能克服帧差法的局限性,使检测效果更好[11-12]。以上方法在进行判决时,阈值通常根据均值与方差或以往经验确定,因此阈值的不确定性会使检测性能受到影响。
本文在单高斯模型基础上,提出一种改进的检测算法。该算法通过单高斯模型初始化背景,再通过奈曼-皮尔逊准则确定初始最佳判决阈值,使判决出错的概率达到最小,从而使检测性能达到最优。最后通过德国HEIMANN公司型号为HTPA80x64dR1L5.0/1.0的热电堆阵列传感器获取数据,从而对本文算法进行性能验证。
1. 算法描述
1.1 单高斯模型
单高斯模型是一种在运动目标检测过程中提取背景和前景的方法[13-14]。单高斯背景模型认为,对于背景图像,各个像素的灰度值分布满足高斯分布,在这一先验知识的基础上,即每个像素点服从正态分布,如下公式:
$$P({x_{ij}}) = \frac{1}{{\sqrt {2{\rm{ \mathsf{ π} }}\sigma _{ij}^2} }}\exp ( - \frac{{{{({x_{ij}} - {\mu _{ij}})}^2}}}{{2\sigma _{ij}^2}})$$ (1) 式中:xij表示坐标为(i, j)的像素点的灰度值;μij表示该像素灰度值的均值;σij2表示该像素灰度值的方差;P(xij)表示像素(i, j)灰度值的概率分布。
基于单高斯建模的异常目标检测主要有3个步骤:背景建模、目标检测和模型更新[12]。
背景建模最常见的方法就是利用前N帧的均值和方差作为单高斯模型的参数,每个像素点的参数均不一样。建立好高斯模型后,设定一个概率阈值,将待检测的图像的灰度值代入到对应像素的高斯模型,若概率值大于设定阈值,将其判定为前景像素点,反之即为背景像素点,其中设定的概率阈值一般根据经验获得。随着时间的推移,背景可能会发生一些变化,因此需要自适应更新背景。背景更新的原则为:若像素点为前景像素点,则背景保持不变,若该像素为背景时,则按以下公式进行更新:
$$\mu _{ij}^{n + 1} = (1 - \alpha )\mu _{ij}^n + \alpha x_{ij}^{n + 1}$$ (2) $${(\sigma _{ij}^{n + 1})^2} = (1 - \alpha ){(\sigma _{ij}^n)^2} + \alpha {(\mu _{ij}^{n + 1} - x_{ij}^{n + 1})^2}$$ (3) 式中:μijn+1和(σijn+1)2表示更新后的均值和方差;α表示背景更新参数,取值为0~1之间,当α取值越大,则表示背景变化速度越快,该值也是一个经验值。
在检测判决的时候,概率阈值的选取往往通过经验值获得[15],若选择阈值偏大,则很容易将异常像素点判决为正常,导致漏警率增加。若选择阈值偏小,则容易将正常像素点判决为异常像素点,导致虚警率增加。这两种错误判决概率都会影响系统的性能。
1.2 假设检验理论
在异常检测时,各个像素点只有两种可能状态,一种是前景,一种是背景,该问题即为二元信号检测问题[16-17]。假设正常状态为H0,则异常状态为H1,输出信号经概率转移机构以一定的概率映射到观测空间R中,观测空间R又可划分为两个判决区域R0和R1。在检测判决时,正常状态下的像素点可被系统判决为正常和异常两种状态,因此,对像素点正常和异常的判决结果共有4种可能性,表 1即为二元信号检测判决结果:
表 1 二元信号检测判决结果Table 1. Judgment results of binary signal detectionJudgment Assumption H0 H1 H0 (H0/H0) (H0/H1) H1 (H1/H0) (H1/H1) 表中展示了4种可能判决结果,(Hi/Hj)表示将结果Hj判决为Hi,其中i, j∈[0, 1]。每个判决结果对应相应的判决概率,其中P(Hi/Hj)表示假设Hj为真时,判决假设Hi成立的概率。其中观测值(x/Hj)落在区域Ri时,Hi假设成立,概率表示如下:
$$P({H_i}/{H_j}) = \int\limits_{{R_i}} {P(x/{H_j})} {\rm{d}}x\;\;\;\;\;\;i,j \in [0,1]$$ (4) 在以上4种判决结果中,只有两种是正确的判决概率,另外两种是错误判决概率。其中P(H1/H0)表示将正常的观测值判决为异常,此概率为虚警率,P(H0/H1)表示将异常的观测值判决为正常,此概率为漏警率。
假设H0与H1均服从高斯分布,x为判决门限。图 1为检测判决结果示意图。
图中左边的曲线为H0的分布,从图中可以看出,若判决门限增大,虚警率会降低,但漏警率会增加,虚警率与漏警率无法同时达到最小。因此,如何确定最佳门限使错误概率达到最小,正确概率达到最大是一个研究难点。
1.3 奈曼-皮尔逊准则
为了提高系统检测性能,使漏警率与虚警率达到最小。本文在单高斯模型的基础上,利用奈曼-皮尔逊准则确定检测判决初始阈值。该准则在P(H1/H0)=α的约束条件下,使正确判决概率P(H1/H1)最大,即等价于使漏警率P(H0/H1)最小。利用拉格朗日乘子μ(μ≥0)构建目标函数:
$$ \mathit{J} = \mathit{P}({\mathit{H}_0}/{\mathit{H}_1}) + \mathit{\mu }[\mathit{P}({\mathit{H}_1}/{\mathit{H}_0}) - \mathit{\alpha }] $$ (5) 在P(H1/H0)=α的约束条件下,使错误判决概率P(H0/H1)最小,即求目标函数J的最小值,将公式(5)转化为积分运算得:
$$J = \int\limits_{{R_0}} {P(x/{H_1})} {\rm{d}}x{\rm{ + }}\mu [\int\limits_{{R_1}} {P(x/{H_0})} {\rm{d}}x - \alpha ]$$ (6) 将:
$$\int\limits_{{R_1}} {P(x/{H_0})} {\rm{d}}x = 1 - \int\limits_{{R_0}} {P(x/{H_0})} {\rm{d}}x$$ (7) 代入公式(6)可得:
$$ J=\mu (1-\alpha )+{\displaystyle \underset{{R}_{0}}{\int }[P(x/{H}_{1})-\mu P(x/{H}_{0})}]{\rm{d}}x$$ (8) 要使J达到最小,被积函数应该取负值。此时可得到判决表达式如下:
$$\frac{{P(x/{H_1})}}{{P(x/{H_0})}}\mathop \gtrless \limits_{{H_0}}^{{H_1}} \mu $$ (9) 式中,判决门限μ可由约束条件得到:
$$P({H_1}/{H_0}) = \int\limits_{{R_1}} {P(x/{H_0})} {\rm{d}}x = \int_\mu ^{ + \infty } {P(x/{H_0})} {\rm{d}}x = \alpha $$ (10) 该准则通过理论推导确定最佳阈值,很好地解决了依靠经验获取阈值的问题,提高了系统的可移植性与适用性,使正确判决概率P(H1/H1)在虚警率一定的情况下达到最大。
2. 实验与性能分析
本研究采用德国HEIMANN型号为HTPA 80x64dR1L5.0/1.0的热电堆阵列传感器,它是一款64行80列的红外阵列传感器,该传感器的输出经过双线性插值后为目标温度值(℃)。实验时首先需要获取静止场景下的多帧数据,利用公式(1),选择100帧数据获取各个像素点的均值和方差,构建高斯背景模型;然后选择不同的阈值进行判决,验证不同阈值对检测性能的影响;最后通过判决后的二值图像直观地观察检测效果,并通过计算漏警率、虚警率与准确率来客观地评价算法性能。
2.1 二值图像
本文通过模拟视频监控的场景,将传感器置于墙壁上,用传感器获得多组监测数据,再用不同的阈值对其进行判决处理。首先选择常见的判决阈值均值与方差和、均值与两倍方差和进行判决处理,然后在虚警率为0.01的约束下,根据本文算法获得判决阈值,再进行判决,比较判决结果。图 2中(a)和(e)分别为两组数据的原始灰度图像,其他则为二值图像。
从图 2中可以看出,本文所用传感器噪声较大,系统很容易将背景点误判为前景点。(b)、(e)、(f)、(g)中众多背景像素均被判为前景像素,检测效果略差。而本文所选阈值大大降低了这种错误概率,虽然仍存在部分背景点被误判为前景点,但这种错误概率明显降低,从二值图像中能较好地发现目标。
2.2 检测性能
为了进一步客观地描述检测性能,本文先获取图像中前景所占像素个数P与背景像素的个数N。经过判决后,将前景判决为前景的像素个数记为TP,将前景判断为背景的像素个数记为FN,将背景判决为背景的个数记为TN,将背景判断为前景的像素个数记为FP。因此可以通过准确率、漏警概率与虚警概率客观的评判检测性能。
其中准确率表示判决正确的比例,可用A表示,定义如下:
$$A = \frac{{{T_P} + {T_N}}}{{P + N}}$$ (11) 漏警概率表示将前景像素点判决错误的概率,可用MA表示,定义如下:
$${M_A} = \frac{{{F_N}}}{{{T_P} + {F_N}}}$$ (12) 虚警概率表示将背景像素点判决错误的概率,可用FA表示,定义如下:
$${F_A} = \frac{{{F_P}}}{{{T_P} + {F_P}}}$$ (13) 选择图 2中的第一个场景为例,通过分析原始数据的多帧数据均值可得到场景中背景像素点有5025个,前景像素点有95个。利用不同的阈值进行判决并分析检测结果,为了避免结果的随机性,此次实验选择100检测结果的均值作为最终检测结果。表 2为不同阈值的检测判决结果。
表 2 不同阈值的检测判决结果Table 2. Detection and judgment results of different thresholdsThreshold TP TN FP FN A MA FA Threshold1 93 3259 1766 2 0.6547 0.0211 0.9499 Threshold2 88 4511 514 7 0.8982 0.0737 0.8538 Threshold3 75 4959 80 20 0.9805 0.2105 0.5161 表中阈值1表示均值与方差和,阈值2表示均值与两倍方差和,与二值图像的判决阈值一致,由单高斯模型所得,阈值3表示根据奈曼-皮尔逊准则获得的阈值。从表中可以看出,根据阈值3判决后的二值图像,FP从1766降低为80,准确率也从0.6547提升到0.9805,虽然MA增大了一点点,但FA显著降低了,即错误概率整体下降了。因此,在这3个阈值中,阈值3的判决效果最好,即通过本文算法确定的阈值能提高检测概率,使错误判决概率达到最小。
3. 结论
本文在基于单高斯模型的异常目标检测算法的基础上,提出了一种基于奈曼-皮尔逊准则的最佳阈值选取算法。本文首先通过实验对背景进行高斯建模,再利用该准则求出最佳判决阈值,最后通过对比不同的阈值判决结果,根据主观和客观评价得出本文算法所确定的阈值能较好地区分前景与背景的结论。该算法为阈值选取奠定了理论基础,得到的二值图像也利于红外图像的识别与跟踪,为后续的应用做出了贡献。虽然本文所用传感器在实际应用中噪声太大,导致判决错误的概率大大增加,但在本文阈值的判决下,系统仍能够清晰地区分前景和背景。
-
表 1 二元信号检测判决结果
Table 1 Judgment results of binary signal detection
Judgment Assumption H0 H1 H0 (H0/H0) (H0/H1) H1 (H1/H0) (H1/H1) 表 2 不同阈值的检测判决结果
Table 2 Detection and judgment results of different thresholds
Threshold TP TN FP FN A MA FA Threshold1 93 3259 1766 2 0.6547 0.0211 0.9499 Threshold2 88 4511 514 7 0.8982 0.0737 0.8538 Threshold3 75 4959 80 20 0.9805 0.2105 0.5161 -
[1] 庞文正. 红外热成像在民用领域应用不断拓展市场前景不可限量[J]. 中国安防, 2020, 15(3): 62-65. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGAF202003013.htm PANG Wenzheng. The application of infrared thermal imaging in the civil field continues to expand and the market prospects are unlimited[J]. China Security, 2020, 15(3): 62-65. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGAF202003013.htm
[2] 刘成, 鲍可进. 基于图像处理的嵌入式自动报警系统[J]. 计算机工程与设计, 2007, 28(17): 4198-4199, 4269. DOI: 10.3969/j.issn.1000-7024.2007.17.045 LIU Cheng, BAO Kejin. Embedded automatic alarm system based on image processing[J]. Computer Engineering and Design, 2007, 28(17): 4198-4199, 4269. DOI: 10.3969/j.issn.1000-7024.2007.17.045
[3] 谈新权, 江柳, 刘伟宏. 红外热成像报警方法研究[J]. 激光与红外, 1997, 27(5): 286-291. https://www.cnki.com.cn/Article/CJFDTOTAL-JGHW199705012.htm TAN Xinquan, JIANG Liu, LIU Weihong. Research on infrared thermal imaging alarm method[J]. Laser and Infrared, 1997, 27(5): 286-291. https://www.cnki.com.cn/Article/CJFDTOTAL-JGHW199705012.htm
[4] 许彬, 郑链, 王永学, 等. 红外序列图像小目标检测与跟踪技术综述[J]. 红外与激光工程, 2004, 33(5): 44-49. https://www.cnki.com.cn/Article/CJFDTOTAL-HWYJ200405011.htm XU Bin, ZHENG Lian, WANG Yongxue, et al. Overview of small target detection and tracking technology in infrared serial images[J]. Infrared and Laser Engineering, 2004, 33(5): 44-49. https://www.cnki.com.cn/Article/CJFDTOTAL-HWYJ200405011.htm
[5] LI H, WEI Y T, LI L Q, et al. Infrared moving target detection and tracking based on tensor locality preserving projection[J]. Infrared Physics & Technology, 2010, 53(2): 77-83. http://www.onacademic.com/detail/journal_1000034076425010_63d8.html
[6] Sengar S S, Mukhopadhyay S. Moving object detection using statistical background subtraction in wavelet compressed domain[J]. Multimedia Tools & Applications, 2019, 12(12): 1-22. DOI: 10.1007/s11042-019-08506-z?utm_medium=affiliate&utm_content=meta
[7] 张晓露, 李玲, 辛云宏. 基于小波变换的自适应多模红外小目标检测[J]. 激光与红外, 2017, 47(5): 647-652. DOI: 10.3969/j.issn.1001-5078.2017.05.023 ZHANG Xiaolu, LI Ling, XIN Yunhong. Adaptive multi-mode infrared small target detection based on wavelet transform[J]. Laser and Infrared, 2017, 47(5): 647-652. DOI: 10.3969/j.issn.1001-5078.2017.05.023
[8] 秦剑, 陈钱, 钱惟贤. 基于光流估计和自适应背景抑制的弱小目标检测[J]. 光子学报, 2011, 40(3): 476-482. https://www.cnki.com.cn/Article/CJFDTOTAL-GZXB201103032.htm QIN Jian, CHEN Qian, QIAN Weixian. Dim target detection based on optical flow estimation and adaptive background suppression[J]. Acta Photonica Sinica, 2011, 40(3): 476-482. https://www.cnki.com.cn/Article/CJFDTOTAL-GZXB201103032.htm
[9] 詹令明, 李翠芸, 姬红兵. 基于显著图的红外弱小目标动态规划检测前跟踪算法[J]. 计算机辅助设计与图形学学报, 2019, 31(7): 1061-1066. https://www.cnki.com.cn/Article/CJFDTOTAL-JSJF201907001.htm ZHAN Lingming, LI Cuiyun, JI Hongbing. Infrared dim target tracking algorithm based on saliency map dynamic programming before detection[J]. Journal of Computer Aided Design and Graphics, 2019, 31(7): 1061-1066. https://www.cnki.com.cn/Article/CJFDTOTAL-JSJF201907001.htm
[10] 刘源, 李庆, 梁艳菊. 基于FPGA的红外目标自动检测系统[J]. 红外技术, 2019, 41(6): 521-526. http://hwjs.nvir.cn/article/id/hwjs201906005 LIU Yuan, LI Qing, LIANG Yanju. Infrared target automatic detection system based on FPGA[J]. Infrared Technology, 2019, 41(6): 521-526. http://hwjs.nvir.cn/article/id/hwjs201906005
[11] 徐鹏, 任波. 基于单高斯模型的森林火灾烟图像目标检测[J]. 计算机与现代化, 2009(2): 18-20. DOI: 10.3969/j.issn.1006-2475.2009.02.006 XU Peng, REN Bo. Forest fire smoke image target detection based on single Gaussian model[J]. Computer and Modernization, 2009(2): 18-20. DOI: 10.3969/j.issn.1006-2475.2009.02.006
[12] 朱华生, 叶军. 基于改进高斯模型的车流量检测算法[J]. 激光与红外, 2013, 43(10): 1180-1183. DOI: 10.3969/j.issn.1001-5078.2013.10.22 ZHU Huasheng, YE Jun. Vehicle flow detection algorithm based on improved Gaussian model[J]. Laser & Infrared, 2013, 43(10): 1180-1183. DOI: 10.3969/j.issn.1001-5078.2013.10.22
[13] 喻旭勇, 王直杰. 一种基于改进单高斯模型的运动目标提取方法[J]. 科学技术与工程, 2013, 13(13): 3609-3613. DOI: 10.3969/j.issn.1671-1815.2013.13.017 YU Xuyong, WANG Zhijie. A moving target extraction method based on improved single Gaussian model[J]. Science Technology and Engineering, 2013, 13(13): 3609-3613. DOI: 10.3969/j.issn.1671-1815.2013.13.017
[14] 王小平, 张丽杰, 常佶. 基于单高斯背景模型运动目标检测方法的改进[J]. 计算机工程与应用, 2009, 45(21): 122-124. https://www.cnki.com.cn/Article/CJFDTOTAL-JSGG200921035.htm WANG Xiaoping, ZHANG Lijie, CHANG Ji. Improvement of moving target detection method based on single Gaussian background model[J]. Computer Engineering and Applications, 2009, 45(21): 122-124. https://www.cnki.com.cn/Article/CJFDTOTAL-JSGG200921035.htm
[15] 吴一全, 孟天亮, 吴诗婳. 图像阈值分割方法研究进展20年(1994—2014)[J]. 数据采集与处理, 2015, 30(1): 1-23. https://www.cnki.com.cn/Article/CJFDTOTAL-SJCJ201501001.htm WU Yiquan, MENG Tianliang, WU Shihua. Research progress of image threshold segmentation methods for 20 years (1994-2014)[J]. Data Acquisition and Processing, 2015, 30(1): 1-23. https://www.cnki.com.cn/Article/CJFDTOTAL-SJCJ201501001.htm
[16] 李文杰, 闫世强, 胡磊, 等. 红外预警卫星系统虚警抑制技术综述[J]. 红外技术, 2020, 42(2): 115-120. http://hwjs.nvir.cn/article/id/hwjs202002002 LI Wenjie, YAN Shiqiang, Hu Lei, et al. Overview of false alarm suppression technology of infrared early warning satellite system[J]. Infrared Technology, 2020, 42(2): 115-120. http://hwjs.nvir.cn/article/id/hwjs202002002
[17] 鞠德航, 林可祥, 陈捷. 信号检测理论导论[M]. 北京: 科学出版社, 1997. JU Dehang, LIN Kexiang, CHEN Jie. Introduction to Signal Detection Theory[M]. Beijing: Science Press, 1997.
-
期刊类型引用(4)
1. 崔丽群,李万欣. 改进Cascade R-CNN的X射线图像违禁品检测方法. 计算机仿真. 2025(03): 299-303 . 百度学术
2. 徐叶军. 基于多孔卷积神经网络的图像空间结构信息细节表征. 盐城工学院学报(自然科学版). 2024(01): 20-25 . 百度学术
3. 李立,易诗,刘茜,程兴豪,王铖. 基于密集残差生成对抗网络的红外图像去模糊. 红外技术. 2024(06): 663-671 . 本站查看
4. 张坤. 基于深度神经网络的图像技术在灰度图像彩色化进程中的应用研究. 自动化与仪器仪表. 2023(10): 27-30+35 . 百度学术
其他类型引用(5)