夜间复杂场景下红外图像行人检测算法研究

赵双, 陈树越, 王巧月

赵双, 陈树越, 王巧月. 夜间复杂场景下红外图像行人检测算法研究[J]. 红外技术, 2021, 43(6): 575-582.
引用本文: 赵双, 陈树越, 王巧月. 夜间复杂场景下红外图像行人检测算法研究[J]. 红外技术, 2021, 43(6): 575-582.
ZHAO Shuang, CHEN Shuyue, WANG Qiaoyue. Infrared Pedestrian Detection in Complex Night Scenes[J]. Infrared Technology , 2021, 43(6): 575-582.
Citation: ZHAO Shuang, CHEN Shuyue, WANG Qiaoyue. Infrared Pedestrian Detection in Complex Night Scenes[J]. Infrared Technology , 2021, 43(6): 575-582.

夜间复杂场景下红外图像行人检测算法研究

基金项目: 

江苏省研究生科研创新基金项目 KYCX19_1770

详细信息
    作者简介:

    赵双(1995-),女,硕士,主要研究方向:模式识别(行人检测)。E-mail:zhsss1030@163.com

    通讯作者:

    陈树越(1963-),男,教授,主要研究方向:计算机视觉、图像处理。E-mail:csyue2000@163.com

  • 中图分类号: TP391

Infrared Pedestrian Detection in Complex Night Scenes

  • 摘要: 针对夜间红外图像中行人与背景灰度差异小且存在遮挡等问题,提出了一种夜间复杂场景下的红外行人检测算法。首先利用行人语义融合方法生成对目标全覆盖的显著图,与原图融合得到感兴趣区域,然后构造基于改进的方向梯度直方图特征的两分支分类器,同时提出一种遮挡判别算法,根据分类器模糊分数判断是否遮挡,设计一种头部模板实现最终的行人检测。在LSI远红外行人数据集和自主采集的冬、夏季节夜间行人数据上进行实验,结果表明:在不同环境下,所提出的方法均可快速鲁棒地检测出行人,可较显著地降低漏检率,检测率可达到94.20%。
    Abstract: An infrared pedestrian detection algorithm is proposed to solve the problem of small differences between pedestrians and backgrounds in gray scale images and the occurrence of occlusion in infrared images at night. First, a significant graph with the full coverage of the target is generated by the pedestrian semantic fusion method, and the region of interest is obtained by combining it with the original graph. Then, a two-branch classifier based on the improved histogram of the gradient feature is constructed. The fuzzy score of the classifier is used to determine the occurrence of occlusion and call the head template for the final detection. Experiments based on the LSI far infrared pedestrian dataset and independent datasets of pedestrians captured at night in winter and summer prove that the proposed method is robust and quick in detecting pedestrians under different environments. It can significantly reduce the rate of missed detection and realize a detection rate of 94.20%.
  • 混凝土材料往往因为预埋钢筋的腐蚀、水的侵蚀、连续的冻融循环、荷载等多种因素共同作用,产生裂缝、孔洞和分层等缺陷[1]。这些内部缺陷随着时间的推移会逐渐积聚、扩展,严重威胁着结构的耐久性和安全性[2]。主动红外热像检测方法作为一种无损检测手段,由于具有检测面积大、非接触式和应用操作简单等优点在混凝土结构检测领域得到了广泛的关注,并逐渐被应用到了隧道、桥梁现场检测中。

    主动红外热像检测技术是一种利用红外热像仪检测材料内部缺陷的无损检测方法,其检测的基本原理是:材料被热激励后其表面红外辐射量因内部缺陷的存在而表现出差异,红外热像仪通过记录该差异,以获得材料内部的缺陷信息[3]。红外图像的信息提取与分析是红外热像检测技术的核心内容。理论上,根据热图像缺陷区域和正常区域之间的红外辐射差异可获得缺陷的信息。但实际上,红外图像本质是根据缺陷与正常区域之间的温度和辐射率生成的灰度图,而且红外光辐射的能量远比可见光低,因此到达光学镜头的红外辐射能很小,导致了红外图像与可见光图像相比只有较低的对比度,分辨弱小目标和细节能力差[4];另外,红外光子的随机性、红外成像系统的固有特性以及热激励不均匀等给红外图像引入了许多噪声,在一定程度上改变了图像的原始信息,增加了图像分割及后续图像处理的难度[5-6]。传统的基于空域的红外图像处理方法主要分为两个大的步骤:首先,是对红外图像进行降噪和增强,常用的方法有高斯滤波、中值滤波、引导滤波、小波变换、Contourlet变换、三维块匹配算法等[7-10];其次,对红外图像进行边缘特征的提取,常用的方法有:基于边缘的检测算法、基于数学形态的检测算法和最近发展较快的基于网络模型的检测算等[11-12]。传统的基于单张空域的红外图像处理方法虽然在一定程度上可以消除噪声的影响、提高图像的对比度,但是仍存在一些问题。第一,采集的数据集包含大量的热图像,每一帧红外图像都对应着某一时刻,依靠视觉手动选择缺陷信息丰富的红外图像进行缺陷信息的提取的识别费时费力。第二,在图像降噪、增强和图像分割过程中设定阈值会引入主观成分,干扰红外图像的解释。第三,仅仅分析单张红外图像,忽略采集过程中的时序信息可能会导致忽略一些边缘的缺陷信息[13-14]

    针对上述问题,本文提出了一种基于时序信息的红外图像缺陷信息提取方法。首先,通过室内实验制作含缺陷分层的混凝土试块,其次利用主动红外热像检测技术进行红外数据的采集,提取每个像素点的温度特征曲线,然后采用基于时序信息的提取方法进行含分层缺陷混凝土的缺陷提取,并与传统的基于空域的处理方法进行对比分析。

    主动红外热像检测技术中,当以一定的距离对混凝土材料表面持续加热时,物体会吸收入射波的能量并将其转化为热能,并以温度场的形式表现出来。如果试样存在缺陷(本研究采用的是隔热型缺陷,模拟混凝土内部的空气分层缺陷),到达缺陷的大部分能量将反射到试样表面,引起表面正常区域和有缺陷区域温度场的差异。

    利用红外热像仪记录整个检测过程中物体表面温度场的空间和时间分布信息,通过对红外图像数据进行分析和处理进而可以提取材料近表层的分层缺陷信息。主动红外热像检测技术采集到的一系列红外图像组成了一个三维的图像数据集[15](尺寸:Nx×Ny×Nt,见图 1(a)),在空间维度上,每一帧对应着某一时刻红外热像仪所采集到的物体表面温度场信息,其像素个数为Nx×Ny;在时间维度上,每个像素点可以看作是一条随时间变化的温度特征曲线(Nt时间点组成),如图 1(b)所示,其中标签NT11 DEFECT表示缺陷区域的温度特征曲线,标签NT11 NORMAL表示正常区域的温度特征曲线。

    图  1  主动红外热成像采集的数据结构:(a) 三维红外数据;(b) 像素点温度特征曲线
    Figure  1.  Active infrared thermal imaging acquisition of data structures (a) Three-dimensional infrared data; (b) Temperature characteristic curves of pixels

    主动红外热像技术采集到的三维红外图像数据,其正常区域和含缺陷的区域每个像素点的温度特征曲线在冷却阶段会存在差异,如图 1(b)所示,利用这个特点我们可以采用许多能够分辨这个特征曲线差异值的相关算法进行缺陷信息的提取,本文采用相对简单、容易实施的K-means方法来提取混凝土的缺陷信息。K-means聚类方法的原理是同一类内的实体是相似的,一个类是测试空间中点的集合,同一类内任意一个点到其类中心的距离小于其到其它类中心的距离,我们可以用此算法分辨正常区域和缺陷区域的温度特征曲线[16]。K-means方法的关键是核函数的选取,核函数决定了其分辨能力,本文采用常用的马氏距离进行度量。其具体算法原理如下[17]

    假设给定的数据集为Y={y1, y2, …, ym},其中yi=[X1, X2, …, Xn],将数据对象划分为kC={c1, c2, …, ck},每个类有一个类中心U={u1, u2, …, uk}。选取欧式距离作为相似性和距离判断准则,计算ck类内各点到聚类中心uk的距离平方和,见公式(1):

    $$ J\left( {{c_k}} \right) = \sum\limits_{{x_i} \in {C_k}} {{{\left\| {{x_i} - {u_k}} \right\|}^2}} $$ (1)

    聚类的目标是使各类总的距离平方和最小,见公式(2):

    $$ J(C) = \sum\limits_{k = 1}^K J \left( {{c_k}} \right) = \sum\limits_{k = 1}^K {\sum\limits_{{x_i} \in {C_k}} {{{\left\| {{x_i} - {u_k}} \right\|}^2}} } $$ (2)

    根据最小二乘法和拉格朗日原理,聚类中心uk应该取为类别ck类各数据点的平均值。

    K-means算法是一个反复迭代过程,目的是使聚类域中所有的点到聚类中心距离的平方和最小。

    本次实验混凝土试件的设计强度为C50,尺寸为50 cm×50 cm×20 cm,在混凝土中嵌入4块尺寸为10 cm×10 cm的聚苯乙烯材料(隔热型材料),模拟混凝土中的分层缺陷,混凝土试块见图 2(a)。试验采用美国FLIR公司的A655SC非制冷型红外热像仪,其热灵敏度为30 mK,图像分辨率为640×480,标准测温范围为-40℃~150℃,波长范围为7.5~14 μm,见图 2(b)。主动热激励系统采用自制的配有自动控制加热时间的碳化硅远红外加热板,共2块,每块加热板的加热功率为500 W,见图 2(c)。整个实验过程中加热时间为5 min,冷却时间为10 min;加热完成后,立即用红外热像仪采集试样表面的冷却温度场,整个采集系统见图 3所示,本文选用的是持续加热法。

    图  2  实验试块和仪器:(a) 混凝土试块;(b) 红外热像仪;(c) 红外加热板
    Figure  2.  Test blocks and instruments: (a) Concrete test block; (b) Infrared thermal imager; (c) Infrared heating plate
    图  3  主动红外热像采集系统
    Figure  3.  Active infrared thermography acquisition system

    实验采集到的红外图像序列如图 4所示,根据红外图像可以发现一共存在4块分层缺陷,各个缺陷之间存在温度场相互影响的干扰区,而且各个缺陷的轮廓比较模糊,存在被隐藏的缺陷信息。整个采集的红外图像数据的第一帧(0 s)最清晰,其正常区域和缺陷区域存在较大的温差;之后随着冷却的进行,正常区域和缺陷区域的温差逐渐减小,缺陷信息逐渐模糊,至最后一帧很难用肉眼分辨。

    图  4  混凝土试块红外图像数据
    Figure  4.  Infrared image data of concrete block

    主动红外热像检测技术所采集的图像每一帧都含有大量的噪声,为了测试基于时序信息红外图像缺陷信息提取的可行性以及性能,本次在图像特征提取前不对图像进行预处理。首先,将红外图像数据按像素点逐个提取时间序列,组成聚类数据集;然后将时序数据序列输入到K-means程序中,进而得到每一帧各个像素点的聚类信息。为了提高运算效率,本次在图像序列处理中采样间隔为1,其序列长度减小为原来的一半。聚类完成后得到图像中每一个像素点所属的类别,进而完成对图像缺陷信息的提取。

    图 5为经过聚类后的提取结果,通过观察发现4个缺陷信息都被提取出来,与原始红外图像相比(图 4),其缺陷信息有了明显的增强,缺陷信息完全肉眼可见,每个识别出的缺陷区域呈近似正方形,完整性相当好,接近于预埋缺陷的形状,而且缺陷提取后的图像序列的时序信息得以保留。

    图  5  处理后的红外图像
    Figure  5.  Processed infrared image

    为了测试基于时序信息红外图像分层缺陷的信息提取效果,本文采用基于空域的二维K-means图像缺陷信息提取算法与其进行对比。由于采集的红外图像数据集第一帧(0 s)缺陷信息最清晰,因此选用第一帧红外图像进行基于空域的分层缺陷信息提取。两种方法的分层缺陷信息提取结果见图 6,由图 6(b)所示,基于时序信息的分层缺陷提取方法4个分层缺陷都被完全提取出来,图 6(a)中模糊、隐藏的信息也被提取出来,缺陷细节分辨能力较好。由图 6(c)所示,基于空域信息的分层缺陷信息提取方法4个分层缺陷被识别为一个缺陷,缺陷细节分辨能力较差。通过分析可能是受缺陷之间温度场叠加的相互影响,缺陷之间区域(图 6(a)中虚线框内部所示的无缺陷区域)的温度信息和分层缺陷的温度场信息较为接近,而和图 6(a)的无缺陷边缘温度场信息差异较大,导致基于空域信息的提取方法效果较差;根据含缺陷混凝土试块的物理特性可知,存在分层缺陷和正常区域的温度特征曲线是存在差异的,基于时序信息的提取方法主要是根据每个像素点的温度特征曲线差异来提取特征,其提取缺陷的分辨能力和效果更好。

    图  6  处理结果对比分析:(a) 红外原图;(b) 基于时序K-means方法;(c) 基于空域K-means方法
    Figure  6.  Comparative analysis of processing results: (a) Original infrared image; (b) K-means method based on temporal information; (c) K-means method based on spatial information

    主动红外热像检测技术中,传统的红外图像处理方法在一定程度上可以消除噪声、提高图像的对比度,但是仍存在一些问题。针对上述问题,本文根据主动红外热成像的数据特点提出了一种基于时序信息的红外图像缺陷信息提取方法。结果表明,基于时序信息的缺陷提取方法是可行的,其可以提取到隐藏的缺陷信息,分层缺陷信息提取效果优于基于空域的K-means方法。

  • 图  1   行人检测流程图

    Figure  1.   Pedestrian detection flow chart

    图  2   目标性计算示意图

    Figure  2.   Schematic diagram of target calculation

    图  3   HOG特征计算过程

    Figure  3.   HOG feature calculation process

    图  4   检测窗口分块

    Figure  4.   Detection window chunking

    图  5   头部检测模型

    Figure  5.   Head detection model

    图  6   样本示例:(a)(b)(c)冬季拍摄;(d)(e)(f)夏季拍摄

    Figure  6.   Sample diagram: (a)(b)(c) Shooting in winter; (d)(e)(f) Shooting in summer

    图  7   目标性检测

    Figure  7.   Schematic diagram of target detection

    图  8   不同算法检测效果对比

    Figure  8.   Detection effects of different algorithms

    表  1   两分支的SVM分类器训练参数

    Table  1   SVM classifier training parameters of the two branches

    Window size Block size Cell size Step Bin Feature dimension
    Near target 48×96 16×16 8×8 8 9 1980
    Distant target 24×48 8×8 4×4 4 9 1980
    下载: 导出CSV

    表  2   测试数据的基本信息

    Table  2   Basic information of test data

    Dataset Size/frame Date Location
    Test-L 2000 - -
    Test-W1 1578 2018/1/2 Street
    Test-W2 979 2018/1/3 Campus
    Test-S1 1123 2019/5/29 Street
    Test-S2 1089 2019/5/30 Campus
    下载: 导出CSV

    表  3   参数混淆矩阵

    Table  3   Parameter confusion matrix

    Truth Predicted result
    Positive example Negative example
    Positive example TP FN
    Negative example FP TN
    下载: 导出CSV

    表  4   Wm标记结果

    Table  4   Wm marking results

    Wm Picture number Pedestrian number Pedestrian mark Labeling rate/% Mark time/s
    5 500 774 630 81.4 5.94
    10 500 774 636 82.2 8.39
    50 500 774 671 86.7 12.70
    100 500 774 928 94.1 17.83
    150 500 774 751 97.0 23.29
    200 500 774 752 97.2 29.01
    350 500 774 755 97.6 44.00
    500 500 774 755 97.6 56.38
    下载: 导出CSV

    表  5   与基本算法检测结果对比

    Table  5   Comparison of detection results with the basicalgorithm

    Algorithm ACC/% t/ms
    HOG 89.27 236.4
    TBHOG 86.19 122.8
    TBHOG+ROI extraction 91.44 159.0
    TBHOG+Occlusion handling 93.23 168.4
    TBHOG+ ROI extraction + occlusion handling 94.20 181.6
    下载: 导出CSV

    表  6   与其他算法检测效果对比

    Table  6   Comparison of detection effect with other algorithms

    Algorithm LSI FIR test-W test-S
    ACC/% t/ms ACC/% t /ms ACC/% t/ms
    HOG 89.27 236.4 80.59 289.7 62.77 274.1
    LBP 85.21 202.3 77.90 304.5 59.25 294.5
    HOG-LBP 93.64 333.7 84.03 375.8 68.17 373.8
    ACF 94.05 1008 85.54 1469 64.28 1742
    RetinaNet 90.13 1364 82.21 1730 63.09 2297
    Proposed 94.20 181.6 89.17 264.7 73.64 285.3
    下载: 导出CSV
  • [1]

    XU Z, ZHUANG J, LIU Q, et al. Nighttime FIR pedestrian detection benchmark dataset for ADAS[C]// Proceedings of Pattern Recognition and Computer Vision, 2018: 323-333.

    [2]

    TAO Y, FU D, SHU P. Pedestrian tracking for infrared image sequence based on trajectory manifold of spatio-temporal slice[J]. Multimedia Tools and Applications, 2017, 76: 11021-11035. DOI: 10.1007/s11042-016-3461-8

    [3] 刘洋. 基于LS-DYNA的汽车正面碰撞计算机模拟仿真[D]. 西安: 西华大学, 2011.

    LIU Yang. Simulation on the Front Impact of Vehicle Based on LS-DYNA[D]. Xi'an: Xihua University, 2011.

    [4]

    Dalal N, Triggs B. Histograms of Oriented Gradients for Human Detection[C]// 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05), 2005, 1(1): 886-893.

    [5]

    Bosch A, Zisserman A, Munoz X. Representing shape with a spatial pyramid kernel[C]//Acm International Conference on Image & Video Retrieval, 2007: 401-408(doi: https://doi.org/10.1145/1282280.1282340).

    [6]

    Sangeetha D, Deepa P. A low-cost and high-performance architecture for robust human detection using histogram of edge oriented gradients[J]. Microprocessors and Microsystems, 2017, 53: 106-119. DOI: 10.1016/j.micpro.2017.07.009

    [7]

    ZHENG C H, PEI W J, YAN Q, et al. Pedestrian detection based on gradient and texture feature integration[J]. Neurocomputing, 2017, 228: 71-78. DOI: 10.1016/j.neucom.2016.09.085

    [8] 朱聪聪, 项志宇. 基于梯度方向和强度直方图的红外行人检测[J]. 计算机工程, 2014, 40(12): 195-198, 204. https://www.cnki.com.cn/Article/CJFDTOTAL-JSJC201412037.htm

    ZHU Congcong, XIANG Zhiyu. Infrared pedestrian detection based on histograms of oriented gradients and intensity[J]. Computer Engineering, 2014, 40(12): 195-198, 204. https://www.cnki.com.cn/Article/CJFDTOTAL-JSJC201412037.htm

    [9]

    Itti L, Koch E. A model of saliency-based visual attention for rapid scene analysis[J]. IEEE Trans., 1998, 20(11): 1254-1259 http://dl.acm.org/citation.cfm?id=297870

    [10]

    Radhakrishna A, Sheila H, Francisco E, et al. Frequency-tuned salient region detection[C]//2009 IEEE Conference on Computer Vision and Pattern Recognition, 2009: (doi: 10.1109/CVPR.2009.5206596).

    [11]

    HOU X D, ZHANG L Q. Saliency detection: a spectral residual approach[C]//2007 IEEE Conference on Computer Vision and Pattern Recognition, 2007: (doi: 10.1109/CVPR.2007.383267).

    [12]

    Alexe B, Deselaers T, Ferrari V. Measuring the objectness of image windows[J]. IEEE Transactions on Software Engineering, 2012, 34(11): 2189-2202. http://newmed.wanfangdata.com.cn/Paper/Detail/PeriodicalPaper_PM22248633

    [13]

    WANG X, HAN T X, YAN S. An HOG-LBP human detector with partial occlusion handling[C]//12th International Conference on Computer Vision of IEEE, 2010: (doi: 10.1109/ICCV.2009.5459207).

    [14]

    Javier M N, Vazquez D, Lopez A M, et al. Occlusion handling via random subspace classifiers for human detection[J]. IEEE sTransactions on Cybernetics, 2013, 44(3): V342-354. http://www.ncbi.nlm.nih.gov/pubmed/23757554

    [15]

    Broggi A, Bertozzi M, Fascioli A, et al. Shape-based pedestrian detection[C]//IEEE Intelligent Vehicles Symposium, 2000: (doi: 10.1109/IVS.2000.898344).

    [16]

    Brehar R, Vancea C, Nedevschi S. Pedestrian detection in infrared images using aggregated channel features[C]//IEEE International Conference on Intelligent Computer Communication & Processing, 2014: (doi: 10.1109/ICCP.2014.p6936964).

    [17]

    LIN T Y, Goyal P, Girshick R, et al. Focal loss for dense object detection[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017, 99: 2999-3007. DOI: 10.1109/ICCV.2017.324

    [18] 车凯, 向郑涛, 陈宇峰, 等. 基于改进Fast R-CNN的红外图像行人检测研究[J]. 红外技术, 2018, 40(6): 578-584. http://hwjs.nvir.cn/article/id/hwjs201806010

    CHE Kai, XIANG Zhengtao, CHEN Yufeng, et al. Research on infrared image pedestrian detection based on improved fast R-CNN[J]. Infrared Technology, 2018, 40(6): 578-584. http://hwjs.nvir.cn/article/id/hwjs201806010

  • 期刊类型引用(2)

    1. 黄坤琳,吴国周,徐维新,李利东,王海梅,李航,李自翔,司荆柯,刘洪宾,吴成娜. 呼伦贝尔东部农田区动态融雪过程及其影响因子. 干旱区研究. 2024(09): 1514-1526 . 百度学术
    2. 黄林,李晖,康璇. 基于Freeman全极化分解的干雪识别指数模型构建. 厦门理工学院学报. 2023(05): 40-48 . 百度学术

    其他类型引用(2)

图(8)  /  表(6)
计量
  • 文章访问数: 
  • HTML全文浏览量: 
  • PDF下载量: 
  • 被引次数: 4
出版历程
  • 收稿日期:  2019-07-01
  • 修回日期:  2019-11-24
  • 刊出日期:  2021-06-19

目录

/

返回文章
返回