融合视觉显著性的红外航拍行人检测

张兴平; 邵延华; 梅艳莹; 张晓强; 楚红雨

融合视觉显著性的红外航拍行人检测

张兴平¹,
邵延华^1, ,,
梅艳莹¹,
张晓强¹,
楚红雨^{1, 2}

1.
西南科技大学信息工程学院, 四川绵阳 621010
2.
西南科技大学四川天府新区创新研究院, 四川成都 610299

基金项目:

国家自然科学基金资助项目 61601382

四川省自然科学基金资助项目 2023NSFSC1388

详细信息

作者简介:
张兴平（1999-），女，四川泸州人，硕士研究生，主要研究方向为目标检测与模型加速

通讯作者:
邵延华（1982-），男，四川绵阳人，博士，副教授，硕导，主要研究方向为计算机视觉与模式识别。E-mail: syh@alu.cqu.edu.cn

中图分类号: TP391
计量
- 文章访问数: 43
- HTML全文浏览量: 12
- PDF下载量: 19
出版历程
- 收稿日期: 2023-01-09
- 修回日期: 2023-03-13
- 刊出日期: 2024-09-19

Aerial Infrared Pedestrian Detection with Saliency Map Fusion

1.
School of Information Engineering, Southwest University of Science & Technology, Mianyang 621010, China
2.
Tianfu Institute of Research and Innovation, Southwest University of Science & Technology, Chengdu 610299, China

摘要

摘要:
目标检测是计算机视觉的基本任务之一，无人机搭载红外相机为夜间侦察、监视等提供便利。针对红外航拍场景检测目标小、图像纹理信息少、对比度弱以及红外目标检测中传统算法精度有限，深度算法依赖算力及功耗不友好等问题，提出了一种融合显著图的红外航拍场景行人检测方法。首先，采用U2-Net从原始热红外图像中提取显著图对原始图像进行增强；其次分析了像素级加权融合和图像通道替换融合两种方式的影响；再次，重聚类先验框，以提高算法对航拍目标场景的适应性。实验结果表明：像素级视觉显著性加权融合效果更优，对典型YOLOv3、YOLOv3-tiny和YOLOv4-tiny平均精度分别提升了6.5%、7.6%和6.2%，表明所设计的融合视觉显著性方法的有效性。
- 红外行人检测 /
- 图像增强 /
- 显著图 /
- YOLOv4
Abstract:
Object detection is a fundamental task in computer vision. Drones equipped with infrared cameras facilitate nighttime reconnaissance and surveillance. To realize small target detection, slight texture information, weak contrast in infrared aerial photography scenes, limited accuracy of traditional algorithms, and heavy dependence on computing power and power consumption in infrared object detection, a pedestrian detection method for infrared aerial photography scenes that integrates salient images is proposed. First, we use U2-Net to generate saliency maps from the original thermal infrared images for image enhancement. Second, we analyze the impact of two fusion methods, pixel-level weighted fusion, and replacement of image channels as image-enhancement schemes. Finally, to improve the adaptability of the algorithm to the target scene, the prior boxes are reclustered. The experimental results show that pixel-level weighted fusion presents excellent results. This method improves the average accuracy of typical YOLOv3, YOLOv3-tiny, and YOLOv4-tiny algorithms by 6.5%, 7.6%, and 6.2%, respectively, demonstrating the effectiveness of the designed fused visual saliency method.
- infrared pedestrian detection /
- salient map /
- image enhancement /
- YOLOv4

HTML全文

0. 引言

根据世界卫生组织的统计，2016年道路交通伤害导致140万人死亡，已经是全球第八大死亡原因^[1]，道路交通安全已经成为人类不可忽视的安全威胁之一。为减少道路交通对人类造成的伤害，目前已经有多种传感器系统被应用于汽车辅助驾驶，以期在危险情况中及时对驾驶者做出提醒，如雷达、激光测距雷达、超声波和摄像机等技术。其中雷达、激光测距雷达和超声波等属于主动测量方案，在复杂环境下易受干扰；而基于摄像机的测量方案属于被动测量方法，抗干扰能力更强，在辅助驾驶和自动驾驶领域具有广阔的应用前景，已经成为计算机视觉领域的热门研究方向。

在夜间、雾霾等低可见度天气条件下，由于驾驶员的视线受阻，更易发生交通事故。红外线由于波长较长，具有穿透雾霾的能力，且所有温度高于绝对零度的物体都会产生红外辐射^[2]，故对红外线成像的红外相机具有全天候工作能力，特别在夜间、雾霾等对可见光相机成像具有严重干扰的天气条件下具有明显优势。因此，利用红外成像设备作为辅助观测手段以提高行车安全性的方法，得到了广大相关研究人员和国内各大汽车制造厂商的关注^[3]。

目前，基于红外相机的车载辅助驾驶系统主要利用红外相机的全天候工作特性，帮助驾驶员在恶劣条件下观察路面情况，技术手段主要集中在行人检测与跟踪领域。如文献[3]-[4]介绍了车载夜视技术以及红外行人检测算法的发展现状，文献[5]介绍了一种基于YOLO模型的远红外车载图像快速行人检测方法，文献[6]提出了一种相关滤波框架下的红外图像行人跟踪方法，行人的位置估计需依靠驾驶员的经验判断。文献[7]使用激光雷达成像与红外成像融合的方式获取可视图像及深度信息，但成本较高。

基于立体视觉原理获取深度信息，仅需两个相机采集双目图像，然后利用双目视差原理计算目标深度，成本较低。但是在红外图像中，由于纹理细节较少，在可见光立体视觉中使用广泛的BM（Block Matching）和SGBM（Semi Global Block Matching）等传统稠密立体匹配算法不能很好地完成红外图像立体匹配。因此，本文结合道路场景的特点，设计了一种基于红外立体视觉的路况行人感知方法，该方法可以生成感兴趣目标处稠密的全局半稠密深度图。经实验验证，该方法在道路环境下可以有效地提供车前行人等目标的深度信息。

1. 双目测距模型

1.1 三角测量模型

本文双目测距模型如图 1所示，两相机光心O₁、O₂存在x、z方向明显位移dx、dz。考虑到实际系统的安装误差因素，两相机坐标系间同时存在y方向位移dy和绕x、y、z三轴的相对旋转α、β、γ。dx、dy、dz和α、β、γ共同构成相机的外部参数，可通过双目相机标定获得。

图 1 双目测量模型

Figure 1. Binocular measurement model

下载: 全尺寸图片幻灯片

通过标定获得相机内部及外部参数后，本文采用线性三角测量法对空间点进行解算，如图 1，空间点N分别投影到两相机像平面π₁、π₂的n₁、n₂点处，投影关系可由式(1)表示，其中n₁、n₂用π₁、π₂像面坐标系下的齐次坐标表示，N用世界坐标系下的齐次坐标表示，P₁、P₂分别表示空间点N到像面π₁、π₂的投影关系，为3×4矩阵，由相机内、外部参数计算得到：

$$ {n_1} = {\mathit{\boldsymbol{P}}_1}N,\quad {n_2} = {\mathit{\boldsymbol{P}}_2}N $$

(1)

通过π₁、π₂像面上的一对匹配点n₁↔n₂，可根据式(2)^[8]计算得到N点在世界坐标系下的齐次坐标。其中，x_i、y_i分别表示π_i像面上N的像点n_i的横、纵坐标，p_i^j表示P_i矩阵的第j行（i＝1, 2，j＝1, 2, 3）。

$$\left[ {\begin{array}{*{20}{c}} {{x_1}p_1^3 - p_1^1} \\ {{y_1}p_1^3 - p_1^2} \\ {{x_2}p_2^3 - p_2^1} \\ {{y_2}p_2^3 - p_2^2} \end{array}} \right]N = 0$$

(2)

1.2 极线约束

极线约束是指双目图像中某一图像上的点必然对应于另一图像上的一条线，如图 1，直线O₁N上任一点都成像于π₁像面上的n₁点处，而其在像面π₂上的像位于直线e₂n₂上，即e₂n₂为n₁的对极线，e₂为光心O₁在像面π₂上的投影点，其数学关系可用式(3)表示：

$${\mathit{\boldsymbol{I}}_{{e_2}{n_2}}} = \mathit{\boldsymbol{I}}{n_1}$$

(3)

式中：${\mathit{\boldsymbol{I}}_{{e_2}{n_2}}}$表示直线e₂n₂；F为基本矩阵，可通过相机内、外部参数获得。

由于n₂是N在像面π₂的像点，故n₂在直线${I_{{e_2}{n_2}}}$上，即$n_2^{\rm{T}}{I_{{e_2}{n_2}}} = 0$，所以一对匹配点n₁↔n₂满足式(4)关系。

$$n_2^{\rm{T}}\mathit{\boldsymbol{F}}{n_1} = 0$$

(4)

因此，可利用式(4)对初始匹配结果进行筛选，去除误匹配点。

2. 系统设计与搭建

2.1 系统方案设计

驾驶员在驾驶车辆时，一般需要观察车辆正前方和两侧路面情况以确保行车安全。因此，为了满足实际道路应用条件，本文设计了一种大视场红外双目立体视觉环境感知单元，有效视场角约为120°。由于目前红外相机成像单元分辨率普遍不高，以及红外相机镜头视场角等因素的制约，本文提出了一种双红外双目测量方案。方案设计如图 2所示，即使用两对双目相机分别覆盖左右两侧，组成等效120°测量视场。图 2中4只相机分别组成左视、右视双目相机组，两相机组的基线长度均设计为75 cm，两组双目相机测量视场构成120°等效测量视场。该方案将4只红外相机安装在同一直线上，将系统尺寸限制在100 cm×10 cm×10 cm内，有利于在不改变车辆结构的条件下安装使用。

图 2 系统设计方案

Figure 2. System design scheme

下载: 全尺寸图片幻灯片

2.2 实验系统平台

依据2.1节所述方案，搭建实验平台，如图 3所示，该平台由4只长波红外相机及广角镜头、嵌入式处理单元、外围电路、刚性载体和外壳组成。

图 3 大视场红外立体视觉实验系统

Figure 3. Large field of view infrared stereo vision experimental system

下载: 全尺寸图片幻灯片

2.3 红外棋盘格标定板

由于三角测量模型需要已知的相机内参和双目相机外参解算匹配点坐标，因此需对相机进行标定。目前应用最广泛的相机标定算法为张正友标定法^[9]，该方法需要单平面棋盘格作为标定板。由于红外辐射量和物体温度有关，物体温度越高，红外辐射越强，红外图像体现的是物体温度差异。根据红外成像原理，本文设计了一种红外棋盘格标定板（下称标定板），如图 4所示。

图 4 红外棋盘格标定板

Figure 4. Infrared chessboard

下载: 全尺寸图片幻灯片

图 4(a)为该标定板的可见光图像，图 4(b)为红外图像。棋盘格白格为良导热材料制成，背层贴有电热片，黑格为隔热材料制成，背层无电热片，通电后白格区域电热片发热使其温度升高，黑格区域的隔热材质使其保持相对较低的温度，从而使棋盘格的红外图像具有与可见光图像相似的图像特征。本文设计的棋盘格可用于红外相机标定，可见光相机标定和红外、可见光相机联合标定。

3. 深度图生成方法

本文的路况行人感知问题研究定位于道路使用者中的行人和骑行者等目标。由于人体具有较为明显的温度、边缘特征，因此可以此为依据在双目相机左、右图像中寻找感兴趣区域，并在感兴趣区域中进行特征点提取、配准并最终生成可视化半稠密深度图。

3.1 图像幂次变换

图像幂次变换是指通过对图像灰度值的k次幂变换，使灰度值较大的位置得到增强，而灰度值较小的位置得到抑制。图像幂次变换可用式(5)表示：

$${i_{{\rm{new}}}} = M{\left( {\frac{{{i_{{\rm{old}}}}}}{{{i_{\max }}}}} \right)^k}$$

(5)

式中：i_old、i_new为图像上任一点转换前、后灰度值；i_max为原图像的最大灰度值；M为处理后的图像最大灰度值，指数k越大，图像增强效果越明显，本文应用场景中k值的取值范围为1.6~2.0。

由于红外图像是对红外热辐射的成像，温度高的物体成像位置灰度值大，温度低的物体成像位置灰度值小。一般红外场景中的人体温度较高，背景温度较低，对应红外图像中，行人目标位置灰度值较大，背景位置灰度值较小，通过图像幂次变换，可有效增强行人目标，抑制背景。如图 5(b)，相对原图（图 5(a)），其背景得到明显抑制，行人目标得到增强。

图 5 感兴趣区域提取

Figure 5. Region of interest (ROI) detection

下载: 全尺寸图片幻灯片

3.2 感兴趣区域提取

由于行人、骑行者的竖向边缘较多^[10]，因此可以使用Sobel边缘检测算法检测图像中的竖向边缘，如图 5(c)（为了便于观察，图像有亮度增强）所示，图中实线框内为行人目标，虚线框内为无效目标，利用目标灰度约束可以剔除大部分无用边缘信息，如图 5(d)所示，图像中剩余的轮廓信息主要集中在行人位置处。由于轮廓位置所占图像面积较小，仅将该位置作为特征提取区域不利于提取到足够多的特征点，因此使用图像膨胀算法对图 5(d)所示基于灰度约束的边缘提取图像进行处理，得到图 5(e)所示感兴趣区域（Region of interest, ROI），通过在左右图像ROI区域内提取和匹配特征点，可有效减少特征点提取和匹配数量，减少误匹配数量，提高算法运行效率。

3.3 特征点检测与匹配

由于红外图像缺乏一般可见光图像中丰富的纹理细节特征，仅在目标轮廓边缘等梯度变化较大的地方存在明显图像特征，因此本文采用SURF（Speeded-Up Robust Features）算法^[11]在ROI区域对图像进行特征提取。SURF算法基于图像边缘检测特征点，且运行速度快，经实验验证，其在长波红外图像上具有良好的特征点提取效果。利用SURF算法在ROI区域进行特征点检测和匹配的效果如图 6(a)所示，图中线段的端点为特征点位置，其两端为一对初始匹配点，可以看出其中存在明显错误匹配点。利用式(4)对匹配点进行筛选，结果如图 6(b)所示，图中线段连接的匹配点为筛选后的匹配点，可见图 6(a)中的明显错误匹配点被有效剔除。

图 6 特征点提取及匹配

Figure 6. Feature points extraction and match

下载: 全尺寸图片幻灯片

3.4 半稠密深度图估计

获取筛选后匹配点后，利用三角测量模型可以解算匹配点对应的空间点坐标，获取原始稀疏深度图（如图 7(a)）。由于原始深度图是稀疏的，因此其直接用于显示效果较差。本文采用种子填充法（Seed-Filling）标记图 5(e)中不同连通域，在各连通域中选取原始深度图对应区域中的所有有效深度值的中值作为该区域的代表深度值，得到半稠密深度图，如图 7(b)。

图 7 深度图（局部）

Figure 7. Depth map (local)

下载: 全尺寸图片幻灯片

由于ROI图像中不同连通域表示场景中的不同目标，同一目标的不同位置的深度值是相近的，因此使用代表深度值估计整个目标的深度是可行的，且代表深度值的中值选取策略可以有效避免少量错误匹配点产生的异常深度值对目标深度估计的影响。

3.5 深度图显示

为便于观察，本文采用从浅到深的渐变颜色表示0~30 m内的距离远近。距离越远，颜色越深；距离越近，颜色越浅。图 8给出了6组夜间路面测试结果，对照图和显示图依次对应。其中对照图经过幂次变换对背景进行了抑制，显示图在对照图的基础上引入了渐变颜色表示图像中目标的深度信息，并在图像右侧给出了颜色图例。图 8中6组显示图中包含不同距离的行人、跑步者、骑行者等目标。可以看出，行人、跑步者、骑行者等目标均得到较好的颜色标记，参考颜色图例可以判断目标的相对远近，从而为驾驶员在夜间驾驶提供良好的辅助观测信息。

图 8 路面测试结果

Figure 8. Results of road test

下载: 全尺寸图片幻灯片

4. 测距精度实验

为验证系统测距精度，本文在夜间室外环境下，采用合作目标对左、右视双目相机分别进行精度实验，合作目标为一个2×2红外棋盘格，如图 9所示。以左视双目相机为例，合作目标参考位置如图 10所示，取3个方向，每个方向5~30 m范围内的18个点（图中未全部画出）验证系统测距精度。合作靶标的位置约定真值由精度为2+2 ppm的全站仪间接测得，以左相机为基准点，利用全站仪分别测量左相机和合作靶标的中心角点坐标，通过计算得到合作靶标中心距左相机基准点的距离约定真值。将系统测距结果和约定真值作比较，图 11给出了系统测距误差，系统测距结果在30 m范围内绝对误差均小于1 m，相对误差小于3%；15 m范围内绝对误差小于0.5 m，相对误差小于1.5%。考虑到本文的路况行人感知方法的主要应用场景为向驾驶者提供辅助观测信息，系统的测距精度满足实用需求。

图 9 2×2红外棋盘格

Figure 9. 2×2 infrared chessboard

下载: 全尺寸图片幻灯片

图 10 左视双目视场目标参考位置

Figure 10. Reference position of targets in left binocular field of view

下载: 全尺寸图片幻灯片

图 11 测距实验结果

Figure 11. Results of distance measurement

下载: 全尺寸图片幻灯片

5. 结论

本文设计了一种基于红外立体视觉的路况行人感知方法。针对红外图像纹理细节少，传统稠密双目立体匹配算法效果差的问题。本文首先提取图像ROI，然后在其中提取特征点并匹配以生成原始稀疏深度图，最后结合ROI和原始稀疏深度图估计ROI内稠密的全局半稠密深度图。并设计了实验系统对该方法进行实验验证。实验结果表明，该方法具有良好的行人等目标的检测效果，在系统约120°观测视场角内，目标深度感知相对误差在15 m范围内优于1.5%，30 m范围内优于3%，满足实际应用场景。

图 1 YOLOv4-tiny网络结构

Figure 1. The network structure of YOLOv4-tiny

下载: 全尺寸图片幻灯片

图 2 U2-Net网络结构

Figure 2. The network of U2-Net

下载: 全尺寸图片幻灯片

图 3 RSU-L模块网络

Figure 3. The network of RSU-L module

下载: 全尺寸图片幻灯片

图 4 航拍热红外图像显著图生成

Figure 4. Aerial thermal infrared image salient map generation

下载: 全尺寸图片幻灯片

图 5 显著图替换伪彩色图像RGB通道

Figure 5. Salient maps replacement of infrared image channels

下载: 全尺寸图片幻灯片

图 6 像素级加权融合

Figure 6. The pixel-level weighted fusion

下载: 全尺寸图片幻灯片

图 7 ComNet数据集实例

Figure 7. Instances of ComNet dataset

下载: 全尺寸图片幻灯片

图 8 多场景行人检测推理实例

Figure 8. The inference instances of multi-scene pedestrian detection

下载: 全尺寸图片幻灯片

表 1 K-Means锚框聚类结果

Table 1 The results of anchor box re-clustered

Models	Anchor Box	IOU/%
YOLOv4-tiny	(10, 14) (23, 27) (37, 58) (81, 82) (135, 169) (344, 319)	49.32%
Ours	(14, 39) (21, 69) (26, 95) (38, 85) (33, 113) (45, 130)	82.08%

下载: 导出CSV

表 2 与BASNet^[14]显著图提取方法对比

Table 2 Comparison with BASNet^[14] salient maps generation method

Data fusion method	Salient map extraction method	AP₅₀/%
Data fusion method	Salient map extraction method	YOLOv3	YOLOv4-tiny
Original infrared image	-	88.8	88.6
Salient map	-	77.1	75.6
R channel replaced	BASNet	92.7	91.7
R channel replaced	U2-Net	94.7	93.7
G channel replaced	BASNet	93.8	91.1
G channel replaced	U2-Net	94.2	94.7
B channel replaced	BASNet	90.5	91.5
B channel replaced	U2-Net	92.4	92.9
Weighted fusion	BASNet	94.4	92.0
Weighted fusion	U2-Net	95.3	94.8

下载: 导出CSV

表 3 与先进目标检测器的对比

Table 3 Comparison of advanced object detectors

Model	AP₅₀/%	Model size/MB
IRA-YOLOv3^[23]	84.4	10.7
YOLOv3^[8]	88.8	235
YOLOv3+WF	95.3	235
ZHAO, et al.^[14]	90.3	97
YOLOv3-tiny	86.3	28.1
YOLOv3-tiny+WF	93.9	28.1
YOLOv4-tiny^[1]	88.6	23.1
YOLOv4-tiny+WF	94.8	23.1

下载: 导出CSV

参考文献(23)

[1]	Bochkovskiy Alexey, WANG Chienyao, LIAO Hongyuan. YOLOv4: Optimal speed and accuracy of object detection[EB/OL]. [2020-8-28]. https://arxiv.org/abs/2004.10934.
[2]	顾佼佼, 李炳臻, 刘克, 等. 基于改进Faster R-CNN的红外舰船目标检测算法[J]. 红外技术, 2021, 43(2): 170-178. http://hwjs.nvir.cn/article/id/6dc47229-7cdb-4d62-ae05-6b6909db45b9 GU J J, LI B Z, LIU K, et al. Infrared ship target detection algorithm based on improved faster R-CNN[J]. Infrared Technology, 2021, 43(2): 170-178. http://hwjs.nvir.cn/article/id/6dc47229-7cdb-4d62-ae05-6b6909db45b9
[3]	杨蜀秦, 刘江川, 徐可可, 等. 基于改进CenterNet的玉米雄蕊无人机遥感图像识别[J]. 农业机械学报, 2021, 52(9): 206-212. YANG S Q, LIU J C, XU K K, et al. Remote sensing image recognition of corn stamens based on improved CenterNet for unmanned aerial vehicles[J]. Transactions of the Chinese Society for Agricultural Machinery, 2021, 52(9): 206-212.
[4]	Miezianko Roland, Pokrajac Dragoljub. People detection in low resolution infrared videos [C]//Proc of the 2008 IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops, 2008: 1-6.
[5]	REN Shaoqing, HE Kaiming, Girshick Ross, et al. Faster R-CNN: towards real-time object detection with region proposal networks [J]. IEEE Trans on Pattern Analysis, 2016, 39(6): 1137-1149.
[6]	Redmon Joseph, Divvala Santosh, Girshick Ross, et al. You only look once: unified, real-time object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016: 779-788.
[7]	Redmon Joseph, Farhadi Ali. YOLO9000: better, faster, stronger[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017: 7263-7271.
[8]	Redmon Joseph, Farhadi Ali. Yolov3: An incremental improvement[EB/OL]. [2018-04-08], https://arxiv.org/abs/1804.02767v1.
[9]	LIU Wei, Anguelov Dragomir, Erhan Dumitru, et al. SSD: Single shot multibox detector[C]// Proceedings of the European Conference on Computer Vision, 2017: 21-37.
[10]	LI Chengyang, SONG Dan, TONG Ruofeng, et al. Illumination-aware faster R-CNN for robust multispectral pedestrian detection[J]. Pattern Recognition, 2019, 85: 161-171. DOI: 10.1016/j.patcog.2018.08.005
[11]	仇国庆, 杨海静, 王艳涛, 等. 基于视觉特征融合的机载红外弱小目标检测[J]. 激光与光电子学进展, 2020, 57(18): 79-86. QIU G Q, YANG H J, WANG Y T, et al. Airborne infrared dim small target detection based on visual feature fusion[J]. Laser & Optoelectronics Progress, 2020, 57(18): 79-86.
[12]	李婉蓉, 徐丹, 史金龙, 等. 显著性物体检测研究综述: 方法、应用和趋势[J/OL]. 计算机应用研究, https://doi.org/10.19734/j.issn.1001-3695.2021.12.0645. LI W R, XU D, SHI J L, et al. Review of salient object detection research: methods, applications and trends[J/OL]. Computer Application Research, https://doi.org/10.19734/j.issn.1001-3695.2021.12.0645.
[13]	LIU Yixiu, ZHANG Yunzhou, Coleman Sonya, et al. A new patch selection method based on parsing and saliency detection for person re-identification[J]. Neurocomputing, 2020, 374: 86-99. DOI: 10.1016/j.neucom.2019.09.073
[14]	赵兴科, 李明磊, 张弓, 等. 基于显著图融合的无人机载热红外图像目标检测方法[J]. 自动化学报, 2021, 47(9): 2120-2131. ZHAO X K, LI M L, ZHANG G, et al. Object detection method based on saliency map fusion for UAV-borne thermal images[J]. Acta Automatica Sinice, 2021, 47(9): 2120-2131.
[15]	QIN Xuebin, ZHANG Zichen, HUANG Chenyang, et al. U2-Net: Going deeper with nested U-structure for salient object detection[J]. Pattern Recognition, 2020, 106: 107404. DOI: 10.1016/j.patcog.2020.107404
[16]	刘若阳, 艾斯卡尔·艾木都拉. 基于局部协方差矩阵判别模型的红外小目标检测方法[J]. 激光与红外, 2020, 50(6): 761-768. DOI: 10.3969/j.issn.1001-5078.2020.06.019 LIU R Y, Aiskar Aimudu. Infrared small target detection method based on local covariance matrix discriminant model[J]. Laser & Infrared, 2020, 50(6): 761-768. DOI: 10.3969/j.issn.1001-5078.2020.06.019
[17]	袁明, 宋延嵩, 张梓祺, 等. 基于增强局部对比度的红外弱小目标检测方法[J]. 激光与光电子学进展, https://kns.cnki.net/kcms/detail/31.1690.tn.20220524.1403.002.html. YUAN M, SONG Y S, ZHANG Z Q, et al. Infrared small target detection method based on enhanced local contrast[J]. Laser and Optoelectronics Progress, https://kns.cnki.net/kcms/detail/31.1690.tn.20220524.1403.002.html.
[18]	CHEN Yunfan, Hyunchul Shin. Pedestrian detection at night in infrared images using an attention-guided encoder-decoder convolutional neural network [J]. Applied Sciences, 2020, 10(3): 809. DOI: 10.3390/app10030809
[19]	代牮, 赵旭, 李连鹏, 等. 基于改进YOLOv5的复杂背景红外弱小目标检测算法[J]. 红外技术, 2022, 44(5): 504-512. http://hwjs.nvir.cn/article/id/f71aa5f4-92b0-4570-9056-c2abd5506021 DAI J, ZHAO X, LI L P, et al. Infrared small target detection algorithm in complex background based on improved YOLOv5[J]. Infrared Technology, 2022, 44(5): 504-512. http://hwjs.nvir.cn/article/id/f71aa5f4-92b0-4570-9056-c2abd5506021
[20]	罗会兰, 陈鸿坤. 基于深度学习的目标检测研究综述[J]. 电子学报, 2020, 48(6): 1230-1239. LUO H L, CHEN H K. A review of object detection based on deep learning[J]. Chinese Journal of Electronics, 2020, 48(6): 1230-1239.
[21]	赵鹏鹏, 李庶中, 李迅, 等. 融合视觉显著性和局部熵的红外弱小目标检测[J]. 中国光学, 2022, 15(2): 267-275. ZHAO P P, LI S Z, LI X, et al. Infrared weak and small target detection combining visual saliency and local entropy[J]. China Optics, 2022, 15(2): 267-275.
[22]	LI Minglei, ZHAO Xingke, LI Jiasong, et al. ComNet: combinational neural network for object detection in UAV-Borne thermal images [J]. IEEE Trans on Geoscience and Remote Sensing, 2021, 59(8): 6662-6673. DOI: 10.1109/TGRS.2020.3029945
[23]	SHAO Yanhua, ZHANG Xingping, CHU Hongyu, et al. AIR-YOLOv3: aerial infrared pedestrian detection via an improved YOLOv3 with network pruning[J]. Applied Sciences, 2022, 12(7): 3627. DOI: 10.3390/app12073627

施引文献

资源附件(0)

图(8) / 表(3)

计量

文章访问数: 43
HTML全文浏览量: 12
PDF下载量: 19
被引次数: 0

0. 引言
1. 双目测距模型
1.1 三角测量模型
1.2 极线约束
2. 系统设计与搭建
2.1 系统方案设计
2.2 实验系统平台
2.3 红外棋盘格标定板
3. 深度图生成方法
3.1 图像幂次变换
3.2 感兴趣区域提取
3.3 特征点检测与匹配
3.4 半稠密深度图估计
3.5 深度图显示
4. 测距精度实验
5. 结论

0. 引言
1. 双目测距模型
1.1 三角测量模型
1.2 极线约束
2. 系统设计与搭建
2.1 系统方案设计
2.2 实验系统平台
2.3 红外棋盘格标定板
3. 深度图生成方法
3.1 图像幂次变换
3.2 感兴趣区域提取
3.3 特征点检测与匹配
3.4 半稠密深度图估计
3.5 深度图显示
4. 测距精度实验
5. 结论

参考文献(23)

施引文献

资源附件(0)

融合视觉显著性的红外航拍行人检测

作者简介: 张兴平（1999-），女，四川泸州人，硕士研究生，主要研究方向为目标检测与模型加速

通讯作者: 邵延华（1982-），男，四川绵阳人，博士，副教授，硕导，主要研究方向为计算机视觉与模式识别。E-mail: syh@alu.cqu.edu.cn

计量

出版历程