An Infrared Image Enhancement Method Based on Semantic Segmentation
-
摘要: 针对对比度受限的自适应直方图均衡化(contrast limited adaptive histogram equalization, CLAHE)强行分块造成的视觉不自然现象,本文提出了一种基于语义分割的红外图像增强方法。语义分割网络将整个红外图像分割成种类块而不是传统的矩形图像块。然后,每个种类块各自进行对比度受限的直方图均衡化,以减少过度增强。最后,采用了一种新的边缘过渡方法来避免种类块之间的突变。实验结果表明,本文所提出的红外图像增强方法在对比度和熵上优于其他对比算法,而且避免了传统CLAHE的视觉不自然现象,具有更好的视觉效果。Abstract: To solve the problem of visual unnaturalness caused by contrast-limited adaptive histogram equalization (CLAHE) forced blocking, this study proposes an infrared image enhancement method based on semantic segmentation. The semantic segmentation network segments the entire infrared image into category blocks instead of traditional rectangular image blocks. Each category block is individually subjected to contrast-limited histogram equalization to reduce over-enhancement. Finally, a new edge transition method is introduced to avoid abruptness between category blocks. The experimental results show that the proposed image enhancement method outperforms other contrast algorithms in terms of contrast and entropy and avoids the visual unnaturalness of traditional CLAHE with better visual effects.
-
Keywords:
- image enhancement /
- infrared image /
- semantic segmentation /
- histogram equalization /
- CLAHE
-
0. 引言
红外成像技术是基于目标热辐射进行成像的,与可见光成像相比具有抗干扰能力强,不受环境影响等优点[1]。然而,由于红外成像器件,成像原理和大气衰减,红外图像普遍存在对比度低,细节模糊等问题[2]。因此,对红外图像进行图像增强是必不可少的。
图像增强方法通常分为两种[3-4]:变换域的图像增强方法和空间域的图像增强方法。变换域的图像增强方法是基于傅里叶变换的,而空间域的图像增强方法是直接处理图像的像素[5]。直方图均衡化(histogram equalization,HE)[6]是一种简单、高效的空间域的图像增强方法。直方图均衡化通常分为两种[7]:全局直方图均衡化(global histogram equalization,GHE)和局部直方图均衡化(local histogram equalization,LHE)。GHE方法通过对整幅图像的直方图进行处理来完成图像增强,但它可能导致微小目标信息的丢失。LHE将直方图均衡化处理应用于图像的局部区域,有效地增强了局部细节和对比度,其中最具代表性的算法之一是对比度受限的自适应直方图均衡化(contrast limited adaptive histogram equalization,CLAHE)[8],它增强效果显著,成熟易于实现[9],因此在工程上被广泛应用。在CLAHE中,图像被分割为大小相等的矩形块[10],并在每个子块中各自进行直方图均衡处理。然而由于同一目标物体被传统的CLAHE强行分割到不同图像子块,各个图像子块直方图被独立计算,因此会出现块效应,导致图像视觉不自然的现象[11-12]。CLAHE分块导致的块效应,甚至“块闪烁”现象,影响观感和感知。特别是对一些要求比较高的场景,如:机载、舰载等领域,CLAHE的“块”效应有可能会造成对天空等背景的不均匀误判,导致同一块属性的温度场左右、上下不一致,造成感知误差。
基于此,为了提高红外图像的对比度,同时避免传统算法出现的块效应,视觉不自然等问题,本文提出了基于语义分割的红外图像增强方法。首先采用语义分割网络将原始图像分割成不同的种类块。其次利用语义分割的语义信息,对每个种类块分别进行对比度受限的直方图均衡化。每个种类块在不忽略图像信息的情况下被单独操作,有效地减少了过度增强,同时有效提高了局部对比度。最后采用了新的边缘过渡方法,以避免种类块之间的突变。种类块增强与这种边缘过渡方法相结合,很好地减少了块效应,实现了图像增强。
1. 基本原理
CLAHE算法能够有效地提高局部对比度,其实现流程如图 1所示。在图 1中,CLAHE强行分块,独立计算子块映射函数,因此会出现块效应,导致视觉不自然,如图 2所示。在图 2中,红色矩形框中的天空出现了块效应,同一片天空区域灰度值差异较大,有明显的界限感。因此本文针对这些问题,提出了一种基于语义分割的红外图像增强方法,如图 3所示,包含3个步骤。第一步,使用语义分割网络CGnet[13]来获得红外图像对应的标签图,将红外图像分割成种类块。第二步,对每个种类块各自进行图像增强。第三步,在种类块之间进行边缘过渡。
1.1 语义分割
语义分割是对图像进行像素级别的分割处理,将图像里的每一个像素,配上提前定义好的标签,从而将每一个像素进行分类[14]。究其本质,语义分割就是对图像进行像素级别的分割与分类。如图 4所示,不同的颜色代表事先设定的不同标签,因此各个种类块包含了不同的语义信息。
本文使用Tianyi Wu等人提出的一种拥有上下文引导块,更好地学习局部特征和周围环境的联合特征,分割高效的轻量级语义分割网络:CGNet(context guided network)[13]。通常来说,高精度的语义分割方法具有更多的参数量,内存占用更大。表 1为各种语义分割网络在公开数据集Cityscape的参数、精度、运行时间。CGNet具有较少的参数数量,同时实现了较高的精度。
表 1 各种语义分割模型在Cityscapes数据集上的参数、精度、运行时间分析Table 1. Parameters, accuracy and time analysis of various semantic segmentation models Cityscapes datasetMethod Parameter(M) MIoU/(%) Time/ms SegNet 29.5 56.1 89.2 ENet 0.4 58.3 19.3 PSPNet 65.6 73.6 > 1000 RefineNet 118.4 78.4 > 1000 CGNet 0.5 64.8 56.8 研究者们提出了轻量化的语义分割模型,这些模型通过对轻量化的结构进行优化,降低模型的参数和计算量,从而有效地提升网络的推理速度。对于我们的数据集而言,图像尺寸为640×480,推理时间为16.8 ms。将红外图像和人为提前定义的标签送入语义分割网络CGnet中训练,之后用红外图像进行测试,测试结果的结果为所需的标签图。输出标签图与红外图像逐像素对应,不同的颜色包含不同种类的语义信息。因此,利用CGNet将红外图像分割成不同种类的种类块。
1.2 种类块图像增强
在标签图中,不同种类块对应的不同RGB值,因此可以获得该种类所有的像素坐标。输出的标签图和红外图像像素点一一对应,因此根据种类块的像素坐标可以获得该像素点的原始灰度值。通过语义分割将整幅图像分割成M个种类块:
$$ X = {X_A} \cup {X_B} \cup \cdots \cup {X_M} $$ (1) 式中:Xi={X(u, v)}表示由L个离散灰度级组成的给定输入图像种类块i;X(u, v)表示与空间位置(u, v)对应的灰度值;种类块i中所有元素的个数记为Ni。
根据直方图均衡化的原理[15],对于种类块i灰度级l的映射灰度级为Hi:
$$ {H_i} = (L - 1)/{N_i}\sum\limits_{k = 0}^l {{H_i}(k)} $$ (2) 之后,对每个种类块进行裁剪和重映射处理,以减少局部对比度过度增强,如图 5所示。蓝色区域的像素被统一分配到橙色区域。这个过程可以通过迭代来实现。
裁剪阈值cliplimit的计算公式为:
$$\text { clipl}\;\text {imit} =\frac{N_i\left[1+10 *\left(u_i / q_i\right)\right]}{L}$$ (3) 式中:Ni表示种类块i的数量;u代表种类块i灰度均值;q代表种类块i灰度方差,表示种类块i灰度范围。
对比限制直方图均衡化后的种类块i映射函数为:
$$ {T_i}(l) = (L - 1)/{N_i}\sum\limits_{k = 0}^l {{H_i}^*(k)} $$ (4) 式中:Hi∗(k)为裁剪后的直方图;Ti(l)是种类块i的映射函数。同理可得不同种类块的映射函数。
1.3 种类块边缘过渡
由于不同图像块的映射函数是独立计算的,因此相邻图像块的映射函数可能存在较大差异,直方图均衡化后,相邻图像块之间不可避免地会产生块效应[16]。在传统的CLAHE方法中,为了避免相邻图像块间的块效应,采用双线性插值[17]来减小块效应。
与传统插值方法类似,为了避免相邻种类块之间的块效应,直方图均衡化后的任意像素的映射值都是通过同时考虑其他图像块的映射函数来计算的。对于原始图像上的任意像素p,其映射值为其他种类块对应灰度映射值的边缘过渡处理结果,如图 6所示。种类块经过边缘过渡后,任意像素p的最终映射值Ti∗(l)计算为:
$$ {T_i}^*(l) = \sum\limits_{i = 1}^M {{w_i}{T_i}} (l) $$ (5) 其中:
$$ {w_i} = {d_i}/\sum\limits_{i = 1}^M {({d_i}/D} ) $$ (6) $$ D = \sum\limits_{i = 1}^M {{d_i}} $$ (7) 其中不同的种类块用不同的颜色来区分。Oi是不同种类块的中心,像素p与其他种类块的中心Oi之间的欧氏距离称为di。
种类块的中心$ {O_i}({\bar x_i},{\bar y_i}) $的计算公式为:
$$ {O_i}({\bar x_i},{\bar y_i}) = \left\{ \begin{gathered} {{\bar x}_i} = \frac{{\sum\limits_{j = 0}^{{N_i}} {{x_j}} }}{{{N_i}}} \hfill \\ {{\bar y}_i} = \frac{{\sum\limits_{j = 0}^{{N_i}} {{y_j}} }}{{{N_i}}} \hfill \\ \end{gathered} \right. $$ (8) 式中:种类块的总像素个数表示为Ni;(xj, yj)为种类块中像素点的坐标位置。
任意像素点p到种类块i的中心${O_i}({\bar x_i},{\bar y_i})$的欧式距离di的计算公式为:
$$ {d_i} = \sqrt {{{(m - {{\bar x}_i})}^2} + {{(n - {{\bar y}_i})}^2}} $$ (9) 式中:(m, n)为任意像素点p的坐标位置。
2. 实验结果及分析
2.1 实验设置
本文使用公开红外语义分割数据集SODA[18](segmenting object in day and night)1800张和自己采集与标注的红外数据集500张,并使用Labelme进行标注,之后再进行数据增广处理,最终得到4600张红外图像,包含了12个常见种类,进行语义分割训练。实验在python中实现,并在一台带有NVIDA RTX a6000 GPU和64 GB RAM的电脑进行。
2.2 评价指标
本文通过主观评价与客观评价相结合来验证本文算法的有效性。主观评价主要通过人眼的视觉感受评判。客观评价主要依靠数学模型定量计算,定量评价[19-20]。本文采用对比度(Contrast)和熵(Entropy)来对实验结果做出客观评价。
1)图像对比度的计算公式如下[21]:
$$ \varphi = \sum\limits_\tau \tau {(i,j)^2}{\gamma _\tau }(i,j) $$ (10) 式中:$\tau (i,j) = |i - j|$表示相邻像素之间的灰度差;γτ(i, j)表示相邻像素之间的灰度差为τ的像素分布概率,图像对比度越高,图像质量越好,图像更清晰。
2)图像熵ENT计算公式如下[22]:
$$ \mathrm{ENT}=-\sum\limits_{M, N} p\left(m_{(i, j)}\right) \log _2\left(p\left(m_{(i, j)}\right)\right)$$ (11) 式中:M×N表示图像的大小;p(m(i, j))表示灰度值m(i, j)的概率。熵值反映了图像灰度特征所包含的信息量。熵值越高,图像的信息量越大,质量越高。
2.3 实验结果与分析
实验结果如图 7~图 10所示。为了验证本文算法的有效性,将其与双直方图均衡[23](brightness preserving bi histogram equalization,BBHE)、二维直方图均衡[24](two-dimensional histogram equalization,2DHE)和对比度受限的自适应直方图均衡(CLAHE)算法进行比较,并从主观和客观评价两个方面进行分析。
通过实验结果可以看出本文所提出的算法很好地实现了图像增强,对比度和各种细节都得到了增强,具有不错的视觉效果。CLAHE算法由于强行分块,会导致同一个目标物体被分割到不同图像块,独立计算,忽略了整体信息。如红色矩形框中所示,图 7(d)中的一面墙,图 8(d)中的树、图 9(d)建筑周围的天空和图 10(d)中的地面,同一目标物体中部分区域灰度差异大,有明显的界限,出现了视觉不自然。本文所提出的算法将红外图像分割成种类块,有效地避免了视觉不自然,同时很好地增强了图像。
表 2和表 3给出了图 7~10四组图像使用不同算法的对比度和熵的值。从表 2、表 3可以看出,与原图相比,各种算法得到的对比度和熵都有所增加,并且本文算法的对比度和熵值都略优于其他算法。
综上说明采用本文方法得到的图像对比度更高,层次感更强,细节更突出,图像质量更好。
3. 结论
本文提出了一种基于语义分割的图像增强方法。该方法不同于简单地在空间上分割图像的传统方法,而是采用语义分割的方法将图像分割成种类块。根据各个种类块具有的语义信息,给种类块进行限制对比度的直方图均衡,取得了更好的图像增强效果,并且解决了传统CLAHE分块独立计算视觉不自然的问题,具有更好的视觉效果。通过多组图像,与各种图像增强算法对比,并且从主观和客观评价分析,验证了算法的有效性。
-
表 1 各种语义分割模型在Cityscapes数据集上的参数、精度、运行时间分析
Table 1 Parameters, accuracy and time analysis of various semantic segmentation models Cityscapes dataset
Method Parameter(M) MIoU/(%) Time/ms SegNet 29.5 56.1 89.2 ENet 0.4 58.3 19.3 PSPNet 65.6 73.6 > 1000 RefineNet 118.4 78.4 > 1000 CGNet 0.5 64.8 56.8 表 2 不同算法的对比度
Table 2 Contrast of different algorithms
-
[1] 石川凌. 海陆场景的红外实时仿真研究[D]. 杭州: 浙江大学, 2016. SHI Chuanling. Study on Infrared Real-time Simulation of Sea-land Scene[D]. Hangzhou: Zhejiang University, 2016.
[2] 曾庆杰. 红外成像中图像质量提升算法研究[D]. 西安: 西安电子科技大学, 2021. ZENG Qingjie. Research on Image Quality Improvement Algorithm in Infrared Imaging[D]. Xi 'an: Xidian University, 2021.
[3] William K. Pratt. Introduction to Digital Image Processing[M]. Taylor and Francis: CRC Press, 2013.
[4] Jain A. Fundamentals of digital image processing[J]. Computer Vision, Graphics, and Image Processing, 1989, 46(3): 400-400.
[5] Yeong-Taeg Kim. Contrast enhancement using brightness preserving bi-histogram equalization[J]. IEEE Transactions on Consumer Electronics, 1997, 43(1): 1-8. DOI: 10.1109/30.580378
[6] Stark J A. Adaptive image contrast enhancement using generalizations of histogram equalization[J]. IEEE Transactions on Image Processing, 2000, 9(5): 889-96. DOI: 10.1109/83.841534
[7] YANG Maoxiang, TANG Guijin, LIU Xiaohua, et al. Low-light image enhancement based on Retinex theory and dual-tree complex wavelet transform[J]. Optoelectronics Letters, 2018, 14(6): 470-475. DOI: 10.1007/s11801-018-8046-5
[8] Zuiderveld K. Contrast limited adaptive histogram equalization[J]. Graphics Gems, 1994: 474-485.
[9] Suharyanto, Hasibuan Z A, Andono P N, et al. Contrast limited adaptive histogram equalization for underwater image matching optimization use SURF[J]. Journal of Physics, 2021, 1803(1): 012008.
[10] Ali M Reza. Realization of the contrast limited adaptive histogram equalization(CLAHE) for real-time image enhancement[J]. The Journal of VLSI Signal Processing, 2004, 38(1): 35-44. DOI: 10.1023/B:VLSI.0000028532.53893.82
[11] Arici Tarik, Dikbas Salih, Altunbasak Yucel. A histogram modification framework and its application for image contrast enhancement[J]. IEEE Transactions on Image Processing, 2009, 18(9): 1921-1935. DOI: 10.1109/TIP.2009.2021548
[12] Kim Wonkyun, You Jongmin, Jeong Jechang. Contrast enhancement using histogram equalization based on logarithmic mapping[J]. Optical Engineering, 2012, 51(6): 067002-1-067002-10. DOI: 10.1117/1.OE.51.6.067002
[13] WU T, TANG S, ZHANG R, et al. CGNet: a light-weight context guided network for semantic segmentation[J]. IEEE Transactions on Image Processing, 2021, 30: 1169-1179. DOI: 10.1109/TIP.2020.3042065
[14] Badrinarayanan Vijay, Kendall Alex, Cipolla Roberto. SegNet: a deep convolutional encoder-decoder architecture for image segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(12): 2481-2495. DOI: 10.1109/TPAMI.2016.2644615
[15] CHEN Soong-Der, Ramli Abd Rahman. Contrast enhancement using recursive mean-separate histogram equalization for scalable brightness preservation[J]. IEEE Trans. Consumer Electronics, 2003, 49(4): 1301-1309. DOI: 10.1109/TCE.2003.1261233
[16] 刘程威. 红外成像系统架构及图像处理关键技术研究[D]. 南京: 南京理工大学, 2020. LIU Chengwei. Research on Infrared Imaging System Architecture and Image Processing Key Technologies[D]. Nanjing: Nanjing University of Science and Technology, 2020.
[17] Pizer S M, Amburn E P, Austin J D, et al. Adaptive histogram equalization and its variations[J]. Computer Vision, Graphics, and Image Processing, 1987, 39(3): 355-368. DOI: 10.1016/S0734-189X(87)80186-X
[18] LI C, XIA W, YAN Y, et al. Segmenting objects in day and night: edge-conditioned CNN for thermal image semantic segmentation[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020, 32(7): 3069-3082.
[19] Silva Eric A, Panetta Karen, Agaian Sos S. Quantifying image similarity using measure of enhancement by entropy[J]. Mobile Multimedia/Image Processing for Military and Security Applications, 2007, 6579: 65790U-65790U-12. DOI: 10.1117/12.720087
[20] ZHANG Yujin. Handbook of Image Engineering[M]. Singapore: Springer, 2021.
[21] GAO Ce, YUN Lijun, WANG Kun, et al. Infrared image enhancement method based on discrete stationary wavelet transform and CLAHE[C]//IEEE International Conference on Computer Science and Educational Informatization(IEEE CSEI 2019), 2019: 52: DOI: 10.1109/CSEI47661.2019.8938871.
[22] Gonzalez R C, Woods R E. Digital Image Processing[M]. Singapore: Pearson Prentice Hall, 2002: 75-215.
[23] KIM Yeong-Taeg. Contrast enhancement using brightness preserving bi-histogram equalization[J]. IEEE Transactions on Consumer Electronics, 1997, 43(1): 1-8. DOI: 10.1109/30.580378
[24] Turgay Celik. Two-dimensional histogram equalization and contrast enhancement[J]. Pattern Recognition, 2012, 45(10): 3810-3824. DOI: 10.1016/j.patcog.2012.03.019
-
期刊类型引用(1)
1. 夏晨旭,郝群,张一鸣,张韶辉,李凡飞,杨智慧,孙建坤. 基于结构光投影三维重建的人脸特征检测. 激光与光电子学进展. 2023(22): 186-192 . 百度学术
其他类型引用(2)