导引头变跟踪点红外图像仿真建模研究

王艳奎; 吴根水; 姬爽

摘要: 本文以第四代红外成像空空导弹制导半实物仿真过程中导引头对变跟踪点红外图像仿真的需求为研究目的,在分析变跟踪点红外图像仿真需求与传统的采用固定跟踪点红外仿真图像差异的基础上,采用了全新的基于导引头光轴指向的变跟踪点红外图像仿真建模方法.该建模方法利用导引头伺服跟踪平台的实时跟踪参数和仿真战情参数建立了完整的变跟踪点红外图像仿真模型,解决了以往采用固定跟踪点红外图像仿真方法所导致的弹道末端红外图像仿真的原理误差,可满足第四代红外成像空空导弹导引头半实物仿真中红外目标和红外干扰弹图像变跟踪点的仿真需求.

关键词:

0. 引言

自寻的反坦克导弹等低成本武器系统大多采用非制冷红外探测器^[1-2]，具有成像速度快、命中率高、发射后不管等优点，但需要手动调整跟踪框以锁定目标，对操作手的熟练度要求较高^[3]。若能准确分割出图像中的典型目标，并给出提示，可提高锁定目标的响应时间与打击的精度。

典型目标分割^[4]是计算机视觉领域关键的预处理步骤，其目的是通过一些可区分特征将目标与背景分离。较好的分割性能有助于提升目标跟踪、识别等应用的精度。目前，国内外学者对典型目标分割进行了大量的研究，提出了许多有效算法，如阈值分割法、水平集变分法、主动轮廓模型和视点不变特征法^[5]。然而，非制冷红外探测器输出的红外图像存在边缘细节模糊、灰度不均匀等干扰现象，大大影响分割性能^[6]。为了解决这个问题，提出了许多新的分割算法来提高分割精度。李唐兵等人^[7]针对斑点鬣狗优化算法容易陷入局部最优解、求解质量低等缺点，提出了基于Lévy飞行和单纯形搜索的红外图像分割。相比于传统粒子群算法分割结果，改进的算法能够取得较好的阈值分割结果。然而，这些改进分割算法的性能提升总是以计算复杂度增加为代价，导致这些方法难以满足实时处理的要求，且算法的环境适应性也较低。

众所周知，目标分割与识别是计算机视觉领域两大基本任务。在大多数图像处理任务中，目标分割与识别是顺序执行的。只有准确分割出目标，才有助于后续图像分析、识别与理解。

随着对图像分析技术的研究深入，分割与识别过程可以被整合到一个任务框架中进行。韩红伟等人^[8]利用水平集将目标从背景杂波中分割出来，其中目标的有效特征用形状代替，并将其用于模板匹配以实现目标识别。近年来，稀疏表示已经在自然图像处理领域获得广泛的应用，并在分割与识别任务中获得了优异的性能。南航刘忠林教授^[9]提出了一种基于稀疏矩阵的谱聚类图像分割算法，通过最小化不同尺度上目标信息的谱聚类误差，分别提取边缘和区域特征信息，并利用所提取的特征信息创建稀疏矩阵，最终实现目标的准确分割。Zhang等人^[10]提出了基于形状稀疏组合的方法来完成典型目标的分割，该方法使用相似变换向点分布模型中的平均形状对齐，然后从对齐后的形状字典中重建目标物体的整体形状，并引入误差变量处理单个点定位误差问题。可以看出，由于以上文献都需要对目标进行严格对齐，此类方法表示新形状的能力有限。

为了从任意图像中分割出特定目标，一些学者在能量函数中引入先验轮廓信息作为约束项，对分割过程中能量函数演化进行约束。Zhang等人^[11]提出了一种多尺度映射轮廓模型，有效改善了复杂背景下的分割性能，但若图像中目标轮廓与先验信息存在较大差异时，往往不能得到理想效果。受压缩感知理论启发，目标轮廓可以由形状字典中一组特征近似表示。文献[12]假定输入形状可以由形状字典的形状原子稀疏线性组合近似表示，提出了一种新颖的稀疏形状合成模型，通过利用稀疏轮廓约束目标分割，并得到了较好的性能，该方法需要事先完成关键点提取和预对齐。若目标的形状轮廓不能与目标对齐，这将使目标分割与识别精度受到较大影响。由于隐式形状表示已被证明具有很强的形状表征能力，能够将目标轮廓先验隐式地融入到稀疏表示中，这将使轮廓对齐更容易。因此，本文在稀疏表示框架的基础上提出了一种改进隐式形状表示框架，该方法通过字典中概率形状的稀疏线性组合来引导隐式形状的演变，首先从字典中选择最能代表形状的稀疏形状组合，将目标轮廓先验隐式地融入到稀疏表示中，然后构造了一种将基于区域分割与稀疏表示相结合的新能量函数，通过迭代求解水平集函数最优解，最终得到典型目标的分割结果。

1. 基于水平集方法的目标分割

作为一种经典的变分方法，水平集方法已广泛应用于图像分割。水平集方法将界面视为高一维空间中某一函数，利用高维能量函数表示隐式曲线，并通过梯度下降迭代优化。随着研究的深入，国内外学者提出以端到端的方式将水平集方法嵌入深度网络模型的训练过程中，并获得满意的分割效果。Javanmardi等人^[13]利用神经网络预测了演化参数，并结合用户对边界点的点击来获得模板的预测轮廓。虽然此类改进的水平集分割方法能获得较优性能，但由于深度网络需要大量的数据进行训练驱动，且算法复杂度也较高，难以实现实时处理。本文则采用概率形状的稀疏线性组合来引导水平集隐式形状的演变。

本章将简要回顾水平集方法在目标分割中的应用，该方法求解目标边缘的过程就是能量泛函最小化的过程。在Mumford-Shah水平集模型^[14]中，对给定图像I中典型目标分割是利用分段平滑函数最小化找到目标平面的参数轮廓C_i，进而将图像I分割成N个不相交区域Ω₁, Ω₂, …, Ω_N。Mumford-Shah能量函数F_MS(u, C)可定义如下：

$$ {F_{{\text{MS}}}}\left( {u, C} \right) = \sum\limits_{i = 1}^N {\int\limits_{{{\mathit{\Omega}} _i}} {{{\left( {I - {u_i}} \right)}^2}} } {\text{d}}x{\text{d}}y + \mu \int\limits_{{{\mathit{\Omega}} _i}} {{{\left| {\nabla {u_i}} \right|}^2}} {\text{d}}x{\text{d}}y + \gamma \left| {{C_i}} \right| $$

(1)

式中：u_i是用于逼近输入图像I的分段平滑函数，能够确保每个区域Ω_i内的具有平滑连续的边缘曲线；μ和γ为式(1)的正则加权系数。Chan等人^[15]基于辅助变量目标泛函提出了一种非凸泛函逼近方法CV（Chan-Vese）模型，并通过欧拉方程获得数值解，如式(2)所示：

$$ \begin{array}{l} {E_{{\text{cv}}}}\left( {\phi , {c_ + }, {c_ - }} \right) = \int\limits_{\mathit{\Omega}} {{{\left| {I\left( {x, y} \right) - {c_ + }} \right|}^2}H\left( {\phi \left( {x, y} \right)} \right){\text{d}}x{\text{d}}y} + \hfill \\ \quad \int\limits_{\mathit{\Omega}} {{{\left| {I\left( {x, y} \right) - {c_ - }} \right|}^2}\left( {1 - H\left( {\phi \left( {x, y} \right)} \right)} \right){\text{d}}x{\text{d}}y + } \hfill \\ \quad \gamma \int\limits_{\mathit{\Omega}} {{{\left| {\nabla H\left( {\phi \left( {x, y} \right)} \right)} \right|}^2}{\text{d}}x{\text{d}}y + } \hfill \end{array} $$

(2)

式中：H是Heaviside函数；φ(x, y)是水平集函数，其过零点轮廓C＝{(x, y): φ(x, y)＝0}将图像空间Ω划分为两个不相交的区域，即：轮廓内部区域c₊＝{(x, y): φ(x, y)＞0}；轮廓外部区域c_－＝{(x, y): φ(x, y)＜0}。等式(2)的前两项用于拟合数据的图像相关保真项，第三项为正则约束项，以平滑轮廓曲线。c₊和c_－分别是轮廓曲线C的内/外部所对应的均值。因此，图像分割是在c₊和c_－驱动下找到一个水平集函数φ(x, y)＝0，其曲面的零水平集就是目标的边缘包络。

2. 基于稀疏形状先验与水平集变分正则的目标分割

2.1 概率形状模型

概率形状模型通过映射函数f: $ \mathcal{R}^d$→[0, 1]定义了一个形状，该映射函数可以将形状域空间Ω中每一个像素x分配一个概率f(x)，其中f(x)表示像素x属于目标的概率；d是图像的维度，对于红外图像一般设置为2。假定有含有N个基本形状元素α_i, i∈1, 2, …N的概率形状字典A＝[α₁, α₂, …, α_N]∈R^(W×H)×N，其中W与H分别表示形状块的宽与高。文献[16]已经证明了概率形状字典中各元素的线性组合得到的结果也是有效的形状，如图 1所示。

图 1 字典中的原子块结

Figure 1. Patch structure in dictionary

下载: 全尺寸图片幻灯片

相比于目标形状的参数化显示表示，概率形状模型不依赖于形状的参数化。因此，形状对齐不需要估计点对应关系，且形状传播也不需要控制点重新栅格插值。与符号距离函数等形状替代隐式表示相反，f(x)的值具有明确的概率意义。由于采用与像素点相关的松弛概率来代替像素点是一部分目标边界的硬决策，这使得概率形状模型与形状的经典定义有根本不同^[17]。该定义在形状建模和形状推理方面产生了许多优势，并且能够以全局最优的方式实现具有形状先验的图像分割。

2.2 结合变分正则的稀疏形状先验模型

给定输入图像I中目标形状为g∈R^(W×H)×1，其中g能被概率形状字典A中的元素稀疏线性表示。由于字典的过完备（即冗余性），该稀疏问题的解能被唯一表示：

$$ \mathop {\min }\limits_{s \in {R^{N \times 1}}} {\left| s \right|_0}, \quad {\text{s}}{\text{.t}}{\text{.}}\quad {\boldsymbol{A}}s = g $$

(3)

在实际应用中，图像中的典型目标可能出现模糊、遮挡等干扰现象，导致稀疏表示存在误差，因此式(3)可以改写成式(4)：

$$ \mathop {\min }\limits_{s \in {R^{N \times 1}}} {\left| s \right|_0}, \quad {\text{s}}{\text{.t}}{\text{.}}\quad {\left\| {{\boldsymbol{A}}s - g} \right\|_2} \leqslant \delta $$

(4)

通过最小化式(4)能够求解出稀疏系数，其中|⋅|₀表示L₀范数，表示系数非零项的个数。对于过完备的非正交字典，式(4)是一个NP难问题，很难直接求解。近年来，很多学者对该问题进行了研究，采用了L₁范数松弛优化对该问题进行求解。

$$ \mathop {\arg \min \lambda }\limits_{s \in {R^{N \times 1}}} {\left| s \right|_1} + {\left\| {{\boldsymbol{A}}s - g} \right\|_2} $$

(5)

式中：λ是正则参数。式(5)可以采用稀疏正则求解最优概率形状表示。由于目标的形状是未知的，仍然无法求解式(5)的最优解。为了解决这个问题，Zhang等人^[18]将目标形状显式表示为曲线顶点，并在求解稀疏表示之前对目标形状进行预对齐，这大大降低了目标分割的可操作性，且限制了形状表示的能力。鉴于隐式形状表示中目标形状对齐更容易操作，参考文献[19]的思路，本文将目标形状进行隐式表达，采用水平集形式H(φ(x))来表征形状g，因此本文所提形状系数模型的目标函数如下所示：

$$ E\left( {I, \phi , s} \right) = \mathop {\arg \min }\limits_{\phi , s \in {R^{N \times 1}}} \lambda {\left| s \right|_1} + \mu E\left( {\phi \left( x \right)} \right) + {\left\| {{\boldsymbol{A}}s - H\left( {\phi \left( x \right)} \right)} \right\|_2} $$

(6)

式中：μ是一个常数。值得注意的是，式(6)的最后一项E(φ(x))是一个数据驱动项，它使φ(x)在稀疏表示的约束下将目标与输入图像分离。众所周知，可以选择的能量函数E(φ(x))的种类较多，本文选用前面提到的CV模型作为数据驱动正则项。为了便于统一符号，式(2)被改写为如下等式：

$$ \begin{array}{l} {E_{{\text{cv}}}}(I, \phi , {c_ + }, {c_ - }) = \int_{\mathit{\Omega}} {{{\left| {I(x) - {c_ + }} \right|}^2}H(\phi (x){\text{d}}x + } \hfill \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\int_{\mathit{\Omega}} {{{\left| {I(x) - {c_ - }} \right|}^2}(1 - H(\phi (x)){\text{d}}x + } \hfill \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\beta \int_{\mathit{\Omega}} {\delta (\phi (x))\left| {\nabla \phi (x)} \right|{\text{d}}x} \hfill \end{array} $$

(7)

式中：H(⋅)与δ(⋅)分别是Heaviside函数与狄拉克函数；β为正则参数，其取值随迭代值自适应变换，初始值为50。一般来说，给定一个包含形状g的输入图像I，该形状g与概率形状字典中的形状先验相似。为了实现目标分割，本文设计了一个能量函数(s^*, φ^*)＝argminE(I, φ, c₊, c_－, s)，能够从图像I中分割出目标的同时，选择合适的原子进行稀疏线性表示。

本文所提的目标函数能表示为：

$$ E(I, \phi,s)=\left\| {{\boldsymbol{A}}s - H\left( \phi \right)} \right\|_2^2 + \lambda {\left| s \right|_1} + \mu {E_{{\text{cv}}}}\left( {I, \phi } \right) $$

(8)

前两项为目标轮廓的稀疏正则项，第三项为水平集能量函数。当λ＝0时，该目标函数就演变成基于水平集的目标分割。如果将E_cv(I, φ)项更改为显式稀疏误差向量e，其对应的水平集H(φ)＝g－e，这种显式求解需要对目标形状进行预对齐，大大降低了目标分割的可操作性。

2.3 所提模型形状不变性

一般来说，创建字典有两种方法，一种是直接从给定的海量样本中学习特定于任务的字典，具有很强的表示能力，但该字典的基本原子没有意义，如KSVD（K-Singular Value Decomposition）、MoD（Method of Optimal Direction）等^[19]。因此，一些学者将测试样本表示为训练或先验样本的稀疏线性组合，并取得了较优的结果。本文所采用的概率形状字典就是将测试样本表示为训练样本的加权线性组合，通过L₁范数优化求取稀疏解。引入形状先验知识可以提高水平集性能，形状先验知识会引导水平集曲线隐式形状的演变。本文采用隐式对齐来实现形状归一化，充分考虑了缩放、平移和旋转不变性。

对于基于形状先验的目标分割，几何变换不变性是一个理想的特性。本文采用文献[16]所提的内在隐式对齐来解决这个问题，主要思想是将稀疏项中H(φ(x))重写为H(σ_φR(θ)φ(x－μ_φ))，其中σ_φ与μ_φ分别表示尺度因子和平移因子；R(θ)是旋转矩阵，并且θ表示旋转角。对于平面二维图像，假设x＝(x¹, x²)，μ_φ＝(μ_φ¹, μ_φ²)，而不是求解参数φ与s。内在隐式对齐采用下式计算其参数：

$$ {\mu _\phi } = \int {xh(\phi (x)){\text{d}}x} $$

(9)

$$ h(\phi (x)) = {{H(\phi (x))} \mathord{\left/ {\vphantom {{H(\phi (x))} {\int {H(\phi (x)){\text{d}}x} }}} \right. } {\int {H(\phi (x)){\text{d}}x} }} $$

(10)

$$ {\sigma _\phi } = \sqrt {\int {{{(x - {\mu _\phi })}^2}h(\phi (x)){\text{d}}x} } $$

(11)

$$ R(\theta ) = \left[ {\begin{array}{*{20}{c}} {\cos \theta }&{ - {\text{sin}}\theta } \\ {\sin \theta }&{\cos \theta } \end{array}} \right] $$

(12)

$$ \theta = \arg \mathop {\min }\limits_{\theta \in [0, 2{\rm{ \mathsf{ π}}}]} \int {{{({x^1} - \mu _\phi ^1)}^2}{\text{d}}x} $$

(13)

2.4 优化求解过程

为了便于对本文所改进的目标函数进行优化求解，本文所提模型被分解为两个子问题交替求解，分别采用了稀疏优化领域常用的软阈值法和交替梯度下降法。首先，固定s求解φ，我们可以获得如下式：

$$ \frac{{\partial E}}{{\partial \phi }} = \frac{{\partial {E_{{\text{sp}}}}}}{{\partial \phi }} + \mu \frac{{\partial {E_{{\text{cv}}}}}}{{\partial \phi }} $$

(14)

E_cv的梯度可以表示为如下式：

$$ \frac{{\partial {E_{{\text{cv}}}}}}{{\partial \phi }} = \delta (\phi ){(I - {c_ + })^2} - {(I - {c_ - })^2} - \beta {\text{div}}(\frac{{\nabla \phi }}{{\left| {\nabla \phi } \right|}}) $$

(15)

E_sp的梯度可以表示为如下式：

$$ \frac{{\partial {E_{sp}}}}{{\partial \phi }} = 2\delta \left( \phi \right)\int_{\mathit{\Omega}} {{{\boldsymbol{A}}^{\text{T}}}} \left( {{\boldsymbol{A}}s - H\left( {\phi \left( x \right)} \right)} \right){\text{d}}x $$

(16)

然后，固定φ求解s，我们可以得到如下式：

$$ \frac{{\partial E}}{{\partial \phi }} = \eta \int\limits_{\mathit{\Omega}} {2{{\boldsymbol{A}}^{\text{T}}}} \left( {{\boldsymbol{A}}s - H\left( {\phi \left( x \right)} \right)} \right){\text{d}}x $$

(17)

式中：η(⋅)为软阈值操作算子。受压缩感知领域的l₁范数理论和Bregman迭代的激励^[12]，本文交替求解得到的结果随CV模型迭代过程优化，最终获得最优分割结果。

3. 实验结果与分析

3.1 数据集

本文依托红外物理国家重点实验室的开放课题，建立了多种复杂场景下外场挂飞的红外数据集，包含舰船目标、飞机目标、装甲目标等。为了便于对本文提出的典型目标进行分割与识别，项目组对数据集进行了裁剪，将各类目标从图像中分割与校正，构建并训练出概率轮廓字典^[19-20]。本文设计的数据集包括6类目标的共计1064张目标图像，且部分类中包含多类不同目标。图 2展示了不同类别的部分目标，其中前三行分别为飞机类目标（Aircraft），车辆目标（Vehicle）和船舶目标（Ship），每行都包含3类不同的目标。每个目标有大约70张图片。本实验构建的概率轮廓字典利用典型目标库构造训练字典，并将待测目标表示为训练字典中原子的线性组合。字典中所有图片被随机投影为504维向量，经过学习后的字典有950个原子，平均每个类别至少有64个原子。

图 2 概率形状字典的部分原子

Figure 2. Partial atoms of probabilistic shape dictionary

下载: 全尺寸图片幻灯片

3.2 实验设置

为了验证所提出的典型目标分割算法的有效性，实验选用了5幅具有代表性的红外图像，包含飞机、车辆等目标。所有图像都是使用艾睿光电的非制冷VO_x热成像传感器RTD6122M进行采集，其中像元尺寸为12 μm，图像分辨率为40×512。选用的目标都存在部分缺失或遮挡，尤其是部分图像在光照影响下存在轮廓不清晰、边缘模糊的情况。在目标函数中稀疏正则与变分正则的系数分别为λ＝10与μ＝1.5，其中水平集采用默认参数进行迭代，β取值随迭代值自适应变换，初始值为50。随着迭代开始，进化曲线在稀疏轮廓的约束下逐渐向目标边缘靠拢。

本文选用了3种具有代表性的轮廓约束分割算法进行对比分析，分别为基于稀疏形状组合的分割方法（Sparse Shape Combination, SSC）^[11]，基于概率形状稀疏表示的分割算法（Probabilistic Shape Sparse Representation, PSS）^[21]以及基于自适应形状约束Graph-Cuts算法的分割算法（Adaptive Shape Constrained Graph-Cut, ASCG）^[22]。值得注意的是，虽然对比算法都已开源，但SSC算法主要针对医学图像，本文应用过程中需要修改接口函数及图像尺寸参数，但不会影响该算法对红外典型目标的分割性能。本文所提出的模型采用MATLAB 2019a进行开发，所有对比算法均在相同软硬件平台下运行，其中CPU为Intel(R) Core(TM) i5-8265U@ 1.60 GHz，内存容量4.0 GB，以及64位WIN10操作系统。

3.3 消融分析

本文以结构稀疏表示和变分理论为基础，结合空间约束（Space Constraint, SC）、概率形状模型（Probabilistic Shape Model, PCM）、自适应字典学习（Adaptive Dictionary-learning, AD）及变分正则化技（Variational Regularization, CVR），实现了典型目标分割。为验证改进策略对模型检测效果提升的有效性，本文进行了消融实验，使用相同的实验设备以及数据进行测试，选取Dice相似系数（Dice Similarity Coefficient, DSC）和Hausdorff距离（Hausdorff Distance, HD）^[23]作为客观指标进行分割性能的量化分析，其中DSC是衡量分割结果和基准值的区域重叠度，而HD被用来测量分割结果和基准值的边缘集合间远离程度。

为了便于分析不同改进模块对整体分割性能的影响，表 1展示了消融分析结果，其中：“×”与“√”分别表示算法中不采用或采用的模块。序列1是不采用任何改进策略的全变分分割，作为消融分析的对比基线，其余对比算法都采用了CVR模块。从对比结果可以看出，采用了所有改进策略得到的DSC与HD分别为0.920与0.131，均优于其他对比算法。值得注意的是，未采用概率形状模型的算法都是采用了KPCA进行代替，在特征空间中寻找最近似的表达式来表示目标形状。因此，消融分析结果表明采用概率形状模型进行稀疏表示，明显优于直接对形状原子进行稀疏表示。序列2与3分别是采用了空间约束与概率形状模型的算法，分别将DSC指标提升到0.683与0.692。序列8采用了空间约束模块，在训练过程中限制了形状适应度，防止CVR演化曲线结果与实际目标轮廓不符。序列8的HD相比于序列4降低了0.07。

表 1 消融分析

Table 1. Ablation analysis

No.	SC	PCM	AD	CVR	DSC	HD
1	×	×	×	×	0.612	0.407
2	√	×	×	√	0.683	0.331
3	×	√	×	√	0.692	0.337
4	×	√	√	√	0.871	0.201
5	√	×	√	√	0.751	0.283
6	√	√	×	√	0.862	0.154
7	×	×	√	√	0.719	0.297
8	√	√	√	√	0.920	0.131

下载: 导出CSV

| 显示表格

本文方法是通过将两种正则信息进行的融合。当λ＝0时，该目标函数就演变成基于水平集的目标分割；μ＝0则是稀疏形状先验模型，这种显式求解需要对目标形状进行预对齐。而本文算法在处理时避免了对齐操作，可降低单帧图像的处理时间。对比实验结果也表明，本文所提算法的运行时间介于两者之间，主要是由于形状约束加快了曲线的收敛速度。

图 3展示了序列3、4、5与6获得的分割结果。可以看出，序列3仅采用了PCM，其分割结果并不是一个有意义的形状目标，且存在较多虚假的区域；序列5仅采用空间约束，没有采用PCM，导致目标部分区域存在过分割现象；而序列4的结果与序列6的结果类似，都是加入了形状先验的信息，对轮廓的演化进行了约束，从而引导分割结果朝着有意义的目标逼近，最终实现目标的准确分割。

图 3 不同策略组合下的分割结果。(a)序列3；(b)序列4；(c)序列5；(d)序列6

Figure 3. Segmentation results under different strategy-combinations. (a)# 3; (b)#4; (c)#5; (d)#6

下载: 全尺寸图片幻灯片

3.4 定性分析

定性分析是一种针对不同对比算法分割结果的主观评价方法，主要通过与基准结果进行对比，分析分割结果的边缘准确度。图 4展示了不同对比算法的分割结果，其中图 4(a)是基准图。第一行中的图像包含多个目标，且尺寸各异，目标存在部分遮挡、缺损、黏连等干扰因素。本文所提出的算法在大多数测试图像的分割均达到了较满意的效果，其外形轮廓与基准结果较接近，重叠度较高，但对比算法都将海岸护坝误认为目标。除了极个别复杂背景下较小尺寸，且边缘模糊的目标的分割结果较差，大多数图像上的目标都在轮廓曲线约束下获得了较好的分割结果。ASCG算法虽然可以获得相对光滑的曲线，但分割结果受到了背景粘连的误导，第二行的坦克目标的炮管未能分割出来。对于较模糊的图像，SSC重建的稀疏形状组合并不理想，其结果存在微弱的欠分割。另外，由于CV变分模型的能量泛函具有非凸性，导致其容易陷入局部最小，尤其是在不同初值下存在极致不唯一问题。PSS算法将低对比度目标分割成了两个目标，如图 4(d)所示。虽然本文所提的算法与ASCG算法都采用了CV变分模型进行正则约束，也存在局部最优情况，但本文算法采用的形状约束可控制曲线逼近目标轮廓，且对非均匀图像也具有较好的分割效果。图 4中隐式形状的演变表明，本文改进模型可以通过迭代优化获得稀疏系数，以实现目标分割，即使目标存在部分缺失或遮挡，也能够完整获得目标边界。

图 4 不同对比算法的分割结果(a)基准结果；(b)SSC; (c)PSS；(d) ASCG; (e)Proposed.

Figure 4. Segmentation results of different comparison algorithms (a) Benchmark results; (b)SSC; (c)PSS; (d) ASCG; (e)Proposed

下载: 全尺寸图片幻灯片

3.5 定量分析

表 2展示了4种对比算法对不同红外图像分割结果的DSC和HD系数，其中每张测试图像的最优分割结果加粗标示。DSC是衡量分割结果与基准值的区域重叠度，重叠度越大，分割的性能越好。从表 2的结果可以看出，本文所提的算法通过对训练样本中附加的形状信息引入知识到分割过程中，可以改善较差的性能，获得0.892的DSC值，而SSC、PSS以及ASCG的DSC平均值分别是0.828、0.871与0.872。表 2中PSS算法结果中，除了Img_3，其余图像的DSC值与本文算法相似。PSS的平均值差异较大，主要是由于Img_3中目标外形与字典中原子差异过大，很难从字典中选择最能代表形状的稀疏形状组合，导致演化曲线未能与目标轮廓保持一致，而本文算法通过添加正则项，对偏离训练数据库中学习到的目标形状的情况进行惩罚。表 2中，HD值越大，表明分割结果和基准值的边缘差异越大，用以评价分割边缘的准确度。对比分割算法的HD结果可以发现，本文所提算法性能指标整体最优，ASCG模型次之，PSS模型的客观参数相对最差。结果表明，本文所提算法在区域和边缘两方面均与基准值较为吻合，且对不同环境下采集的图像具有较好适应性。

表 2 不同对比算法定量分析

Table 2. Quantitative analysis for different comparison algorithms

	SSC		PSS		ASCG		Proposed
	DSC	HD	DSC	HD	DSC	HD	DSC	HD
Img_1	0.702	0.287	0.781	0.258	0.799	0.255	0.831	0.210
Img_2	0.872	0.201	0.901	0.183	0.898	0, 187	0.924	0.165
Img_3	0.825	0.243	0.883	0.192	0.871	0.211	0.882	0.201
Img_4	0.839	0.261	0.859	0.171	0.864	0.226	0.890	0.192
Img_5	0.903	0.141	0.934	0.128	0.921	0.124	0.935	0.089
Mean	0.828	0.226	0.872	0.186	0.871	0.204	0.892	0.171

下载: 导出CSV

| 显示表格

定性定量结果表明，本文所提出的模型具有较高的分割准确性，而对比算法在复杂背景下很难实现目标的分割，尤其是当图像中的目标被遮挡或粘连时，其形状表示能力受到限制。与现有方法不同，本文改进的模型首先采用软阈值算法恢复稀疏系数，然后根据这些系数选择先验形状，以指导水平集曲线进行隐式形状的演化。实验结果表明，即使目标存在缺失、部分遮挡或与背景相似等干扰，该模型仍表现出良好的性能。值得注意的是，与ASCG算法不同，本文方法不会生成中间形状。因此，当输入形状与字典中的所有元素完全不同时，可能会导致性能下降。

4. 结论

本文在稀疏表示的基础上提出了一种改进的隐式形状表示框架，该方法通过字典中概率形状的稀疏线性组合来引导隐式形状的演变，最终实现典型目标的分割。实验结果表明，所提出的模型能够在复杂背景下对典型目标实现稳定分割，尤其在处理部分遮挡、粘连目标时也表现出较好的分割效果。由于目标轮廓先验隐式地融入到稀疏表示中可以实现目标识别，下一步计划将分割与识别过程整合到一个任务框架中，进一步提升光电装备自动捕获典型目标的性能。