基于上下文感知和尺度自适应的实时目标跟踪

夏爱明, 伍雪冬

夏爱明, 伍雪冬. 基于上下文感知和尺度自适应的实时目标跟踪[J]. 红外技术, 2021, 43(5): 429-436.
引用本文: 夏爱明, 伍雪冬. 基于上下文感知和尺度自适应的实时目标跟踪[J]. 红外技术, 2021, 43(5): 429-436.
XIA Aiming, WU Xuedong. Real-time Object Tracking Based on Context Awareness and Scale Adaptation[J]. Infrared Technology , 2021, 43(5): 429-436.
Citation: XIA Aiming, WU Xuedong. Real-time Object Tracking Based on Context Awareness and Scale Adaptation[J]. Infrared Technology , 2021, 43(5): 429-436.

基于上下文感知和尺度自适应的实时目标跟踪

基金项目: 

国家自然科学基金 61671222

详细信息
    作者简介:

    夏爱明(1985-),男,硕士研究生,主要研究方向为视觉目标跟踪。E-mail: 362931408@qq.com

    通讯作者:

    伍雪冬(1975-),男,博士,教授,主要研究方向为计算机视觉, 能源预测与环境经济调度等。E-mail: woolcn@163.com

  • 中图分类号: TP391.41

Real-time Object Tracking Based on Context Awareness and Scale Adaptation

  • 摘要: 针对传统核相关滤波视觉目标跟踪算法在快速运动、背景杂波、运动模糊等情况下跟踪精度低且不能处理尺度变化的问题,提出了一种基于上下文感知和尺度自适应的实时目标跟踪算法。该算法在核相关滤波算法框架的基础上,引入了上下文感知和尺度自适应方法,增加了背景信息且能够处理目标的尺度变化。首先,利用融合了fHOG(fusion histogram of oriented gradient)、CN(color names)和灰度的特征对目标区域进行采样,训练一个二维位移滤波器,然后,在目标区域建立尺度金字塔,利用fHOG对目标区域进行多尺度采样,训练一个一维尺度滤波器,最后,在模型更新阶段改进了更新策略。在标准数据集OTB-2015上对100组视频序列进行的试验结果表明,提出的算法比基准算法(kernel correlation filter, KCF)精度提高了13.9%,成功率提高了14.2%,且优于实验中对比的其他跟踪算法。在尺度变化、运动模糊、快速运动等条件下,提出的算法在准确跟踪的同时,能够保持较高的速度。
    Abstract: Because the traditional kernel correlation filter algorithm for visual object tracking has low tracking accuracy under fast motion, background clutter, and motion blurring conditions and cannot deal with scale changes, a real-time object tracking algorithm based on context awareness and scale adaptation is proposed. Based on the kernel correlation filter algorithm framework, context-aware and scale-adaptive methods are introduced to add background information and handle changes in the scale of the target. First, the target region is sampled using the features of the fusion histogram of oriented gradient (fHOG), color names (CN), and gray, and a two-dimensional translation filter is trained. Then, a scale pyramid is established in the target area and multi-scale sampling is performed using fHOG on the target area. Following this, a one-dimensional scale filter is trained. Finally, the update strategy is improved in the model updating stage. The experimental results of 100 sets of video sequences in the standard OTB-2015 dataset show that the proposed algorithm showed an improvement in the accuracy by 13.9% as compared with the benchmark algorithm (kernel correlation filter, KCF), and the success rate improved by 14.2%, which is superior to that of other comparison-tracking algorithms considered in the experiment. Under the conditions of scale change, motion blur, and fast motion, the proposed algorithm can maintain a high speed with accurate tracking.
  • 蒙皮是飞机运行中最容易出现损伤的零部件,因其直接与外部环境相接触,很容易产生裂纹、积水、腐蚀等故障。这些故障大都难以用肉眼察觉,却又直接影响着飞机的飞行安全[1]。因此,如何对飞机蒙皮的故障进行快速准确地边缘检测显得尤为重要。目前的检测手段主要有:射线检测、涡流检测、磁粉检测、渗透检测和超声检测等[2]。红外热成像检测有着范围广、速度快、稳定非接触等优点,已成为重要的检测手段[3]。但红外图像分辨率低且灰度较为集中,如何准确快速地对红外图像进行边缘提取尤为重要。

    Canny算法[4]因其较优的信噪比和检测精度,在图像处理方面得到了广泛应用。但传统的Canny算法在双阈值的选择上缺乏自适应性。因此,众多自适应Canny算法被提出,李二森等[5]提出的自适应Canny边缘检测算法利用全局阈值分割法来寻找动态阈值,但此法精确度较低。杜磊等[6]采用图片信息熵最大时的阈值作为图像的自适应阈值。郭方方等[7]和宋人杰等[8]利用了最大类间方差法(Otsu)来确定Canny的分割阈值。这种方法虽然阈值精度较高,但计算量大,在处理大型图像时运算缓慢。考虑引入烟花算法来减少最大类间方差法(Otsu)的计算时间。

    烟花算法(Fireworks Algorithm,FWA)[9-11]是Tan等在2010年提出的一种先进的、高效的群体智能算法,具有全局探索、局部暴发、分布并行等优点。但烟花算法也存在一定的不足,总体来说主要有以下4个方面:①爆炸半径机制缺乏自适应性,从而导致适应度值最好的烟花爆炸半径会被限制在极小的范围,致使具备最多爆炸火花数的最优烟花几乎丧失局部挖掘的能力,浪费计算资源。②当前适应度值最优的火花被直接保留为下一代的烟花,导致算法一旦陷入局部最优则很难跳出。③高斯变异火花在增加解的多样性方面作用有限,反而耗费了大量的计算时间。④每个烟花爆炸后依然作为下一代的火花,导致重复计算,降低了计算效率。

    近些年来,科研工作者针对上述问题投入了大量精力,提出了众多改进型的烟花算法,并表现出良好的性能。王亮等[12]在算法的搜索过程中引入了柯西变异算子,并改进了选择策略,使新的算法具备了更多样的爆炸火花与更精确的收敛精度。Shaoqiu Zheng等[13]针对FWA的选择策略做出改进,给烟花之间加入了合作机制,使算法在全局探索和收敛速度方面有了进步。张水平等[14]的带有动态爆炸半径的增强型烟花算法(Enhanced Fireworks Algorithm with Dynamic Explosion Radius,EFWA-DER)改进了传统烟花算法的基本算子并加入爆炸半径动态调整的策略,提高了算法的优化性能。Li等[15]的导引烟花算法,在传统烟花算法中引入导引火花,提高了算法的搜索效率。陶小华等[16]提出的具有导向功能的改进烟花算法(improved FWA with directional function,IDFWA)充分利用了当代最优个体的位置信息以及历代的全局最优解,改进了传统烟花算法的搜索方式,消除了爆炸半径对搜索范围的限制。以此来使烟花具有更好的搜索能力。Li J.等[17]在改进型烟花算法(Improved Fireworks Algorithm,IFWA)中提出新的爆炸半径与火花产生方式,以此来提高算法的寻优能力。以上改进型烟花算法都从一定程度上使爆炸火花呈现出多样性,增强算法跳出局部最优的能力。但烟花算法陷入局部最优的主要原因在于算法在下一代的选择策略上都无条件地将当前适应度值最好的火花(并不一定是全局最优解范围内的火花)列入下一代烟花。而这类火花在下一代的爆炸半径又会非常小,所以算法会无法跳出局部最优,不利于全局探索。基于此,提出快速烟花算法(Fast Fireworks Algorithm,FFWA),该算法采用不同的爆炸半径产生方式,使核心烟花的爆炸半径更加合理,增强了局部挖掘能力;剔除了烟花爆炸序列中本烟花作为第一个爆炸火花的机制,减少了算法的运算量,提高了算法的收敛速度;并且在选择策略上增加了判断机制,使算法可以更加轻易地跳出局部最优。

    本文主要致力于提升自适应Canny算法中分割阈值的计算速度,引入烟花算法来对图像的最大类间方差进行寻优,同时针对传统烟花算法会出现早熟和计算效率低的缺陷,对其爆炸半径和爆炸火花的生成方式与次代烟花的选择策略做出改变,提出快速烟花算法,最后通过实验分析了快速烟花算法和其他寻优算法的表现,对各类自适应Canny算法的计算速度与边缘提取效果进行了比较。

    传统的Canny算法主要分为4个部分。首先对图像的噪声进行滤波(通常为高斯滤波),然后对去噪后的图像计算其梯度幅值与方向,其次对图像的梯度幅值进行非极大值抑制,最后进行双阈值判定检测边缘。

    Canny算法中,边缘的检测和连接需要根据双阈值(高阈值THh,低阈值THl)来判断,其中高阈值主要区分背景与前景,而低阈值主要平滑边缘,将不连续的部分连接起来。通常低阈值等于1/2~1/3的高阈值,但高阈值的选取则需要按照经验预设或通过多次实验不断改进。可利用最大类间方差法实现对THh的计算。

    最大类间方差法由日本学者大津提出,是根据最小二乘原理得出的一种可以自动选取阈值的算法。在最大类间方差法中,用阈值将图像分为目标和背景两部分。目标和背景之间的方差值越大,表示组成图像的两部分区分度越高。当一部分背景被错分为目标或者是当目标被错分为背景,则会导致两部分的区分度降低。所以,类间方差最大,则表明错分的概率最小。假设要分割的图像的灰度范围是{0, 1, …, L-1}。通过阈值t图像像素将被按式(1)和(2)分为两个部分:

    $$ \begin{array}{c} C_{0}=\{0, 1, \cdots, t\} \end{array} $$ (1)
    $$ \begin{array}{c} C_{1}=\{t+1, t+2, \cdots, L-1\} \end{array} $$ (2)

    C0C1分别代表目标和背景。这类图像的误差在C0C1之间:

    $$ \sigma(t)^{2}=\omega_{0}(t)^{*} \omega_{1}(t)^{*}\left[\mu_{0}(t)-\mu_{1}(t)\right]^{2} $$ (3)

    式中:t是阈值;ω0(t)是图像灰度值小于阈值t的像素数量。ω1(t)是图像灰度值大于阈值t的像素数量。μ0(t)是图像灰度值小于阈值t的像素平均灰度值。μ1(t)是图像灰度值大于阈值t的像素平均灰度值,使得σ(t)2最大值的tmax是最佳分割阈值。

    tmax作为图像前景与背景的最佳分割阈值,在本质上与Canny算法中的高阈值THh作用是一样的,可以令THh=tmax。通过多次实验对比得到,THh=2.5THl时算法提取的边缘最准确与完整,令THl=tmax/2.5,以此来连接边缘,获得边缘检测图像。但Otsu计算量较大,耗费时间较长,可通过结合快速烟花算法解决此问题。

    燃放烟花爆竹是中国传统节日尤其是除夕的一项重要节日庆祝活动,点燃的烟花被发射到夜空中,爆炸产生火花继而照亮其临近的夜空,产生出一幅美丽的图案。在一个优化问题中,烟花被看作为最优化问题的解空间中一个可行解,那么烟花爆炸产生一定数量火花的过程即为其搜索邻域的过程[9]。烟花算法由爆炸算子、变异算子、映射规则和选择策略4部分组成。烟花的爆炸示意图如图 1所示。

    图  1  烟花爆炸示意图
    Figure  1.  Schematic diagram of fireworks explosion

    图 1所示,烟花爆炸产生火花,然后在所有的烟花与火花中按照选择策略选择下一代烟花进行爆炸操作,依次循环迭代,在解空间中寻找最优解。

    在可行解空间随机产生一些烟花,对其初始化后利用适应度函数计算出适应度值并进行评估,则第ii=1, 2, …, n)个烟花爆炸产生的火花数目为:

    $${S_i} = {E_n} \times \frac{{{y_{\max }} - f\left( {{x_i}} \right) + \xi }}{{\sum\limits_{i = 1}^N {\left( {{y_{\max }} - f\left( {{x_i}} \right)} \right) + \xi } }}$$ (4)

    式中:En是控制N个烟花产生火花总数的参数;f(xi)为第i个烟花的适应度值。ymax=max(f(x))表示烟花所对应适应度的最大值。ξ是为避免除零操作引入的一个极小正数。为避免生成的Si过多或过少,还需对Si进行如下限制:

    $${s_i} = \left\{ {\begin{array}{*{20}{l}} {a*{s_i}}&{{\rm{ if }}\;{s_i} < a*{s_i}} \\ {b*{s_i}}&{{\rm{ if }}\;{s_i} > b*{s_i}} \\ {{s_i}}&{{\rm{ otherwise }}} \end{array}} \right.$$ (5)

    式中:ab为爆炸数目限制因子。

    根据烟花适应度的好坏,计算不同烟花的爆炸半径R,适应度好的烟花在邻近区域生成较多的火花,适应度差的烟花在较大范围内产生较少的火花。计算公式如下:

    $${R_i} = {E_{\rm{r}}} \times \frac{{f\left( {{x_i}} \right) - {y_{\min }} + \xi }}{{\sum\limits_{i = 1}^N {\left( {f\left( {{x_i}} \right) - {y_{\min }}} \right) + \xi } }}$$ (6)

    式中:Er为预设的最大爆炸半径;ymin=min(f(x))为烟花所对应适应度值的最小值;ξ为一个极小的正数。

    xi生成的第j(j=1, 2, …, Si)个火花的第k(k=1, 2, …, z)维度上坐标为:

    $$x_{ik}^{} = x_{ik}^{} + {R_i} \cdot \operatorname{rand} ( - 1, 1)$$ (7)

    式中:rand(-1, 1)为-1~1之间的随机数。

    在传统烟花算法中产生第i(i=1, 2, …, N)个高斯火花的第k(k=1, 2, …, z)维度上的坐标为:

    $$x_{ik}^{} = {x_{ik}} \cdot {\rm{Gaussian }}(1, 1)$$ (8)

    式中:Gaussian(1, 1)代表平均值为1;标准方差为1的高斯分布。

    在产生爆炸火花或变异火花时,有可能更新后的坐标超出了取值范围,这时需要采用一定的映射规则来对越界火花进行修正:

    $${x_{ik}} = {X_{{\rm{LB}}, k}} + |{x_{ik}}|\% ({X_{{\rm{UB}}, k}} - {X_{{\rm{LB}}, k}})$$ (9)

    式中:XLB,kXUB,k分别表示该优化问题中烟花取值的下边界与上边界。

    在每一次迭代中,所有的个体(烟花和火花)中,适应度最好的烟花无条件保留到下一代,剩余的N-1个个体采用轮盘赌的方式选取,每一个火花被选中的概率为:

    $$p\left( {{x_i}} \right) = \frac{{R\left( {{X_i}} \right)}}{{\sum\limits_{j = 1}^n R \left( {{X_j}} \right)}}$$ (10)
    $$R\left( {{X_i}} \right) = \sum\limits_{j = 1}^n d \left( {{X_i}, {X_j}} \right) = \sum\limits_{j = 1}^n {\left\| {{X_i}, {X_j}} \right\|} $$ (11)

    式中:R(Xi)为烟花Xi与其他烟花的距离之和;d(Xi, Xj)为烟花Xi与烟花Xj之间的欧式距离;n为所有烟花与火花数目之和。

    烟花算法的具体执行步骤为:

    步骤1  在解空间随机生成一定数量烟花,每个烟花都是一个可行解。

    步骤2   根据每个烟花所在位置的适应度值,按照各自的爆炸数目(式(4))爆炸半径(式(6))进行爆炸。同时,随机选取一定数量的烟花进行高斯变异。

    步骤3   计算所有的火花的适应度值并排序。

    步骤4   判断是否达到迭代次数,如果是,则输出最优值,否则,选取下一代烟花。

    步骤5  重复以上2, 3, 4步,直到达到迭代次数。

    传统烟花算法的执行流程如图 2所示。

    图  2  传统烟花算法流程图
    Figure  2.  Flowchart of traditional Fireworks Algorithm

    图 2所示,在传统烟花算法中,火花分为爆炸火花和高斯火花,前者主要负责对解空间进行探索和挖掘,适应度好的烟花在小范围内生成较多的火花,适应度差的烟花在大范围内生成较少的火花。而高斯火花的作用主要是增加种群多样性。

    烟花算法的选择策略为当前最优(适应度值最优)火花作为下一代烟花,其余N-1个火花的选择方式有随机选取、轮盘赌的方式选取、按照适应度值排序选取等。这些选择策略都无一例外地直接保留了当前最优火花,而该火花(也是拥有爆炸火花数最多的烟花)在下一代的爆炸半径几乎等于0,这样不仅没有起到局部挖掘的作用,并且会在其他烟花没有找到更优点的情况下陷入局部值。因此,对烟花算法的选择策略增加一个判断机制,该机制如下:

    每一代的当前最优火花必须满足以下条件之一时,才可以被选择为下一代烟花。

    1)当前最优火花适应度优于上一代最优火花时。

    2)当前最优火花适应度劣于上一代最优火花,且满足接受概率P时。

    为引入以上判断机制,需对烟花算法的爆炸半径计算方式与爆炸火花产生方式进行改变。

    在烟花算法中,烟花主要分为两类,靠近极值点的烟花(当前适应度值较好的烟花)和远离极值点的烟花(当前适应度值较差的烟花),在算法的计算过程中,两类烟花分别发挥着不同的作用,前者主要在小范围内发挥其局部挖掘的能力,后者则在更大的范围内发挥探索的能力[18]。通过计算不难发现,传统烟花算法的爆炸半径计算公式会使拥有爆炸数量最多的最优烟花Xb的爆炸半径非常小甚至等于0,这会使Xb的爆炸火花出现大量重复计算,也是算法容易早熟的原因之一。因此,郑少秋[19]等在EFWA(enhanced fireworks algorithm)中增加了最小爆炸半径检测机制,使每一个烟花的爆炸半径不会小于Amin。增强了在算法早期烟花的探索能力。但这种限制最小爆炸半径的策略过分依赖于算法预先设定的最大迭代次数,而这是人为设定的。事实上,一个优秀的爆炸半径策略应该让两类烟花各自发挥其能力即核心烟花更好的发掘,非核心烟花更好的探索,并且也应该考虑到计算空间的整体信息和当前迭代的次数。基于此,提出一种新的爆炸半径计算公式:

    $${R_i} = {R_c} \times [(\frac{{|{X_{i, k}} - {X_{B, k}}|}}{{({X_{{\rm{UB}}, k}} - {X_{{\rm{LB}}, k}})}}) + 1/t]$$ (12)

    式中:|Xi,k-XB,k|为第k维上当前烟花距离最优烟花的绝对距离,t为当前迭代次数。

    式(13)主要分为两部分,第一部分为当前烟花距离最优烟花的绝对距离与空间上下限的比值,全局信息的引入使爆炸半径的分配更具整体性。第二部分为当前迭代次数的倒数,这一部分主要是保证在算法前期各类烟花均具备良好的探索能力,并且随着算法深入,逐渐降低对爆炸半径的影响,使第一部分发挥优势。图 3为FFWA在Sphere函数上自适应爆炸半径的取值。

    图  3  FFWA在Sphere函数上自适应爆炸半径的取值
    Figure  3.  The value of adaptive explosion radius Of FFWA in Sphere function

    图 3可知,爆炸半径的取值整体呈现非线性递减的趋势,在算法前期,核心烟花的爆炸半径足够大,可以快速锁定全局最优值的范围,后期爆炸半径在合理的范围内又足够小,充分发挥了其局部挖掘的能力。而非核心烟花根据与核心烟花的绝对距离与迭代次数的改变,自适应地选取爆炸半径,合理地在全局进行搜索,使计算过程快速收敛。

    对于传统烟花算法(包括绝大多数改进型)为了保留代间信息,都选择将每一个烟花本身作为下一代爆炸火花的第一个火花。这导致每一代爆炸火花的适应度值评估都会因重复计算而耗费大量时间,当然并不能说这些重复计算是无意义的,因为在传统烟花算法对后代烟花的选择策略的前提下,为了保留当前最优与后期收敛,不得不这样做。但如果在选择策略中加入当前最优适应度值保存机制,那么就完全不必要进行这些重复计算。因此,新的爆炸方式中,每一个烟花的爆炸火花序列将不再存储该烟花本身,而是全部生成新的火花,改进后,每一代需要评估的火花数由原先的n=sum(Si)+N个减少为n'=sum(Si)个,从而使算法在没有降低全局探索能力的前提下,计算效率得到稳定的提升,且这种改进对各类适应度函数存在普遍适用性。

    为了可以避免上一代的火花重复计算浪费时间,又可以使算法在每一代的迭代中保留上一代最优火花的信息,对每一代的最优火花进行一次判断选择机制,即每一代的最优火花与当代的最优烟花进行比对,如果适应度更好,则保留为下一代的烟花,反之,则按照一定概率(接受概率P)接受。为使结果最终收敛,接受概率P也随迭代次数逐渐收缩,最终接近于零。其余火花按照适应度排序择优选取。在理论上,这种新的选择策略既保证了最优值的保存,又使算法更加灵活,避免陷入局部最值,收敛稳定,此外,在改进后的选择策略中,其余烟花的选取不再依靠欧式距离的计算,又进一步降低了算法的运行时间。

    快速烟花算法的具体步骤为:

    步骤1   在解空间内随机设置一定数量的烟花,并设置接受概率与收缩系数。

    步骤2   根据式(4)与式(12)规定的爆炸数目与爆炸半径进行爆炸。FFWA删除了烟花的高斯变异过程。并且每个烟花的爆炸序列中只储存爆炸火花的信息,不再对烟花本身进行储存。

    步骤3  计算每个火花的适应度值并排序。

    步骤4  判断是否达到迭代次数,如果是,则输出迭代结果,否则,判断当前最优火花是否优于上一代最优烟花,如果是,则将该火花选为下一代烟花,否则按照接受概率选取。剩余烟花按照适应度排序择优选取。

    步骤5   对接受概率进行收缩。

    步骤6  重复以上2,3,4步,直到达到迭代次数。

    快速烟花算法流程如图 4所示。

    图  4  快速烟花算法流程图
    Figure  4.  Fast fireworks algorithm flow chart

    本文用快速烟花算法对图像的类间方差进行寻优,并将求得的最大类间方差作为Canny算法中的高阈值THh,令低阈值THl等于THh/2.5,据此对图像进行边缘的检测与连接,获得图像的边缘。

    算法的具体步骤为:

    步骤1   对待检测的图像进行高斯去噪,降低噪声对后续计算的影响,防止误检测。

    步骤2   对去噪后的图像计算梯度幅值与方向。

    步骤3   对梯度幅值进行非极大值抑制,将局部最大值之外的所有梯度值抑制为0。

    步骤4   初始化快速烟花算法,将Otsu设置为适应度函数,读入图像,循环迭代,输出最佳分割阈值fm

    步骤5  将该阈值赋予Canny算法中的高阈值THh,低阈值THl=THh/2.5。

    步骤6   进行双阈值检测和连接边缘,得到边缘检测图像。

    图 5为基于FFWA的自适应Canny边缘检测算法流程图。

    图  5  基于FFWA的自适应Canny边缘检测算法流程图
    Figure  5.  Flowchart of adaptive Canny edge detection algorithm based on FFWA

    实验主要分为两部分,首先对快速烟花算法,传统烟花算法,构造型烟花算法[20],柯西烟花算法与动态搜索烟花算法[21]的计算性能做出对比,然后分别对基于上述算法的自适应Canny边缘检测结果进行对比。

    实验系统环境为:Win7,Intel 2.20 GHz CPU i5,8 G RAM,编程环境为:Matlab 2016a。

    为了对改进算法的性能进行评估,实验选取了4个具有全局最优值的标准函数进行对比,如表 1所示。此外,共设置了10组不同参数来评估参数对算法的影响,结果表明,不同组的参数设置对算法间的影响微乎其微,仅以表 2中参数为例,进行实验。

    表  1  基准测试函数
    Table  1.  Standard test function
    Name Function Range Dimension Optimal
    Sphere ${f_1}\left( x \right) = \sum\limits_{i = 1}^n {x_i^2} $ [-100, 100]d 30 0
    Ackley ${f_2}(x) = - 20\exp ( - 0.2\sqrt {\sum\limits_{i = 1}^d {x_i^2} } ) - \exp (\frac{1}{d})\sum\limits_{i = 1}^d {\cos (2{\rm{ \mathsf{ π} }}{x_i})} + 20 - e$ [-32, 32]d 30 0
    Griewank ${f_3}(x) = \frac{1}{{4000}}\sum\limits_{i = 1}^d {x_i^2} - \prod\limits_{i = 1}^d {\cos (\frac{{{x_i}}}{{\sqrt i }})} + 1 $ [-600, 600]d 30 0
    Six-Hump Camel-Black ${f_4}(x) = 4x_1^2 - 2.1x_1^4 + \frac{1}{3}x_1^6 + {x_1}{x_2} - 4x_2^2 + 4x_2^4 $ [-5, 5]2 2 -1.03162
    下载: 导出CSV 
    | 显示表格
    表  2  五种算法的参数设置
    Table  2.  Parameter Settings
    Algorithm Common Parameters Mutations Acceptance probability Shrinkage Rate Transfer parameters Control factor Mutation probability
    FFWA N=5
    Er=20
    En=20
    a=0.2
    b=0.8
    1 0.99
    FWA 2
    IFWA 2 21
    CFWA 2 0.15
    dynFWA kd=1.2
    sx=0.8
    下载: 导出CSV 
    | 显示表格

    表 2中,N为初始烟花数,Er为最大爆炸半径,En为爆炸火花总数目,ab为爆炸数目限制系数。4个测试函数如表 1所示,每个测试函数分别独立运行20次,迭代次数设定为1000。由于初始烟花的位置对算法结果的影响很大,为了更加客观地进行比较,消除不确定因素,每次对比的各个算法都使用相同初始位置。并记录出现的最优值、最差值、平均值与平均运行时间4项数据对算法进行评估。测试对比结果见表 3

    表  3  测试函数测试结果对比
    Table  3.  Test function test results comparison
    Algorithm Fun Optimal Worst Average Run Time/s Fun Optimal Worst Average Run Time/s
    FFWA f1 0 0 0 0.85 f3 0 1.078×10-5 2.501×10-5 1.04
    FWA 0 2.887×10-2 5.559×10-5 1.33 9.716×10-5 7.410×10-1 2.552×10-5 1.50
    dynFWA 1.636×10-4 1.222 1.328×10-3 1.06 3.414×10-4 1.053 5.513×10-3 1.19
    IFWA 4.584×10-1 4.839×10-3 4.837×10-2 1.28 1.113E-01 6.591×10-1 4.447×10-1 1.51
    CFWA 2.032×10-5 2.996×10-1 2.842×10-5 1.25 0 2.285×10-1 4.311×10-4 1.46
    FFWA f2 1.216×10-5 1.078×10-1 2.601×10-4 1.03 f4 -1.031628 -1.031628 -1.031628 0.69
    FWA 1.215×10-5 1.880×10-1 2.634×10-4 1.51 -1.031628 -1.031613 -1.031620 1.04
    dynFWA 5.001×10-4 4.203 2.611×10-3 1.27 -1.031628 0.007603 -1.031614 0.87
    IFWA 2.093×10-4 1.666 4.537×10-4 1.46 -1.031628 -1.031628 -1.031628 0.96
    CFWA 8.282×10-5 6.323×10-4 2.220×10-4 1.46 -1.031628 -1.031624 -1.031626 1.03
    下载: 导出CSV 
    | 显示表格

    表 3可知,FFWA在f1, f3, f4三个函数中的计算精度均优于其他对照组,f2中略差于CFWA。运行时间对比上,每一组的运行时间FFWA都是最低的。综合来看,FFWA的性能优于其他4个对照组。为了更加直观地对算法的收敛过程进行评估,给出4个标准函数的收敛曲线,如图 6~图 9所示。

    图  6  Sphere函数收敛曲线
    Figure  6.  Sphere function convergence curves
    图  7  Ackley函数收敛曲线
    Figure  7.  Ackley function convergence curves
    图  8  Griewank函数收敛曲线
    Figure  8.  Griewank function convergence curves
    图  9  Six-hump函数收敛曲线
    Figure  9.  Six-hump function convergence curves

    图 6~图 9对比可知,因为爆炸半径的改进,使FFWA的核心烟花可以在算法早期快速定位在最优值附近。所以FFWA的收敛速度均优于其他4个对照组,而择优选取的选择策略又使得在算法后期有大量的火花在最优值附近挖掘,保证了算法的精度。值得指出的是,传统烟花算法因为高斯火花和映射关系的存在,使其在对最优值处于原点附近的函数计算时有着良好的表现,但红外图像普遍有着灰度集中,且最佳分割阈值不在零点附近的特点,这就需要算法具备更高的全局搜索能力和更高的计算精度。为验证FFWA在红外图像的性能表现,用红外热像仪对飞机损伤蒙皮实拍得到如图 10~图 13所示加热结束后冷却不同时刻飞机蒙皮损伤红外热像图。

    图  10  积水损伤加热结束后不同时刻图像
    Figure  10.  Images of different moments of hydrops
    图  11  脱粘损伤加热结束后不同时刻图像
    Figure  11.  Images of different moments of debonding
    图  12  裂痕损伤加热结束后不同时刻图像
    Figure  12.  Images of different moments of crack
    图  13  腐蚀损伤加热结束后不同时刻图像
    Figure  13.  Images of different moments of Corrosion

    分别用FFWA、FWA、IFWA、dynFWA和CFWA计算图 10~图 13中蒙皮损伤图像的边缘检测阈值。并记录在20次迭代过程中各个算法的平均耗时,平均迭代次数和总误差,总误差为20次试验中收敛阈值和遍历得到的真实值差的总和。实验结果在表 4给出。

    表  4  各个算法的实验结果
    Table  4.  The experimental results of each algorithm
    Mean Convergence Time/s Total Error Average number of iterations
    Hyd Deb Cra Cor Hyd Deb Cra Cor Hyd Deb Cra Cor
    t=20 s FFWA 1.116 1.112 1.116 1.112 0 0 1 0 4.5 4 5 4.5
    FWA 1.752 1.750 1.752 1.750 9 11 9 10 6.5 6.5 6 6
    dynFWA 1.429 1.411 1.429 1.411 4 2 4 3 5 5 6 5
    IFWA 1.644 1.640 1.644 1.640 0 1 2 1 5 4.5 5 5
    CFWA 1.539 1.537 1.539 1.537 0 2 0 1 5 5 5.5 4
    t=100 s FFWA 1.100 1.115 1.100 1.115 0 1 0 1 4 4.5 4 5
    FWA 1.771 1.690 1.771 1.690 10 9 9 7 6 6 5 6
    dynFWA 1.430 1.381 1.430 1.381 1 2 4 3 5 5 5 6
    IFWA 1.644 1.640 1.644 1.640 1 0 0 2 5 4.5 4 5
    CFWA 1.539 1.537 1.539 1.537 0 0 2 4 5 6 5 4.5
    t=200 s FFWA 1.110 1.109 1.112 1.110 0 1 0 1 5 5 4.5 6
    FWA 1.746 1.742 1.757 1.751 5 7 9 10 6.5 6 5 7
    dynFWA 1.427 1.408 1.423 1.412 1 4 4 6 5 5 4.5 4.5
    IFWA 1.647 1.639 1.645 1.640 0 1 0 2 5 4.5 4 4
    CFWA 1.539 1.537 1.537 1.537 1 0 0 1 5 5 5 4.5
    下载: 导出CSV 
    | 显示表格

    表 4可知,在不同损伤的蒙皮红外图像中,FWA的总误差较大,可见FWA的性能在一定程度上依赖于适应度函数的选取,当适应度函数的全局最优值离零点较远时,可靠性较差。而改进后的FFWA却可以在不同的适应度函数中有着较高的可靠性。计算时间上,FFWA的计算耗时明显低于其他对照组,其中平均比FWA节省了36%,比dynFWA节约了约20%。算法的可靠性方面FFWA,IFWA,CFWA在20次实验中均呈现出较高的可靠性,dynFWA与FWA出现了早熟的情况。

    在大量实验中,不同图像中算法的收敛曲线差异性不大,由于篇幅限制,给出两个具有代表性的收敛曲线,分别是t=100 s时的积水损伤阈值收敛曲线(图 14)与t=100 s时的脱粘损伤阈值收敛曲线(图 15)。

    图  14  积水损伤红外热像图阈值计算的收敛曲线
    Figure  14.  Convergence curves of hydrops
    图  15  脱粘损伤红外热像图阈值计算的收敛曲线
    Figure  15.  Convergence curves of debonding

    图 14可知,FWA与dynFWA收敛于局部最优,FFWA,CFWA,IFWA都在计算初期收敛于最优值范围内,且收敛于最佳阈值附近。图 15收敛曲线和图 14类似,但值得指出的是dynFWA特殊的核心烟花爆炸半径机制使其依赖于初始烟花的位置,如果初始烟花在最优值周围,那么dynFWA无论在速度还是精度方面都有着很良好的表现,如果初始烟花离最优点位置较远,那么最优烟花的爆炸半径会越来越大,使得其火花落在最优值周围的概率很低,会出现收敛非常慢的现象。通过图 14图 15可知,改进后的烟花算法可以在较低的代数内收敛于全局最优值。

    针对大量冷却时间不同红外图像进行边缘检测,结果表明在t=100 s时的损伤边缘特征最明显,边缘检测效果最优。为验证本文算法的有效性,分别用本文算法,基于全局阈值的自适应Canny算法(文献[5]算法),基于最大熵的自适应Canny算法(文献[6]算法),基于Otsu的自适应Canny算法(文献[7]算法)对t=100 s时的积水、脱粘、裂痕与腐蚀图像进行边缘检测,检测结果如图 16~图 19所示。并以运行时间、分割阈值与Pratt品质因数(Pratt figure of merit,PFOM)[22]来作为算法的评价指标,品质因数用来评价边缘点的定位精度:

    $${\rm{Pratt}} = \frac{1}{{\max ({I_{\rm{A}}}, {I_{\rm{I}}})}}\sum\limits_{i = 1}^{{I_{\rm{A}}}} {\frac{1}{{1 + ad_i^2}}} \times 100\% $$ (13)
    图  16  飞机蒙皮积水损伤边缘检测结果
    Figure  16.  Edge detection results of hydrops
    图  17  飞机蒙皮脱粘损伤边缘检测结果
    Figure  17.  Edge detection results of debonding
    图  18  飞机蒙皮裂痕损伤边缘检测结果
    Figure  18.  Edge detection results of cracks
    图  19  飞机蒙皮腐蚀损伤边缘检测结果
    Figure  19.  Edge detection results of corrosion

    式中:IA为检测到的边缘点;II为理想边缘点;d为理想边缘点与检测到的边缘点连线的垂直距离。a是对边缘错位时的惩罚系数(本次实验取0.1)Pratt值越大,则表明检测到的边缘越准确。理想边缘为人工标记的边缘图像。检测结果如表 5所示。

    表  5  4种算法检测对比结果
    Table  5.  The comparison results of four algorithms
    Algorithm Run Time/s Threshold PFOM
    Hyd Deb Cra Cor Hyd Deb Cra Cor Hyd Deb Cra Cor
    Proposed method 2.18 2.18 2.06 2.13 133 137 144 96 0.83 0.96 0.87 0.81
    Global threshold method 3.15 3.15 3.12 3.20 139 120 130 112 0.51 0.74 0.76 0.76
    Maximum entropy method 4.59 4.58 4.51 5.02 120 120 182 80 0.70 0.96 0.83 0.85
    Otsu method 4.33 4.29 4.30 4.17 133 137 144 96 0.83 0.96 0.87 0.81
    下载: 导出CSV 
    | 显示表格

    表 5可知,本文算法和文献[7]算法具有同样的检测阈值和Pratt品质因数,但本文算法的计算耗时却比文献[7]算法减少了49%,比文献[6]算法减少了52%,比文献[5]算法减少了30%。从图 16~图 19中可以更加直观地进行对比。文献[5]算法只在腐蚀图中检测结果较好,其他3幅图像均有明显的误判,文献[6]算法基本可以检测出损伤边缘,本文算法与文献[7]算法一样,都对蒙皮损伤边缘做出了较为准确的检测。

    本文针对传统自适应Canny边缘检测算法检测阈值选取不准确和速度慢的不足,提出基于快速烟花算法的自适应Canny边缘检测,利用快速烟花算法对待检测图像的最大类间方差进行计算,使Canny算法分割阈值获取更加迅速,增强了传统自适应Canny算法的精确性与快速性,改善了Canny算法的检测效果。由于快速烟花算法对传统烟花算法的爆炸半径,产生爆炸火花方式与选择策略提出改进,使改进后的算法在速度与可靠性上又有了一定程度的改善。通过实验数据可知,所提方法具有可行性。

  • 图  1   融合特征的可视化

    Figure  1.   Visualization of the fusion features

    图  2   采样区域

    Figure  2.   Sampling area

    图  3   尺度金字塔

    Figure  3.   Scale pyramid

    图  4   本文算法流程图

    Figure  4.   The flow chart of the proposed algorithm

    图  5   100个视频序列的精度图和成功率图

    Figure  5.   Accuracy diagram and success rate diagram of 100 video sequences

    图  6   不同跟踪环境曲线图

    Figure  6.   The graphs of the different tracking environments

    图  7   四种最优算法可视化效果图

    Figure  7.   Four optimal algorithms visualization

    表  1   6种最新算法的特点

    Table  1   The features of the 6 latest algorithms

    Algorithm Feature Scale
    CSK gray No
    KCF HOG No
    DSST Displacement: HOG,gray;Scale: HOG Yes
    CN gray, CN No
    ASLA - Yes
    IKCF Displacement: gray, HOG, CN;Scale: HOG Yes
    下载: 导出CSV

    表  2   11种算法运行速度对比

    Table  2   Comparison of 11 algorithms' running speeds  fps

    Algorithm CarDark Car4 David2 Sylvester Trellis Average speed
    CT 86.93 73.14 54.85 55.39 63.84 66.83
    IVT 15.70 16.65 15.20 16.58 17.18 16.26
    DFT 13.67 4.07 10.69 7.56 6.38 8.47
    ASLA 1.70 1.21 1.56 1.45 1.65 1.51
    L1APG 0.77 0.43 0.56 0.57 0.53 0.57
    ORIA 22.25 8.19 16.61 4.26 5.61 11.38
    CSK 488.46 52.75 482.92 112.83 67.21 240.83
    KCF 331.10 22.44 291.70 91.07 42.26 155.72
    DSST 54.63 5.32 53.38 14.94 6.96 27.05
    CN 155.09 30.38 258.27 81.25 16.42 108.28
    IKCF 39.23 9.47 46.56 24.85 9.24 25.87
    下载: 导出CSV
  • [1]

    Yilmaz A. Object tracking: a survey[J]. Acm Computing Surveys, 2006, 38(4): 1-45. http://doi.ieeecomputersociety.org/resolve?ref_id=doi:10.1145/1177352.1177355&rfr_id=trans/tp/2009/07/ttp2009071195.htm

    [2]

    Smeulders A W M, Chu D M, Cucchiara R, et al. Visual tracking: an experimental survey[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2014, 36(7): 1442-1468. DOI: 10.1109/TPAMI.2013.230

    [3] 魏全禄, 老松杨, 白亮. 基于相关滤波器的视觉目标跟踪综述[J]. 计算机科学, 2016, 43(11): 1-5, 18. DOI: 10.11896/j.issn.1002-137X.2016.11.001

    WEI Quanlu, LAO Songyang, BAI Liang. Visual Object Tracking Based on Correlation Filters: A Survey[J]. Computer Science, 2016, 43(11): 1-5, 18. DOI: 10.11896/j.issn.1002-137X.2016.11.001

    [4] 孟琭, 杨旭. 目标跟踪算法综述[J]. 自动化学报, 2019, 45(7): 1244-1260. https://www.cnki.com.cn/Article/CJFDTOTAL-MOTO201907003.htm

    MENG Lu, YANG Xu. A Survey of Object Tracking Algorithms[J]. Acta Automatica Sinica, 2019, 45(7): 1244-1260. https://www.cnki.com.cn/Article/CJFDTOTAL-MOTO201907003.htm

    [5] 徐康, 龙敏. 增强尺度估计的特征压缩跟踪算法[J]. 红外技术, 2018, 40(12): 1176-1181. http://hwjs.nvir.cn/article/id/hwjs201812010

    XU Kang, LONG Min. Feature Compression Tracking Algorithm with Enhanced Scale Estimation[J]. Infrared Technology, 2018, 40(12): 1176-1181. http://hwjs.nvir.cn/article/id/hwjs201812010

    [6] 刘教民, 郭剑威, 师硕. 自适应模板更新和目标重定位的相关滤波器跟踪[J]. 光学精密工程, 2018, 26(8): 2100-2111. https://www.cnki.com.cn/Article/CJFDTOTAL-GXJM201808032.htm

    LIU Jiaomin, GUO Jianwei, SHI Shuo. Correlation filter tracking based on adaptive learning rate and location refiner[J]. Optics and Precision Engineering, 2018, 26(8): 2100-2111. https://www.cnki.com.cn/Article/CJFDTOTAL-GXJM201808032.htm

    [7] 叶瑞哲, 许卓斌. 基于自适应搜索的空时上下文目标跟踪算法[J]. 微电子学与计算机, 2018, 35(6): 88-91. https://www.cnki.com.cn/Article/CJFDTOTAL-WXYJ201806019.htm

    YE Ruizhe, XU Zhuobin. Spatio-Temporal Context-based Object Tracking Algorithm in Video Surveillance[J]. Microelectronics & Computer, 2018, 35(6): 88-91. https://www.cnki.com.cn/Article/CJFDTOTAL-WXYJ201806019.htm

    [8] 胡昭华, 钮梦宇, 邵晓雯, 等. 多层深度特征的目标跟踪算法研究[J]. 现代电子技术, 2019, 42(1): 51-56. https://www.cnki.com.cn/Article/CJFDTOTAL-XDDJ201901013.htm

    HU Zhaohua, NIU Mengyu, SHAO Xiaowen, et al. Research on object tracking method based on multi-level deep feature[J]. Modern Electronics Technique, 2019, 42(1): 51-56. https://www.cnki.com.cn/Article/CJFDTOTAL-XDDJ201901013.htm

    [9]

    Bolme D S, Beveridge J R, Draper B A, et al. Visual object tracking using adaptive correlation filters[C]//2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition IEEE, 2010: 2544-2550.

    [10]

    Henriques J F, Caseiro R, Martins P, et al. High-speed tracking with kernelized correlation filters[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(3): 583-596. DOI: 10.1109/TPAMI.2014.2345390

    [11]

    Felzenszwalb P F, Girshick R B, McAllester D, et al. Object detection with discriminatively trained part-based models[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(9): 1627-1645. DOI: 10.1109/TPAMI.2009.167

    [12]

    Danelljan M, Shahbaz Khan F, Felsberg M, et al. Adaptive color attributes for real-time visual tracking[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2014: 1090-1097.

    [13]

    Van De Weijer J, Schmid C, Verbeek J, et al. Learning color names for real-world applications[J]. IEEE Transactions on Image Processing, 2009, 18(7): 1512-1523. DOI: 10.1109/TIP.2009.2019809

    [14]

    Danelljan M, Häger G, Khan F, et al. Accurate scale estimation for robust visual tracking[C]//British Machine Vision Conference, 2014: 1-11.

    [15]

    Mueller M, Smith N, Ghanem B. Context-aware correlation filter tracking[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017: 1396-1404.

    [16]

    Henriques J F, Caseiro R, Martins P, et al. Exploiting the circulant structure of tracking-by-detection with kernels[C]//European Conference on Computer Vision, 2012: 702-715.

    [17]

    LI Y, ZHU J. A scale adaptive kernel correlation filter tracker with feature integration[C]//European Conference on Computer Vision, 2014: 254-265.

    [18]

    WU Y, LIM J, YANG M H. Object Tracking Benchmark[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(9): 1834-1848. DOI: 10.1109/TPAMI.2014.2388226

    [19]

    YUN S, CHOI J, YOO Y, et al. Action-decision networks for visual tracking with deep reinforcement learning[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017: 2711-2720.

    [20]

    LI Y, FU C, HUANG Z, et al. Keyfilter-aware real-time uav object tracking[C]//2020 IEEE International Conference on Robotics and Automation (ICRA), 2020: 193-199.

  • 期刊类型引用(6)

    1. 张宇,张健,齐林. 基于遗传算法优化Canny算子的织绣文物纹样抽取方法研究. 丝绸. 2024(06): 1-12 . 百度学术
    2. 严丹昭,陈晶,兰旺耀,廖一鹏. 基于表层温度深度学习的电缆接头绝缘劣化非接触式诊断. 红外技术. 2024(06): 712-721 . 本站查看
    3. 王鑫刚,田军委,于亚琳,王沁,张杰. 改进Canny算法的红外人脸图像边缘轮廓提取. 应用光学. 2023(01): 61-70 . 百度学术
    4. 肖建英,邓强. 三维光学模型的激光图像边缘检测研究. 激光杂志. 2023(08): 110-114 . 百度学术
    5. 涂伟沪,蔡玲霞,李学军. 基于改进蝗虫算法优化Canny算子的鸡蛋裂纹图像检测. 食品与机械. 2022(02): 167-172+202 . 百度学术
    6. 赵一鸣,胡燕海. 用于小型注塑件边缘提取的改进坎尼算法. 机械制造. 2022(07): 1-5+11 . 百度学术

    其他类型引用(1)

图(7)  /  表(2)
计量
  • 文章访问数:  338
  • HTML全文浏览量:  68
  • PDF下载量:  55
  • 被引次数: 7
出版历程
  • 收稿日期:  2019-06-07
  • 修回日期:  2021-03-18
  • 刊出日期:  2021-05-21

目录

/

返回文章
返回
x 关闭 永久关闭

尊敬的专家、作者、读者:

端午节期间因系统维护,《红外技术》网站(hwjs.nvir.cn)将于2024年6月7日20:00-6月10日关闭。关闭期间,您将暂时无法访问《红外技术》网站和登录投审稿系统,给您带来不便敬请谅解!

预计6月11日正常恢复《红外技术》网站及投审稿系统的服务。您如有任何问题,可发送邮件至编辑部邮箱(irtek@china.com)与我们联系。

感谢您对本刊的支持!

《红外技术》编辑部

2024年6月6日