一个关于visual tracking的benchmark

自从工作后,就很少接触visual tracking这个领域了。最近下班没事,浏览博客看到几篇CVPR2013关于visual tracking的paper,其中有一篇名为Online Object Tracking: A Benchmark的paper对目前该领域几乎大部分优秀算法做了一个分析和评估,提出了更为严谨合理的评估方法。作者是University of California at Merced的一个博士后,以前好像是自动化所的一个博士。他针对29个算法,测试了50个视频,并且标记了所有视频的groundtruth,其耐心和毅力值得敬佩。

分析算法特性

当然,作者不是简单的罗列出所有的算法,而是针对目前的存在的算法,总结出四个模块:Representation Scheme,Search Mechanism,Model Update,Context and Fusion of Trackers。个人觉得前三个模块的确是visual tracking最重要的部分,Representation Scheme方面,算法的提出相对热闹些:基于图像原始像素值(如Lucas and Kanade稀疏点的光流法),直方图(如color histograms, histograms of oriented gradients (HOG)等),Harr-like特征,binary feature,基于sparse representation等等。Search Mechanism方面,可以用的方法相对就会比较单一。对于跟踪算法是基于最优化函数框架的算法,跟踪物体的位置通过local optimum search确定位置。而对于算法是基于binary classifier的,方法主要有两种:particle filter和dense sampling search。Model Update方面,对于binary classifier就是训练样本的更新。对于subspace-based tracking就是物体外观图像块的update。

Read More