基于弱监督 E2LSH 和显著图加权的目标分类方法

TaylorA · 发表于 2020-11-9 17:25

EDA365欢迎您登录！

您需要登录才可以下载或查看，没有帐号？注册

x

摘要：在目标分类领域，当前主流的目标分类方法是基于视觉词典模型，而时间效率低、视觉单词同义性和歧义
性及单词空间信息的缺失等问题严重制约了其分类性能。针对这些问题，该文提出一种基于弱监督的精确位置敏感
哈希(E2LSH)和显著图加权的目标分类方法。首先，引入 E2LSH 算法对训练图像集的特征点聚类生成一组视觉词
典，并提出一种弱监督策略对 E2LSH 中哈希函数的选取进行监督，以降低其随机性，提高视觉词典的区分性。然
后，利用 GBVS(Graph-Based Visual Saliency)显著度检测算法对图像进行显著度检测，并依据单词所处区域的显
著度值为其分配权重；最后，利用显著图加权的视觉语言模型完成目标分类。在数据集 Caltech-256 和 Pascal VOC
2007 上的实验结果表明，所提方法能够较好地提高词典生成效率，提高目标表达的分辨能力，其目标分类性能优
于当前主流方法。
关键词：目标分类；视觉词典模型；精确位置敏感哈希；视觉显著图；视觉语言模型
1 引言
视觉词典模型(Bag of Visual Words Model,
BoVWM)[1 4]的出现迈出了由图像底层特征向高层
视觉语义过渡的第 1 步。由于其性能优越，在图像

分类[5]等领域的应用十分广泛，然而，以下几个关键
问题的存在却极大地限制了其性能。首先是词典生
成效率低，当前主要的词典生成算法(如 K-Means[1])
在对特征点[6]聚类时都需要多次迭代高维近似近邻
计算，随着数据量的增大时间效率会急剧下降。其
次是传统聚类算法的初始聚类中心大都是随机生成
的，导致聚类结果对噪声的鲁棒性较差且容易引起
视觉单词同义性和歧义性问题[7]。此外，传统的视觉
词典模型都面临视觉单词空间信息缺失的问题，极
大地降低了该模型的语义表达能力。

附件下载：

游客，如果您要查看本帖隐藏内容请回复

StepPeng33 · 发表于 2020-11-9 17:59

学习下

帐号		自动登录	找回密码
密码			注册

[毕业设计] 基于弱监督 E2LSH 和显著图加权的目标分类方法

EDA365欢迎您登录！

浏览过的版块

推荐内容 /1