|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
基于卷积神经网络和监督核哈希的图像检索方法
' y& S$ c3 z8 P; O; k! |. M1 I; t! l6 h$ d: [$ }7 K* U4 y
摘要:当前主流的图像检索方法采用的视觉特征,缺乏自主学习能力,导致其图像表达能力不强,此外,传统的特征索引方法检索效率较低,难以适用于大规模图像数据.针对这些问题,本文提出了一种基于卷积神经网络和监督核哈希的图像检索方法.首先,利用卷积神经网络的学习能力挖掘训练图像内容的内在隐含关系,提取图像深层特征,增强特征的视觉表达能力和区分性;然后,利用监督核哈希方法对高维图像深层特征进行监督学习,并将高维特征映射到低维汉明空间中,生成紧致的哈希码;最后,在低维汉明空间中完成对大规模图像数据的有效检索.在ImageN-et-1000和Calech-256数据集上的实验结果表明,本文方法能够有效地增强图像特征的表达能力,提高图像检索效率,优于当前主流方法.3 g; r* K! n3 h8 V
关键词:深度学习;图像检索;卷积神经网络;近似近邻检索;监督核哈希7 I/ a) O" O1 q
* S, X4 [. A# o. y0 K6 g1 u/ U3 s. W$ O7 I* ?
1引言& V# m9 |6 r0 r2 k; [
随着大数据时代的到来,互联网图像资源迅猛增长,如何对大规模图像资源进行快速有效地检索以满足用户需求亟待解决.图像检索技术由早期的基于文本的图像检索('Text-based Image Retrieval , TBIR)逐渐发展为基于内容的图像检索(Content-based Image Retrieval,CBIR),CBR通过提取图像视觉底层特征来实现图像内容表达.虽然视觉底层特征中,如GIST "],SIFT[2]、SURFl3]等在图像处理领域表现出优良的性能,但是生成这些描述子时固定的编码步骤使得描述子缺少学习能力,限制了其图像内容表达能力,难以适应多样的图像数据./ y) \# h4 y+ u/ O3 P- r2 }
为得到大量图像数据的内在隐含关系,生成更具有区分性和代表性的特征, Hinton 等学者4~6将深度学习应用于图像处理领域中,为提取更加有效的图像特征提供了新思路. Tang 等7将 DBN第一层采用稀疏化连接,同时利用概率降噪算法提高DBN输出特征对噪声的鲁棒性.Lee 等l8构建了卷积深度置信网络(Conv-olutional Deep Belief Network , CDBN),利用CDBN能从未标注的自然图像中学习有效的高阶特征表示. Huang等(9在CDBN的基础上提出了局部卷积受限玻尔兹曼机(Local Convolutional Restricted Boltzmann Machines,LCRBM)模型,该模型利用对象类的总体结构学习特征,在人脸识别任务中取得非常好的效果.He等[10]通过在卷积神经网络(Convolutional Neural Network , CNN)的卷积层和全连接层加入SPP( Spatial Pyramid Pooling)层,直接对不同大小图像进行学习并生成多尺度特征.但是,深度学习生成的图像特征维数较高,存在维数灾难问题,当图像数据规模较大时,若采用传统的最近邻检索方法(如R-treel"], KD-tree 2]等)进行检索就会使检索速度急剧下降,难以适用于大规模数据.
0 b4 L2 p: u( L, \& H
9 W1 a8 {% ^& K! R0 O c3 u2 c O$ g3 }3 u& a& n r
2 ?2 e4 _/ x k- i0 A# H
# p* @2 R& x8 ^6 V* ?% N
& R" W! w# T1 p' U0 i
|
|