|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
* j0 w0 ~9 p: ?. O; j m) [融合标签关联关系与用户社交关系的微博推荐方法
, w4 _4 R) m8 Z9 `9 Z) T
* e" P& F2 E$ o M+ l摘要:通过分析微博特点及现有微博推荐算法的缺陷,提出一种融合了标签间关联关系与用户间社交关系的微博推荐方法.采用标签检索策略对未加标签和标签较少的用户进行加标,构建用户-标签矩阵,得到用户标签权重,为了解决该矩阵中稀疏的问题,通过挖掘标签间的关联关系,继而更新用户-标签矩阵.考虑到多用户之间社交关系对挖掘用户兴趣并进行微博推荐的重要性,构建用户-用户社交关系相似度矩阵,并与更新后的用户-标签矩阵进行迭代,得到最终的用户兴趣并进行相关推荐.实验证明了该算法针对微博信息推荐是有效的.: G2 Z& L$ |6 k, t! W6 n
关键词:微博推荐;标签检索;用户-标签矩阵;用户标签权重;标签关联关系;用户-用户社交关系相似度矩阵4 v6 `- N3 i/ V5 ~- W5 d* ~) D
- L4 [# Y% [$ D( J
1 b/ Q; \4 ~+ j V# t# J! ]7 K9 [
1引言" W+ @9 t' l8 N8 R: I
随着Web2.0技术、无线网络技术和移动通信4G技术的发展,微博社交网络平台应运而生.如何在此平台中为用户提供个性化的服务,筛选出高质量的内容变得非常重要,而准确的发现用户的兴趣则是实现这种个性化服务的前提.在此前提下,大量的用户兴趣推荐算法应运而生.针对微博长度短,内容稀疏的特点,多数研究人员多从扩展文本特征,丰富语义的角度出发进行文本表示.主流的方法多使用外部数据库进行语义扩充.少数研究人员对文本特征向量进行缩减,利用极少数词表示用户的兴趣[2.由于微博中的标签是用户专门添加来描述自身特征的,其对于描述用户兴趣具有重要意义.在互联网其他领域的研究中,已经有一些工作开始考虑使用标签信息来表示用户兴趣3.在推荐研究[4.5]方面,虽然已有人采用标签来发掘用户兴趣[67],也已有研究人员挖掘用户的关系进行推荐[8.p],但并未考虑多标签之间存在着一定的关联关系,更是很少有人将标签间关系与用户间关系融合表征用户兴趣进行相关微博推荐.
, ~6 I) T+ h7 k" ^$ ~& k本文提出了一种融合了标签间关联关系与用户间社交关系的微博推荐方法.对于无标签以及标签较少的用户,通过标签检索策略获取相应标签,继而构建用户-标签矩阵,得到初始用户标签权重,考虑标签与标签间的关联关系,通过挖掘被同一用户标注的多标签的内联关系与被不同用户标注的多标签外联的关系,构建合理的多标签关联关系矩阵,对用户-标签矩阵进行更新.另外,考虑用户与用户之间的社交信息关系,构建合理的用户间社交关系相似度矩阵,并与更新后的用户-标签矩阵进行迭代,得到最终的用户标签权重.与忽略标签与用户间关系的微博推荐算法对比,本文提出的推荐方法能够更有效地进行微博推荐.图1为文章算法程序流程图,主要由标签关联关系与用户社交关系两部分组成,该算法的输入是微博信息流,输出为微博的推荐序列.8 Q0 Z y! X2 M2 c4 a: C- w9 Z
) p% T% f1 A2 y1 a8 p' B
" H d+ l& i* B* K0 a
4 A: ^6 _/ P. W! f2 o& N
9 x7 e$ g6 I! j5 o }% u1 f. V: H
|
|