|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
基于情感标签的极性分类
, k4 p. Y! a3 ^3 g/ P' U9 p' c摘要:情感极性分析是文本挖掘中一种非常重要的技术.然而在不同领域中,很多情感极性分类系统存在分类精度低和缺少大量标注数据的缺陷.针对这些问题,提出了一种基于情感标签的极性分类方法.首先通过所有文本建立Sentiment-Topic模型,抽取出文本的情感标签;然后利用情感标签将文本划分为两个子文本,并通过Co-training算法对子文本进行分类;最后合并两个子文本的分类结果,并确定文本的情感极性.实验结果表明该方法具有较高的分类精度,而且不需要大量的分类样本.
0 b9 F: B* O# `关键词:极性分类;情感标签;半监督学习;co-training学习. d5 |3 q" D! q1 E. C. s! a
/ A6 p- L' N: d# X$ o- Y# c' E! o1 引言8 u. s4 k( _" B- |* T. v
近些年来,文本情感极性分析受到越来越多的关注[1~52,这是因为许多用户在互联网上分享自己的观点或体验来表达自己的各种情感色彩和情感极性,如喜、怒,哀、乐和批评、褒扬等6.此外,生产厂商可以根据大众的口碑有针对性地提高产品的服务质量,赢得更多的经济效益.' |: m1 t! s M# G) c; B6 `
目前,由于文本中含有复杂情感表达和大量的情感歧义,导致分类的准确率很低.例如,“交通方便服务周到,很不错的酒店.唯一不满的是价格没有竞争力,比汉庭还贵.而且没有早餐送,比较遗憾.”作者首先给予了正面评价,之后又提出了不足之处.而评论的情感极性是正面的,正是由于情感词“方便”、“周到”和“不错”的重要性远远要高于其他情感词.并且“方便”与“周到”、“不错”之间存在着潜在的联系.这是因为在对酒店正面评价时,自然而然地,文本中还有一些其他对酒店正面评价的情感词.因此,文本的情感极性分类是一项非常复杂的任务[7,如何从文本中抽取出关键的情感词,将对文本的情感极性分析具有极其重要的作用.针对上述问题,本文研究通过情感标签对文本进行情感极性分析.所谓情感标签,是指文本中那些关键的情感词.在情感标签抽取时,考虑了情感词的3个特征,分别是情感词的关键度﹑情感词间的相关度和情感词的位置特征.关键度是用来衡量该词在文本中的重要程度,相关度是衡量其他词对该词的影响程度,位置特征是该词所属句子在文本中的具体位置.2 E4 n( P: I7 |5 C
! R& R; S+ p8 u( g; i2 t% Y
7 K4 H. {" i. I% i! S. s9 v' m) Q2 h" D6 \
|
|