摘要:近十几年来,就微博的快速发展,微博数据成倍增长,如何利用数据获得有用的信息,成为了研究的热点。其中,微博情感预测是一个热门的方向,他在分析与预测时事走向、反馈产品意见、分析消费者爱好等方面都有广泛的应用。
本文主要介绍了基于特征融合和基于情感词典的分析方法,并且本文采用了基于情感词典的情感预测方法。该算法的基础是情感词典,目标是包含有明显正、负情感词的微博,该算法又结合了多个程度词字典,从多个角度描述微博,通过对情感词的加权求和,得到情感值,从而对情感进行分类。最后用PyQt设计了一个情感分类的可视化界面,通过输入一段文本,得到相应的情感分类结果。
关键词:情感分类;情感词典;情感值计算
目录
摘要
Abstract
1 绪论-1
1.1 课题研究背景-1
1.2 课题的研究目的和意义-2
1.3 国内外研究现状-2
1.4本文的主要内容-4
2 相关技术和资源-5
2.1 预处理技术-5
2.2 情感资源-5
2.3 本章小结-6
3 基于情感词典的情感分类-7
3.1 微博的情感分类介绍-7
3.2 基于情感词典的情感分类算法-7
3.3 本章小结-9
4 基于特征融合的情感分类-10
4.1 词性特征对情感分类的影响-10
4.2 特征选择和融合-10
4.3本章小结-11
5 基于PyQt的情感可视化实现-12
5.1 PyQt的介绍-12
5.2 PyQt的设计与实现-12
结 论-14
参 考 文 献-15
附 录-17
致 谢-21