摘要:随着网络技术的飞速发展,互联网上以短文本为主要内容的形式已经逐渐确立了其相对其他文本内容显著的优势。微博是诸多在线交流形式中的一种,而微博相对于其他形式来说具有简短、操作性强和即时性等特点,成为国内外一个流行的热点。人们可以通过微博发布博文、对他人的博文做出评论,也可以对某些人、热门事件等发表个人的观点看法,也可以通过回复评论互相交流意见、近一步给出正负评价。
本文研究了基于支持向量机的微博情感分类方法,主要的方向是微博文本的情感分类问题。研究的出发点是从微博文章或者评论的文本中直接区分出带有正面或者负面的情感信息,使用的工具是MATLAB,以此来观察大众对明星公众人物或社会热点问题的看法和立场。本文所提到的文本情感分类的实用目的是利用机器代替人类脑力完成微博文本的情感分类工作,用具体的数字代替人类的感性认知。
关键词:微博;情感分类;文本;预测;信息
目录
摘要
Abstract
1 绪论-1
1.1 研究背景及意义-1
1.2 在国内外的研究现状-1
1.3 研究主要内容-2
2 文本情感分类-3
2.1 情感分类研究现状-3
2.2 文本情感分类-3
2.3微博文本情感分类方法-4
2.3.1 基于支持向量机的微博文本情感分类方法-4
2.3.2 基于语义规则的微博文本情感分类方法-5
2.3.3 两种方法对比-5
2.4 本章小结-5
3 系统功能设计-7
3.1 系统设计总方案-7
3.2爬虫的基本原理-7
3.3 支持向量机(SVM)的基本思想-8
3.4情感词典的构建-9
3.5 本章小结-10
4 系统验证与分析-11
4.1 系统的验证-11
4.2 抓包数据处理-11
4.3 建立模拟词典-14
4.4 运行结果-15
4.5 本章小结-16
结 论-17
参 考 文 献-18
附录A 部分程序-19
致 谢-21