摘要:在自然语言处理领域,文本的情感分析已经成为了研究的热门方向。微博、淘宝、美团、携程、当当等网站的评论信息都有着巨大的商业价值和社会价值。与此同时,大数据时代的到来,使得探索数据中隐藏的信息变得尤为重要。对于中文文本的情感倾向性研究,在这样的大环境下也得到了飞快的发展。本文首先介绍了文本情感分析的研究现状和基于机器学习分类中神经网络模型的文本情感分析方法,然后利用爬虫软件收集了21101条文本,运用python软件对短文本进行预处理,采用中文短文本情感分类的TFIDF权值计算方法进行特征权值计算,通过神经网络模型进行情感分类,分词结果用词云展示。本文主要通过用ROC曲线和准确率来分析准确率,得到AUC=0.904,总体准确率高达83.39%。
关键词:情感分析;情感分类;文本情感模型
目录
摘要
Abstract
1 引言-1
2 理论知识-2
3 文本情感模型-5
3.1 空间向量模型-5
3.2 神经网络模型-5
4 情感分类应用-8
4.1文本预处理及分词-8
4.2 文本分析结果-15
5 结论-19
参考文献-20
致谢-21