摘 要: 当前,在自然语言处理领域,文本情感分析是其中一个十分重要的研究对象。互联网已成为社会不可或缺的一部分以及在各个社交媒体上所发表的信息也大幅度增长,各个电商平台下的评论似满天星,很多网友能在网上发表各种具有情感倾向性的意见,这样就能有海量的数据应用于文本情感分析。而大量的数据将包含很多有价值的信息,例如社会热点事件的发酵趋势,以及各种电子商务产品评估带来的潜在好处,并且消费者们能够依据购物评论和就餐评论等决定自己的购买选择。
情感分析研究运用的方法有很多,其中最重要的方法之一就是机器学习,其发展过程从最初的情感词典评估,再到情感特征提取,进而引入支持向量机、朴素贝叶斯等分类器,再到目前应用最多的深度学习。2006年,Bengio等人提议出了有关深度学习的概念,并且深度学习模型在很多领域上都得到了广泛的应用。
在二十一世纪初,发展最为重要的循环神经网络,它本身最杰出的能力是处理序列能力。而循环神经网络(Recurrent Neural Networks, RNN)中最常见的是长短记忆网络(Long Short Term Memory Networks, LSTM)。而卷积神经网络(Convolutional Neural Networks, CNN)的发展也较为不错,它最大的特点就是卷积控制模型,因此它提取的文本特征的序列更加高级。由此知,深度学习的应用比传统的机器学习更为广泛。
则本文着眼于研究机器学习算法,其主要运用的神经网络模型为LSTM、CNN、MLP。通过实验评价指标分析出机器学习算法在文本多粒度情感分析中的性能以及差异。
关键词:情感分析;机器学习;深度学习
目录
摘要
Abstract
1 绪论-1
1.1 研究背景及意义-1
1.2 国内外研究现状-1
1.2.1 情感分析的研究现状-1
1.2.2 深度学习的研究现状-2
2-机器学习-3
2.1 机器学习的发展历程-3
2.2 传统的机器学习方法-3
2.2.1 支持向量机-3
2.2.2 朴素贝叶斯-4
2.3 深度学习-5
2.3.1 深度学习的概念-5
2.3.2 深度学习的特点-6
2.3.3 神经网络常见分类-6
3-情感分析-12
3.1 文本情感分析的原因-12
3.2 多粒度情感分析理论基础-12
3.3 情感分析实验流程-13
3.3.1 文本的预处理-13
3.3.2 基于深度学习的情感分析模型-14
4-实验结果分析-17
4.1 实验环境配置-17
4.2 实验数据预处理-17
4.2.1 实验数据集介绍-17
4.2.2 英文切片-18
4.3 实验评价指标-18
4.4 词向量训练-19
4.5 实验参数设置-20
4.6 实验结果与分析-20
5-总结与展望-22
5.1 总结-22
5.2 展望-22
参 考 文 献-23
致 谢-25