摘要:现代信息网络高速联通,传统的语言表达借助互联网技术的成熟发展得以飞快地传播,人们也越来越喜欢凭借互联网传达他们的价值观和情感。网络文本正以非同寻常的速度不断堆积,在这样的环境下就必然涉及到了自然语言处理技术中的情感分析,该技术的主要任务是处理互联网中的舆论信息,因为只有运用计算机的方法才能够处理如此庞大的网络文本。所谓的情感分析研究也就是分析大数据,该技术的目标就是要发掘出数据中的情感信息。而具体分析用户的态度(情感、观点),判别文本的主客观性,这种方法叫做文本情感的倾向性分析。具体对于主观信息需要判别其情感倾向,也就是判别其是正面、负面还是中性的。本文主要采用多粒度的情感分析方法进行实验,这类方法可以自动适应不同的粒度,快速响应处理多粒度的文本,最终根据不同粒度而获得相似的情感分析效果。
关键词:自然语言处理;情感分析;多粒度;AT-LSTM
目录
摘要
Abstract
1-绪论-1
1.1-研究背景-1
1.2-情感分析的定义和方法-1
1.3-研究现状及发展趋势-1
1.4-本文组织结构-1
2-相关理论基础-3
2.1-机器学习-3
2.1.1-机器学习基础概念-3
2.1.2-一种常用的分类算法——逻辑回归-3
2.2-神经网络和深度学习-5
2.2.1-人工神经网络简介-5
2.2.2-深度学习下的神经网络-6
2.2.3-神经网络的构建及分类-6
2.3-自然语言处理中的深度学习-10
2.3.1-自然语言处理基本概念-10
2.3.2-自然语言处理与神经网络的结合-10
3-前期准备-12
3.1-神经网络模型的情感分析流程-12
3.2-多粒度LSTM网络模型的构建-12
3.2.1-长短期记忆网络模型(Long Short-Term Memory)-12
3.2.2-多分类问题-16
3.3-神经网络模型的学习过程-16
3.3.1-神经网络的代价函数-16
3.3.2-反向传播算法-17
3.3.3-神经概率语言模型-18
3.4-AT-LSTM网络模型的构建-18
3.4.1-编码器—解码器的RNN模型-18
3.4.2-注意力机制-19
3.4.3-基于注意力机制的LSTM(AT-LSTM)-21
4-实验-23
4.1-实验环境-23
4.2-数据的相关处理-23
4.2.1-本文的数据信息-23
4.2.2-英文切词-23
4.3-AT-LSTM网络模型的情感分析训练与预测-24
4.3.1-实验参数设置-24
4.3.2-实验评价指标-24
4.3.3-AT-LSTM训练词向量-25
4.3.4-实验结果与分析-26
5-总结和展望-29
参 考 文 献-30
致 谢-32