摘要:随着AR技术的不断进步,AR图书市场不断发展和扩大,对AR图书质量水平提出了更高的要求,同时AR图书质量问题的出现在许多方面让用户对AR技术运用到图书上产生了质疑。而互联网的发展使越来越多的用户趋向于在网络平台上购买图书并发表自己的观点和情感,很多质量问题也通过在线评论慢慢显露出来,急需使用数据挖掘技术对在线文本进行提取分析来获得有用的信息,如果尽早发现这些质量问题,可以为买家、卖家和厂家三方提供很大的帮助,所以如何从图书在线评论中挖掘到有效信息来调查研究AR图书质量是本文的研究重点。
本文收集当当网、京东和亚马逊三大网站上的图书在线评论,研究如何提取图书特征及进行情感分析,从而得到数据挖掘的结果,帮助买家、卖家及厂家作出科学的决策。
本文首先收集三大网站上的图书在线评论,构建原始的评论数据库;利用NLPIR分词软件进行文本分词处理、词性标识;构建词表,删去停用词,形成语料库;针对产品特征词和情感词进行分类,统计AR图书产品特征的情感极性。最后,展示在线评论的可视化调查结果来调查AR图书的质量。
研究结果表明,用户往往关注的较多的是图书的内容、包装、价格、app、AR技术及媒体制作的画面。AR图书在图书的包装、AR技术和媒体制作方面基本得到了用户的认可,而在app的运行和操作方面表现的很差,需要开发商进行改进,从这方面的到消费者的认可。
关键词:产品质量;在线产品评论;图书评论;情感分析;数据挖掘
目录
摘要
ABSTRACT
1绪论-1
1.1研究背景-1
1.2研究目的和意义-1
1.3研究方法与技术路线-2
1.3.1研究方法-2
(1)文献研究法-2
(2)调查研究法-2
1.3.2技术路线-2
1.4研究内容-3
1.5研究创新点-4
2文献综述-4
2.1图书质量研究现状-4
2.2 在线评论内容的研究现状-5
2.3产品特征挖掘的研究现状-6
3相关理论和技术-6
2.1文本情感分析-6
2.2中文分词理论-7
2.3分词软件-8
2.4 HowNet情感词典介绍-9
4研究过程-10
4.1研究流程设计-11
4.2数据抓取-12
4.3数据预处理-12
4.4数据整理-13
4.4.1 建立词表-13
4.4.2挖掘结果-18
4.5数据可视化分析-22
5结论与展望-27
5.1研究总结-27
5.2研究展望-27
参考文献-29
致谢-31