摘要:随着近年来社会的发展,网络小说变得越来越流行,越来越多的年轻人喜欢看网络小说,同时网络小说的质量参差不齐引人堪忧。不良的小说对于青少年的世界观、人生观有着众多不好的影响。另外,网络小说的流行也对传统小说的发展产生了一定的阻碍,传统小说开始走向没落。基于这种社会现状,本文将通过文本挖掘,聚类分析网络小说和传统小说的特点试图找出解决相关社会问题的方法。
综合文章分析,研究出了网络小说与传统小说的各自特点,并根据这些特点分析出网络小说与传统小说各自存在的问题和改进方法。传统小说存在着传播性弱以及网络小说存在着文学水平参差不齐的问题。针对传统小说传播性弱的问题,笔者认为传统小说应该加强宣传,同时紧跟互联网的潮流,在网上流行的小说网站中增加传统小说的比例和宣传。而对于网络小说质量差的问题,则应该提高小说网站上架的标准,质量特别差的网络小说不得通过审核。另外,加强引导,促进读者们的审美提高。
本文的分析包含三个特色:(1)真实有效的数据;(2)使用了文本挖掘、聚类分析等统计方法,逐步深入、逐层解剖,逻辑清楚。(3)分析传统小说和网络小说的情况好坏原本是人的主观判断,本文则通过客观的数据来分类归纳特点,基本排除了主观的影响,使得该分析更加具有权威性。
关键词:文本挖掘、词频分析、聚类分析、网络小说、传统小说
目录
摘要
Abstract
第一章 引言-5
第二章 文献综述-5
第三章 数据来源(小说情况)-10
第四章 特征分析-12
(一)词云图统计-12
(二)色彩偏好词频统计-13
(三)季节词频统计-16
(四)情绪词频分析-17
(五)对话词频统计-17
(六)豆瓣评分统计-18
(七)贴吧数量统计-18
第五章 聚类-19
(一)色彩偏好聚类-19
(二)季节聚类-20
(三)情绪聚类-22
(四)小说整体聚类-23
第六章 总结-24
参考文献-25