摘要:随着移动端互联网技术的发展加快,社交网络在人们的生活中占有越来越大的比重,从原来单一的平面媒体、广播、电视到现在多元化的互动社交平台,人们获取信息和发布信息的方式也变得越来越多样化,与此同时也带了大量的数据,开启了海量数据下的数据挖掘时代。新浪微博作为国内最大的在线社交网络平台,允许用户随时随地以短文本的方式表达自己的所思所想。本文正是以新浪微博这一社交网络平台为例,通过有效的分析方式,研究分析用户的行为,并以用户的行为做为基础对不同的用户进行个性化的微博内容推荐,从而可以帮助用户提升使用微博的愉悦感。
关键词 社交网络;用户行为;主题提取;兴趣建模;内容推荐
目录
摘要
Abstract
1绪论-1
1.1研究背景-1
1.3研究内容和意义-2
1.4研究方法-2
1.5技术路线-2
2.相关理论综述-3
2.1大数据的理论综述-3
2.2社交网络理论综述-4
2.3用户行为理论综述-4
2.3.1用户行为-4
2.3.2网络用户行为-4
2.4社交网络中的用户行为分析-5
3.微博用户行为分析-6
3.1微博概况-6
3.2微博用户构成及使用动机-6
3.3微博中的用户行为-7
3.3.1微博用户主要行为-8
3.4转发、评论、点赞等典型用户行为分析-11
3.5用户行为和用户兴趣的关系-13
4基于用户行为的用户兴趣模型搭建-14
4.1用户兴趣的建模步骤-14
4.2相关技术介绍-14
4.2.1中文文本分词技术-14
4.2.2中文分词工具-15
4.2.3词袋模型-15
4.2.4贝叶斯分类-16
4.3 LDA主题模型-16
5.实验及结果分析-18
5.1数据预处理-18
5.2词频提取-18
5.3文本向量化-20
5.4建立LDA主题模型-20
5.5用户兴趣及个性化推荐-22
结论-24
致谢-26
参考文献-27