摘要:随着社交网络的快速发展,生活中人们对其的依赖度越来越高,虚拟的社交网络平台现如今已经成为人们生活中重要的通信及社交工具,其强大的在线社交功能时时刻刻都在影响着人们的生活。新浪微博其活跃用户量连续十季度增长超过30%,如今微博月活跃用户达3.4亿。如此庞大的用户数目,蕴藏着海量的数据信息,本系统是对新浪微博数据信息进行分析,从而能更好的挖掘其潜在价值,可以应用到其他行业。本论文首先介绍了影响力算法,而本系统是从中选取F-F算法与平均转发数算法相结合计算出用户的影响力,然后绘制影响力分布图加载到系统功能中;之后介绍了SEISMIC模型,通过估计帖子的传染率而预测最终转发数,做出分布图并通过系统显示;最后利用PyQt4设计系统用户界面,利用python编程实现系统各功能。
关键词:社交网络;影响力;SEISMIC模型
目录
摘要
Abstract
1 绪论-1
1.1-课题产生的背景-1
1.2-课题研究的目的-1
1.3-课题的要求及主要内容-1
2 影响力计算-3
2.1 Follower-Friend算法-3
2.1.1 算法思想-3
2.1.2 算法步骤-4
2.2 平均转发数算法-4
2.2.1 算法思想-4
2.2.2 算法步骤-4
2.3 K-覆盖度算法-5
2.3.1 算法思想-5
2.3.2 用户期望影响力-5
2.3.3 算法步骤-5
2.4 MicroRank算法-6
2.4.1 算法思想-6
2.4.2 算法步骤-6
3 SEISMIC模型-8
3.1 SEISMIC模型介绍-8
3.2 传染率计算-9
3.3 转发数预测-10
4 新浪微博数据分析系统的实现-12
4.1系统简介-12
4.2系统功能实现-12
4.2.1 系统用户界面的构建-12
4.2.2 数据收集及处理-14
4.2.3 系统各功能模块-16
结 论-24
参 考 文 献-25
附录A 系统功能主程序-26
致 谢-32