摘要:本系统致力于解决在生活节奏越来越快的信息时代里,微博数量爆炸式的增长和人们想要快速且精准地获取最近微博内所发生的事之间的矛盾。在熟悉了微博OAuth2.0认证机制的流程后,本系统借助了微博自身的API和中科院张华平博士的NLPIR语言分析组件进行二次开发,主要实现了后台自动数据抓取、数据即时分析和显示、历史数据回放等功能。
关键词:信息时代;快速精准;微博API;NLPIR
目录
摘要
Abstract
1 绪论-1
1.1 开发背景-1
1.2 开发目的与意义-1
1.2.1 开发的目的-1
1.2.2 开发的意义-1
1.3 国内外的研究现状及发展趋势-2
2 系统分析与设计-3
2.1 系统可行性分析-3
2.1.1 技术可行性-3
2.1.2 社会可行性-3
2.2 项目宗旨-3
3 准备工作-4
3.1 微博授权机制-4
3.1.1 微博OAuth2授权机制说明-4
3.1.2 实际授权流程-4
3.2 NLPIR语言分析组件在C#中的使用说明-5
3.2.1 获取NLPIR程序包-5
3.2.2 使用方法-5
4 项目介绍-6
4.1 系统模块及功能-6
4.1.1 数据自动抓取-6
4.1.2 数据分析组件-6
4.1.3 数据显示组件-6
4.1.4 历史话题回放-6
4.2 特点分析-6
4.2.1 数据静默分析处理-6
4.2.2 实时分析-6
4.2.3 显示与处理分成两个程序-7
4.2.4 可存储历史记录和闪看-7
4.2.5 特色化分析-7
4.3 适用人群-7
4.3.1 想摆脱却无法摆脱微博的重度患者-7
4.3.2 特殊分析需求者-7
5 系统概要设计-8
5.1 系统设计目标-8
5.2 系统功能整体结构-8
5.3 系统涉及接口-9
5.3.1 微博请求授权接口-9
5.3.2 微博获取授权接口-9
5.3.3 微博获取授权信息接口-10
5.3.4 微博回收授权接口-11
5.3.5 微博博文获取接口-11
5.3.6 微博评论获取接口-13
5.3.7 NLPIR的Cluster组件接口-13
5.3.8 NLPIR的Sentiment Analysis组件接口-15
5.4 数据结构设计-16
5.4.1 微博结构体-16
5.4.2 评论结构体-16
5.4.3 聚类组件结果结构体-17
5.5 简单情绪预测原理-17
5.6 系统功能实现-18
5.6.1 微博授权-18
5.6.2 配置运行参数-18
5.6.3 Windows服务控制-19
5.6.4 数据显示页面-19
6 总结与展望-20
6.1 总结-20
6.2 展望-20
6.3 心得体会-20