摘要:数据的快速大量增长,使我们真正步入了的数据时代。从海量数据中挖掘出有价值的信息并创造出价值,已经成为人们关注的重点。在概率统计和数据挖掘等方面,贝叶斯网络的具体应用受到了人们越来越多的关注和研究。
在一个统计问题里,运用贝叶斯统计方法进行有效的学习的前提是合理地确定先验。在遇到样本难得且具有概率统计特征的机器学习和数据挖掘这类问题时,贝叶斯理论的统计决策与推理方法是比较常用的。相对于其他统计学派的统计方法,贝叶斯统计方法的显著特点是其可以综合先验信息和后验信息。而先验分布的问题是应用贝叶斯理论首要解决的问题。
本文介绍了贝叶斯统计模型和贝叶斯统计推断中使用的原则,着重介绍了贝叶斯统计推断中先验分布的选择问题,并结合重度睡眠者所占比例的数据,分别选择了无信息先验分布中的离散均匀分布、主观概率法中的离散分布和连续分布、共轭分布中的Beta分布三种方法进行分析。
关键词:贝叶斯先验分布;无信息先验分布;共轭先验分布
目录
摘要
Abstract
1 绪论-5
1.1 研究背景-5
1.2 研究目的及意义-5
2 贝叶斯统计的主要内容-6
2.1 贝叶斯统计模型-6
2.2 后验分布-6
2.3 贝叶斯统计推断原则-7
2.4 选取先验分布的方法-7
2.4.1 无信息先验分布法-8
2.4.2 主观概率法-8
2.4.3 共轭先验分布法-9
2.5 Beta分布-10
3 贝叶斯统计推断的实际应用-11
3.1 无信息先验分布-12
3.2 主观概率法-13
3.2.1 离散分布-13
3.2.2 连续分布-15
3.3 共轭分布-17
4 总结与展望-20
4.1 总结-20
4.2 展望-21
参考文献-22
致谢-23