贝叶斯所有内容
五、先验分布
是总体分布参数θ的一个概率分布。贝叶斯学派的根本观点,是认为在关
于θ的任何统计推断问题中,除了使用样本X所提供的信息外,还必须对
θ规定一个先验分布,它是在进行推断时不可或缺的一个要素。贝叶斯学
派把先验分布解释为在抽样前就有的关于θ的先验信息的概率表述,先验
分布不必有客观的依据,它可以部分地或完全地基于主观信念。 六、后验分布
根据样本 X 的分布Pθ及θ的先验分布π(θ),用概率论中求条件概率
分布的方法,可算出在已知X=x的条件下,θ的条件分布 π(θ|x)。因为这
个分布是在抽样以后才得到的,故称为后验分布。贝叶斯学派认为:这个分
布综合了样本X及先验分布π(θ)所提供的有关的信息。抽样的全部目的,
就在于完成由先验分布到后验分布的转换。如上例,设p=P(θ=1)=0.001,
而π(θ=1|x)=0.86,则贝叶斯学派解释为:在某甲的指标量出之前,他患病
的可能性定为0.001,而在得到X后,认识发生了变化:其患病的可能性提
高为0.86,这一点的实现既与X有关,也离不开先验分布。计算后验分布
的公式本质上就是概率论中著名的贝叶斯公式(见概率),这公式正是上面
提到的贝叶斯1763年的文章的一个重要内容。
关于贝叶斯方法的争论
贝叶斯学派与频率学派争论的焦点在于先验分布的问题。所谓频率学
派是指坚持概率的频率解释的统计学家形成的学派。贝叶斯学派认为先验
分布可以是主观的,它没有也不需要有频率解释。而频率学派则认为,只
有在先验分布有一种不依赖主观的意义,且能根据适当的理论或以往的经
验决定时,才允许在统计推断中使用先验分布,否则就会丧失客观性。另
一个批评是:贝叶斯方法对任何统计问题都给以一种程式化的解法,这导
致人们对问题不去作深入分析,而只是机械地套用公式。贝叶斯学派则认
为:从理论上说,可以在一定条件下证明,任何合理的优良性准则必然是
相应于一定先验分布的贝叶斯准则,因此每个统计学家自觉或不自觉地都
是“贝叶斯主义者”。他们认为,频率学派表面上不使用先验分布,但所
得到的解也还是某种先验分布下的贝叶斯解,而这一潜在的先验分布,可
能比经过慎重选定的主观先验分布更不合理。其次,贝叶斯学派还认为,
贝叶斯方法对统计推断和决策问题给出程式化的解是优点而非缺点,因为
它免除了寻求抽样分布,(见统计量)这个困难的数学问题。而且这种程
式化的解法并不是机械地套公式,它要求人们对先验分布、损失函数等的
选择作大量的工作。还有,贝叶斯学派认为,用贝叶斯方法求出的解不需
要频率解释,因而即使在一次使用下也有意义。反之,根据概率的频率解
释而提供的解,则只有在大量次数使用之下才有意义,而这常常不符合应用
的实际。这两个学派的争论是战后数理统计学发展中的一个特色。这个争
论目前还远没有解决,它对今后数理统计学的发展还将产生影响。
2、贝叶斯公式