贝叶斯公式
啥也别说先看公式:
P(A|B)=P(B|A)P(A)P(B)(1)
我第一眼看到公式(1)的时候心里的想法是:这是啥,啥玩意,有啥用。
算了都给出公式了不来分析分析
2.1 公式推导
来上图
图 one:啥也不是图
我们先看图one,在一个 Ω 的样本空间中, A 事件是左边的又短又胖的大椭圆, B 事件是右边的又细又长的长椭圆, A 事件和 B 事件的相交的区域是中间红色的事件 C 。(能不能不要这么啰嗦,图上不都有么,好的好的)
来我们先看几个定义(不看不行么?):
我们假设(感觉天天在假设), A 事件发生的概率为 P(A) ,我们可以理解为左边那个大椭圆的面积; B 事件发生的概率为 P(B) ,可以理解为右边那个长椭圆的面积;中间相交的区域事件 C 的概率为 P(C) ;在事件 A 发生的情况下, B 事件发生的概率定义为 P(B|A) ;同样的道理,在事件 B 发生的情况下, A 事件发生的概率定义为 P(A|B) 。好了定义完了,下面开始算:
1、计算在事件 B 发生的情况下, A 事件发生的概率 P(A|B)
我们想象 B 发生的概率是多少?没错为 P(B) ,就是指在 椭圆B 的区域内 A 也要发生,显然就是要在红色的 C 区域,那么我们可以得到:
P(A|B)=P(A∩B)P(B)=P(C)P(B)(2)
(没问题吧,ok,解决一个)
2、计算在事件 A 发生的情况下, B 事件发生的概率 P(B|A)
同样的方法,很简单就可以直接写出答案
P(B|A)=P(A∩B)P(A)=P(C)P(A)(3)
(没问题,有解决一个)
好,我们看公式(2)和(3)中都有一个 P(C) ,来我们转换一下:
{P(C)=P(A|B)P(B)P(C)=P(B|A)P(A)(4)
还差一点,继续
P(A|B)P(B)=P(B|A)P(A)⇒P(A|B)=P(B|A)P(A)P(B)(5)
是不是有点眼熟,这不就是贝叶斯公式么。没错!
2.2 公式解读
还是把公式拿过来
P(A|B)=P(B|A)P(A)P(B)(6)
P(A|B) :后验概率(posterior probability)
P(B|A) :似然值(likelihood)
P(A) :先验概率(prior probability)
其中 A 是我们的假设hypothesis, B 是我们的数据Data。
P(A) 先验概率指的就是我们的经验;
P(B|A)/P(B) 可以想象成为我们获取的数据对先验概率的影响;
P(A|B) 后验概率就是我们想要得到的概率。
3、一个小例子
好了弄明白贝叶斯原理之后,我们来看看一个小例子,看看贝叶斯是怎么求解问题的。
问题:
假设我们有100枚硬币,其中有一个是特殊硬币,特殊硬币的正反两面都是相同的都为花面,其他硬币都是正常硬币,一面是花面,一面是数字面。我们从这堆硬币中取出一枚硬币我们只看到其中一面为花面,请问该枚硬币为特殊硬币的概率?
求解:
首先定义一下事件,该枚硬币为特殊硬币设置为事件 A ,取出一枚硬币看到其中一面为花面的事件为 B ,最终的问题是求解 P(A|B) ,就是指 B 发生的情况下, A 发生的概率。
拿出我们的贝叶斯公式:
P(A|B)=P(B|A)P(A)P(B)
首先看 P(A) 我们的先验概率,很简单,100枚硬币,其中只有一个为特殊硬币所以, P(A)=1100 。
再看 P(B) ,它指的是取出一枚硬币其中一面为花面的概率,我们知道一百枚硬币,其中一枚特殊硬币,所以总共有两百个面,其中101个面为花面,所以 P(B)=101200 。
最后看 P(B|A) ,它指的是,当去取一枚硬币为特殊硬币时,看到其中一面为花面的概率,很显然为1。
所以最后P(A|B)=P(B|A)P(A)P(B)=2101
问题解决,很简单吧。
其实更简单的方法也有,200个面,其中花面为101个,特殊硬币占2个花面,那么取到它的概率肯定是 2101 ,问题解决。