因果胜于统计--简单回顾一下贝叶斯

周末好不容易又拿起了思考快与慢继续读,尝试追赶今年的阅读目标。看到16章的问题,被死去的回忆戳中了,贝叶斯啊贝叶斯。

考虑以下情形

一辆出租车在夜晚肇事后逃逸。  
这座城市有两家出租车公司,其中一家公司的出租车是绿色的,另一家是蓝色的。  
你知道以下数据:  
  这座城市 85% 的出租车是绿色的,15%是蓝色的。  
  一位目击证人辨认出那辆肇事出租车是蓝色的。当晚,警察在出事地点对证人的证词进行了测试,得出的结论是:目击者在当时能够正确辨认出这两种颜色的概率是 80%,错误的概率是 20%。  

这场事故的出租车是蓝色而不是绿色的概率是多少?反正肯定不是80%对吧(笑

让我们一起来看看贝叶斯定理

P(AB)=P(A)P(BA)P(B)P(A|B) = \frac{P(A)P(B|A)}{P(B)}

PP 是指 Probability概率

在上述情形下,让A=出租车为蓝色A=出租车为蓝色B=辨认为蓝色B=辨认为蓝色。即

P(辨认成蓝色的前提下出租车为蓝色)=P(出租车为蓝色)P(出租车为蓝色的前提下辨认成蓝色)P(辨认成蓝色的概率)P(辨认成蓝色的前提下出租车为蓝色)=\frac{P(出租车为蓝色)P(出租车为蓝色的前提下辨认成蓝色)}{P(辨认成蓝色的概率)}

等式左边是我们想求的值。等式右边上面的两个概率题目中已经给出

P(出租车为蓝色)=0.15(这座城市85P(出租车为蓝色的前提下辨认成蓝色)=0.8(正确辨认出这两种颜色的概率是80\begin{align*} &P(出租车为蓝色)=0.15(这座城市85\\%的出租车是绿色的,15\\%是蓝色的)\\ &P(出租车为蓝色的前提下辨认成蓝色)=0.8(正确辨认出这两种颜色的概率是80\\%) \end{align*}

而辨认成蓝色的概率我们可以用全概率公式

P(A)=nP(ABn)P(A)=\sum_n P(A\cap B_n)

其中Bn:n=1,2,3\\{B_n:n=1,2,3\dots\\}是概率空间的全部分割,具体到上述情境中就是两种情况,B1=出租车为蓝色B_1=出租车为蓝色B2=出租车为绿色B_2=出租车为绿色

P(B)=P(B出租车为蓝色)+P(B出租车为绿色)=P(辨认为蓝车为蓝色)P(车为蓝色)+P(辨认为蓝色车为绿色)P(车为绿色)=0.8×0.15+0.2×0.85=0.29\begin{align*} P(B)&=P(B\cap 出租车为蓝色)+P(B\cap 出租车为绿色)\\ &=P(辨认为蓝|车为蓝色)P(车为蓝色) + P(辨认为蓝色|车为绿色)P(车为绿色)\\ &=0.8\times0.15+0.2\times0.85\\ &=0.29 \end{align*}

因此,出租车在被辨认成蓝色的条件下真的是蓝色的概率为

P(辨认成蓝色的前提下出租车为蓝色)=0.15×0.80.290.41\begin{align*} P(辨认成蓝色的前提下出租车为蓝色) &= \frac{0.15\times0.8}{0.29}\\ &\approx 0.41 \end{align*}

大学学到的内容好像一梭子全还给老师了,只有在读这本"思考快与慢"通篇概率论的书时,意识中有种警觉,这儿是不是要用到概率论、贝叶斯。

生活中能时时保持保持这样警觉,摆脱系统1的桎梏吗?难啊🤔

Comments