Conditional Probability, Bayes' Rule, and Independent
在不同的条件下,同一事件的发生概率往往不同。因此需要知道事件发生的概率是如何随条件的改变而随之改变。即新的信息到来的时候,应该如何更新所关注事件的概率
条件概率 & 贝叶斯公式两种视角下的条件概率3 个有用的公式 公式扩展独立结论:独立和互补结论:独立和互斥的关系:互斥一定不独立结论:两两独立 & 相互独立结论:多个相互独立事件的各个group之间依旧是相互独立的条件独立总结
条件概率 & 贝叶斯公式



上述example 展示了 在新事件 A 发生后,B 的概率发生的变化。
两种视角下的条件概率
- 条件概率可以视为将样本空间由 转为

缩减了样本空间,通常情况下更容易计算概率。
- 条件概率P(B|A) 可以视为一个新的在 B上的概率测空间,其中样本空间没有发生改变,但是 概率定义 发生了改变。在事件A发生的情况下,位于 事件A 之外的outcome的概率变为 0 ,如下图所示,而调整了事件A内的outcome的概率值。

满足 概率的三条公理及其推理,例如 , 但是通常 , (因为不是定义在 上的概率测度)
3 个有用的公式

式1其实就是条件概率公式,理解:AB同时发生的概率等于 先让A发生,然后在该条件下让B发生 这两部分概率之和,当然,先让B发生也可
式2 又称之为全概率公式,证明如下:
其中 与 为互不相容事件,因此由概率公理3可直接相加,再借助第一个公式,即可。相当于对概率空间进行了划分,然后计算划分后各部门的概率值,再计算加权平均,而权重就是划分好各部分的面积。
式3又称为贝叶斯公式。探讨的是信息更新,且把事件A和事件B的顺序调换过来;

把条件概率看作是新的信息到来后,所关注事件的概率发生的变化;比如,在上述例子中,没有诊段之前,得病的概率为0.001,在诊断的病之后,某人的病的概率变为0.0893。
公式扩展


关于公式3:贝叶斯公式

贝叶斯公式是用来描述 一个事件发生之后,所关注事件的概率发生的变化。其中先验概率、后验概率的先后就是指事件发生的先后。
独立
注:事件的独立性和随机变量的独立性是有区别的,后续在随机变量的时候会讲到。

注:如果P(A)=0 或者P(B) = 0,那么A B独立
两种定义方式:
- 从计算的角度,
- 从理解的角度, 更好理解,即新的事件 发生(新的信息)不会对旧事件 发生的概率产生影响 ,所以这两个是独立的。
结论:独立和互补
如果B发生对A没有帮助 (),那么B不发生同样对A没有帮助(),即:如果 和 独立,那么 和 也独立。推广到n个事件依然成立

共有四种情况:

P(B),P(B|A)和P(B|A^c)三者的图例关系如下所示:P(B) 为 P(B|A)和P(B|A^c) 的加权平均,权重为P(A) 和 P(A^c)的概率值。也正因为是加权平均,所以在仅仅知道两者的情况下,没法计算第三者。

在B和A独立的情况下,三者相同。
从韦恩图看独立:


结论:独立和互斥的关系:互斥一定不独立
互斥一定是不独立的!!因为若 互斥,则
互斥和独立都是在探讨无关,只是:
- 互斥是指两个集合无关,即没有交集
- 独立是指新事件发生与所关注事件发生的概率无关。
结论:两两独立 & 相互独立
相互独立 → 两两独立


结论:多个相互独立事件的各个group之间依旧是相互独立的

注:此处的group是指 任意事件 交集或并集 得到的新事件 ,见下图

条件独立
之前的 独立 都是在 下探讨的,现在在 的概率测度下探讨。举个例子:性别和收入一般是不独立的(通常情况下,男性收入高于女性),但是在专业性较强的岗位,性别和收入是独立的, 即P(income & gender | profession job) = P(income | profession job) * P(gender | profession job), (专业性较强的岗位和体力没有关系)
谨记:是一个新的概率测度

e.g. 中 推导如下:
因此,如果 和 在 发生的条件下独立,那么只要 发生了, 发生了也不会对 带来任何信息,即有 。
反过来也也推导,即如果A发生的大前提下,知道 的信息对 没有帮助,那么 和 在 发生的条件下独立.

注:在确定了第一阶段抽中哪个盒子之后,第n次和第n+1次抽样才是独立的,因此属于条件独立。

直观上的解释:本题虽然是有放回的抽样,但是随着不断的抽中金币,会不断的改变第一阶段抽中哪个箱子的概率(见上图中),因此第 n+1 次抽中金币的概率和 n 次抽中金币的概率是不一样的。极端一点,如果前100000次都抽中了金币,那么很大概率是抽中了第k 个盒子(全都是金币),因此第100001次抽中金币的概率为1。
总结
本章围绕条件概率和独立展开,最后结合有了条件独立:
- 在条件概率中,延伸出了三个公式,可以简化计算。
- 条件概率的两种角度理解,一种是理解为概率空间发生了变化,一种是概率测度改变了。
- 在独立中,延伸出了多个结论,包括独立和互斥、独立和互补等之间的关系。
- 独立事件可以借助条件概率来加深理解,即新的事件不会影响所关注事件的概率,视为独立
- 条件独立不是在原先的概率测度()中衡量独立性,而是在条件概率测度下()衡量独立性。
