Conditional Probability, Bayes' Rule, and Independent

在不同的条件下,同一事件的发生概率往往不同。因此需要知道事件发生的概率是如何随条件的改变而随之改变。即新的信息到来的时候,应该如何更新所关注事件的概率

条件概率 & 贝叶斯公式

notion imagenotion image
notion imagenotion image
notion imagenotion image
上述example 展示了 在新事件 A 发生后,B 的概率发生的变化。

两种视角下的条件概率

  1. 条件概率可以视为将样本空间由 转为
    1. notion imagenotion image
      缩减了样本空间,通常情况下更容易计算概率。
  1. 条件概率P(B|A) 可以视为一个新的在 B上的概率测空间,其中样本空间没有发生改变,但是 概率定义 发生了改变。在事件A发生的情况下,位于 事件A 之外的outcome的概率变为 0 ,如下图所示,而调整了事件A内的outcome的概率值。
    1. notion imagenotion image
      满足 概率的三条公理及其推理,例如 , 但是通常 , (因为不是定义在 上的概率测度)

3 个有用的公式

notion imagenotion image
式1其实就是条件概率公式,理解:AB同时发生的概率等于 先让A发生然后在该条件下让B发生 这两部分概率之和,当然,先让B发生也可
式2 又称之为全概率公式,证明如下:
其中为互不相容事件,因此由概率公理3可直接相加,再借助第一个公式,即可。相当于对概率空间进行了划分,然后计算划分后各部门的概率值,再计算加权平均,而权重就是划分好各部分的面积。
式3又称为贝叶斯公式。探讨的是信息更新,且把事件A和事件B的顺序调换过来;
notion imagenotion image
把条件概率看作是新的信息到来后,所关注事件的概率发生的变化;比如,在上述例子中,没有诊段之前,得病的概率为0.001,在诊断的病之后,某人的病的概率变为0.0893。

公式扩展

notion imagenotion image
notion imagenotion image
关于公式3:贝叶斯公式
notion imagenotion image
贝叶斯公式是用来描述 一个事件发生之后,所关注事件的概率发生的变化。其中先验概率、后验概率的先后就是指事件发生的先后。

独立

注:事件的独立性和随机变量的独立性是有区别的,后续在随机变量的时候会讲到。
notion imagenotion image
注:如果P(A)=0 或者P(B) = 0,那么A B独立
两种定义方式:
  • 从计算的角度,
  • 从理解的角度, 更好理解,即新的事件 发生(新的信息)不会对旧事件 发生的概率产生影响 ,所以这两个是独立的。

结论:独立和互补

如果B发生对A没有帮助 (),那么B不发生同样对A没有帮助(),即:如果 独立,那么 也独立。推广到n个事件依然成立
notion imagenotion image
共有四种情况:
notion imagenotion image
P(B),P(B|A)和P(B|A^c)三者的图例关系如下所示:P(B) 为 P(B|A)和P(B|A^c) 的加权平均,权重为P(A) 和 P(A^c)的概率值。也正因为是加权平均,所以在仅仅知道两者的情况下,没法计算第三者。
notion imagenotion image
在B和A独立的情况下,三者相同。
从韦恩图看独立:
notion imagenotion image
notion imagenotion image

结论:独立和互斥的关系:互斥一定不独立

互斥一定是不独立的!!因为若 互斥,则
互斥和独立都是在探讨无关,只是:
  • 互斥是指两个集合无关,即没有交集
  • 独立是指新事件发生与所关注事件发生的概率无关。

结论:两两独立 & 相互独立

相互独立 → 两两独立
notion imagenotion image
notion imagenotion image

结论:多个相互独立事件的各个group之间依旧是相互独立的

notion imagenotion image
注:此处的group是指 任意事件 交集或并集 得到的新事件 ,见下图
notion imagenotion image

条件独立

之前的 独立 都是在 下探讨的,现在在 的概率测度下探讨。举个例子:性别和收入一般是不独立的(通常情况下,男性收入高于女性),但是在专业性较强的岗位,性别和收入是独立的, 即P(income & gender | profession job) = P(income | profession job) * P(gender | profession job), (专业性较强的岗位和体力没有关系)
谨记:是一个新的概率测度
notion imagenotion image
e.g. 中 推导如下:
因此,如果 发生的条件下独立,那么只要 发生了, 发生了也不会对 带来任何信息,即有
反过来也也推导,即如果A发生的大前提下,知道 的信息对 没有帮助,那么 发生的条件下独立.
notion imagenotion image
注:在确定了第一阶段抽中哪个盒子之后,第n次和第n+1次抽样才是独立的,因此属于条件独立。
notion imagenotion image
直观上的解释:本题虽然是有放回的抽样,但是随着不断的抽中金币,会不断的改变第一阶段抽中哪个箱子的概率(见上图中),因此第 n+1 次抽中金币的概率和 n 次抽中金币的概率是不一样的。极端一点,如果前100000次都抽中了金币,那么很大概率是抽中了第k 个盒子(全都是金币),因此第100001次抽中金币的概率为1。

总结

本章围绕条件概率独立展开,最后结合有了条件独立:
  • 在条件概率中,延伸出了三个公式,可以简化计算。
  • 条件概率的两种角度理解,一种是理解为概率空间发生了变化,一种是概率测度改变了。
  • 在独立中,延伸出了多个结论,包括独立和互斥、独立和互补等之间的关系。
  • 独立事件可以借助条件概率来加深理解,即新的事件不会影响所关注事件的概率,视为独立
  • 条件独立不是在原先的概率测度()中衡量独立性,而是在条件概率测度下()衡量独立性。
notion imagenotion image