Discrete Random Variables
本节引入了随机变量,然后介绍了离散随机变量以及期望和方差这两个刻画随机变量的工具,最后,讲述了常见的离散随机变量。
随机变量
先回忆概率空间三要素:样本空间 、事件的集合 、概率空间 。
如果我只是关注各种outcome()所形成的事件的几率值的话,那么之前定义的概率测度就足以满足需求了。 但是很多时候我们关注 outcome 某些量的特征,比如说从班级抽出来个同学的平均体重。也就是说感兴趣的不是 的概率,而是 其他量的特征,这时候概率空间不足以解决这个问题,因此就有了随机变量。
随机变量: 把样本空间中的outcome映射到实数空间。 随机变量中的随机体现在原先样本空间中的outcome是随机的。

- 随机性来自事件本身,映射是确定的!
- 映射到实数之后,可以看作形成了一个新的样本空间,只不过新的样本空间中的outcome都是实数。
随机变量是映射(map),将事件映射到实数。
引入随机变量最根本的原因在于想要数位化这个世界(digitize the word)原先的样本空间的 outcome 是某种随机事件,通过随即变量数位化了
概率空间从 到 ,之后,会更多聚焦在后者。
Q: Why particularly interested in functions that map to “ℝ”?
A:可以对outcome做数值运算,比如加、减、乘、除、对数、指数、大于、小于 等;若不做映射,只能做交集、并集等集合操作。(这里的数值运算是指 对 做数值运算,而不是概率测度 上的)
Q: How to define the probability measure of (i.e., ) from ?(P,P_X分别为原先的概率测度和映射之后的概率测度)

Two main aspect of X:
- the value of X (random)
- the distribution of X (fixed)
离散随机变量
本章小结:定义了离散随机变量, 并引入了三个工具来刻画它,随后分别介绍了三个工具。

注解:
- :the range of : 一个新的样本空间
- 离散随机变量,是指新映射得到的样本空间是离散的,即其中元素为有限个或者无限可数个。
- 映射之前的样本空间 不一定是离散的!也可能是连续的。

之前的离散概率空间,我们在每个 上定义了概率,那么对于新的概率空间中的新样本空间 , 有几种特别的方式来刻画:
- pmf : 概率质量函数 (可以理解为重量)
- cdf:累加分布函数
- mgf:矩母函数
以上三种方式,只需要知道一种,即可计算出其余两种。此外,pmf是只针对离散概率空间的,cdf和 mgf是连续和离散均有 。
离散随机变量 有两个特征:
- 时间到了会吐出来一个值 ;
- 这个值上有重量, 即概率 。
概率质量函数 (PMF)

- 从实数映射到 的函数
- 表示随机变量 吐出来的值刚好等于 的概率值
- 只定义 上的概率,本质上走的是之前概率空间 中 的路线 。(对 的概率做定义)




上述Q的Ans显然不是 ,如果 原先的概率空间想相同,然后又相同的映射,那么pmf是一样的,但是,反过来不成立。
累计分布函数
cdf 对任意随机变量(离散 和 连续)都成立,因此定义 & 特征在任意概率空间都满足。
定义cdf使得任意区间的概率都可计算
CDF定义

扩展:
- 定义了 在 上的值,
- 因此可以把 扩展到任意区间,()
CDF的特征

注对第三点特征表示:函数右连续,即 等于 从右无限接近的 。因为定义 的时候就是左开右闭的!


(6)说明了PMF和CDF的联系
(7)表面上是在说,有可数个间断点,但本质上是在说 离散样本空间有可数个
随机变量函数 Transformation
是随机变量的转化函数,因此本质上是从 到 的映射

对于Y,有两个角度:
- 可以视为从原始概率空间先通过X映射到R,然后又通过g做了一次映射。
- 也可以视为是从原始概率空间 直接映射到 的。

在X上有多少 过函数 可以得到 qi
期望和方差
用来刻画一个随即变量的分布长什么样
- 期望E[X] 和 方差 Var[X] 这里的 并不是括号运算符,只是一种表示方式!
期望
定义

- 期望本质上是随机变量的加权平均
- 期望一定要是绝对收敛,因为只有绝对收敛才能保证加法交换性,进而使得期望是个固定值
- 随机变量随机的背后有一个固定不变的值(特征),那就是期望
理解

- 加权平均,权重为每个吐出来值的概率;
- 期望可以理解为所有取值的中心(重心)
Expectation of Transformation
计算Y的期望 不必要先计算 或者 的分布


随机变量进行 变换 后,各个点重量还是一样的,只是值发生了改变(一方面值的大小改变了,另一方面值之间的间距也可能发生了改变)。值做了一个变换(映射)
Mean 和 Variance


- 注意方差的定义:本质上也是某个随机变量的加权平均。这个随机变量是随机变量的变换,即偏离的距离平方)。因此,也可以按照期望的计算方式来计算。
- 标准差 是方差开根号。此处有点 mse 和rmse 的味道了
- 无论方差还是标准差刻画的都是随机变量到中心点 的距离。

- 方差刻画随机变量的胖瘦
- 方差是大于等于0的数值;且如果方差等于0,那么随机变量为恒定值,此时已经没有了随机性
- 随机变量 的期望是一定大于 期望的平方的,因为方差大于等于 0
一些性质

- 随机变量做线性变换后的方差与期望。

- 上述定理描述的是
- 具体证明过程亦可直接展开 来计算得到。
- 通过上述公式,当 时,进一步可以推导
- 期望的一个重要性质是 一组随机变量之和的期望等于这组随机变量各自期望之和。