Continuous Random Variables
Eecall & IntroductionProbability Density Function and Continuous Random Variablepdf值的含义Relation between the pdf and the cdfExample (Uniform Distributions)Transformation两条定理PDF of TransformationSome ExamplesExpectation, Mean, and VarianceDefinitionExample (Uniform Distributions)Some properties of expectationDefinition of Mean and VarianceProperties of mean and variance (relation of E and cdf)Realtion of expectation and cdf本页总结
Eecall & Introduction
回顾离散随机变量:

引出连续随机变量出现的动机

注:现实生活中,大多数的观测数据是离散的,只不过理论上,连续的会更容易研究,可以引入积分等工具。

先定义了原始的概率空间 ,和在原始概率空间上的 , 然后通过随机变量引入到新的概率空间 。
任意一个点的概率为 ,只有区间上有概率值

pdf的引出

Probability Density Function and Continuous Random Variable


pdf 和 pmf 扮演者相同的角色,也是需要满足几点条件即可。
- 大于等于 0
- 实数域积分为 1
注:之前pmf还有一个条件是只能在可数个数值上概率大于 0.
pdf 不一定是要连续函数
pdf 函数值(函数的高度)并不代表概率值,连续随机随机变量在任意一个点上的概率均为 0,pdf在某个区间的面积才对应概率值,这就是离散和连续概率定义的区别:
- 离散概率需要定义样本空间 每一个 样本点
- 连续概率需要定义任意一个区间
因为是求积分,因此改变pmf的中可数个点的值,并不影响积分值,所以不是唯一的。但是pmf一定是唯一的

pdf值的含义

注: will be near : if f(a) > f(b) ,那么随机变量X的值落在a附近的概率要比落在b附近的概率大
pdf中的 值本身不代表概率,这也是为什么 会大于的原因,但是这个值只需要乘上一个很小的 区域 ,就与落在这个端点的概率值近似。即值不代表概率,区域面积代表概率。
值代表的是密度,因此值是可能大于1的。 mass(重量) = density(密度) * volume(长度)。 因此pdf 的 需要乘一段 长度 才是概率值。
见下图

Relation between the pdf and the cdf

- CDF 和 PDF 可以互相计算出来
- 在不可微分的点上,可以任意指定 的值

CDF的性质定义 不管是离散还是连续均适用!

CDF函数曲线也可以区分离散概率和连续概率:
- 离散随机变量的cdf是离散的
- 连续随机变量的cdf是连续的
Example (Uniform Distributions)


- 均匀分布 CDF 曲线的斜率为 。
- cdf 的斜率为 pdf
- 改变pdf上可数个点的值,并不影响该概率分布!
Transformation
讲的是对随机变量的计算,加减法等别的一些函数转换。
注:随机变量有两个特性,一是会吐出来一个值,二是有一个分布。这两个上面都可以做转换,这里讨论的是 的转换。即经过转换后,的重量如何分配?


- 这里的推导对离散和连续均适用,只不过连续函数更好表示。
两条定理

这里的推导细节:
- 对于 均匀分布的随机变量 ,di
- 定理1证明较为简单,定理2证明见:
Q:想要得到一个 0-1 均匀分布的随机变量?如何得到一个cdf为 的随机变量?
- 把任意一个随机变量放到自己累计分布函数cdf中做转换后,得到的就是0-1之间的均匀分布
- 对均匀分布做一个 CDF的逆变换(可以是任意分布的CDF)后,就得到了分布为 该CDF的随机变量
对上述定理的图形化理解:

上图左下角的图示,曲线代表了某一随机变量的累计分布函数 cdf。在 cdf 函数曲线上,斜率越大说明,对应横坐标 的概率越大。所以对于上图,落在中间部分的 显然比两边的概率较大,即斜率大的地方,数据聚集比较多。
把 吐出来值 再经过 转换过去,显然值域为 ,但为什么是均为分布呢?直观上看,在轴上范围较小的一段,经过转换后,得到轴上就比较稀疏了。所以有了纵轴上的均有分布。
反过来,如果先有了纵轴上的均匀后分布,然后对转换,就会得到横轴上 cdf 为 的随机变量。
常用于计算机生成任意随机分布的随机变量(离散和连续和混合均可以),只需要0-1均匀分布即可!
PDF of Transformation



实际上这种计算方式不够通用!还是用 定义来计算比较好。
Some Examples


这里的计算方式不是很好,对复杂函数会很难理解,推荐使用定义+画函数图来先计算 cdf,然后再求导计算pdf

Expectation, Mean, and Variance
Definition

期望的本质还是加权平均。
Example (Uniform Distributions)

期望有重心的含义!
Some properties of expectation

Definition of Mean and Variance

均值和方差是来刻画 随机变量的,是固定值!
Properties of mean and variance (relation of E and cdf)

这里和离散随机变量是一样的!
Realtion of expectation and cdf


之前计算期望,不管是连续还是离散,都是在 pdf 与 pmf 上来计算的。那么期望于cdf是否有关系呢?是的
本页 ppt 在非负随机变量上证明了期望和cdf函数之间的关系,然后拓展到任意随机变量上,最后再拓展到离散随机变量上。
本页总结
- 对于连续概率函数,pdf 中的值不代表概率,面积()才代表概率。当然,在思考的时候,可以理解为 的值没有概率含义,但是 的结果是有实际含义的:代表落在 处的概率与落在 处的概率的比例。
- 只要写出一个函数 , 满足pdf的两点条件,那么就能找到一个以为pdf的随机变量
- 随机变量的函数转换。
- 期望和 cdf 的关系!