机器学习数学基础(三)
随机变量
集合论基础
- 样本空间 (
):实验所有可能结果的集合 - 事件:
的子集(例如, ) -
-代数 ( ):对补集、可数并集和交集封闭的事件集合 - 随机变量:如果对所有
,都有 ,则函数 是随机变量
离散随机变量
- 定义:
取可数个值(例如,整数),记为 - 概率质量函数(PMF):
,对于 - 示例:
- 伯努利分布:
, - 二项分布:
- 伯努利分布:
连续随机变量
- 定义:
取不可数无穷多个值(例如,实数) - 概率密度函数(PDF):
满足 - 示例:
- 均匀分布:
,对于 - 正态分布:
,
- 均匀分布:
累积分布函数(CDF)
- 定义:
,对于任何随机变量 (离散或连续) - 性质:
- 单调不减:对所有
,有 - 右连续:
, 表示 从右边趋近 (即 ) -
且 - 对于离散
: - 对于连续
:
- 单调不减:对所有
期望
- 定义:
- 离散:
- 连续:
- 离散:
- 线性性:
- 无意识统计学家法则(LOTUS):对于任意函数
,- 离散:
- 连续:
- 离散:
方差与标准差
- 方差:
- 标准差:
- 性质:
-
样本均值与样本方差估计量
- 样本均值:
- 无偏:
- 无偏:
- 样本方差:
- 无偏:
- 无偏:
置信区间(CI)
- 定义:参数(例如
)的区间估计,具有置信水平 - 对于
( 已知):置信区间为 其中 是 的 分位数 - 对于
( 未知):置信区间为 其中 是自由度为 的 分布的分位数
散度与熵
离散分布的 KL 散度
- 定义:对于支撑集为
和 的离散分布 和 :- 如果
,则
- 如果
- 分解:
其中:- 交叉熵:
- 熵:
- 交叉熵:
- 二元情况:
- 熵:
- 交叉熵:
- 熵:
- 性质:
-
,当且仅当 时取等号 - 不对称:一般情况下,
-
连续分布的 KL 散度
- 定义:对于连续密度
和 :
Jensen-Shannon 散度
- 定义:
和 的对称散度,支撑集为 和 : 其中-
是有效的度量
-
多元正态分布的计算
多元正态密度
- PDF:对于
,均值为 ,协方差为 : - 对数密度:
多元正态分布的 KL 散度
- 一般情况:对于
和 : - 特殊情况:
-
当
时: -
当标准正态分布(
, )时:
-