Chapter2 随机变量和分布函数¶

随机变量

设\(\xi(\omega)\)是定义在概率空间\((\Omega, \mathcal{F}, P)\)上的实值函数，且对于\(\mathcal{R}\)上的任一波雷尔集\(B\)，有：

\(\xi^{-1}(B)=\left \{ \omega | \xi(\omega) \in B \right \} \in \mathcal{F}\)

则称\(\xi(\omega)\)为随机变量，简称随机变量。

随机变量¶

离散型随机变量¶

若随机变量\(\xi\)的所有可能取值为有限个或可列多个，则称\(\xi\)为离散型随机变量。

分布列：
1. \(P(\xi=x_i)=p_i > 0\)
2. \(\sum^{\infty}_{i=1}p_i=1\)

常见离散型随机变量

退化分布伯努利分布两点分布二项分布泊松分布几何分布超几何分布

\(P(\xi=x)=1\)

\(P(\xi=0)=1-p, P(\xi=1)=p\)

\(P(\xi=x_1)=1-p, P(\xi=x_2)=p\)

记作\(\xi \sim B(n, p)\)，则： \(P(\xi=k)=C_n^kp^k(1-p)^{n-k}\)

记作\(\xi \sim P(\lambda)\)，则： \(P(\xi=k)=\frac{\lambda^k}{k!}e^{-\lambda}\)

\(P(\xi=k)=(1-p)^{k-1}p\) 无记忆性

\(P(\xi=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n}\) 例如样品抽检问题

连续型随机变量及密度函数¶

分布函数¶

分布函数：

\(F(x)=P(\xi \leq x) \quad -\infty < x < +\infty\) 为随机变量\(\xi\)的分布函数。

公理化定义为： 1. \(F(x)\)是非减函数： \(x_1 \leq x_2 \Rightarrow F(x_1) \leq F(x_2)\) 2. \(F(x)\)处处左极限存在，右连续： \(F(x-0)=\lim_{\Delta x \to 0}F(x-\Delta x)=F(x)\) 且 \(F(x+0)=F(x) = \lim_{\Delta x \to 0}F(x+\Delta x)\) 3. \(\lim_{x \to -\infty}F(x)=0, \lim_{x \to +\infty}F(x)=1\)

密度函数

若存在非负可积函数\(F(x)\)，使得分布函数\(F(x)\)满足：

\(F(x)=\int_{-\infty}^{x}p(y)dy \quad -\infty < x < +\infty\)

则以\(F(x)\)为分布函数的随机变量\(\xi\)称为连续型随机变量，\(p(x)\)称为\(\xi\)的密度函数。

相关性质：
1. \(F(x)\)在\(p(x)\)的连续点处可导，且\(F'(x)=p(x)\)
2. \(p(a < \xi \leq b)=F(b)-F(a)=\int_{a}^{b}p(x)dx\)
3. \(p(x) \geq 0\)
4. \(\int_{-\infty}^{+\infty}p(x)dx=1\)

常见连续型随机变量

均匀分布指数分布正态分布

记作\(\xi \sim U(a, b)\)，则：

\(p(x)=\begin{cases} \frac{1}{b-a}, & a \leq x \leq b \\ 0, & \text{其他} \end{cases}\)

记作\(\xi \sim exp(\lambda)\)，则：

\(p(x)=\begin{cases} \lambda e^{-\lambda x}, & x \geq 0 \\ 0, & x < 0 \end{cases}\)

记作\(\xi \sim N(\mu, \sigma^2)\)，则：

\(p(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\)

随机向量¶

离散型随机向量¶

若随机向量\(\xi=(\xi_1, \xi_2, \cdots, \xi_n)\)的所有可能取值为有限个或可列多个，则称\(\xi\)为离散型随机向量。

例如二维离散型随机向量：

\(\xi_1 \backslash \xi_2\)	0	1
0	\(x\)	\(y\)
1	\(z\)	\(w\)

联合分布列：
1. \(P(\xi_1=x_i, \xi_2=y_j)=p_{ij} > 0\)
2. \(\sum^{\infty}_{i=1}\sum^{\infty}_{j=1}p_{ij}=1\)
边际分布列：
1. \(P(\xi_1=x_i)=\sum^{\infty}_{j=1}p_{ij}\)
2. \(P(\xi_2=y_j)=\sum^{\infty}_{i=1}p_{ij}\)

连续型随机向量¶

若存在\(n\)元可积非负函数\(p(x_1, x_2, \cdots, x_n)\)，使得分布函数

\(F(x_1, x_2, \cdots, x_n) = \int_{-\infty}^{x_1}\int_{-\infty}^{x_2}\cdots\int_{-\infty}^{x_n}p(y_1, y_2, \cdots, y_n)dy_1dy_2\cdots dy_n\)，

则以\(F(x_1, x_2, \cdots, x_n)\)为分布函数的随机向量\(\xi=(\xi_1, \xi_2, \cdots, \xi_n)\)称为连续型随机向量:

\(p(x_1, x_2, \cdots, x_n)\)称为联合密度函数
- \(p \geq 0\)
- \(\int_{-\infty}^{+\infty}\cdots\int_{-\infty}^{+\infty}p(y_1, y_2, \cdots, y_n)dy_1dy_2\cdots dy_n=1\)
- 在\(p\)的连续点处可导，且有： \(\frac{\partial^nF(x_1, x_2, \cdots, x_n)}{\partial x_1\partial x_2\cdots\partial x_n}=p(x_1, x_2, \cdots, x_n)\)
边际分布（以二维为例）：
- \(p_1(x_1)=\int_{-\infty}^{+\infty}p(x_1, x_2)dx_2\)
- \(p_2(x_2)=\int_{-\infty}^{+\infty}p(x_1, x_2)dx_1\)
- \(F_1(x_1)=\int_{-\infty}^{x_1}\int_{-\infty}^{+\infty}p(y_1, y_2)dy_2dy_1\)

常见连续型随机向量

n维均匀分布n维正态分布

记作\(\xi \sim U(D)\)，其中\(D\)为\(n\)维区域，\(S(D)\)为\(D\)的测度，则：

\(p(x_1, x_2, \cdots, x_n)=\begin{cases} \frac{1}{S(D)}, & (x_1, x_2, \cdots, x_n) \in D \\ 0, & \text{其他} \end{cases}\)

记作\(\xi \sim N(\mu, \Sigma)\)，其中\(\mu\)为\(n\)维向量，\(\Sigma\)为\(n\)阶对称正定矩阵，则：

\(p(x_1, x_2, \cdots, x_n)=\frac{1}{(2\pi)^{n/2}|\Sigma|^{1/2}}e^{-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu)}\)

二维正态分布

对应的对称正定矩阵为： \(\Sigma=\begin{bmatrix} \sigma_1^2 & \rho\sigma_1\sigma_2 \\ \rho\sigma_1\sigma_2 & \sigma_2^2 \end{bmatrix}\) 其中\(\rho\)为相关系数

\(p(x, y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]}\)

其中\(\mu_1, \mu_2\)分别为\(x, y\)的均值，\(\sigma_1, \sigma_2\)分别为\(x, y\)的标准差
二元正态分布的边际分布仍是正态分布且与相关系数无关

最后更新: 2025年2月18日 00:36:18
创建日期: 2025年2月18日 00:36:18