Chapter2 随机变量和分布函数¶
随机变量
设\(\xi(\omega)\)是定义在概率空间\((\Omega, \mathcal{F}, P)\)上的实值函数,且对于\(\mathcal{R}\)上的任一波雷尔集\(B\),有:
则称\(\xi(\omega)\)为随机变量,简称随机变量。
随机变量¶
离散型随机变量¶
若随机变量\(\xi\)的所有可能取值为有限个或可列多个,则称\(\xi\)为离散型随机变量。
- 分布列:
- \(P(\xi=x_i)=p_i > 0\)
- \(\sum^{\infty}_{i=1}p_i=1\)
常见离散型随机变量
\(P(\xi=x)=1\)
\(P(\xi=0)=1-p, P(\xi=1)=p\)
\(P(\xi=x_1)=1-p, P(\xi=x_2)=p\)
记作\(\xi \sim B(n, p)\),则: \(P(\xi=k)=C_n^kp^k(1-p)^{n-k}\)
记作\(\xi \sim P(\lambda)\),则: \(P(\xi=k)=\frac{\lambda^k}{k!}e^{-\lambda}\)
\(P(\xi=k)=(1-p)^{k-1}p\) 无记忆性
\(P(\xi=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n}\) 例如样品抽检问题
连续型随机变量及密度函数¶
分布函数¶
-
分布函数:
\(F(x)=P(\xi \leq x) \quad -\infty < x < +\infty\) 为随机变量\(\xi\)的分布函数。
公理化定义为: 1. \(F(x)\)是非减函数: \(x_1 \leq x_2 \Rightarrow F(x_1) \leq F(x_2)\) 2. \(F(x)\)处处左极限存在,右连续: \(F(x-0)=\lim_{\Delta x \to 0}F(x-\Delta x)=F(x)\) 且 \(F(x+0)=F(x) = \lim_{\Delta x \to 0}F(x+\Delta x)\) 3. \(\lim_{x \to -\infty}F(x)=0, \lim_{x \to +\infty}F(x)=1\)
密度函数
若存在非负可积函数\(F(x)\),使得分布函数\(F(x)\)满足:
\(F(x)=\int_{-\infty}^{x}p(y)dy \quad -\infty < x < +\infty\)
则以\(F(x)\)为分布函数的随机变量\(\xi\)称为连续型随机变量,\(p(x)\)称为\(\xi\)的密度函数。
- 相关性质:
- \(F(x)\)在\(p(x)\)的连续点处可导,且\(F'(x)=p(x)\)
- \(p(a < \xi \leq b)=F(b)-F(a)=\int_{a}^{b}p(x)dx\)
- \(p(x) \geq 0\)
- \(\int_{-\infty}^{+\infty}p(x)dx=1\)
常见连续型随机变量
记作\(\xi \sim U(a, b)\),则:
\(p(x)=\begin{cases} \frac{1}{b-a}, & a \leq x \leq b \\ 0, & \text{其他} \end{cases}\)
记作\(\xi \sim exp(\lambda)\),则:
\(p(x)=\begin{cases} \lambda e^{-\lambda x}, & x \geq 0 \\ 0, & x < 0 \end{cases}\)
记作\(\xi \sim N(\mu, \sigma^2)\),则:
\(p(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\)
随机向量¶
离散型随机向量¶
若随机向量\(\xi=(\xi_1, \xi_2, \cdots, \xi_n)\)的所有可能取值为有限个或可列多个,则称\(\xi\)为离散型随机向量。
例如二维离散型随机向量:
\(\xi_1 \backslash \xi_2\) | 0 | 1 |
---|---|---|
0 | \(x\) | \(y\) |
1 | \(z\) | \(w\) |
-
联合分布列:
- \(P(\xi_1=x_i, \xi_2=y_j)=p_{ij} > 0\)
- \(\sum^{\infty}_{i=1}\sum^{\infty}_{j=1}p_{ij}=1\)
-
边际分布列:
- \(P(\xi_1=x_i)=\sum^{\infty}_{j=1}p_{ij}\)
- \(P(\xi_2=y_j)=\sum^{\infty}_{i=1}p_{ij}\)
连续型随机向量¶
若存在\(n\)元可积非负函数\(p(x_1, x_2, \cdots, x_n)\),使得分布函数
则以\(F(x_1, x_2, \cdots, x_n)\)为分布函数的随机向量\(\xi=(\xi_1, \xi_2, \cdots, \xi_n)\)称为连续型随机向量:
- \(p(x_1, x_2, \cdots, x_n)\)称为联合密度函数
- \(p \geq 0\)
- \(\int_{-\infty}^{+\infty}\cdots\int_{-\infty}^{+\infty}p(y_1, y_2, \cdots, y_n)dy_1dy_2\cdots dy_n=1\)
- 在\(p\)的连续点处可导,且有:
\(\frac{\partial^nF(x_1, x_2, \cdots, x_n)}{\partial x_1\partial x_2\cdots\partial x_n}=p(x_1, x_2, \cdots, x_n)\)
- 边际分布(以二维为例):
- \(p_1(x_1)=\int_{-\infty}^{+\infty}p(x_1, x_2)dx_2\)
- \(p_2(x_2)=\int_{-\infty}^{+\infty}p(x_1, x_2)dx_1\)
- \(F_1(x_1)=\int_{-\infty}^{x_1}\int_{-\infty}^{+\infty}p(y_1, y_2)dy_2dy_1\)
常见连续型随机向量
记作\(\xi \sim U(D)\),其中\(D\)为\(n\)维区域,\(S(D)\)为\(D\)的测度,则:
\(p(x_1, x_2, \cdots, x_n)=\begin{cases} \frac{1}{S(D)}, & (x_1, x_2, \cdots, x_n) \in D \\ 0, & \text{其他} \end{cases}\)
记作\(\xi \sim N(\mu, \Sigma)\),其中\(\mu\)为\(n\)维向量,\(\Sigma\)为\(n\)阶对称正定矩阵,则:
\(p(x_1, x_2, \cdots, x_n)=\frac{1}{(2\pi)^{n/2}|\Sigma|^{1/2}}e^{-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu)}\)
二维正态分布
对应的对称正定矩阵为: \(\Sigma=\begin{bmatrix} \sigma_1^2 & \rho\sigma_1\sigma_2 \\ \rho\sigma_1\sigma_2 & \sigma_2^2 \end{bmatrix}\) 其中\(\rho\)为相关系数
\(p(x, y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]}\)
-
其中\(\mu_1, \mu_2\)分别为\(x, y\)的均值,\(\sigma_1, \sigma_2\)分别为\(x, y\)的标准差
-
二元正态分布的边际分布仍是正态分布且与相关系数无关
创建日期: 2025年2月18日 00:36:18