跳转至

Chapter2 随机变量和分布函数

随机变量

\(\xi(\omega)\)是定义在概率空间\((\Omega, \mathcal{F}, P)\)上的实值函数,且对于\(\mathcal{R}\)上的任一波雷尔集\(B\),有:

\(\xi^{-1}(B)=\left \{ \omega | \xi(\omega) \in B \right \} \in \mathcal{F}\)

则称\(\xi(\omega)\)为随机变量,简称随机变量。

随机变量

离散型随机变量

若随机变量\(\xi\)的所有可能取值为有限个或可列多个,则称\(\xi\)为离散型随机变量。

  • 分布列:
    1. \(P(\xi=x_i)=p_i > 0\)
    2. \(\sum^{\infty}_{i=1}p_i=1\)

常见离散型随机变量

\(P(\xi=x)=1\)

\(P(\xi=0)=1-p, P(\xi=1)=p\)

\(P(\xi=x_1)=1-p, P(\xi=x_2)=p\)

记作\(\xi \sim B(n, p)\),则: \(P(\xi=k)=C_n^kp^k(1-p)^{n-k}\)

记作\(\xi \sim P(\lambda)\),则: \(P(\xi=k)=\frac{\lambda^k}{k!}e^{-\lambda}\)

\(P(\xi=k)=(1-p)^{k-1}p\) 无记忆性

\(P(\xi=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n}\) 例如样品抽检问题

连续型随机变量及密度函数

分布函数

  • 分布函数:

    \(F(x)=P(\xi \leq x) \quad -\infty < x < +\infty\) 为随机变量\(\xi\)的分布函数。

公理化定义为: 1. \(F(x)\)是非减函数: \(x_1 \leq x_2 \Rightarrow F(x_1) \leq F(x_2)\) 2. \(F(x)\)处处左极限存在,右连续: \(F(x-0)=\lim_{\Delta x \to 0}F(x-\Delta x)=F(x)\)\(F(x+0)=F(x) = \lim_{\Delta x \to 0}F(x+\Delta x)\) 3. \(\lim_{x \to -\infty}F(x)=0, \lim_{x \to +\infty}F(x)=1\)

密度函数

若存在非负可积函数\(F(x)\),使得分布函数\(F(x)\)满足:

\(F(x)=\int_{-\infty}^{x}p(y)dy \quad -\infty < x < +\infty\)

则以\(F(x)\)为分布函数的随机变量\(\xi\)称为连续型随机变量,\(p(x)\)称为\(\xi\)的密度函数。

  • 相关性质:
    1. \(F(x)\)\(p(x)\)的连续点处可导,且\(F'(x)=p(x)\)
    2. \(p(a < \xi \leq b)=F(b)-F(a)=\int_{a}^{b}p(x)dx\)
    3. \(p(x) \geq 0\)
    4. \(\int_{-\infty}^{+\infty}p(x)dx=1\)

常见连续型随机变量

记作\(\xi \sim U(a, b)\),则:

\(p(x)=\begin{cases} \frac{1}{b-a}, & a \leq x \leq b \\ 0, & \text{其他} \end{cases}\)

记作\(\xi \sim exp(\lambda)\),则:

\(p(x)=\begin{cases} \lambda e^{-\lambda x}, & x \geq 0 \\ 0, & x < 0 \end{cases}\)

记作\(\xi \sim N(\mu, \sigma^2)\),则:

\(p(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}\)

随机向量

离散型随机向量

若随机向量\(\xi=(\xi_1, \xi_2, \cdots, \xi_n)\)的所有可能取值为有限个或可列多个,则称\(\xi\)为离散型随机向量。

例如二维离散型随机向量:

\(\xi_1 \backslash \xi_2\) 0 1
0 \(x\) \(y\)
1 \(z\) \(w\)
  • 联合分布列:

    1. \(P(\xi_1=x_i, \xi_2=y_j)=p_{ij} > 0\)
    2. \(\sum^{\infty}_{i=1}\sum^{\infty}_{j=1}p_{ij}=1\)
  • 边际分布列:

    1. \(P(\xi_1=x_i)=\sum^{\infty}_{j=1}p_{ij}\)
    2. \(P(\xi_2=y_j)=\sum^{\infty}_{i=1}p_{ij}\)

连续型随机向量

若存在\(n\)元可积非负函数\(p(x_1, x_2, \cdots, x_n)\),使得分布函数

\(F(x_1, x_2, \cdots, x_n) = \int_{-\infty}^{x_1}\int_{-\infty}^{x_2}\cdots\int_{-\infty}^{x_n}p(y_1, y_2, \cdots, y_n)dy_1dy_2\cdots dy_n\)

则以\(F(x_1, x_2, \cdots, x_n)\)为分布函数的随机向量\(\xi=(\xi_1, \xi_2, \cdots, \xi_n)\)称为连续型随机向量:

  • \(p(x_1, x_2, \cdots, x_n)\)称为联合密度函数
    • \(p \geq 0\)
    • \(\int_{-\infty}^{+\infty}\cdots\int_{-\infty}^{+\infty}p(y_1, y_2, \cdots, y_n)dy_1dy_2\cdots dy_n=1\)
    • \(p\)的连续点处可导,且有:
      \(\frac{\partial^nF(x_1, x_2, \cdots, x_n)}{\partial x_1\partial x_2\cdots\partial x_n}=p(x_1, x_2, \cdots, x_n)\)
  • 边际分布(以二维为例):
    • \(p_1(x_1)=\int_{-\infty}^{+\infty}p(x_1, x_2)dx_2\)
    • \(p_2(x_2)=\int_{-\infty}^{+\infty}p(x_1, x_2)dx_1\)
    • \(F_1(x_1)=\int_{-\infty}^{x_1}\int_{-\infty}^{+\infty}p(y_1, y_2)dy_2dy_1\)

常见连续型随机向量

记作\(\xi \sim U(D)\),其中\(D\)\(n\)维区域,\(S(D)\)\(D\)的测度,则:

\(p(x_1, x_2, \cdots, x_n)=\begin{cases} \frac{1}{S(D)}, & (x_1, x_2, \cdots, x_n) \in D \\ 0, & \text{其他} \end{cases}\)

记作\(\xi \sim N(\mu, \Sigma)\),其中\(\mu\)\(n\)维向量,\(\Sigma\)\(n\)阶对称正定矩阵,则:

\(p(x_1, x_2, \cdots, x_n)=\frac{1}{(2\pi)^{n/2}|\Sigma|^{1/2}}e^{-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu)}\)

二维正态分布

对应的对称正定矩阵为: \(\Sigma=\begin{bmatrix} \sigma_1^2 & \rho\sigma_1\sigma_2 \\ \rho\sigma_1\sigma_2 & \sigma_2^2 \end{bmatrix}\) 其中\(\rho\)为相关系数

\(p(x, y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]}\)

  • 其中\(\mu_1, \mu_2\)分别为\(x, y\)的均值,\(\sigma_1, \sigma_2\)分别为\(x, y\)的标准差

  • 二元正态分布的边际分布仍是正态分布且与相关系数无关


最后更新: 2025年2月18日 00:36:18
创建日期: 2025年2月18日 00:36:18