抽样分布

抽样分布

1. \(\chi^2\)分布

\(X_1,X_2,\cdots,X_n\)是来自总体\(N(0,1)\)的样本,则称统计量 \[\chi^2 = X_1^2 + X_2^2 + \cdots + X_n^2\] 服从自由度为\(n\)\(\chi^2\)分布,记为\(\chi^2 \sim \chi^2(n)\)。自由度指包含独立变量的个数。

\(\chi^2(n)\)分布的概率密度为 \[f(x) = \begin{cases} \frac{1}{2^{n/2} \Gamma (n/2)} x^{n/2 - 1} e^{-x/2}, \quad x>0 \\ 0, \qquad \qquad \qquad \qquad \quad 其他 \end{cases}\]

\(\chi^2\)分布的可加性:设\(\chi_1^2 \sim \chi^2(n_1), \chi_2^2 \sim \chi^2(n_2)\),并且\(\chi_1^2\)\(\chi_2^2\)相互独立,则有 \[\chi_1^2 + \chi_2^2 \sim \chi^2 (n_1 + n_2)\]

\(\chi^2\)分布的数学期望和方差:若\(\chi^2 \sim \chi^2(n)\),则有 \[E(\chi^2) = n, \quad D(\chi^2) = 2n\]

\(\chi^2\)分布的上分位点:对于给定的正数\(\alpha, 0<\alpha<1\),满足条件 \[P\{\chi^2 > \chi_{\alpha}^2(n)\} = \int_{\chi_{\alpha}^2(n)}^{+ \infty} f(y) dy = \alpha\] 其中\(\chi_{\alpha}^2(n)\)可通过查表获得。

2. t分布

\(X \sim N(0,1),Y \sim \chi^2(n)\),且\(X,Y\)相互独立,则称随机变量 \[t = \frac{X}{\sqrt{Y/n}}\] 服从自由度为\(n\)的t分布,记为\(t \sim t(n)\)
t分布又称为学生氏(Student)分布,概率密度函数为 \[h(t) = \frac{\Gamma[(n+1)/2]}{\sqrt{\pi n} \Gamma(n/2)} (1 + \frac{t^2}{n})^{-(n+1)/2}, \quad - \infty < t < + \infty\]

\(n\)充分大时,其图形类似于标准正态变量概率密度的图形,利用\(\Gamma\)函数的性质可得 \[\lim_{n \to \infty} h(t) = \frac{1}{\sqrt{2 \pi}} e^{- t^2/2}\]

t分布的上分位点:对于给定的\(\alpha,0 < \alpha < 1\),满足条件 \[P\{t > t_{\alpha}(n)\} = \int_{t_{\alpha}(n)}^{+ \infty} h(t) dt = \alpha\]

3. F分布

\(U \sim \chi^2(n_1), V \sim \chi^2(n_2)\),且\(U,V\)相互独立,则称随机变量 \[F = \frac{U/n_1}{V/n_2}\] 服从自由度为\((n_1,n_2)\)的F分布,记为\(F \sim F(n_1,n_2)\)

F分布的概率密度函数为 \[\psi(x) = \begin{cases} \frac{\Gamma[(n_1 + n_2)/2](n_1 + n_2)^{n_1/2} x^{(n_1/2)-1}}{\Gamma(n_1/2) \Gamma(n_2/2)[1 + (n_1x/n_2)]^{(n_1+n_2)/2}}, \quad x>0 \\ 0, \qquad \qquad \qquad \qquad \qquad \qquad \quad 其他 \end{cases}\]

有定义可知,若\(F \sim F(n_1,n_2)\),则 \[\frac{1}{F} \sim F(n_2,n_1)\]

F分布的上分位点:对于给定的\(\alpha,0<\alpha<1\),满足条件 \[P\{F > F_{\alpha}(n_1,n_2)\} = \int_{F_{\alpha}(n_1,n_2)}^{+ \infty} \psi(x) dx = \alpha\]

4. 正态总体的样本均值与样本方差的分布

设总体\(X\)(不管什么分布,只要存在均值和方差)的均值为\(\mu\),方差为\(\sigma^2\)\(X_1,X_2,\cdots,X_n\)是来自\(X\)的一个样本,\(\overline{X},S^2\)分别是样本均值和样本方差,则有 \[E(\overline{X}) = \mu, \quad D(\overline{X}) = \frac{\sigma^2}{n}, \quad E(S^2) = \sigma^2\]

定理1:设\(X_1,X_2,\cdots,X_n\)是来自正态总体\(N(\mu,\sigma^2)\)的样本,\(\overline{X}\)是样本均值,则有 \[\overline{X} \sim N(\mu, \frac{\sigma^2}{n})\]

定理2:设\(X_1,X_2,\cdots,X_n\)是来自正态总体\(N(\mu,\sigma^2)\)的样本,\(\overline{X},S^2\)分别是样本均值和样本方差,则有:

  1. \(\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\)
  2. \(\overline{X}\)\(S^2\)相互独立。

定理3:设\(X_1,X_2,\cdots,X_n\)是来自正态总体\(N(\mu,\sigma^2)\)的样本,\(\overline{X},S^2\)分别是样本均值和样本方差,则有 \[\frac{\overline{X} - \mu}{S / \sqrt{n}} \sim t(n-1)\]

定理4:设\(X_1,X_2,\cdots,X_{n_1}\)\(Y_1,Y_2,\cdots,Y_{n_2}\)分别来自正态总体\(N(\mu_1,\sigma_1^2)\)\(N(\mu_2,\sigma_2^2)\)的样本,且这两个样本相互独立,设\(\overline{X} = \frac{1}{n_1} \sum_{i=1}^{n_1} X_i\)\(\overline{Y} = \frac{1}{n_2} \sum_{i=1}^{n_2} Y_i\)分别是这两个样本的样本均值;\(S_1^2 = \frac{1}{n_1 - 1} \sum_{i=1}^{n_1}(X_i - \overline{X})^2\)\(S_2^2 = \frac{1}{n_2 - 1} \sum_{i=1}^{n_2} (Y_i - \overline{Y})^2\)分别是这两个样本的样本方差,则有:

  1. \(\frac{S_1^2/S_2^2}{\sigma_1^2 / \sigma_2^2} \sim F(n_1 - 1,n_2 - 1)\)
  2. \(\sigma_1^2 = \sigma_2^2 = \sigma^2\)时, \[\frac{(\overline{X} - \overline{Y}) - (\mu_1 - \mu_2)}{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)\] 其中 \[S_w^2 = \frac{(n_1 - 1)S_1^2 + (n_2 - 1)S_2^2}{n_1 + n_2 - 2}, \quad S_w = \sqrt{S_w^2}\]