跳转到内容
Go back

考研数学概率论之抽样分布笔记

Edit page

考研数学概率论之抽样分布笔记

一、常用统计量

X1,X2,,XnX_1, X_2, \cdots, X_n 是来自总体 XX 的一个样本,x1,x2,,xnx_1, x_2, \cdots, x_n 是这一样本的观察值。

1. 样本平均值

样本均值:

X=1ni=1nXi\overline{X} = \frac{1}{n} \sum_{i=1}^n X_i

其观察值:

x=1ni=1nxi\overline{x} = \frac{1}{n} \sum_{i=1}^n x_i

样本均值反映了样本数据的平均水平,在对总体均值进行推断时起到关键作用。例如在估计某班级学生的平均成绩时,样本均值就是重要的参考统计量。

2. 样本方差

样本方差:

S2=1n1i=1n(XiX)2S^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \overline{X})^2

其观察值:

s2=1n1i=1n(xix)2s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2

样本方差用于衡量样本数据的离散程度,方差越大,说明数据越分散。比如在分析不同批次产品质量的稳定性时,样本方差能直观体现数据的波动情况。

3. 样本标准差

样本标准差:

S=1n1i=1n(XiX)2S = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (X_i - \overline{X})^2}

其观察值:

s=1n1i=1n(xix)2s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2}

它与样本方差作用类似,只是标准差的量纲与数据本身一致,更便于直观理解数据的离散程度。

4. 样本 kk 阶(原点)矩

Ak=1ni=1nXikA_k = \frac{1}{n} \sum_{i=1}^n X_i^k

k=1,2,k=1,2,\cdots,其观察值:

ak=1ni=1nxika_k = \frac{1}{n} \sum_{i=1}^n x_i^k

一阶原点矩就是样本均值,而高阶原点矩可以反映数据在分布上的一些特征,例如三阶原点矩可以用于衡量数据分布的偏态。

5. 样本 kk 阶中心矩

Bk=1ni=1n(XiX)kB_k = \frac{1}{n} \sum_{i=1}^n (X_i - \overline{X})^k

k=2,3,k=2,3,\cdots,其观察值:

bk=1ni=1n(xix)kb_k = \frac{1}{n} \sum_{i=1}^n (x_i - \overline{x})^k

二阶中心矩与样本方差紧密相关,它消除了均值对数据离散程度度量的影响,能更纯粹地反映数据围绕均值的波动。

二、常考性质

  1. 若总体 XXkk 阶矩 E(Xk)=μkE(X^k)=\mu_k 存在(k1k\geq1),当 nn 充分大时,由辛钦定理可知,样本 kk 阶原点矩 AkA_k 依概率收敛于总体 kk 阶原点矩 μk\mu_k。即 AkPμkA_k \xrightarrow{P} \mu_k,这是矩估计法的理论依据。比如在估计总体均值(一阶原点矩)时,我们可以用样本均值(样本一阶原点矩)作为估计量,当样本量足够大时,这种估计是合理且可靠的。

  2. 样本均值 X\overline{X} 与样本方差 S2S^2 相互独立(这一性质在正态总体下尤为重要)。在后续对正态总体参数进行区间估计和假设检验时,该性质会频繁使用,简化了很多复杂的计算和推导过程。

三、常见分布

(一)χ2\chi^2 分布

1. 定义

X1,X2,,XnX_1, X_2, \cdots, X_n 相互独立且均服从标准正态分布 N(0,1)N(0,1),则

χ2=X12+X22++Xn2\chi^2 = X_1^2 + X_2^2 + \cdots + X_n^2

服从自由度为 nnχ2\chi^2 分布,记为 χ2χ2(n)\chi^2 \sim \chi^2(n)。这里自由度 nn 表示独立变量的个数。例如在研究多个独立的标准正态分布随机变量平方和的分布情况时,就会用到 χ2\chi^2 分布。

2. 概率密度函数

f(x)={12n/2Γ(n/2)xn/21ex/2,x>00,x0f(x) = \begin{cases} \frac{1}{2^{n/2} \Gamma(n/2)} x^{n/2-1} e^{-x/2}, & x>0 \\ 0, & x\leq0 \end{cases}

虽然该函数形式较为复杂,但理解其大致形状和特征很重要,它的图像是在 x>0x>0 一侧的单峰偏态分布。

3. 性质

4. 分位点

对于给定的正数 α\alpha (0<α<10<\alpha<1),满足 P{χ2>χα2(n)}=αP\{\chi^2 > \chi^2_{\alpha}(n)\}=\alpha 的点 χα2(n)\chi^2_{\alpha}(n)χ2(n)\chi^2(n) 分布的右(上)α\alpha 分位点。在进行假设检验等统计推断时,分位点常用于确定拒绝域。比如在 χ2\chi^2 检验中,根据计算得到的统计量与相应的分位点比较,来判断是否拒绝原假设。

(二)tt 分布

1. 定义

XN(0,1)X \sim N(0,1)Yχ2(n)Y \sim \chi^2(n),且 XXYY 独立,则

T=XY/nT = \frac{X}{\sqrt{Y/n}}

服从自由度为 nntt 分布,记为 Tt(n)T \sim t(n)

2. 概率密度函数

f(t)=Γ(n+12)nπΓ(n2)(1+t2n)n+12,<t<+f(t) = \frac{\Gamma\left(\frac{n+1}{2}\right)}{\sqrt{n\pi}\,\Gamma\left(\frac{n}{2}\right)} \left(1+\frac{t^2}{n}\right)^{-\frac{n+1}{2}}, \quad -\infty < t < +\infty

其图像关于 t=0t=0 对称,形状与标准正态分布相似,但在自由度较小时,尾部比标准正态分布更厚,意味着出现极端值的概率更大。

3. 性质

4. 分位点

对于给定的正数 α\alpha (0<α<10<\alpha<1),满足 P{T>tα(n)}=αP\{T > t_{\alpha}(n)\}=\alpha 的点 tα(n)t_{\alpha}(n)t(n)t(n) 分布的右(上)α\alpha 分位点。由于 tt 分布的对称性,t1α(n)=tα(n)t_{1-\alpha}(n) = -t_{\alpha}(n)。在 tt 检验中,通过比较计算得到的 tt 统计量与分位点来做出统计决策。

(三)FF 分布

1. 定义

Uχ2(n1)U \sim \chi^2(n_1)Vχ2(n2)V \sim \chi^2(n_2),且 UUVV 独立,则

F=U/n1V/n2F = \frac{U/n_1}{V/n_2}

服从自由度为 (n1,n2)(n_1, n_2)FF 分布,记为 FF(n1,n2)F \sim F(n_1, n_2)

2. 概率密度函数

f(x)={Γ(n1+n22)Γ(n12)Γ(n22)(n1n2)n1/2xn1/21(1+n1n2x)(n1+n2)/2,x>00,x0f(x) = \begin{cases} \frac{\Gamma\left(\frac{n_1+n_2}{2}\right)}{\Gamma\left(\frac{n_1}{2}\right)\Gamma\left(\frac{n_2}{2}\right)} \left(\frac{n_1}{n_2}\right)^{n_1/2} x^{n_1/2-1} \left(1+\frac{n_1}{n_2}x\right)^{-(n_1+n_2)/2}, & x>0 \\ 0, & x\leq0 \end{cases}

其图像也是单峰偏态分布,形状取决于两个自由度的值。

3. 性质

4. 分位点

对于给定的正数 α\alpha (0<α<10<\alpha<1),满足 P{F>Fα(n1,n2)}=αP\{F > F_{\alpha}(n_1, n_2)\}=\alpha 的点 Fα(n1,n2)F_{\alpha}(n_1, n_2)F(n1,n2)F(n_1, n_2) 分布的右(上)α\alpha 分位点。同时,有 F1α(n1,n2)=1/Fα(n2,n1)F_{1-\alpha}(n_1, n_2) = 1/F_{\alpha}(n_2, n_1)。在方差分析等应用中,根据 FF 统计量与分位点的比较来判断不同组数据的方差是否存在显著差异。

本文档总结了考研概率论中抽样分布的核心知识点,适合复习与查阅。


Edit page
Share this post on:

Previous Post
幂级数展开和麦克劳林的关系
Next Post
高等数学-曲线积分的特殊路径方法