§2 数理统计方法
一、
总体参数的估计
1、总体(母体)与样本(子样)
研究某个问题,它的对象的所有可能观测结果称为总体(或母体),记作。总体中抽取一部分样品称为总体的一个样本(或子样)。样本中样品的个数称为样本的大小(或容量)。,可以认为是大样本,否则称为小样本。
数理统计方法就是应用概率论的结果,通过样本来了解和判断总体的统计特性的科学方法。
2、 样本特征数与总体数字特征对照表
名 称 |
样本特征数 |
总体数字特征 |
均 值 |
|
|
方 差 |
|
|
标准差 |
|
|
变异系数 |
|
|
偏态系数 |
|
|
峰态系数 |
|
|
注意,1° 当较大时,取
(有时称此为样本方差,而称表中的为样本修正方差)
2° 样本特征系数还有:
样本阶原点矩
样本阶中心矩
样本中位数 (样本大小n为奇数)
样本均差
样本极差
3、总体参数的点估计
记x1 ,x2 ,···,xn是从总体中取出的一个样本,可用样本的特征数来估计总体的数字特征。其常用方法有以下两种:
[矩法] 矩法是用样本的r阶矩作为总体r阶矩的估值。具体步骤如下:
设的分布函数包含k个参数(其取值未知),记作。假定的k阶原点矩存在,它们自然是的函数,即
(r=1,2,···,k)
考虑总体的一个样本作出这一样本的r阶矩,即
=
然后解方程组
(= (r=1,2,···,k)
记所得的解为
用分别作为的估值。
[最大似然法] 设总体的分布是连续型的,分布密度函数为,其中是待估计的未知参数。对于给定的使函数达到最大值的,并用它们分别作为的估值。
由于ln与在同一点()上达到最大值,因此,引入函数
L()=ln=)
它称为似然函数。只要解方程组
(i=1,2,···,k)
就可以从中确定所要求的,它们分别称为参数的最大似然估计值。
如果总体的分布是离散型的,只要把上述似然函数中的取为就可以了。
例 正态总体的参数估计,假定已知总体遵从正态分布N(,但参数未知。现在要用总体的n次观测值x1 , x2 ,···, xn求的最大似然估值。
解 因为总体的分布密度函数为
因此,似然函数为
解方程组
得
容易检验确实使取到最大值。因此它们分别是的最大似然估值。
[估值好坏的判别标准]
1° 无偏性 如果参数的估值 x1 , x2 ,···, xn)满足关系式
则称是的无偏估值。
2° 有效性 如果和都是参数的无偏估值。
则称比有效。进一步,如果固定样本的容量n,使极小值的无偏估值就称为的有效估值。
3° 一致性 如果对任意给定的正数,总有
则称的估值是一致的。
由契贝谢夫不等式(见§1,三)易见,当
对某成立时,是的一致估值。
在实用中,往往应用这一充分条件来验证是否是的一致估值。
例
总体分布 |
未知总体 参 数 |
总体参数估值 |
无偏性 |
有效性 |
一致性 |
|
|
|
有 有 有 有 有 有 有 |
有 有 有 有 |
有 有 有 有 有 有 |
4、样本的频率分布
频率分布较完整地反映实验数据的变化规律。建立频率分布的步骤(设样本为x1 ,x2 ,···, xn)是:
(1) 找出最大值与最小值,求得极差。
(2) 根据样本大小分组,通常大样本分成10~20组,小样本分成5~6组,再根据组数k和极差R决定组距c,如果按等距分组,则c。
(3) 确定分点(常取比原数据的精度高一位)。
(4) 数出各组的频率。
(5) 计算频率
(6) 画直方图(分点为横坐标,频率与组距之比为纵坐标)。
(7) 如果变量是连续的,则描出光滑曲线,近似的代替总体的分布。
5、总体参数的区间估计
[小概率原理]
在一次试验中,概率很小(接近于零)的事件认为是实际上不可能发生的事件;而概率接近于1的事件认为是实际上必然发生的事件。
[置信区间与显著性水平]
对总体参数(如)进行区间估计(即估计参数的取值范围)时,如果对于预先给定的很小的概率,能找到一个区间(),使得
=1-
那末称区间()为参数的置信区间,和称为置信限(或临界值);和称为否定域;概率称为显著性水平,1-称为置信水平(或置信概率)。
[总体参数的区间估计表]
假设总体遵从正态分布)。对于预先给的显著性水平,可用一个样本x1,
x2 ,···,xn的均值和标准差s来估计总体的均值和方差的置信区间,也可用两个样本与的均值和标准差来估计两总体均值差的置信区间。
样本情况 |
总体参数或的置信区间 |
与置信区间有关的与的确定 |
大样本 已知总体方差 |
|
查正态分布表 |
大样本 总体方差未知 |
|
同上 |
小样本 已知总体方差 |
|
同上 |
小样本 总体方差未知 |
|
查t分布表(自由度为n-1) |
已知两总体的 方差 |
|
查正态分布表 |
两总体的方差 未 知 |
式中 |
查t分布表 (自由度为n1 + n2-2 ) |
小样本 已知总体均值 |
|
查分布表 (自由度为n) |
小样本 总体均值未知 |
|
查分布表 (自由度为n) |
小样本 两总体的均值 与方差未知 |
|
查F分布表 (自由度为 查分布表 (自由度为(n2 _-1,n1 –1)) |