参数估计就是用样本统计量$\hat{\theta }$去估计总体的参数$\theta$,用来估计总体参数的统计量称为估计量,根据一个具体样本计算出来的估计量的数值称为估计值。
基本原理
点估计
点估计就是用样本统计量$\hat{\theta }$的某个取值直接作为总体参数$\theta$的估计值。由于样本是随机的,由样本得到的估计值很可能不等于总体真值,所以需要说明点估计值与总体参数真值接近的程度。
区间估计
区间估计是在点估计的基础上,给出总体参数估计的一个区间,该区间通常由样本统计量加减估计误差得到。
例如,在重复抽样下,样本均值的数学期望等于总体均值,$E(\bar{X})=\mu$,标准差$\sigma_X=\frac{\sigma}{\sqrt{n}}$,可知$\bar{X}$取值落在$\mu$的左右2个标准差范围内的概率为0.95。但在进行参数估计时,情况恰好相反。$\bar{X}$是已知的,$\mu$是未知的,此时$\mu$被包含在以$\bar{X}$为中心的左右2个标准差的范围内,这种情况下,有95%的样本均值会落在$\mu$的2个标准差范围之内。也就是说,有95%的样本均值所构造的2个标准差的区间会包括$\mu%。
由样本统计量所构造的总体参数的估计区间称为置信区间。将构造置信区间的过程重复多次,得到多个置信区间,在这些置信区间中,包含总体参数真值的置信区间所占的比例称为置信水平。