数据学习(十)-假设检验

北慕城南 提交于 2020-01-06 14:44:54

目录

1.假设检验的基本问题

2.一个总体参数的检验

3. 两个总体参数的检验

1.假设检验的基本问题

假设检验是推断统计的另一项重要内容,它与参数估计类似,但角度不同,参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。

1.1 假设的陈述

1.对总体参数的具体数值所作的陈述,称为假设,或称为统计假设。
2. 先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程,称为假设检验。
3. 通常将研究者想收集证据予以支持的假设称为备择假设,或称为研究假设,用H1或Ha表示。
4.通常将研究者想收集证据予以反对的假设称为原假设,或称零假设,用H0表示。

在这里插入图片描述
备选假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验。
在单侧检验中,由于研究者感兴趣的方向不同,又可以分为左侧检验和右侧检验。如果研究者选择的备选假设的方向是“<”,称为左侧检验反之选择是“>”,称为右侧检验。
备选假设没特定的方向性,并含有符号“!=”的假设检验,称为双侧检验或双尾检验。

1.2 两类错误与显著性水平

当原假设为真时拒绝原假设,所犯的错误称为第一类错误, 又称弃真错误。犯第一类错误的概率通常记为a.
当原假设为假时没有拒绝原假设,所犯的错位称为第二类错误,又称取伪错误。犯第二类错误的概率通常记为b。
假设检验中犯第一类错误的概率,称为显著性水平,记为a。
在这里插入图片描述

1.3 统计检验量与拒绝域

根据样本观测结果计算得到的,并据以对原假设和备选假设作出决策的某个样本统计量,称为检验统计量。
标准化检验统计量=(点估计量-假设值)/点估计量的抽样标准差
能够拒绝原假设的检验统计量的所有可能取值的集合,成为拒绝域。
根据给定的显著性水平确定的拒绝域的边界值,称为临界值。

1.4 利用P值进行决策

在原假设为真的条件下,检验统计量的观测值大于或等于其计算值的概率。称为P值,也称为观察到的显著性水平。
在这里插入图片描述

2.一个总体参数的检验

2.1 总体均值的检验

在对总体均值进行假设检验时,采用什么检验步骤和检验统计量取决于我们所抽取的样本是大样本(n>=30)还是小样本(n<30),此外还需要区分总体是否服从正态分布、总体方差o2是否已知等几种情况。

2.1.1 大样本的检验方法
样本均值经标准化后服从标准正太分布,因而采用正太分布的检验统计量。设假设的总体均值为u0,当总体方差o2已知时,总体均值检验的统计量为:
在这里插入图片描述
当总体方差o2未知时,可以用样本方差s2来近似代替总体方差,此时总体均值检验的统计量为:
在这里插入图片描述
例题如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.1.2 小样本的检验方法

在小样本(n<30)情形下,检验统计量的选择与总体是否服从正太分布,总体方差是否已知有着密切联系。
当总体方差o2已知时,即使在小样本情况下,检验统计量认可根据大样本的计算方式进行计算。
当总体方差o2未知时,需要用样本方差s2代替总体方差o2,此时不再服从标准正态分布,而是服从n-1的t分布。因此需要采用t分布来检验总体均值,通常称为t检验,检验的统计量为:
在这里插入图片描述
在这里插入图片描述

2.2 总体比例的检验

在这里插入图片描述
在构造检验统计量时,我们仍然利用样本比例p与总体比例pi之间的距离等于多少个标准差op来衡量,因为在大样本情形下统计量p近似服从正态分布,而统计量
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.3 总体方差的检验*

与总体均值和总体比例检验通常使用的抽样分布不同,它使用的是卡方(y2)分布。此外,总体方差的检验,不论样本容量n是大或小,都要求服从正态分布,这是由检验统计量的抽样分布决定的。
检验统计量为
在这里插入图片描述
在这里插入图片描述

3. 两个总体参数的检验

3.1 两个总体均值之差的检验

在实际研究中,我们常常需要比较两个总体的差异,如一所学校的重点班和普通班两个班级的英语平均成绩是否有显著差别等。
在这里插入图片描述
3.1.1 两个总体均值之差的检验:独立样本

(1)大样本的检验方法
在大样本情况下,两个均值之差x1-x2的抽样分布近似服从正态分布,而x1-x2经过标准化后则服从标准正态分布,如果两个总体的方差o1,o2已知,则采用下面的检验统计量:
在这里插入图片描述
当两个总体方差o1,o2未知时,可以分别用样本方差s1,s2替代,此时检验统计量为:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
(2)小样本的检验方法
在两个样本都为独立小样本的情况下,检验两个总体的均值之差,需要假定两个总体都服从正态分布。检验时有四种情况:
1)总体服从正态分布,当两个总体方差o1和o2已知时,无论样本容量大小都服从正态分布,可用大样本的公式
2)总体服从正态分布,当两个总体的方差o1和o2未知但相等时,即o12=o22,则需要样本的方差来估计,公式为:
在这里插入图片描述
这时,两个样本均值之差经标准化后服从自由度为(n1+n2-2)的t分布,因此采用下面的检验统计量为:
在这里插入图片描述
3)总体服从正态分布,当两个总体的方差o1和o2未知且不相等时,o12!=o22,如果两个样本容量相等,即n1=n2=n,两个样本均值之差经标准化后服从自由度为(n1+n2-2)=2(n-1)的t分布,因而采用的检验统计量为:
在这里插入图片描述
4)总体服从正态分布,当两个总体的方差o1和o2未知且不相等时,o12!=o22,而且两个样本容量不相等,即n1!=n2,两个样本均值之差经标准化后服从自由度为(n1+n2-2)的t分布,而是近似服从自由度为v的t分布,因而采用的检验统计量为:
在这里插入图片描述
该统计量的自由度为v,其计算公式为
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
3.1.2 两个总体均值之差的检验:匹配样本
d:第i个配对样本数据的差值,i=1,2,3,…,n;
d把:配对样本数据差值的平均值,即d把=di的和/n;
s2:配对样本数据差值的方差

对于小样本情形,配对差值服从自由度为n-1的t分布,统计量为
在这里插入图片描述

在这里插入图片描述

3.2 两个总体比例之差的检验

两个总体比例之差的检验思路与一个总体比例的检验类似,只是涉及两个总体,可以得到检验统计量
在这里插入图片描述
在这里插入图片描述
但由于两个总体的比例pi1和pi2是未知,需要采用两个样本比例p1,p2来估计op1-p2.这时又两种情况:
第一种情况是原假设成立的情况下,即H0:pi1-pi2=0或H0:pi1=pi2,pi1=pi2=pi的最佳估计量是将两个样本合并后得到的合并比例p.如果设x1表示样本1中具有某种属性的单位数,x2表示样本2具有某种属性的单位数,则合并后的比例为:
在这里插入图片描述
这时两个样本比例之差pi1-pi2抽样分布的标准差opi1-pi2的最佳估计量为:
在这里插入图片描述
将公式带入其中得到统计量为
在这里插入图片描述
第二种情况是,当我们要检验假设H0:pi1-pi2=d0,d0!=0时,可直接用两个样本比例p1和p2作为相应的两个总体比例pi1和pi2的估计量,标准差估计为
在这里插入图片描述
将公式带入其中得到统计量为
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.3 两个总体方差比的检验

由于两个样本方差比s12/s22是两个总体方差比值o12/o22的理想估计量,而当容量为n1和n2的两个样本分别独立得取自两个正态分布时,统计量
在这里插入图片描述
服从F(n1-2,n2-1)分布,所以选择上述公式作为统计量。在原假设成立的条件下,检验统量变为
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!