假设检验中所谓“小概率事件”,并非逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的原则,即小概率事件在一次试验中是几乎不发生的,但概率小到什么程度才能算作“小概率事件”,显然,“小概率事件”的概率越小,否定原假设h0就越有说服力,常记这个概率值为α(0<α<1),称为检验的显著性水平。对于不同的问题,检验的显著性水平α不一定相同,一般认为,事件发生的概率小于0.1、0.05或0.01等,即“小概率事件”
基本步骤:
1、提出检验假设又称无效假设,符号是h0;备择假设的符号是h1。
h0:样本与总体或样本与样本间的差异是由抽样误差引起的;
h1:样本与总体或样本与样本间存在本质差异;
预先设定的检验水准一般为0.05。
现在以一个例子来说明。
某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为m0=0.081mm,总体标准差为s= 0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度的均值为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?
(a=0.05)
解题结果:
有些同学看到这个结果以后,就会觉得不好理解,为什么就拒绝了假设h0呢?
首先,我们从图一中,可以得出如下信息:u代表新机床生产产品的总体均值,而
则分别是老机床产品的总体均值和方差,而此时新机床产品的总体均值和方差不知道,也正是我们现在需要估计的统计量。我们假设,新机床的产品和老机床的总体均值和方差一样,接下来,就是要看看这种假设是不是可靠,可靠程度有多大,这就是我们现在说的假设检验。
由于假设新机床的产品(x)和老机床的总体均值和方差一样,所以:
那么通过
变换,就把新机床样品x的均值转变成服从标准正态分布,x自身所服从的分布曲线就是图一中的标准正态分布曲线整体向右平移0.076。
这个计算结果就是告诉我们,新机床的产品(x)和老机床的总体均值和方差一样这个假设(就是h0),在只做了一次抽样的情况下(样本均值为0.076mm),这件事情真的发生的可能性处于图一中的左边曲线下面的蓝色部分内(z=-2.83),而图一中两边蓝色部分面积之和即a=0.05,也就是预先设定的检验水准。那么这次抽样结果的计算表明这样一个事实:在我们认为新机床产品的总体均值和旧机床的相等(h0)这一可能性只有5%(小概率)的前提下,在仅做一次抽样的情况下,这个小概率事件就发生了,所以我们认为拒绝前面的假设。
看完这些,如果要用自己的语言来描述上述事件的整个过程,估计有人还是不能说清楚,那么,这里就尝试用通俗的语言来描述整个事情的经过:
有个公司,觉得老机床性能变坏了,就新买了一批机床,现在工程师要验证这批新机床是不是比老机床性能更好(产品均值不能一样)。工程师经过对新老机床的各种性能分析之后,得出结论:新机床和老机床的性能一样(h0,这个假设体现在图二和图三中)的可能性不会超过5%(反过来也意味着新机床和老机床性能不一样的可能性为95%)。因为新老机床的产品都服从正态分布,在作出不会超过5%这个推断的时候,工程师的大脑里面就出现了那条标准正态分布曲线,5%就意味着横轴的z值必须处于
为了验证他们这个推断,所以他们抽取了一批样本,现在就是要在样本中找到一个能和z值对应的统计量,刚好样本的均值服从正态分布,转换为相应的z值以后,结果真的处于上述两个区间之内(5%),这就相当于小概率事件在一次试验中真的发生了,这时就应拒绝假设h0(这件事情也说明,在仅仅做了一次抽样试验的情况下,这个事情应该出现在z值的95%的范围之内才能接受h0)。也就是在5%的检验水准下拒绝h0。
上述实验结果还表明,只有进一步缩小a值(比如3%),才能不把z=-2.83包括在上面两个区间内,也就是在a更小的情况下,才能接受h0。也就是说,新老机床性能一样的可能性没有5%,而是可能只有3%。a的取值一般不能大于0.1,否则假设检验的方法就失去了意义。
上述小概率检验,可以以打牌的例子说明:假设四个人刚开始打牌,那么,我们可以认为,其中任何一个人在一把牌里面同时抓到四个a,四个2,两个鬼的概率只有1/10000(h0),那么当第一把牌就有人抓到那样的牌的时候,我们肯定会很自然地认为那个人在出老千,或者怀疑1/10000的概率假设不准确,也就是说,我们拒绝h0;反过来,只有当第一把牌谁也没有同时抓到四个a,四个2,两个鬼的时候,我们才接受h0。