当前位置 :主页 > 基金课题 > 科研心得 >
随手学统计:品茶背后的假设检验

调查派在 2014 年推出的「随手学统计」第一季为大家介绍了一些统计学的概念,如死亡率和病死率、灵敏度和特异度等,受到了不少医生的好评。

如今「随手学统计」第二季伴随着夏天的脚步重新归来,本期我们将在袅袅茶香中为大家介绍假设检验的原理。

女士品茶的故事

话说在英国的生物统计权威 R. A. Fisher 教授发表于 1935 年的著作《The Design of Experiment》中,有一个著名的「女士品茶」的故事。


那是 20 世纪 20 年代,一个在剑桥夏日的午后,一群大学的绅士和他们的夫人们,正围坐在英国剑桥户外的桌旁,享用着下午茶。在品茶过程中,有一位女士声称自己在喝英式茶的时候能区分出来是先倒的茶还是先倒的奶。

于是 Fisher 君就打算设计一个实验来验证这位女士是否真的如此天赋异禀,具备这样的品奶茶能力。


实验设计

常识告诉我们,如果想得到有意义的结论,就应该随机给女士几杯茶让女士鉴别一番,根据她答对的次数(或者答对的比例)来判断她是否有这个能力。可是问题是,要做多少次实验呢?根据结果我们又如何来给出定量的结论呢?

教授在当年就给出了他的一套实验思路:

他调配出了 8 杯其他条件一模一样而仅仅是倒茶倒奶顺序相反的茶,其中 4 杯先倒奶,4 杯先倒茶。然后他让女士品尝之后告诉他哪 4 杯是先倒奶,剩下的当然就是先倒茶啦。

结果分析

分析实验结果的时候,教授运用了这样的逻辑:


他首先假设女士没有这个能力(这个假设被称为原假设),然后如果女士很好的鉴别了这 8 杯茶,那就说明在原假设成立的情况下,发生了非常反常的现象,以至于原假设的成立是令人怀疑的。从统计的角度来说,如果在原假设成立的前提下,发生了非常小概率的事件,那我们就有理由怀疑原假设的真实性。

这也是教授假设检验的基本思路。

教授的原假设是 H0:女士没有这样的能力。在原假设的前提下,我们认为女士是毫无根据地瞎猜。这就如一个袋子里放了 8 个球,黑白各 4 个。不放回随机抽取 4 个球,其中白色球数 X 的概率分布为:(有木有回到高中的感觉?)


对于这样的概率分布,教授认为,即使 X=3,女士品出了 6 杯茶,我们也不能拒绝原假设,认为女士有鉴别能力。如果在此时拒绝了原假设,那在 X=4 的情况下(女士鉴别出了 8 杯茶!)也要拒绝原假设。所以在原假设成立的前提下,拒绝原假设的概率变成了 17/70。也就是说如果女士没有这个品茶能力,她竟然能侥幸通过所有测试,使我们错误地认为她有这个能力的概率居然有 17/70!这种错误被称为第一类错误 α,一般来说不希望这个错误发生的概率超过 5%。

女士真的天赋异禀吗?

根据以上分析,Fisher 只有在女士把 8 杯茶都鉴别出来的情况下,才会认为她有这个能力。那后来这位女士怎样了呢?教授没有描述这项实验的结果,可是有位叫 David Salsburg 的统计学家写了一本书《The lady tasting tea》,在书中他告诉我们这位女士还真把 8 杯茶都鉴别出来了!


 

上一篇:导师与研究生:师徒过招那些事
下一篇:ERCP 中单人胆道镜检查增加菌血症及感染风险
分享到: