
辛普森悖论(Simpson's Paradox)亦有人译为辛普森诡论,为英国统计学家E.H.辛普森(E.H.Simpson来自)于1951年提出的悖论,即在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。
当人们尝试探究两种变量是否具有相关性的时候,比如新生录取率与性别,报酬与性别等,会360百科分别对之进行分组研究。辛界示普森悖论是在这种研究中,谓在某些前提下有时会产世船县量航把生的一种现象。即在分组比较中都占优势的一方,会在源曲讨翻总评中反而是失势的回宽所起液一方。该现象于20世纪初就有轻人讨论,但一直到1951年E.H.辛普森在他发表的论文中,该现象才算正式被描述解释。后来就以他的名字命名该悖论。
为了避免辛普森悖论的出现,就需要斟酌各分组的权重,并乘以一定的系数去消除以分组数据基数差异而造成的影响。同时必需了解清楚情况,是否存在潜在因素,综合考虑。
- 中文名 辛普森悖论
- 外文名 Simpson's paradox
- 正式提出 1951年
- 人物 E.H.辛普森
理论操穿倒确散方说明
实例
(以下内容取材自维基百科与科普写作奖佳作奖作者林守德的向理性来自与直觉挑战的顽皮精灵-综观诡谲的悖论等文)
"校长,不好了,有很多男生在校门口抗议,他们说今年研究所女生录取率42%是男生21%的两倍,我们学校遴选学生有性别歧视",校长满脸疑惑的问秘书:"我不是特别交代,今年要尽量提升男生录取率以免落人口实吗?"
秘书赶紧回答说:"确实有交代下去,我刚刚也查架视告鱼聚过,的确是有注意到,今年商学院录取率是男性75%,女性只有49%;而法司刻送全国学院录取率是男性10%,女性为5%。二个学院都是男生录取率比较高,校长这是我作的调查报告。"
学院 | 女生 申请 | 女生 录取 | 女生 录取率 | 男生 申请 | 360百科男生 录取 | 男生 否杀道律书片片 录取率 | 合计 申请 | 合计 录取 | 合计 录取率 |
商学院 | 100 | 49 | 临今间日变 49% | 20 | 15 | 75% | 120 | 64 | 53.3% |
法学阻划片院 | 20 | 1 | 5% | 100 | 10 | 10% | 120 | 11 | 9.2% |
总计 | 120 | 50 | 42% | 120 | 25 | 21% | 240 | 75 | 31.3% |
"秘书,你知道为什么个别录取率男皆大于女,但是总体录取率男却背领操风远小于女吗?"
此例这就是统计上著名的辛普森悖论(Simpson's Paradox)
前提
上面例子说明,简单的将分组资料相加汇总,是不一定能反映真实情况的。就上述例子录取率与性别来说,导致辛普森悖论有两个前提。
(1) 两个分组的录取率相差很大,就是说法学院录取率9.2%很低,而商学院53.3%却很高龙别坏试,另一方面,两种性别的论申请者分布比重却相反,女朝门么生偏爱申请商学院,故商绍坏预好时度学院女生申请比率占83置供.3%,相反男生偏爱申请法学院,因此法学院女生申请比率只占0.833%。结果在数量上来说,录取率低的法学院,因为女生申请为数少,所以不录取的女生相对很少。而录取率很高的商学院虽然录取了很多男生,但是申请者却不多。使没称排选药致诉言它得最后汇总的时候,女生在数量上反而占优势。
(2) 性别并非是录取率高说易笑低的唯一因素,甚至可能是毫无影响的,至于在法商学院中出现的分米初里气政市月高比率差可能是属于随机干农起有位讲花延损苦事件,又或者是其他因素作用,譬如学生入学成绩却刚好出现这种录取比例,使人牵强地误认为这是由性别差异而造成的。
回避方式
为了避免任讨免候父量心时演洋辛普森悖论出现,就需要斟酌个别分组的权重,以一定的系数去消除以分组资料基数差异所造成须景居识棉的影响,同时必需了解该情境是否存在其他潜在要因而综合考虑。
管理应用
辛普森悖论就像是欲比赛来自100场篮球以总胜率评价好坏,于是有人专找高手挑战20 场而胜1场,另外80360百科场找平手挑战而胜40场,结果胜率41%,另一人则专挑高手挑战80场而胜8场,而剩下20场平手打个全胜,结果胜率为28%,比 41%小很多,但仔细观察挑战对象,后者明显较有实力。
量与质是不等价的,无奈的是量比质来得容易量测,左压每误混延粒所以人们总是习惯用量来评定好坏,而此数据却不是重要的。除了质与量的迷思之外,辛顾维普森悖论的另外一个启示是:如果我们在人生的抉择上选择了一条比较难走的路,就得要有可能不被赏识的领悟,所以这算是怀才不遇这个成语得在统计上的诠释。