1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

有哪些有趣而著名的悖论?

本帖由 漂亮的石头2021-05-27 发布。版面名称:知乎日报

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    486,020
    赞:
    46
    [​IMG] Serendipity,星星还是要还给宇宙的 阅读原文

    分享一个有趣的悖论:辛普森悖论

    辛普森悖论为英国统计学家E.H.辛普森E.H.Simpson)于 1951 年提出的悖论,即在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。

    有一个非常有趣的故事来解释该悖论:

    在一次教职工大会上,一群老师想要知道让学生获得最好学习成绩的最佳学习时间长度。

    因此,他们决定收集学生学习的时间数据,然后与学生的考试成绩进行比较。

    因为事先相信更多的数据会意味着更好的结果,所以所有的老师都提供了他们的课程学时数据进行分析。也就是说,不同学科的数据被放在了一起进行统计分析。

    然而,最后却得到了一个负相关的结论,以及一个强烈的负相关系数——-0.7981

    [​IMG]

    很明显,这个结论是违背认知的,当然也是绝对错误的

    那么问题出在了哪里?

    答案是:不应跨学科整合所有数据,而应该分别分析每门课程的数据

    例如,当单独分析体育学科时,结果如下:

    [​IMG]

    一个正的相关系数——0.6353

    这就是一种统计现象,即当引入第三个或多个混杂变量时,前两个变量间看似强关联的数学关系就会消失,有时候甚至发生关系的逆转。

    随后,统计人员重新绘制了所有数据,和之前不同的是,每门课都用不同的颜色进行了标注,结果如下:

    [​IMG]

    可以看到,每门课的学习成绩和学习时间都是正相关的

    然而,总体上来看,这两者却是呈现负相关的。在数据分析过程中,学习成绩和学习时间这两者的关系被完全的颠倒了。

    [​IMG]

    这就是所谓的辛普森悖论

    以上,谢谢

    阅读原文
     
正在加载...