KellyWeaver,公共卫生 / 营养流行病学 阅读原文 太长不看版总结: 由于数据源和研究设计的限制,这篇研究不能证明每天一个鸡蛋增加糖尿病风险是因果关系,60% 的风险估计也是看看就好,实际上真实的效应大概率并不是这个数。事实上作者本人也从未声称这是因果关系。 也就是说,这篇研究并不能说明你刻意每天不吃蛋就能把风险降回去,因为真正引起疾病风险上升的因素也可能不是吃蛋。即便少吃蛋,如果真正的危险因素仍然还逍遥法外,那么患糖尿病的风险就不会降回去。 因此,这篇研究主要的价值在于,作为一个先行者,为未来的营养流行病学研究者在做基于中国人群的同一话题的研究时提供了宝贵的科学证据参考。 对于不做研究的公众来说,你们并没有必要过度关注这篇研究!!!球球各路营销号放过营养学家们吧!!!(虽然微博微信抖音都已经开始集体狂欢了,唉。。。) 应评论区要求,再简单补充一下目前营养学界针对蛋怎么吃的结论: 就目前的研究进展而言,从一些顶刊上基于美国人群的高质量综合性证据[1][2]来看,每天吃一个全蛋,对没有基础疾病的健康人来说,是不会增大心血管病或糖尿病风险的。 基于中国人群的证据也显示,每天吃一个全蛋不会增加心血管病风险[3],虽然这篇不知道为啥只发在一个非顶刊的杂志上。 如果是每天吃一个以上的蛋,目前学界尚未给出统一明确结论,但一些初步的研究结果表明,可能不同的人都需要在考虑自己对膳食胆固醇摄入的敏感性的前提下量力而行[4][5]。说人话:如果血脂遭不住,就别吃那么多。 营养流行病学研究之间结论打架是常事,关键是要结合研究的质量来综合评价它能支撑什么样的结论,不能支撑什么样的结论。 纠正:60% 这个数字是未经充分校正的结果,完全校正后瞬间小了一半 微博和公众号们抄去狂欢的 60% 的数字,实际上只是这篇研究里校正协变量最少的模型的结果,什么抽烟、喝酒、体力活动、膳食、超重肥胖这些明显和糖尿病风险增加相关的因素都没有校正。 而一旦把这些因素稍事校正之后,这些关联的强度迅速打折了一半以上,而且本来良好的剂量反应关系(鸡蛋吃得越多危险越大)也变成了诡异的 ∩ 型(鸡蛋吃着吃着,危险居然就没那么大了)。 这些都提示着:这个鸡蛋摄入和糖尿病之间的关联,可能还有其他混杂因素的影响没有抹干净。 这篇研究,很难论证因果关系 从研究设计上来说,这篇研究是观察性研究,总体来说是一个前瞻性的队列设计。 一般来说,做得足够实锤的队列研究,也是可以无限接近于提示因果关系真实存在的,只要研究者能满足以下这一堆复杂的条件: 用精确的测量方式尽可能减小随机误差,得到真实的暴露和结局变量 在结果中做出剂量反应关系(吃得越多风险越大 / 小) 在多个异质的人群中重复,能够复现相似的关系 有充足的体内和体外实验证据支持生物学机制 有临床试验证据支持干预的实效 用精确的测量方式和巧妙的研究设计尽可能排除每一种其他的影响很大的合理怀疑 ……等等其他因素,具体可以参考 Hill 标准 那么这样做出来的队列研究,「实锤程度」就会越来越高,结论的可靠程度也会越来越高。 这样的研究,即便有着观察性研究无法论证因果关系的本质限制,也往往能够发上 AJCN、JN 乃至 BMJ、JAMA、Lancet、NEJM 这样的顶刊。 但是,前面所提到的这种队列研究只是极少数。在营养流行病学领域中,绝大部分的队列研究,正如题目中这一篇,是很难做到前面这些的。 因此,这样的研究也无法论证因果关系,最多只能证明被研究的食物是一个疾病风险的标志。 也就是说:这篇文章最多能揭示一个类似「和手指不黄的人相比,食指中指泛黄的人里,得肺癌的人更多」这样的相关关系。但这样的相关关系最后是不是真的因果关系,就超出这篇研究的研究设计的能力范围了。 (注:在这个例子里,是抽烟时产生的焦油会把手指染黄,抽烟同时导致肺癌;而不是手指颜色本身导致肺癌。因此,虽然数据见到是手指颜色发黄的人肺癌风险更高,但漂白手指并不能降低肺癌风险,戒烟才行。这就是为什么不能拿着相关性当作因果性。) 而这篇研究发现的一天一个蛋和糖尿病之间的联系,有没有像黄色手指那个例子一样,有其他的合理怀疑的病因呢?是有的。 1991 年 -2009 年期间,中国人的鸡蛋摄入基本和很多社会经济状态因素和生活方式特征都挂钩,而这些因素又大多会直接和间接影响糖尿病风险。 研究者在文内已经提及,在他们的人群中,吃蛋多的人教育程度更高、收入更高、居住在市区,同时 BMI 更高(更胖)、血压更高、喝酒喝得多,平时运动少,膳食模式也更「现代」(文中没提他觉得什么是「现代」,但我估计应该是类似西方饮食的那种肉多的膳食模式)。 这些每一种因素,除了教育程度高之外,其他几乎全是与更高糖尿病风险相关的。而,这些混杂因素对糖尿病发病风险的影响,即使像绝大多数流行病学研究做的那样,以在多变量线性模型中加入直线相关协变量或分类哑变量的方式校正,也不见得能全部排除干净。这是所有流行病学研究都要面临的问题,不只是这篇研究。 另外,这篇研究采取一个综合的「膳食分数」来抽象概括所有膳食成分的影响,这种做法实际上能起到的调整膳食中其他成分对糖尿病风险影响的效果如何,仍然有待商榷——不过其实现在也没有太多更好的办法来解决这个问题。 如果这里研究的是比较强的联系,像酒精 - 血尿酸,或者吸烟 - 肺癌这种,那么这些残留的影响没有排除干净也没关系。毕竟原本要观察的联系就强,这些因素的残留影响掩盖不住,胳膊拧不过大腿。 但是,像鸡蛋 - 糖尿病这样的本来自己效应量就小的联系,在这些残余的混杂效应的扭曲作用面前就非常脆弱了。如果两边都是胳膊,甚至可能鸡蛋这边的胳膊还弱一点,那谁拧得过谁?这怎么说得清? 对于这种问题,其他的高质量的关于蛋与慢性病的研究,大多都采取了暴力进一步堆样本量的做法,比如合并多个大样本队列,把样本堆到 10 万级;这就是这篇研究采用的 CHNS 这寥寥八千多的数据量所无力支撑的了。 结合此前其他的一些鸡蛋 - 心血管病、鸡蛋 - 糖尿病的关联的研究来看,搞不好这校正后剩下的 17% 的影响都还有一大半都是残余混杂效应。 研究采用的数据可能有一定局限 在研究比较弱的食物 - 疾病关联时,为了保证统计功效,要么得有庞大的样本量,要么得有精确的膳食测量。其他关于蛋 - 慢性病关联的研究,大多选了扩大样本量的前者;样本量上不了十万百万,如果有精确的膳食测量方法,那也不错。 可能是由于中国整体情况就是目前的队列研究中膳食测量数据好的很少,而且基本不供公开使用,于是这篇研究最终采用的数据,就是令人毫不意外的中国居民营养与健康状况调查(CHNS),也即中国境内目前唯一一个可以不用申请就能使用的含膳食测量的纵向数据。 而 CHNS 的膳食数据,从一些描述统计来看,可能质量还不足够好。 比如说,以 2012 年 CHNS 释出的营养素摄入数据为例,CHNS 数据集中部分省份的能量摄入都高得 / 低得很夸张。像有的省,样本平均每日能量摄入中位数才 1300kcal/d,这种全省大饥荒水平的中位能量摄入就是有明显漏记的指征。 对 3 日 24 小时回顾和 3 日称重记录法这种相对而言精度较高的膳食测量方法来说,做出来结果是这样,明显标志着具体膳食测量的质控执行程度值得打一个问号。如果膳食摄入测量不准,后面估计关联强度的时候也会受到影响。 总结 这种级别的效应量,加上万级样本量,而且还是 3 日 24 小时回顾 + 3 日 24 小时膳食称重记录法做的膳食测量,如果每个都是方方面面真的扎扎实实把信效度、质控什么的都做到位了,那至少值得一个营养专业的顶刊。但最后是发在了营养领域一个比较中等的 SCI 期刊上,背后显然就还是有一些局限性没有解决的。 这样的掣肘,大多是数据集本身或者流行病学研究本身难以改变的现实困难造成的,论文作者为了克服这些困难,已经基本尽力了。 对营养流行病学研究者来说,这篇研究是非常宝贵的参考资料。有它探路之后,后续研究无论是选择数据源、安排样本量、计划分析方案,还是得到结果后的解读等等,都能从中得到帮助。 但是,对公众来说,单就这篇研究是否能论证「鸡蛋是增加糖尿病风险的原因,且增大的效应量为 1.6 倍」这一点,答案很清晰:不能这样解读! 各路所谓健康养生的野路子公众号抖音号微博营销号们,求你们了,放过这些只供同行参考的小研究吧,多去看看膳食指南,那才是对你们非研究者来说有价值的东西。。。 如有错漏之处,还望同行不吝斧正。本文禁止转载,知乎日报、知乎官方微博除外。阅读原文