每天的疫情更新你真的看懂了?全球都在玩“数字游戏”

如果英国突然开始对更大规模人群进行检测,并发现新病例大幅增加,这并不一定意味着疫情传播得更快;同样,如果一个国家达到了检测能力上限,它可能会突然报告新增病例的下降,而这些,都是误导性的数字。

4月6日,美国犹他州桑迪城,在当地的一个展览中心内,方舱医院的床位已经备好。

本刊记者/彭丹妮

截至4月7日上午8点,根据美国约翰·霍普金斯大学新冠疫情数据,德国确诊病例超过10万,英国的这一数字为5.2万,不仅低于德国,还低于意大利、西班牙等欧洲其他国家。看统计数据是我们了解一个国家疫情的最主要办法,但仅从数字表面读出“德国疫情比英国似乎严重得多”的结论,这符合真实情况吗?

多位专家表示,比较疫情中各国的数字有误导性,甚至是危险的。英国剑桥大学教授希拉·伯德是著名的生物统计学专家。她说,病例检测和报告体系甚至在国家内部也不一致,更不用说在国际上了。关于谁接受测试、在何时何地检测的规则可能都会发生变化,而这些变化也不一定会及时、准确地体现在不同政府发布的数据中。

在英国,政府说当前卫生系统没有足够的能力检测每一个出现新冠症状的个体,因此只有病情严重到需要去医院寻求治疗的人才会得到检测,在这种情况下,显然很多症状轻微的人会被排除在感染者统计之外。相比之下,在德国,任何出现流感样症状的人、过去14天与确诊病例有接触的或者去过高风险地区的人都能得到检测。

哈佛大学公共卫生学院传染病动力学中心教授马克·利普西奇在《新英格兰医学杂志》上撰文指出,如果医疗服务范围或实验室检测能力瓶颈等问题限制了我们对确诊病例的计数,或者如果只对重病例进行检测,则对确诊病例的简单计数可能是疫情发展轨迹的误导性指标。人们相信,数字就像它一贯象征的理性那样,准确、可靠、不容置疑,比绝大多数文字描述和个人体验都更有力。但流行病统计学家与数学家们提醒,当谈到新冠疫情的时候,只看数字可能非常危险。

如果英国突然开始对更大规模人群进行检测,并发现新病例大幅增加,这并不一定意味着疫情传播得更快;同样,如果一个国家达到了检测能力上限,它可能会突然报告新增病例的下降,而这些,都是误导性的数字。“危险在于,我们依赖这些数据,并假设它们能准确计算出感染的总人数。”英国沃里克大学副教授迈克·蒂尔斯利说,人们需要关注到数字背后更大的图景。

薛定谔的数字

人们每天最关心的数字——新增确诊病例,是否如所想的那样,就是当天感染的人数吗?什么叫“确诊”,各国是一个定义吗?如果一个人核酸试剂检测结果呈阴性但是试剂盒灵敏度只有60%呢?如果一个人今天发病5天后才得到检测结果,那他属于哪天的新发病例呢?

3月27日,香港大学公共卫生学院流行病和生物统计学分部主任高本恩等人在医学论文预印本平台medRxiv网站发表题为《改变COVID-19病例定义对中国大陆流行曲线和传播参数的影响》一文。文章梳理了中国新冠肺炎几次“诊断标准”定义的变化,通过建模分析发现,当这一定义从第一到第二版、从第二到第四版、从第四到第五版改变时,确诊人数分别增加了7、2.8和4.2倍。他们估计,如果整个疫情期间使用的是第五版的病例定义,那么到2月20日属于“确诊者”的人数将高达23.2万例。

4月1日,美国底特律,工作人员在一个车展展馆内查看方舱医院的建设进度。

如果不把这个人为因素考虑进去,只是看到表面上的数字变化,那么高本恩等人指出,在传播参数的计算上就会有一系列连锁反应,包括高估疫情增长率,进而高估基本传染数R0的数值。比如,广东省疾控中心2月13日的一篇文章计算出全国新冠肺炎的R0值高达4.5,但现在普遍认为,R0数值应该在3上下。

由美国约翰·霍普金斯大学系统科学与工程中心(CSSE)一年级的博士生董恩盛等人发起并维护的一个数据可视化地图,只是整合世界各国最新的确诊、死亡和恢复病例等简单数据,就引起每天超10亿双眼睛的关注。董恩盛告诉《中国新闻周刊》,尽管多数时候他们都是引用各国官方数据,但也遇到过采纳何种标准来计数的问题。比如,早期美国疾控中心统计的“确诊病例”需要核酸检测呈阳性加上CDC认定才算是确诊,但他们采用的是“推定阳性病例”的估算方式,即由州或地方实验室确认的第一时间的病例,但未经CDC证实,因此数字有时要比CDC大一些。

美国田纳西比州范德堡大学医学中心传染病专家威廉·沙夫纳3月9日说,我们对于新冠肺炎还在不断了解中,所做的数据统计还处在初步阶段。“(现有数据)全都是估计。你所在的国家认为什么是一个新冠病例?各种病例定义之间差别很大。”

多位专家指出,COVID-19在中国被称作新冠肺炎,在国外大多叫新冠感染,因此在中国,无症状感染者并不属于确诊病例,而是单独计数。根据世卫组织的定义,“无论有无临床体征和症状,经实验室确诊感染新冠病毒者”均为确诊病例,欧洲也采用这一标准。

“无症状感染者”的数据又是另外一个谜。比如,一个常被引用的数据来自2月13日发表在《国际传染病杂志》上的文章。该论文对从武汉包机撤离的565名日本公民进行研究,结果发现撤离者有13人感染,其中4人为无症状感染者,比例为30.8%。复旦大学公共卫生学院原院长姜庆五对此就指出,这个样本量太小,如果再多一个人为无症状感染者,比例就增长到38%。

死亡人数好确定吗?据英国BBC报道,该国卫生部每日通报的,是当日多少新冠病毒检测阳性者死亡,包括感染新冠病毒但可能死于其他疾病的人数,而英国国家统计局的计算方式是看死亡证明,里面写了死者的直接死亡原因及可能原因,只要怀疑和新冠有关,就都统计上。

在美国,截至4月5日,公开信息显示超过9400人死于新冠感染,但是多个领域的专家们认为这是被低估的数字。由于没有统一的系统来报告新冠相关的死亡,而且检测能力持续短缺,一些州和郡县的死亡人数统计标准是模糊的。据《纽约时报》报道,美国联邦政府预计在2021年之前都无法知道因新冠死亡的最终人数,因为美国要到那时才公布主要死亡原因的年度汇编。

“流行病受生物学和社会学因素共同影响,每个基本要素都是一篇科学论文,都是一个研究课题。”姜庆五说。比起简单地计数,高本恩认为我们需要的是找到一个更好的追踪传染病进展的方法。

病死率:不是简单的除法

所有人都想知道这种冠状病毒引起的疾病有多致命,它的术语是病死率,简单地说,就是死于新冠肺炎的人数,除以感染该疾病的总人数。美国天普大学数学教授约翰·艾伦保罗告诉《中国新闻周刊》,死亡人数相对来说是明确的,但由于检测不足,尤其是缺乏随机检测,感染者人数依然未知,他把这个叫做——“分母之谜”。

意大利因其高病死率引来媒体关注。意大利卫生高等学院的研究人员3月23日在《美国医学会杂志》上发表的文章分析了该国高病死率的三个原因。其中一个原因就与分子有关:意大利的病死率统计囊括了核酸检测中阳性患者死亡的发生,无论他的死亡是否是因为基础疾病导致的。而意大利卫生部科学顾问近日指出,在颁发的死亡证明中,只有12%的死亡原因与感染新冠病毒有直接因果关系。

再来看分母。美国斯坦福大学流行病学教授约翰·约阿尼迪斯近日撰文指出,目前为止掌握的有关多少人感染以及这个流行病如何进展的数据“完全不可靠”。“我们不知道没有被捕捉到的感染者是3倍还是300倍,因为新冠暴发3个月之后,大多数国家,包括美国,都缺乏对大规模人群进行检测的能力,而且没有一个国家有关于该病毒在有代表性的随机样本中流行情况的可靠数据。”

根据公开信息,截至4月1日,冰岛总测试人数已超过1.95万人,总测试人数接近总人口的5%,这个比例已远远高于全世界任何国家。换句话说,截至4月1日,世界上还没有哪个国家的检测人数超过其人口的5%。

3月30日,在巴西圣保罗郊区,穿着防护服的医务人员检查过往车辆上人们是否有新冠肺炎症状。

美国早期在检测问题上多次延误,使得美国公布的感染者很少。截至4月7日早上8点,美国已知的确诊人数是36.75万,是全球感染人数最多的国家。但这离真实情况有多远仍未可知。美国哥伦比亚大学医学院教授、艾滋病“鸡尾酒疗法”创始人何大一在4月3日美国智库布鲁金斯学会举办的一场新冠疫情分享会上表示,美国大约三分之二的核酸检测结果呈阳性,说明现有的检测数量远远不足。

信风科技创始人兼CEO陈剑也参与了这场分享会,在疫情期间他一直进行相关模型预测。他向《中国新闻周刊》解释说,何大一提到的“三分之二”叫确诊率,尽管这不是流行病学的基本指标,但是可以用来衡量一个地区检测不足的程度。以中国湖北省外的数据和韩国为参照,他认为检测25~30人中有1个人确诊(3%~4%)是比较合理的数据,低于这个数字,比如香港之前的80:1,说明检测规模有点过大了;而高于这个数字,说明检测是不充分的,美国能达到这个合理比率的州寥寥无几,包括检测人数最多的纽约州,因为感染人数太多,所以比率还是很高。

在非洲,截至4月3日下午,49个国家报告出现新冠确诊病例总计7123人,死亡289人,但这些国家几乎没有自产新冠病毒检测设备的能力,确诊总数如何更是未知数。

即便很好地控制分子和分母,依然有别的计算“陷阱”要警惕。香港大学李嘉诚医学院院长梁卓伟指出,若粗略地将新冠累计死亡人数除以累计确诊患者总数得出病死率,是完全错误的计算方法,“因为分母中有不少为近期确诊病例,他们病程刚刚开始,无法判断之后究竟会康复还是病情恶化而亡。”他带领的团队3月6日发表的研究结果认为,新冠肺炎的病死率上限为1.4%。

“根据我们到目前为止的了解,新冠肺炎的致死率似乎不如最近几十年来演变为主要流行病的其他冠状病毒感染和疾病。但随着更多数据的来临,我们对情况的认识也可能需要改变。”约翰·艾伦保罗说。

警惕简单比较

“目前来自不同国家的数据有很大的偏差,因此这些数据不能直接进行比较。”德国乌尔姆大学流行病学和医学生物统计学研究所主任Dietrich Rothenbacher在接受媒体采访时指出,真实且可以比较的数字来自一个定义明确、系统且具有代表性的样本。

但当读到下面这段话时,我们依然克制不住比较的“诱惑”。据《时代》周刊3月30日报道,德国最新确诊人数超过6.3万,是受疫情冲击最严重的前五个国家之一,但是只有560个人死于这种疾病,意味着它的病死率仅为0.9%,是世界上死亡率最低的国家——尤其是当意大利确诊者的死亡率高达11%时,这个数据看起来有些异乎寻常地低。到了4月6日早上,德国的这个数字依然保持在1.6%,分别低于意大利的12%,西班牙、法国和英国的10%,以及美国的3%。

实际上,德国正是在发现感染者方面跑得最快的国家之一。德国乌尔姆大学流行病学和医学生物统计学研究所主任Dietrich Rothenbacher认为德国的低死亡率与其宽泛的检测有关。早至1月,德国便是最早开发出一种检测新冠病毒可靠方法的国家之一。由于德国的卫生系统在州一级进行管理,因此不受中央监管机构的限制,私营企业迅速开始大规模生产检测设备。现在德国每周可以完成16万例样本的检测,远高于欧洲其他国家。尽量检测出病毒感染者,等于把“分母”变大, 从统计上“降低”了病死率。

4月6日,一名患者被送至美国纽约布鲁克林Wyckoff Heights医疗中心的急诊室。

反观意大利,在疫情早期阶段,意大利起先实行的是广泛检测策略,与感染者有过接触的人无论有无症状都进行检测,但该国卫生部于2月25日决定将这个检测池缩小:优先考虑对需要住院且临床症状更严重的怀疑患者进行检测。这种检测政策带来了很高的阳性结果比例,截至3月中旬,这一数字为19%,并且病死率显著增加——因为症状较轻的,也就是死亡率较低的感染者没有纳入到分母中。

即便是不讨论“统计之外”的数字,简单将已知的死亡人数和确诊人数做除法时,这个数字依然是不能比较的。“没有一个指标可以让我们比较不同国家的情况。”英国沃里克大学副教授迈克·蒂尔斯利说,死亡率可以看出每个国家情况的严重程度,但国际比较很复杂。在获得医疗资源、基本健康状况甚至人口年龄结构方面,没有任何两个国家是相同的。

对此,世卫组织突发卫生事件规划执行主任迈克·瑞恩举例说,韩国的新冠暴发与一个教堂有关,所以感染者的年龄分布要比在意大利北部的更低;而在长期护理中心暴发时,平均感染者年龄会高很多。

2019年,意大利近四分之一的人口年龄在65岁以上,而中国这一年龄结构占比只有11%。截至3月中旬,意大利的总病死率为7.2%,远远高于中国同期的2.3%。意大利卫生高等学院的研究人员指出,如果将年龄分层,从0岁到69岁,这两个国家的病死率是相当的。比如,根据世卫组织-中国联合考察团的报告,中国经实验室确诊病例中,80岁或以上的老人死亡率为21.9%,意大利这一数字为20.2%。

在韩国,大约三分之一的确诊病例在30岁或以下,死亡率为1.6%。尽管德国与意大利的人口有相同的平均年龄,但大量检测将德国感染者的平均年龄拉低至46岁,意大利的这一数字为63岁。

陈剑说,除了统计方面的原因以及年龄结构外,他指出,意大利高死亡率的原因首先是重症的医疗条件跟不上。在意大利北部,一度有超过1200个病人涌入重症监护病房,这是一个惊人的数字。虽然意大利的ICU病床数在欧洲并不算少,大概每10万人12张,但因为疫情是集中在某一个地方暴发,所以全国的病床数没有办法运用起来。相比之下,德国这一数位为28,荷兰为7,在印度这一数字大约为6.5。陈剑分析,中国这一数字仅为3.6,并不高,但是火神山和雷神山的快速建立弥补了这个缺陷。

当问及数学家约翰·艾伦保罗,在此次疫情中,科学家们还应该在哪些最有价值的数据上继续努力时,他列出了一堆数据,包括疾病对不同年龄、经济地位、性别的影响,医疗设施可及性与疾病的关系……“无论我们多么想知道一切有关冠状病毒的事实,可我们仍然有很多未知,而且我们应该接受这种不确定性带来的不适感。”