life

新冠疫情死亡人数该怎么统计才准确

2020 / 09 / 13新浪

新冠疫情持续肆虐,研究人员正在努力统计新冠病毒的死亡率。以下是他们计算疫情真实死亡人数的方法。

3月初,Andrew Noymer的脑中闪过一丝熟悉的怀疑。他看到欧洲和北美国家开始记录各自的第一批COVID-19死亡病例,他知道数据可能会出问题。即使是一个普普通通的冬季,流感导致的一部分死亡病例也会被误归为肺炎。Noymer是加州大学欧文分校的人口统计学家,他当时想,一种常见的疾病尚且如此,COVID-19的死亡病例肯定会出现漏报或少报。“我只记得我在想,‘这真的很难向人们解释’。”他回忆道。

疫情仍在继续,一名工人正在墨西哥城附近的墓地里挖墓坑。来源:Edgard Garrido/Reuters
疫情仍在继续,一名工人正在墨西哥城附近的墓地里挖墓坑。来源:Edgard Garrido/Reuters

到了3月和4月,各国统计局开始公布统计的死亡人数,这印证了他的怀疑:疫情造成的死亡比COVID-19死亡数据本身显示的要多得多。

在剧变时期——战争、自然灾害、疾病暴发——研究人员需要快速统计死亡人数,他们通常会采用一种泛化但可靠的指标:超额死亡率(excess mortality)。这个指标将预期的死亡人数与实际死亡人数进行比较,对许多科学家来说,这是衡量疫情影响的最有效方式。它能帮助流行病学家对不同国家进行横向比较;此外,由于这个指标算起来很快,它还能发现可能被忽略的COVID-19热点地区。有30多个国家公布了估计的超额死亡人数(见“惨痛代价”),根据这些数据,从疫情开始到7月底的这段时期内,这些国家的实际死亡人数比一般预期死亡人数多了近60万(其中413,041例被官方归因于COVID-19)。

来源:《经济学人》/《金融时报》/ Our World in Data/欧洲统计局/Human Mortality Database
来源:《经济学人》/《金融时报》/ Our World in Data/欧洲统计局/Human Mortality Database

不过,这种较高层面的指标有几个缺点。首先,它无法区分死于这种疾病和死于疫情相关其他因素的人,比如常规医疗护理中断造成的诊断延误,或是人们不愿寻求医疗护理。第二,它依赖准确及时地报告死亡人数,这在死亡登记体系不完善或有意掩饰的地区存在局限。第三,和疫情的许多其他方面一样,数据统计也受到了政治操弄,成了国家显示自身优越性的一种手段。

令专家们担心的是,简单的超额死亡人数报告已经被用来对各国疫情响应进行过早乃至错误的比较,反而严重忽略了中低收入国家因数据缺乏而落入的困境。

还有其他更系统的方法可以对死亡进行分类,确定有多少死亡是由感染SARS-CoV-2直接导致的,以及有多少死亡是因为与疫情相关的其他因素导致的。最终,人口统计学家和公共卫生研究人员会从死亡证明中获得足够精细的信息,实现上述分类,继而评估哪些干预手段最奏效,为今后的疫情响应提供参考。

不过,若干媒体已经在分析数据,给这些问题下结论了。一些统计学家指出,随着第一波疫情在许多地区缓和,现在可以、也应该比较各个政府的不同政策了,从而评判它们可能如何影响了死亡率。但许多专家表示,想要严谨地进行这方面的评比,现在还为时过早。有些地区的早期疫情蔓延开来,有些则逐渐消退,这种随机性可能会让比较出现偏差,增加在疫情终结前开展分析的难度,牛津大学人口统计学家及流行病学家Jennifer Dowd说,“这将是个漫长的过程。”

粗略的工具

Lasse Vestergaard是丹麦国家血清研究所的一名流行病学家,也是最先注意到欧洲的死亡人数开始慢慢攀升的人之一。Vestergaard领导的欧洲死亡监测项目(EuroMOMO)每周汇总24个欧洲国家或地区的全因死亡数据。从3月到4月,EuroMOMO的追踪记录显示,有几万例超预期死亡——比官方通报的COVID-19死亡人数还高25%左右。由于检测跟不上,每个国家的统计方式又不同——比如疗养院的死亡不算在内,造成许多感染病例都没有被统计到。想要真正掌握不同国家的实际情况几乎是不可能的任务。

在巴西玛瑙斯当地参加葬礼的人。巴西目前已记录下逾11万的COVID-19死亡病例。来源:Michael Dantas/AFP/Getty
在巴西玛瑙斯当地参加葬礼的人。巴西目前已记录下逾11万的COVID-19死亡病例。来源:Michael Dantas/AFP/Getty

研究人员、新闻记者、政治官员都向超额死亡数要答案。这个指标没有纠结于致死原因,而是直接将某一周或一个月内的全部死亡人数,与统计学家预计在没有疫情情况下的死亡人数相比较——后者通常是之前五年的平均值。更复杂一点的版本还会模拟人口的老龄化趋势,或是移民出境造成的人口变化。当然,这些附加情况也会让国家之间的比较更难。针对超额死亡数的一些分析,比如英国国家统计局7月30日发布的一份报告,将他们的死亡率标准化,控制了不同国家人口的年龄结构差异(见go.nature.com/3hxa14m)。如果官方不需要同时登记死亡原因,只登记死亡的发生会相对快不少,这类统计数据也能比说明死因的数据更快拿到。

《自然》的数据来自人口统计学家维护的几个数据库,还有《金融时报》《经济学人》的跟踪记录——这也是追踪超额死亡的两个最完整的数据集。虽然覆盖面并不全——只列出了32个国家(主要在欧洲)和4个主要城市,但里面囊括了暴发大规模疫情的多个国家,统计到了截至7月底的2/3的官方COVID-19死亡人数。

《自然》的分析显示,不同国家的超额死亡数存在巨大差异(见“多于预期”)。在美国和西班牙这两个目前疫情最严重的国家,分别有约25%和35%的超额死亡数不在官方的COVID-19死亡统计中。而在其他地区,这种不匹配的情况更加严重。以秘鲁为例,74%的超额死亡都未归为通报的COVID-19死亡病例。还有一些国家,比如保加利亚等,在截至目前的疫情中甚至发生了超额死亡数负增长的情况,这意味着虽然出现了病毒,但它们今年的死亡人数反而比预期更低了。

来源:《经济学人》/《金融时报》/ Our World in Data
来源:《经济学人》/《金融时报》/ Our World in Data

挖掘数据

大多数人口统计学家认为,超额死亡数这种一刀切的指标最适合在大流行期间使用。待疫情过去后,他们就能在事后往回看,利用颗粒度更细的数据,更好地总结大流行的死亡率。最终,他们会将死亡分为三类:登记COVID-19为死因的直接死亡;直接但未算入的死亡,这类死亡是指由新冠病毒造成、但没有纳入官方统计的死亡;非直接死亡,即疫情下其他变化导致的死亡。

疫情追踪记录上的直接死亡数据显示了确诊病例数和死亡病例数,一般由当地和国家卫生机构每日更新。但即便是这种直接死亡数据,也不像看起来那样明确无误,哈佛大学医学院的计算流行病学家Maimuna Majumder警告道。

区分死于COVID-19的人和感染COVID-19但死于不相关原因的人是很难的。“这是整体工作中非常关键的一环,”她说,“如果你有两种并发症,要归类到哪一个里面呢?”Majumder说,做这些分类需要一个死亡分类系统,并在系统中纳入能让COVID-19更致命的基础疾病。建立这种系统意味着要等待死因数据,而这些数据大概要一年才能编制完成。

目前,研究人员已经在回溯疫情刚开始的六个月了,并将当时分类错误的死亡人数加回去。武汉市、纽约市等地都在4月上修了死亡人数,计入了被质疑可能是错误分类的死亡病例。

接下来是直接但未算入的死亡——因感染者症状未被识别为COVID-19而未统计的死亡。“我们仍旧在摸索这种疾病到底有哪些症状。”佛罗里达大学的生物统计学家Natalie Dean说。中风和肺栓塞是新冠病毒的两种潜在致命并发症,在一开始可能会被忽视。

一小部分超额死亡是非直接的——源自受疫情影响而发生的疾病,而非病毒本身导致的疾病(见“其他原因导致的死亡”)。比如有医院报告称,癌症与慢性病患者跳过了常规检查,可能会让他们的健康面临风险。一些地区的家庭暴力事件有所增加,精神健康研究人员担心一线工作者和被封锁人群所承受的巨大压力,不过尚不清楚这些是否导致了死亡人数上升。

来源:英国国家统计局
来源:英国国家统计局

根据美国疾控中心(CDC)的一份报告,在疫情早期,美国急诊就诊量下降了40%以上,说明许多人当时不愿意去就诊(K。 P。 Hartnett et al。 Morb。 Mortal。 Wkly Rep。 69, 699–704; 2020)。Majumder说,即使他们真的来就诊,医院也是难以招架。“你是死于其他原因,但你死于其他原因是因为本来要护理你的系统已经无力承受。”CDC公布的不完全初步数据反映了这种非直接死亡的一个缩影:美国4月死于糖尿病的人数比五年平均值高20-45%;缺血性心脏病造成的死亡比平时高6%到29%。

好在封锁措施和习惯的改变,比如戴口罩和勤洗手,可能有效预防了其他原因导致的死亡——尤其是流感等其他传染病。还有,全世界大量人口留在家中,交通事故和特定人际间暴力导致的死亡人数或许也减少了。这些死亡率的下降可能被COVID-19引起的死亡率上升掩盖了。

其中一部分效应已经开始反映在数据中。全球监测系统FluNet发现,今年的流感季缩短了一个月以上,很可能是因为严格的封锁措施以及卫生习惯的改善。南非在艾滋病流行高峰期间部署了死亡追踪系统,可以让流行病学家区分哪些是疾病等自然原因的死亡,哪些是人际间暴力等非自然原因的死亡。南非医学研究所的Debbie Bradshaw领导的团队指出,截至3月底,由于严格的封锁措施落实到位,非自然死亡人数下降至通常水平的一半。当封锁措施从五月底开始解除时,非自然死亡人数又回到了预期水平。

人口统计学家可能永远无法掌握疫情最终的死亡人数,Noymer说,“这不像刮彩票,你可以看到灰色涂膜下面的具体数值。”一旦疫情有所缓和,将上述三类死亡区分开来——并确定有多少死亡可能在没有病毒的情况下发生——将需要长达数月甚至数年的时间。“我们甚至还没有就1918年流感大流行的死亡人数达成一致意见,”他说,“而这些数据我们已经整理了100年。”

清点人数

目前来看,统计超额死亡数有利于绘制不同地区的疫情轨迹。待将来有了完整的死亡原因数据,研究人员就能通过不同国家的直接和间接死亡水平,分析封锁等干预措施的作用。但现在这么做还有点风险,Noymer说,疫情仍在肆虐,最终死亡人数还未知。“现有的分析角度还不够,因为我们还处于上升期。”他说,“这就像在飓风当中预测总降水量。”

即使风暴过后,这些分析也只可能在高收入国家开展,因为那里有完善的出生和死亡登记系统——也称为民事登记和人口统计(CRVS)。计算中低收入国家的死亡人数就没有这么直接了,渥太华国际发展研究中心的CRVS项目专家Irina Dincu说。“在全球范围内,一年中只有约50%的死亡人数会被登记,”她说,“另外50%根本就不存在,它们是看不见的。”

这些死亡为什么看不见?CRVS顾问Gloria Mathenge可以想出很多原因。她就职于太平洋共同体(Pacific Community),这是一个位于新喀里多尼亚努美阿的国际发展组织。她的工作是帮助基里巴斯和汤加等太平洋岛国提升它们的数据系统。虽然整体情况正在改善,但该地区平均仍有20%的死亡未登记入册。

这些国家的许多现有系统都植根于过去的殖民历史。Mathenge说,这造成了它们无法体现当代文化和社会规范,比如中低收入国家的许多人并不是在医院中去世的。因此,除了漏掉的COVID-19死亡病例,本身也没有可靠的方法可以为计算超额死亡数划一条基线。

为了估算这些国家的死亡人数,人口统计学家必须采取准确度稍差的方法,比如上门调查,纽约大学阿布扎比分校的人口统计学家Stéphane Helleringer说。但这种做法很少用,“当我们挨家挨户走访时,这些数据早已经过时了。”

对于部分人口统计学家来说,某个人是死于疾病还是死于医疗资源挤兑,并非绝对重要——所有的死亡都能以某种方式归结到疫情头上。“在某种程度上你不得不承认,“好吧,这可以说是COVID相关的,因为COVID影响了整个医疗系统’。”Noymer说,“对我来说,这个思维实验是,‘如果疫情从来没有发生过,2020年会是什么样的?’”

其他研究人员非常希望将新冠病毒导致的死亡与大环境导致的死亡区分开来,这样就能对新冠病毒本身有多致命的问题给出准确的答案。

不过,现在没什么时间开展这些分析。疫情已经让死亡登记系统不堪重负,这些系统还要面对更大的核查。政客、媒体、公众都想看到每天或每周的统计数据,而这些数据本来要用上几个月才能编制完成。一些人口统计学家为此感到不安,“只有通过回顾的方式,我们才能最好地理解死亡率。”Noymer说,因为汇编和分析死亡证明是非常耗时耗力的工作,“突然之间,所有人都想看到实时数据。”