「Nature」特别报道:计算机模拟驱动了世界对COVID-19的反应

本文转载于转化医学网

作者:Lauren

导言:帝国理工团队的模型更新数据显示,英国的医疗服务很快就会被严重的COVID-19病例所困扰,如果政府不采取行动,可能会面临超过50万人的死亡。英国首相鲍里斯·约翰逊(Boris Johnson)几乎立即宣布了对人们行动的严格新限制。

当伦敦帝国理工学院(Imperial College London)的数学流行病学家尼尔•弗格森(Neil Ferguson)访问位于伦敦唐宁街(Downing Street)的英国政府中心地带时,他并没有意识到自己离这场致命传染病有多近。3月中旬,他向官员简要介绍了他的团队有关计算机模型的最新结果。该模型模拟了冠状病毒SARS-CoV-2在英国人口中的迅速传播。不到36小时后,他在推特上宣布自己发烧咳嗽。随后的检测呈阳性。疾病追踪科学家已经成为他自己项目中的一个数据点。

弗格森是使用数学模型预测病毒传播的努力中最引人注目的数学流行病学家之一,这些模型显示了政府的行动可能是怎样改变疫情的进程的。“这是非常紧张和疲惫的几个月,”弗格森说,在他COVID-19症状相对轻微期间,他一直在工作。“从一月中旬开始,我就没有真正休息过。”

这是与政策最相关的研究了。帝国理工团队的模型更新数据显示,英国的医疗服务很快就会被严重的COVID-19病例所困扰,如果政府不采取行动,可能会面临超过50万人的死亡。英国首相鲍里斯·约翰逊(Boris Johnson)几乎立即宣布了对人们行动的严格新限制。同样的模式表明,如果不采取行动,美国可能面临220万人死亡;白宫也分享了这份报告,并很快出台了有关社交疏离的新指南(见“模拟”)。

「Nature」特别报道:计算机模拟驱动了世界对COVID-19的反应

世界各国政府都在依靠数学预测来帮助指导这一流行病的决策。弗格森指出,计算机模拟只占模拟小组在危机中进行的数据分析的一小部分,但它们在决策中越来越重要。

但是,正如他和其他建模者所警告的那样,关于SARS-CoV-2如何传播的许多信息仍是未知的,必须加以估计或假设——这限制了预测的准确性。例如,帝国模型的早期版本估计SARS-CoV-2与流感一样严重,需要患者住院治疗。结果证明是错误的。

在这次大流行中模拟的真实表现可能在几个月或几年之后才会变得清晰。但要理解COVID-19模型的价值,关键是要知道它们是如何建立的,以及它们所基于的假设。“我们正在构建对现实的简化表示。模型并不是水晶球,”弗格森说。

冠状病毒模型:基础

许多模拟疾病传播方式的模型对于研究它们多年的学术团体来说是独一无二的。但数学原理是相似的。他们试图了解人们如何在三种主要状态之间移动,以及移动的速度有多快:个人要么容易感染病毒;已受感染(I);然后要么恢复(R)要么死亡。R组被认为对病毒免疫,因此不能再传播感染。具有自然免疫力的人也属于这个群体。

最简单的SIR模型做出了基本的假设,比如每个人从感染者身上感染病毒的几率是相同的,因为人群是完美而均匀地混合在一起的,而且感染这种疾病的人在死亡或康复之前传染性都是一样的。更先进的模型可以对决策者在一场新出现的流行病中所需的数量进行预测,它将人们细分为更小的群体——按年龄、性别、健康状况、就业、接触人数等——来设定谁与谁见面、何时见面以及在何处见面(参见“衡量社会融合”)。

「Nature」特别报道:计算机模拟驱动了世界对COVID-19的反应

人口规模、人口密度,人口年龄,交通联系,社交网络的大小和医疗规定上使用详细的信息,模型构建的虚拟副本——有关一个城市,地区或整个国家使用微分方程控制运动和人群在时间和空间上的相互作用。然后他们在这个世界上播下感染的种子,观察事情如何发展。

但是,这反过来又需要一些只能在疫情开始时粗略估计的信息,比如受感染的人死亡的比例,以及基本繁殖数(R0)——平均而言,一个受感染的人会把病毒传给多少人。例如,帝国理工的建模人员在3月16日的报告中估计,0.9%的COVID-19感染者将会死亡(这个数字根据英国的具体人口统计数据进行了调整);R0在2和2.6之间;而SARS-CoV-2在感染者体内培养需要5.1天。他们还假设那些没有表现出症状的人在感染后4.6天仍然可以传播病毒;其他人可以在出现疾病症状前12小时传播病毒;后者的传染性比前者高50%。这些数据依赖于其他类型的模型:流行病学家试图从流行病早期不同国家的不完整信息中拼凑出病毒的基本特性,并据此进行粗略估计。

同时,有些参数必须完全假定。例如,帝国研究小组不得不推测,没有对COVID-19的天然免疫力,因此,所有人群都是从易感人群开始的,而从COVID-19恢复的人在短期内对再次感染具有免疫力。

使用这些参数的模拟运行总是给出相同的预测。但被称为随机模型的模拟会注入一点随机性——例如,滚动一个虚拟骰子,看看I组中的人是否会在见面时感染S组中的人。当模型运行多次时,这给出了一系列可能的可能性。

建模者也以不同的方式模拟人们的活动。在“基于等式”的模型中,个人被分成群体。但随着这些群体被分成更小、更有代表性的社会子集,以更好地反映现实,模型变得越来越复杂。另一种方法是使用一种“基于代理”的方法,即每个人都根据自己的特定规则移动和行动——就像电子游戏系列《模拟人生》中的模拟角色一样。

“你有几行代码,这些代码驱动着你的代理人如何行动,他们如何生活,”在都柏林科技大学研究疾病传播模型的伊丽莎白·亨特(Elizabeth Hunter)说。

基于代理的模型与基于等式的模型构建了相同类型的虚拟世界,但是每个人在特定的一天或相同的情况下可以有不同的行为。伦敦卫生和热带医学学院(LSHTM)的流行病学家Kathleen O 'Reilly说:“这些非常具体的模型非常需要数据。”“你需要收集有关家庭、个人如何去上班以及他们周末做什么的信息。例如,伦敦管理学院(LSHTM)、伦敦大学学院(University College London)和英国剑桥大学(University of Cambridge)的研究人员通过英国广播公司(BBC)的一个公民科学项目,从逾3.6万名志愿者那里收集了社交联系数据。一些帮助英国政府的建模者使用了这个数据集,该数据集在2月份的预印本中被报道。

选择哪个模型呢?

帝国研究小组在这次大流行中使用了基于代理和基于等式的模型。该小组于3月16日进行了模拟,以告知英国政府的COVID-19反应。模拟使用了2005年建立的一个基于代理的模型,以观察如果H5N1禽流感变异为一种在人群之间容易传播的版本,泰国将会发生什么。(2006年,同样的模型被用来研究英国和美国如何减轻致命的流感大流行的影响。)弗格森在2005年接受《自然》杂志采访时表示,收集泰国人口的详细数据比编写模型的编程代码要困难得多。当他的团队对冠状病毒大流行的预测首次公布于众时,这些代码并没有被公布,但是他的团队正在与微软合作整理这些代码并使之可用,Ferguson说。

3月26日,弗格森和他的团队发布了对COVID-19影响的全球预测,该预测采用了更简单的基于方程的方法。它将人分为四组:S,E,I和R,其中“E”指的是那些已经暴露,但还没有传染性的人。“他们给出的总体数据大致相似,”流行病学家阿扎拉·加尼(Azra Ghani)表示,他也是帝国集团的成员。例如,全球预测表明,如果美国不对病毒采取行动,就会有218万人死亡。相比之下,早期基于代理的模拟,使用相同的死亡率和繁殖数假设运行,估计220万美国人死亡。

巴黎皮埃尔·路易斯流行病学和公共卫生研究所(Pierre Louis Institute of Epidemiology and Public Health)的模型师维多利亚·科利扎(Vittoria Colizza)说,不同类型的模型各有优缺点。科利扎在当前的紧急情况下为法国政府提供建议。“这取决于你想问的问题,”她说。

不同之处在于建模者希望以相同方式进行建模的人的数量不同。在基于等式的模型中把一群人聚在一个隔间里,可以使事情变得更简单——也更快——因为这个模型不需要在把每个人都当作个体的高分辨率水平上运行。例如,当科利扎和她的团队想要测试强迫大部分法国人在家工作对感染率的影响时,她使用了基于等式的模型。“我们不需要单独跟踪每个人,看看他们是在工作还是在学校,”她说。

尽管预测结果可能不会因所选择的方法而产生巨大差异,但人们自然会想,这些模拟结果到底有多可靠。不幸的是,在大流行期间,很难获得数据(如感染率)来判断模型的预测。

“你可以预测未来,然后与你得到的进行比较。但问题是,我们的监控系统是相当垃圾的,”LSHTM的建模师John Edmunds说。“报告的病例总数准确吗?不。有准确的地方?没有。”

“预测暴发期间很少调查事件的准确性,期间或之后,只有最近预报员开始做结果,代码,回顾性分析模型和数据,”埃德蒙兹和他的团队指出,去年的报道评估的性能预测在2014 - 15埃博拉疫情在塞拉利昂。他们发现,有可能提前一到两周可靠地预测疫情的发展,但现在不可能了,因为固有的不确定性和对疫情缺乏了解。

为了最小化不完整数据和不正确假设的影响,建模者通常会执行数百次不同的运行,每次都稍微调整一下输入参数。这种“灵敏度分析”试图防止模型输出在单个输入改变时剧烈摆动。

弗格森表示,为了避免过分依赖一种模式,英国政府听取了许多建模组织的建议,包括帝国理工学院和伦敦管理学院的团队。“我们都得出了类似的结论,”他说。

模型的更新

媒体报道称,3月初对帝国理工团队模型的更新,是促使英国政府改变应对流感政策的一个关键因素。研究人员最初估计,15%的医院病例需要在重症监护病房(ICU)接受治疗,但后来将这一数字更新为30%,这是他们3月16日首次公开发布的研究报告中使用的数字。该模型显示,英国仅有4000多张重症监护病房床位的医疗服务将不堪重负。

政府官员此前曾提出一种理论,即允许这种疾病传播,同时保护社会中最年长的人,因为大量受感染的人会康复,并为其余人提供群体免疫力。但他们在看到这些新数据后改变了路线,下令采取社交隔离措施。批评人士接着问道,鉴于1月份的一篇论文显示,中国一小群COVID-19患者中有30%以上需要在ICUs接受治疗,为什么之前没有讨论过社交距离,为什么没有进行广泛的测试,为什么建模者甚至选择了15%的比例。

弗格森表示,模型更新的重要性可能被夸大了。他说,甚至在那之前,模型已经表明,COVID-19如果完全不加控制,可能会在未来一年内杀死大约50万英国公民,ICUs将会超负荷运转。顾问团队曾讨论过通过社交隔离来抑制疫情,但官员们担心,这只会导致今年晚些时候爆发规模更大的第二次疫情。没有考虑在韩国出现的那种大范围的核试验;但是,在某种程度上,弗格森说,这是因为英国卫生机构已经告诉政府顾问,它不可能足够快地扩大检测范围。

至于中国ICUs的数据,临床医生已经看过,但注意到只有一半的病例似乎需要有创机械通气设备;其余的人则接受了加压氧气,所以可能不需要重症监护病房的床位。基于这一点和他们在病毒性肺炎方面的经验,临床医生建议建模者,15%是一个更好的假设。

这一关键的更新是在弗格森在唐宁街向政府官员汇报情况的前一周发布的。曾与惊恐的意大利同事交谈过的临床医生说,加压氧气效果不佳,所有30%的严重住院病例都需要在ICU进行有创通气。弗格森说,更新模型的死亡率预测没有太大变化,因为许多预测的死亡可能发生在社区,而不是医院。但他表示,对卫生服务如何不堪重负的理解,以及意大利的经验,导致了“思想的突然集中”:政府官员迅速转向于保持舌尖距离的措施(见“防范感染禁闭”)。

「Nature」特别报道:计算机模拟驱动了世界对COVID-19的反应

测试的必要性

随着研究人员对病毒的了解越来越多,他们正在更新许多其他关键变量。在3月26日关于COVID-19全球影响的报告中,帝国理工团队将3月16日的R0估估值上调至2.4至3.3之间;在3月30日的一份报告中,研究人员将病毒在11个欧洲国家的传播范围定为3到4.7之间。

但是一些重要的信息仍然对建模者隐藏着。埃德蒙兹说,一种可靠的检测方法可以在没有出现症状的情况下发现被感染的人群,从而转移到康复组,这将改变建模者的游戏规则,并可能极大地改变预测的大流行路径。

强调需要这样一个测试的必要性,一个由英国牛津大学理论流行病学家Sunetra Gupta组建的团队提出,建议在英国记录死亡的模式可能适合一系列SIR模型,包括一个假定数以百万计的人已经被感染,但还没有显示任何症状。只有通过测试才能揭示过去的感染情况,才能揭示实际情况。

还有另一个重要的未知因素:人们将如何对强迫改变他们的行为做出反应,以及这些改变是否会像科学家预期的那样减少传染性接触。例如,在中国进行的调查显示,武汉和上海的市民报告说,在当局实施的社交疏离措施期间,他们与他人的典型日常接触要少七到九倍。

Marco Ajelli研究了在意大利特兰托布鲁诺凯斯勒基金会传染病的传播,来自帝国理工的研究小组和LSHTM7确认他们所观察到的日常接触的改变和中国“差不多”,虽然模型报告还不清晰。

帝国理工的研究小组说,如果所有国家都采取严格的社交隔离、检测和隔离已感染者的战略,在每10万人中每周死亡0.2人之前,就对感染病例进行隔离,那么到今年年底,COVID-19造成的全球死亡总数可能会减少到190万人。弗格森3月25日表示,英国的反应让他“有理由相信”,英国的总死亡人数将控制在2万人以下。

弗格森说,欧洲各地的全国性禁闭已经在努力减少SARS-CoV-2的传播,正如预期的那样。但对于那些担心本国经济、担心被囚禁公民的身心健康的国家来说,社交隔离必须维持多久是一个大问题。目前,社交隔离将会减少病毒的传播,但解除这些措施可能会在今年晚些时候或明年让大流行的第二波爆发成为可能,一个帝国模型提出了这一建议(见“第二波”)。

「Nature」特别报道:计算机模拟驱动了世界对COVID-19的反应

弗格森说,他希望在实践中,各国能够效仿韩国的做法。韩国通过推出高水平的检测和追踪感染者的接触者,设法实施了一种不那么严格的社交隔离。只有像中国湖北省现在所做的那样,对解除封锁限制的地区进行密切监测,才能为建模者提供预测流行病长期死亡人数的所需信息。

参考:https://www.nature.com/articles/d41586-020-01003-6

评论已关闭