前沿研究:针对COVID-19大流行的基于物理的机器学习模型:八个国家的社交距离遵守和短期预测

来源:Quantitative Biology 发布时间:2022年08月02日 浏览次数: 【字体: 收藏 打印文章

论文标题:Physics-informed machine learning for the COVID-19 pandemic: Adherence to social distancing and short-term predictions for eight countries (针对 COVID-19 大流行的基于物理的机器学习模型:八个国家的社交距离遵守和短期预测)

期刊:Quantitative Biology

作者:Georgios D. Barmparis, Giorgos P. Tsironis

发表时间:07 Jul 2022

DOI:10.15302/J-QB-022-0281

微信链接:点击此处阅读微信文章

COVID-19 自2019年报道以来,已在世界范围内迅速蔓延至今。大多数国家最终采用了起源于中国的社交距离规则。一些国家推迟了措施的实施,结果出现了大量感染者和死亡病例。一些国家行动则非常迅速,控制了感染人数。但是,每个国家社交距离保持的程度和速度都不同。

流行病的控制一直是许多研究的主要课题,目前已经使用了几种流行病模型来解决控制措施如何限制流行病增长的问题。最近Quantitative Biology上发表了一篇来自希腊学者们的“Physics-informed machine learning for the COVID-19 pandemic: Adherence to social distancing and short-term predictions for eight countries”的研究性论文(点击链接可下载PDF全文),文章受物理学方法启发,采用人工智能方法分析了 COVID-19 感染数据,从而更清楚地了解感染动态,并有助于预测未来的变化趋势。

2022811017597240png.jpeg


全文概要

本文使用机器学习和SIR感染动力学方程从感染数据中提取遵守社会距离的程度,并通过它评估采取强制措施的有效性。文章先从 SIR 模型来推导感染率的微分方程,然后使用物理信息神经网络(PINN)获取感染人口的数据并估计感染率。训练方法是先在SIR 上进行预训练,然后在每个国家报告的感染数据上进行训练。同时,模型将每条感染曲线与一个衰减斜率联系起来,该斜率表示当前措施对感染现象的总体控制。此外,模型可以使用传播第二阶段的数据进行短期预测(图1)。

文章用“第一波”感染数据做训练,将定量机器学习分析应用于八个国家,发现希腊和美国的两个极端措施分别成功和不成功地限制了传播。紧接着用“第二波”感染数据训练网络后,作者提取了与时间相关的感染率,并进行了时长一周及以上的短期预测(图1)。结果表明,该方法适用于所有国家并具有较好的短期预测结果。

2022811018112550png.jpeg

图1. 模型和结果的总结。

具体方法及结果如下:

1. 通过预先训练的、基于物理的神经网络进行特征提取

数据显示,“第一波”COVID-19在不同国家的不同时间开始,并发生完全不同的演变。在实施了与中国类似的非常严格措施的国家中,疫情传播迅速实现了控制。其他推迟或部分实施措施或基本不采取措施的国家中感染人数较多,而且感染人数的下降速度较慢。

为了进一步了解控制社交距离对八个国家感染人口分布的影响,作者假设SIR 模型可以捕捉每个国家流行病的主要信息,利用特定国家的受感染数据训练了一个物理信息网络并使用它来提取以函数 α(t) 为代表的社会疏离措施的存在和持续性:α(t)=σ0+σt,斜率 σ估计了社会疏离的效率程度。较大的 σ 值描述了一个国家在“第一波”浪潮中采取了严格的社会疏离措施。在提取了每个国家的最优 α(t) 和 μ 之后,通过求解 SIR 模型和拟合真实数据,作者给出了每个国家“第一波”期间的预测病例总数,如图 2 所示。

2022811018224580png1.jpeg

图2. 每个国家的 α(t) 和感染数预测 I(t)

2. 短期预测

在感染初期,通过 SIR 预训练的模型为不同国家提供了 α(t) 的层次结构。因此,可以尝试将此模型应用于 COVID-19 大流行的当前阶段,从而对未来进行预测。图 3展示了一周的预测结果。从图中可已看出,模型的短期预测能力在大多数国家/地区表现的相当不错。

202281101834200png1.jpeg

图3. 使用除上周外的 COVID-19 传播第二阶段的数据训练网络并预测上周的演变。

最后,文章讨论了模型对数据的适应性。当感染率没有迅速变化时,模型可以给出了非常好的短期预测。但当感染率变化非常迅速时,该模型并没有很好的跟随大流行的演变。其次讨论了模型预测的分辨率问题。目前的模型假设的是一个混合良好、基本统一的国家。但是,不同国家、不同地区的行为可能因地理、环境、文化和人口原因而有所不同。因此引入区域数据可以获得更准确的结果。文章提到该方法存在对预测期间感染率的变化较为敏感等局限性,后面可以通过引入更复杂的神经网络架构,比如长短期记忆模型(LSTM)来提高预测的准确性。

Baidu
map