大数据溯源:美国新冠“零号病人”大概率2019年4月出现
中国科学院科技论文预发布平台(ChinaXiv)9月22日发表一项基于新的大数据分析方法得到的溯源结果显示,美国新冠“零号病人”大概率出现在2019年9月前后,最早是罗德岛州首例感染发生概率50%的日期为2019年4月26日,远早于美国官方公布的全美首例确诊日期2020年1月20日。
当前,新冠病毒溯源是全人类面临的共同挑战。一系列研究已显示,美国、西班牙、法国、意大利、巴西等多国早在中国疫情暴发前就已出现遭病毒侵袭的痕迹。为快速、精准地推进溯源,数学家开始尝试基于大数据分析的溯源方法,和生物学家共同寻找“零号病人”。
在最新这项大数据分析工作中,科研人员基于已公开数据并根据传染病模型和统计方法,建立最优化模型,对美国部分州和中国武汉市、浙江省等地的疫情起源时间进行了推断。该研究论文提出,结合数学模型和人工智能技术对传染病进行定性和定量分析,可以揭示传染病流行规律。目前,根据传染病模型和数据进行疫情预测的研究比较多,但是利用大数据分析的方法建立数学模型“倒推”疫情变化的研究,中外都比较少。
在论文中,科研人员主要根据经典传染病模型和统计方法,建立“模型与数据混合驱动的疫情传播模型”,并且应用最小二乘估计和核密度估计方法,得到模型参数。他们利用美国东北部12州每日公布的疫情数据,分别求出美国东北部这12州的初期疫情传播模型所对应的参数。在此基础上,推断出它们各自的首例、50例和100例的感染时间及其对应的概率。
计算结果显示,对于美国东北部的12州,新冠疫情首例感染发生大概率出现在2019年9月前后,最早是罗德岛州首例感染发生概率50%的日期为2019年4月26日,最晚是特拉华州首例感染发生概率50%的日期为2019年11月30日,均早于美国官方公布的全美首例确诊日期2020年1月20日。
此外,为验证这一新方法,论文研究团队还利用同一模型和中国的公开数据,推断了中国武汉市和浙江省首例、50例和100例病例感染时间。武汉市首例感染发生概率50%的日期为2019年12月20日,浙江省首例感染发生概率50%的日期为2019年12月23日。据此推断,中国新冠疫情大概率从2019年12月下旬开始流行,这一结论与流行病学调查结果基本相符,证明该计算方法准确可靠。
该研究论文表明,如果其他国家或地区疫情传播初期检测数据比较准确,可以利用该方法对疫情起源时间进行推断,在给定概率意义下计算出首例和若干例的感染时间。
版权声明:凡注明“来源:中国西藏网”或“中国西藏网文”的所有作品,版权归高原(北京)文化传播有限公司。任何媒体转载、摘编、引用,须注明来源中国西藏网和署著作者名,否则将追究相关法律责任。
-
联合国难民高专对美国大规模驱逐避难申请者表示震惊
联合国难民事务高级专员菲利波·格兰迪21日发表声明,对成千上万名滞留美国得克萨斯州边境地区难民状况和美国大规模驱逐行为表示震惊,呼吁美国政府根据国际准则保护避难申请者应有权利。[详细] -
美新冠死亡人数超1918年大流感 专家认为美抗疫表现“很差劲”
据塔斯社纽约9月21日报道,美国约翰斯·霍普金斯大学20日公布的数据显示,美国新冠疫情死亡人数已超过67.6万人,高于西班牙流感时期(1918年-1919年)的死亡人数。[详细] -
疫情防控政治化严重 美国新增死亡病例居高不下
美国累计确诊病例已超过4238万例,死亡超678000例。由于疫情防控政治化严重,美国社会关于疫苗和口罩等基本防疫措施的对立情绪严重,各种乱象屡见不鲜。 [详细]