您现在正在浏览: 首页 » 基地新闻 » 正文
 

曹志冬:大数据驱动的新冠肺炎疫情预测分析

发布时间: 2021-08-06 22:01:13   作者:本站编辑   来源: 本站原创   浏览次数:   我要评论()

编者按

2021年7月26日,中国应急管理50人论坛·第八届青年论坛在兰州大学召开。在专家主旨报告阶段,中国科学院自动化研究所研究员、博士生导师曹志冬作了题为“大数据驱动的新冠肺炎疫情预测分析”的主旨报告。他从大数据驱动的研究方法和新冠肺炎疫情预测分析两个方面,为疫情的常态化态势分析提供了科学依据。

图片

 

大数据研究方法:两个预测案例

曹志冬研究员先是以两个大数据预测的案例作为开场。第一个案例是著名的“剑桥分析”事件,政治咨询公司“剑桥分析”基于Facebook的27万份个人问卷,结合Facebook用户的浏览记录,高精准地推断网民的个人政治倾向。根据个人政治倾向精准推送诱导信息,最终对五千万Facebook网民进行了诱导性的干预,这在很大程度上影响了美国2016年总统大选的结果。

图片

第二个案例是“Google流感趋势”。2008年,Google研究组在《Nature》发表研究成果,他们利用Google搜索到成千上万的关键词组合,对流感发展趋势建立了预测模型——“谷歌流感趋势”,由此比CDC提前1~2周成功预测到美国流感发展趋势。但这样成功的预言神话却没有持续太久,2014年,“Google流感趋势”预测系统再次受到媒体关注,但这一次却是因为它糟糕的表现。研究人员2014年又在《Science》杂志发布“谷歌流感的寓言:大数据分析的陷阱” 一文,指出在2009年,谷歌流感趋势没能预测到非季节性流感A-H1N1。从2011年8月到2013年8月的108周里,“谷歌流感趋势”预测的发病率达到了CDC报告值的1.5~2倍多。由此曹志冬研究员认为,大数据预测的方法对疾病预测和防控提供了新的方法和思路,但它并不是一蹴而就的。

 

从理论驱动到数据驱动:研究范式的革新

传统的理论驱动的研究与大数据驱动的研究方法有很大区别。前者要先提出理论假设,严格设计抽样调查程序,基于抽样调查数据,运用统计分析工具科学验证假设,证明假设为真或证伪。但是在大数据时代,数据较为密集,数据多到能够替代总体,传统的小样本验证假设的方式就受到了很大的挑战。

在数据层面,有三个影响因素会决定研究方法或者科学实验的成败与否:样本采集精度、样本量大小、样本能否代表总体。科学的理论驱动研究方法必须要满足几个条件:1.样本质量可靠可用;2.满足推断精度条件下样本量最小;3.布局合理,具备足够代表性。在大数据时代,这三个维度相应地发生了质的变化:1.数据混杂,个体精度大幅下降,可靠性低下;2.样本量极大丰富,甚至一定程度上可视为总体;3.布局难以提前设计,具有高不确定性。

图片

曹志冬研究员认为,小数据到大数据的关键在于对数据本身的理解,用于理论研究的小数据是设计数据,而大数据是自然数据。设计数据有目的性强、预先科学设计、采集成本高、失败风险大、一次性使用的特点,而自然数据则无目的性、不需预先设计、采集成本低、失败风险小、可无限循环使用。

 

新冠肺炎疫情预测分析

曹志冬研究员以《Science》和《Nature》的相关研究举例,表明尽管人们的出行模式有很大不同,但大多数人的行为是可预测的。且根据个体之前的行为轨迹,人类时空活动的可预测性高达93%。他表示,传染病主要以接触为主进行传播,没有了人员的密切接触,传染病就无法跨越千里,自身实现传播。

接下来他介绍了中科院自动化研究所对新冠肺炎疫情预测的相关研究。新冠暴发后,他们基于已有基础,快速建立了无偏估计的时空计量风险模型,综合春运人流和发病数据,准确估计出武汉封城前的潜在感染规模(预测发病人数1.86万[1.4万-2.3万],实际1.74万)及流向全国各地数量。2月7日,预印本发布后得到大量关注、转载与引用,中国CDC、科学网、Github等国内外疫情科研信息平台将其列为新冠学术代表性成果,纽约时报头版头条报道中引用。

最后,他还对大数据在新冠抗疫中的应用进行了一些举例,如疫情预测与形势研判、密切接触者追踪、细粒度人员流动信息、物资生产调度平台、疫情服务小程序、疫情数据聚合与展示等。


图片

专家简介

图片

曹志冬,中国科学院自动化研究所研究员、博士生导师,国家杰出青年科学基金获得者。任新冠肺炎疫情联防联控机制科研攻关组信息化专班专家组成员、“十四五”和2021-2035年国家中长期科技发展规划战略研究报告人工智能组执笔人及多个国家一级学会的专委会委员、理事、常务理事。研究方向为社会计算与大数据、公共卫生应急管理、时空统计分析。主持国家科技重大专项、国家科技重点研发计划、基金委重大研究计划等资助国家级课题十余项,发表SCI\SCIE\SSCI\EI检索论文80余篇,主编/主译著作3部,获军队科技进步一等奖、二等奖、中国仿真学会自然科学一等奖等科技奖励8项。新冠抗疫成果获得国家领导和部委领导高度认可和重要批示,得到大量报道、转载和引用。


 

Tags: 本文暂无Tags!

网友评论 已有 0 条评论,查看更多评论»

评论内容:
验证码:
【网友评论仅供其表达个人看法,并不表明本站同意其观点或证实其描述。】
 

设为首页 - 加入收藏
Copyright © 2013-2015 清华大学公共管理学院中国应急管理研究基地, All Rights Reserved
Center of Crisis Management Research. CCMR