编者按
2021年7月26日,中国应急管理50人论坛·第八届青年论坛在兰州大学召开。在专家主旨报告阶段,中国科学院自动化研究所研究员、博士生导师曹志冬作了题为“大数据驱动的新冠肺炎疫情预测分析”的主旨报告。他从大数据驱动的研究方法和新冠肺炎疫情预测分析两个方面,为疫情的常态化态势分析提供了科学依据。
大数据研究方法:两个预测案例 曹志冬研究员先是以两个大数据预测的案例作为开场。第一个案例是著名的“剑桥分析”事件,政治咨询公司“剑桥分析”基于Facebook的27万份个人问卷,结合Facebook用户的浏览记录,高精准地推断网民的个人政治倾向。根据个人政治倾向精准推送诱导信息,最终对五千万Facebook网民进行了诱导性的干预,这在很大程度上影响了美国2016年总统大选的结果。 从理论驱动到数据驱动:研究范式的革新 传统的理论驱动的研究与大数据驱动的研究方法有很大区别。前者要先提出理论假设,严格设计抽样调查程序,基于抽样调查数据,运用统计分析工具科学验证假设,证明假设为真或证伪。但是在大数据时代,数据较为密集,数据多到能够替代总体,传统的小样本验证假设的方式就受到了很大的挑战。 在数据层面,有三个影响因素会决定研究方法或者科学实验的成败与否:样本采集精度、样本量大小、样本能否代表总体。科学的理论驱动研究方法必须要满足几个条件:1.样本质量可靠可用;2.满足推断精度条件下样本量最小;3.布局合理,具备足够代表性。在大数据时代,这三个维度相应地发生了质的变化:1.数据混杂,个体精度大幅下降,可靠性低下;2.样本量极大丰富,甚至一定程度上可视为总体;3.布局难以提前设计,具有高不确定性。 新冠肺炎疫情预测分析 曹志冬研究员以《Science》和《Nature》的相关研究举例,表明尽管人们的出行模式有很大不同,但大多数人的行为是可预测的。且根据个体之前的行为轨迹,人类时空活动的可预测性高达93%。他表示,传染病主要以接触为主进行传播,没有了人员的密切接触,传染病就无法跨越千里,自身实现传播。 最后,他还对大数据在新冠抗疫中的应用进行了一些举例,如疫情预测与形势研判、密切接触者追踪、细粒度人员流动信息、物资生产调度平台、疫情服务小程序、疫情数据聚合与展示等。
专家简介 曹志冬,中国科学院自动化研究所研究员、博士生导师,国家杰出青年科学基金获得者。任新冠肺炎疫情联防联控机制科研攻关组信息化专班专家组成员、“十四五”和2021-2035年国家中长期科技发展规划战略研究报告人工智能组执笔人及多个国家一级学会的专委会委员、理事、常务理事。研究方向为社会计算与大数据、公共卫生应急管理、时空统计分析。主持国家科技重大专项、国家科技重点研发计划、基金委重大研究计划等资助国家级课题十余项,发表SCI\SCIE\SSCI\EI检索论文80余篇,主编/主译著作3部,获军队科技进步一等奖、二等奖、中国仿真学会自然科学一等奖等科技奖励8项。新冠抗疫成果获得国家领导和部委领导高度认可和重要批示,得到大量报道、转载和引用。
核发:吕孝礼
网友评论 已有 0 条评论,查看更多评论»