专业
认证

鹅知道 | 人工智能能为控制疫情做出什么贡献?

[摘要]根据目前的新闻来看,机器学习等数据和计算科学在这次疫情中扮演的主要是辅助角色,其中对控制疫情最帮助的应该是接触者追踪、数据预测和新的流行病学传播模型。

对于如何抗击新型冠状病毒疫情这个问题,更多人首先想到的应该是研发有效的治疗药物,但随着人工智能技术逐渐成熟、强大,科学家们也开始依赖人工智能对抗各式各样的疾病。

知乎答主“甜草莓”认为,在这次新型冠状病毒疫情当中,机器学习等数据和计算科学在这次疫情中扮演的主要是辅助角色,其中对控制疫情最帮助的应该是接触者追踪(contract tracing) 、数据预测和新的流行病学传播模型。

以下为知乎答主“甜草莓”撰文全文,新闻资讯稍作整理:

如果说流行病学中较为严谨的科学研究,比如疫苗制造,药物研发,那么机器学习暂时不能代替主流方法。主要是因为目前主流的机器学习手段可解释性不强,而流行病学等生物和医药学科需要发现数据的内在联系,并通过这些联系指导线下实践。可惜的是目前主流算法暂时无法满足这些要求。

根据目前的新闻来看,机器学习等数据和计算科学在这次疫情中扮演的主要是辅助角色,其中对控制疫情最帮助的应该是接触者追踪、数据预测和新的流行病学传播模型。

接触者追踪

众所周知,与流行传染病患者密切接触的人,自身被感染的风险更高,并且有可能进一步传染他人。因此,追踪并观察这些密切接触者有助于这些高危人群第一时间得到护理和治疗,并防止病毒进一步扩展,这也是流行病控制的关键。

整个过程大概可以分为接触者识别、建立接触者列表和接触者随访三步。

%title插图%num

上一次大规模爆发的疫情是非洲的埃博拉病毒(2013-2015左右),但是在埃博拉病毒爆发期间,非洲整体信息系统普遍落后,当时无法通过技术手段加速追踪过程。

虽然也曾有学者在谷歌、爱立信和三星捐赠的支持下在几内亚开展实验,但是这种依靠捐赠分发手机的小型实验只能小幅度提高接触者随访的效率,当时的主流追踪手段依然是感染者自身回忆,主要的追踪流程依然采用纸质手段,以计算机数据手段为辅:

%title插图%num

不过在这次的疫情中,我们应该会有机会通过近些年的高度信息化工具来改变加速整个接触者追踪的速度和效率,从而控制疫情传播。

到这里就衍生出了两个问题。

问题1:如何识别接触者?

从计算机的角度看,接触者识别本质上是寻找和感染者时间、空间上有重叠的人群。人所走过必有痕迹,尤其是在信息社会,虽然数据上的痕迹不能完全等同于线下接触,但是依然能够给接触者寻找带来很多便利。

如果我们考虑到已经存在的各种数据源,其中可用、而且会非常有效的数据痕迹包括:基站数据(运营商)、支付数据(银联&第三方支付机构)、出行数据(铁路&飞机&住宿)、城市摄像头&户口等行政数据(公安)等。当然如何高效组织和搜索这些数据还涉及个人隐私、以及谁有权限调用等重要问题,我们抛开这些问题不谈,先说说能怎么做、以及做到什么程度。

基站数据:呼叫详细记录(Call Detail Record,CDR):狭义上的CDR是指手机通话或者发送短信时的基本信息记录,消息发送者身份(Points of origin),目的地的身份 (Endpoints),通话持续时间,总使用时间计费等等,但是这只适用于2G/3G。4G以后,CDR通常指任何手机与基站交互后,被记录的数据,这里的数据可能包含用户位置估计(源自于基站定位)。换句话说,只要已知基站分布位置,任何人携带手机后的粗略运动轨迹,都可以通过CDR分析获得。

%title插图%num

CDR数据样例(现在很可能不是这样了),来源ITU

虽然目前基站覆盖范围通常在1K-3K米左右,并不能很精确的确定感染源和接触人群是否存在物理接触,但是对于感染源长期驻留的某些区域,可以考虑对该区域用户进行系统标记,如果某标记用户存在继续暴露的可能,可以视情况而定提示风险或进行医学观察。

%title插图%num

CDR数据用户轨迹复原

其实现在CDR分析已经很成熟了,完全可以用在接触者追踪中。在国际电信联盟(ITU)给出的CDR使用案例中,曾经给出了埃博拉时期的一份案例。

在一个小镇上出现了一例埃博拉病毒,电信部门通过CDR分析追踪该小镇居民(可能为高危接触者)在48小时内的扩散情况(3小时间隔):

第一个12小时:

%title插图%num

第二个12小时:

%title插图%num

第三个12小时:

%title插图%num

第四个12小时:

%title插图%num

这个案例可以扩展一下,如果当时反应迅速,相关数据机构可以考虑定位武汉华南海鲜市场的常驻人群,并追踪这些高危人群后续的行为轨迹,这样可以精准联系到其密切接触的具体人员,完成接触者识别。

此外,CDR数据通常会在运营商留存很久,因此对于已感染人员的行为轨迹可以准确还原,并建立GEO数据库做相关分析比对,多个感染源在短时间内驻留或者通过的区域可以划分为高危区域、做重点观察。

其实现在对CDR数据的利用已经有了一些成功案例:在2010年1月海地地震以及2010年10月霍乱爆发之后,瑞典卡罗刘斯卡研究所的研究人员分析了两百万部手机的每日运动数据,并能够确定霍乱暴发的关键区域,量化受灾难影响的人口及其在接下来的时期内的流动,对当时政府决策提供了巨大价值。

目前已经曝出多个列车和航班上存在确诊的感染人员,需要紧急扩散寻找同程人员的示例,这就反映出目前的信息系统并没有一个非常高效、自动化的交流渠道和平台,很可能目前依然只是靠系统初步筛选、人工再筛选和联系的阶段。

问题2:识别接触者之后,如何建立接触者列表和接触者随访?

相信自从微信和手机普及以后,简单的添加接触者、对接触者的医学观察可以通过社交软件高效完成,不必像埃博拉病毒期间需要各家各户访问、社区监控。

但是考虑到目前本地医务人员和志愿者不足,可以考虑通过构建APP建立本地接触者与外地富余医疗人员之间的观察联系,类似远程随访机制或线上专项医生,这样可以分担部分疫区医疗压力,同时可以引入心理志愿者,为相关接触者分担心理压力。

如果存在一个统一的线上随访平台,同时完成医疗资源分配和数据录入,会提高很多工作者的工作效率,也有利于自闭在家的医学观察用户或者普通用户获得专业的医学建议,尽量不去医院,避免交叉感染。。

更进一步,从科研角度讲,上述提到的CDR等数据可以建立实时的人口流动和疫情传播模型,目前大部分对于疫情的数据分析往往基于传统的流行病学方法,求解微分或者动力学模型,辅以社会经济或者人口统计学特征,求解足够置信的预测数据,比如R0数据或者对潜在感染人数预测。 这些模型虽然在指导公共卫生政策方面很成功,但是往往无法精确体现复杂的人类行为、移动轨迹、真实接触程度。

比如,采取严格的人口管制和卫生措施的城市,其新增潜在传染病例数目往往无法通过传统动力学模型衡量,而鉴于目前医疗资源问题,每日新增病例可能只是因为试剂盒受限,无法精确衡量真实疫情变化趋势,这些可以通过基于上述提到的数据分析完成。

赞(0) 打赏
未经允许不得转载:贝斯通检测认证机构中心 » 鹅知道 | 人工智能能为控制疫情做出什么贡献?

贝斯通检测 专业认证 诚挚服务

国内外一站式检测认证。

联系我们联系我们

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续给力更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

登录

找回密码

注册