在抗击COVID-19新冠疫情的战斗中,政府、医护人员及各个行业利用人工智能和各种热传感器,基于大数据进行分析和预测,将其对公共卫生和全球经济的冲击降至最低。
COVID-19与引起严重急性呼吸系统综合症(SARS)和普通感冒的病毒系出同宗。人类对这种新病毒还不具备免疫力,其早期的影响是毁灭性的。
在中国湖北报告第一个病例之后的几个月,大多数国家都只进行了零星的测试,因此全球各地的人们不清楚他们中间到底有多少人感染了新冠病毒,也不知道如何躲避这种危险,甚至不了解其传播范围。没过多久,人工智能和数据分析技术专家们就意识到,可以利用人工智能技术和数据科学,来支持流行病学家和政府危机应对小组的工作。
通过数据分析和数学方法,再加上物理学方法,可以让我们更深入地了解病毒的自然发展过程。数据科学的先锋们应用数据收集与分析减缓了早期疫情的传播,对社会公共卫生做出了贡献。历史上最早的一个数据分析案例出现在1852年伦敦爆发霍乱期间。最早采用数据分析的一位流行病学家,John Snow,对伦敦死亡病例地理区域的分布进行了分析,从而找出了疫情的源头。当局根据他的分析有针对性地实施干预措施,迅速遏制了疫情的传播。
研究人员通过在数据分析系统中运行模型,能够预测疫情的发展趋势。例如,SIR模型是一种流行病学模型,可以从理论上计算封闭地区的人口随时间的推移感染传染病的人数。该模型使用耦合方程来分析容易感染的人数S(t)、已感染的人数I(t)和已经康复的人数R(t)。
最简单的一个SIR模型是Kermack-McKendrick模型,它是其他许多流行病仓室模型的基础。对于这种情况,我发现帕多瓦大学的研究生Ettore Mariotti在3月初发表的一份分析报告非常有趣。
假设在一个人们不能出入的岛上(即我们的系统),在某个时间,岛上的每个人都处于这三种状态中的一种:“易感(Susceptible)”、“已感染(Infected)”和“已康复(Recovered)”(SIR)。一个从未患病的人(S)有一定的几率生病受到感染(I),并在一段时间后康复(R)。对于COVID-19疫情,还需要增加一个“潜伏期(Exposed)”状态来扩展模型,以涵盖那些携带病毒但尚不具备传染性的人群(如图1的SEIR模型)。
图1:SEIR 模型。(图片来源:triplebyte.com)
这一模型考虑了两个因素:病毒的动态性以及不同个体的相互影响。利用这些信息,就可以定义参数R0,表示一个感染者可能传染的人数。
举例来说,假设A病了,系统中R0=2,这表示A会感染两个人。这两个人然后将感染四个人,而这四个人中的每个人又将分别感染另外两个人(即4×2=8),依此类推。这说明疾病的传播是呈倍数增长而不是简单的累加。R0有三种可能的情形(图2)。
图2:R0的基本场景。(图片来源:triplebyte.com)
关闭学校、体育馆、剧场、餐厅以及其他公共场所可以减少社交接触,从而降低R0。由于病毒的大规模传播会导致公共卫生资源枯竭,因此将R0降至小于1非常重要。如果R0>1,疾病将传播;如果R0<1,疾病会消失。因此,为了在冠状病毒爆发期间降低R0,政府对人员流动实施了严格的限制。
需要注意的是,R0衡量的是疾病可能出现的传播,而不是传播的速度。想一想无处不在的流感病毒,其R0仅为1.3。因此,高R0需要引起注意,但不必为此恐慌。
R0是一个平均值,因此可能会受到一些因素的影响,例如在一定数量的人群中“超级传播者”的个数。超级传播者是指传染人数异常多的感染者。在SARS和MERS疫情中,以及目前的Covid-19疫情中,都出现了超级传播者。但这不一定是坏事,因为它可能表明让疫情持续的人数减少了。超级传播者也可能更容易识别和收治,因为他们的症状很可能更重。
简言之,R0是一个不断变化的数值。跟踪每个病例和疾病的传播非常困难,因此估算R0复杂而具有挑战性。估算值经常随新数据的出现而发生变化。
为了帮助政府控制R0,可以利用人工智能并通过GPS追踪手机收集数据,创建分析模型,以预测哪些小区更有可能出现病例、哪些小区需要紧急干预。
疫情期间,病例数据的质量和一致性变化很大。一些病例呈现假阳性,这使情况更加复杂。大数据和人工智能可以帮助检查人们是否遵守隔离要求,机器学习则可以用来进行药物研究。
亚洲地区为应对疫情采取了一些有效举措,其中包括利用数字技术进行防控。例如,配备智能扫描仪和摄像头的无人机可用来发现违反隔离措施的人员,还可以检测体温。中国内地和台湾地区甚至还应用了智能相机来进行检测。
香港的AI技术公司SenseTime开发了一个平台,即使在人们戴着医用口罩的情况下,也可以通过扫描他们的面部检测出是否发烧。SenseTime公司的非接触式温度检测软件已广泛应用在北京、上海和深圳的地铁站、学校和其他重要的公共场所。
与此同时,阿里巴巴也开发了基于AI的COVID-19诊断系统,该系统可以通过计算机断层扫描(CT扫描)检测出是否感染了新冠病毒,准确率高达96%。
纽约的Graphen公司正在与哥伦比亚大学合作,目的是定义新冠病毒每个基因定位的规范形式,并确定有哪些变体。Graphen提供的Ardi AI平台模拟人类大脑的功能,研究人员利用它来存储突变数据,并使之可视化。
典型的可视化功能是将一个病毒与一组具有相同基因序列的病毒映射。只需点击相应的节点,就可以查看与病毒相关的信息,包括感染者的位置、性别和年龄。
疫情期间,大数据已被广泛用于改善监视系统,以绘制病毒传播图。
大数据的采集、处理和分析需要新的方法和技术。下面列出了四种不同的大数据分析方法:
阿里巴巴还开发了“支付宝健康码”应用,利用大数据支持中国的医疗保健系统,指示谁可以进入公共场所,谁不可以进入。
BlueDot是多伦多的一家初创公司,基于其人工智能平台BlueDot开发的智能系统可以自动监控并预测传染病的传播。BlueDot平台在SARS疫情中已投入使用,其发挥的作用毋庸置疑。
值得一提的是,2019年12月,BlueDot曾对冠状病毒的潜在威胁发出警告,再次证明了其模型的正确。BlueDot使用的工具包含自然语言处理技术。
马里兰州罗克维尔的Insilico Medicine是另一家致力于利用人工智能来预防疾病的公司。该公司正在开发下一代AI和深度学习方法,将其应用在新药发现与开发过程的每一步。Insilico最近使用其系统分析了可能适合抗击新冠病毒的分子,并已经取得成果。该公司目前正在整理用于疫苗开发的信息数据库。
除了对公众健康的影响之外,COVID-19对全球经济也造成了毁灭性的打击。相关部门利用大数据和人工智能分析了疫情对经济的影响,并制定适合的应对策略。
例如,WeBank研究人员利用卫星分析技术确定了中国受疫情影响最大的行业,其中包括钢铁行业。分析显示,中国钢厂的生产量在疫情初期最少降低到了产能的29%,但到2月9日已恢复到产能的76%(图3)。
图3:将2019年12月30日(左)和2020年1月29日(右)同一区域的两张卫星图进行比较,可以看出,在疫情爆发初期,中国的钢铁行业生产活动急剧下降。(图片来源:spectrum.ieee.org)
研究人员还利用人工智能来了解其他的生产和商业活动。其中一种方法是简单地统计大型停车场中汽车的数量。分析表明,到2月10日,特斯拉在上海的汽车生产已完全恢复,而上海迪士尼乐园等旅游场所仍处于关闭状态。
通过分析GPS卫星数据,可以确定有多少人正常上班。然后,由相关软件计算出每个城市的通勤人数,并对2019年和2020年春节假期刚开始时搭乘公共交通的人数进行比较。结果表明,搭乘公共交通的人数在这两年的春节假期开始时都下降了,但是2020年春节后的通勤人数并没像2019年那样恢复。
WeBank研究人员由计算得知,随着经济活动的逐渐恢复,到2020年3月10日,大约75%的劳动力已返工。根据这些曲线,研究人员预测,在中国除武汉以外,大多数工人将在3月底恢复正常工作。
在抗击新冠疫情的战斗中,人们使用了自己的强大工具,而那些经过实践证明有效的方案未来很可能成为一种标准。
ASPENCORE旗下EETimes欧洲网站,参考链接:Marshaling Sensors and Data Analysis to Combat COVID-19。)
本文为《电子技术设计》2020年07月刊杂志文章,版权所有,禁止转载。免费杂志订阅申请点击这里。