近年来人工智能迅速发展,在很大程度上归功于深度学习为代表新理论提出,深度学习理论的三位奠基者因此获得2018年图灵奖。
本届人工智能大会首次邀请到深度学习三巨头之一,2018年度图灵奖得主蒙特利尔大学计算机学教授约书亚·本希奥。在今天开幕式的主题演讲环节中,约书亚·本希奥通过视频方式发表了《机器学习赋能智能手机预测新冠疫情传染性风险》的主题演讲,谈到了基于智能手机的传染性风险。
约书亚·本希奥认为,首先,新冠病毒的重要传播特征就是能够人传人。一个病例出现症状,但往往他在出现症状的前几天就开始具有传染性了。所以医疗机构和政府的疫情防控部门迫切希望进一步扩大检测报告内容。用人工进行操作是可以的,但问题是需要时间,这方面手机记录跟踪的信息可能会给医疗防控带来帮助。标准数据跟踪的问题是只考虑了一个人核酸检测阳性与否的两元化信息,你知道你测为阳性之后,很可能具有非常高传染性是几天之后的事,如果减少这段延误时间,可能大大减少病毒传播。
“我们希望疫情防控中对于症状的追踪不是简单两元的事,有时候症状不一样,症状严重程度也不同,你需要考虑到好多点。你现有病情的状况、年龄、性别都可能影响疾病的进程。另外从那些已经确诊的患者那里收到的信息,你接触过不同风险等级的人,这些信息和线索都需要进行整合。最好的办法就是用机器学习,把这些碎片信息整合起来,确定你是不是已经被传染了,或者处于传染的哪个阶段。” 约书亚·本希奥表示,如果做到了这一点,那些有危险的人就可以根据这些预测出来的传染性,向过去几天所有见过的人发个短信,告诉他们要小心一点、需要待在家里隔离,风险没有那么高的人则可以照常生活,而不需要接受强制隔离。
约书亚·本希奥表示,这种技术未必能够完全取代人工的信息跟踪,人工跟踪可以发现人工智能没有办法评估的东西。我们想利用手机数字接触跟踪方法来加强人工接触跟踪的工具,扩大范围。“手机收集数据的工具对于公共卫生管理来说是很珍贵,很有用的。公共卫生管理部门可以决定测试谁,风险更高的人或者有接触史的人是不是需要进行优先测试。这些技术可以提供很多重要信息,比如预测是不是有可能出现大疫情,在人们去医院之前就已经进行预测了,因为可以看到传染概率在某些地区已经大幅上升了,这对公共卫生是有意义的。”
约书亚·本希奥认为,如果已经知道了整个接触的图表,我们可以做远程预测,基于我们对每个人了解可以预测他的状态,有很多办法都需要某种形式的迭代,对应不同人的不同节点之间都可能会产生多次交流概率信息,直到针对每个人的风险能够达成一个共识。如果机器学习预测器足够简单,另一种做法就是使用联合学习,不需要拥有一个中央的训练服务器,每个人手机上都可以完成自我学习和培训。
手机之间传递的信息可以使一个人风险状况不断更新,每个人能够接受或者发送信息。为了能在手机端做预测,我们也需要训练手机端的预测器。同意分享数据的人可以通过一定的识别方式向服务器提供自己的数据,服务器并不知道这些数字来自谁的手机,你的姓名,只知道症状感受如何,知道这个人是否进行过核酸检测,阳性还是阴性。
风险预测器会接受以下的信息输入,包括调查问卷里面所填的信息,包含现在你有没有自身疾病、年龄性别、行为相关的信息,你在外面或者封闭空间或者工作场所有没有戴口罩,工作的地方有没有玻璃挡着,有没有坐过公共交通工具,家里住多少人,我们知道的这些都有可能影响你有没有受感染的因素,包括过去14天里面的每个数据,你能不能提供这些症状信息和核酸检测报告测试结果信息还有白天和多少人接触过,接触多久,相隔多少距离有交互和接触。当一个人发短信的时候我们就可以知道这个人风险水平有多高。
约书亚·本希奥表示,这个数据是一个可变的输入,根据你每天接触的数量,预测器输入数量也不同,这意味着需要用很多不同机器学习的方法。训练这些机器学习目的是为了什么?一个人向另外一个人发什么信息?比如爱丽丝在五天之前碰到鲍伯,她现在发现她被感染了。她应该给鲍伯发什么信息?最有用最相关的信息就是评估一下,爱丽丝5天之前遇到鲍伯时传染力有多少,我们想要预测每个人在过去14天里面每一天的传染力有多强,这些信息就可以发给他们过去14天所见的所有人。
“我们并不知道传染力,只是有一些类似概率的信息结果,我们并不一定确认如何能够确定正确的训练目标,即使测试结果里面也有假阳性和假阴性。幸运的是,在机器学习中间有一些基于潜在变量的方法可以用来处理这个问题。”