新冠肺炎疫情在海外迎来了爆发之势,而检测手段的繁琐和设备的短缺,也成了疫情防控过程中的拦路虎。
许多媒体都报道,检测不力是多国无法有效追踪疫情,导致病例迅速激增的一个原因。
近日两所知名的高校,卡内基梅隆大学(CMU)和剑桥大学,不约而同地使用了一种新的方式:通过 AI 系统分析声音信息,来检测被 COVID-19 感染的风险。
在卡内基梅隆大学给出的测试器 COVID Voice Detector 中,需要完成几种声音的录制,仅需几分钟即可得到感染风险的结果。
进入网站注册后,需要进入个人情况的填写。其中涉及的信息包括人种,年龄,健康状况,是否确诊或确诊过等信息。
上述信息填写完毕后,需要录制咳嗽、英文元音的发音,数字和字母表朗读等语音信息。
而模型经过了确诊者和正常测试者的一些数据的训练,可以对新输入的声音进行分类的匹配。
最终会返回一个分数,表明所录制的声音,和收集到的 COVID-19 患者数据相比,感染特征相符合的程度。
为了让系统的判断尽可能准确,必须拥有足够多的训练数据,而且还要涵盖多元化的信息,研究人员正在倡议更多的志愿者参与进来。
此外,他们称系统具备可扩展性,如声音来自其他呼吸系统疾病的人,算法就可学到该类疾病的声音特征。
测试器地址:
https://cvd.lti.cmu.edu/cvd/
发稿前访问该网站,提示因为在更新和维护的原因暂时关闭,相关负责人表示,有望在本周末再次上线。
和卡内基梅隆大学类似,剑桥大学也推出了用声音检测 COVID-19 的项目。但稍有不同的是,剑桥大学仅仅还是只是收集数据,还不提供检测的结果。
系统收集数据的方式相差不大,需要填写基本资料和医疗信息,并通过手机麦克风采集语音信息作为训练样本。
同样地,系统也会调查用户的身体健康情况,比如是否发烧、是否感染过等信息。需录制的项目有呼气声、咳嗽声和阅读文本的声音。
项目负责人 Cecilia Mascolo 教授解释说,由于该项研究的大型数据集非常少,为了提供更好的算法以用于早期检测,需要收集到足够多的数据量。
他还表示到,数据量累计之后,即便没有足够冠状病毒阳性病例,还可以找到与其他呼吸道疾病有关的信息。
该项目的最终目标是,开发出可自动检测疾病的机器学习算法,以可推广使用的检测 App 来呈现。
项目地址:
https://www.covid-19-sounds.o...
两个项目彼此独立,但使用的方式和原理拥有着一些共性。而对于项目的具体原理,双方却都没有给出太多信息。
卡内基梅隆大学的研究团队,曾长期致力于语音取证技术。他们认为人的声音,受到器官机构状况和健康程度的影响,能揭示生理,心理甚至医学数据。
受肺炎病毒感染的患者,肺部会发生一些病变,其呼吸模式等参数会受到影响,导致发出的声音出现一些异常特征,对算法而言是一个能够抓取的特点。
剑桥大学的团队,也是由多位专家、博士组成。在项目介绍中他们表示到,新冠肺炎作为一种呼吸系统疾病,感染疾病的人发出的声音会存在一些特征,包括声音,呼吸间隔和咳嗽声等。
虽然这种方式很新颖,但两个项目都处于初期阶段,在 BBC 的一篇报道中,还使用了「Teething problems」(出牙痛,指代初期困难)来表明此方案的困难。
不过在之前的研究中,用声音来诊断疾病的案例中,出现了一些成功的案例。
比如,成立于 2014 年的 ResApp Health,就专注使用机器学习算法来分析咳嗽声,来诊断和测量各种慢性和急性疾病的严重程度。目前取得了一些成果,可对哮喘,肺炎和毛细支气管炎等疾病进行判断。
另一个叫 Sonde 的公司,在去年还获得了一项语音诊断的美国专利。他们开发的一个平台,通过感测和分析语音中的细微变化,可从讲话中判断患者的健康状况,辅助医生进行诊断抑郁症、痴呆症等病症。
用声音诊断 COVID-19 的项目,相比已经成熟的研究,除了时间紧迫之外,关于疾病的声音数据也少之又少,所以难度和挑战也不小。
对于两个项目来说,研究没有经过 FDA 或 CDC 的批准,还不能用于正规的医学诊断。
现阶段的最大目的在于,呼吁更多人(包括确诊者和正常人)贡献自己的声音数据,以推动该研究项目的进展,进而去帮助对新冠等流行病的控制。
关于这些研究,也出现了是否会有效的争议。比如不同地区疫情的程度不同,会不会带来模型的分析偏见。而简单的语音录制,虽然方便但收集的语音信息,是否达到了科学分析的要求。
现在看来,关于系统的专业性和准确度,还需要等待后续的验证。在此之前,没人知道前方的道路,但另一方面,这正是科学探索的魅力所在。