根据美国疾病控制和预防中心给出的数据显示,结核病是世界上最致命的疾病之一。2017 年,近 1000 万人感染了结核病,其中 130 万人死于结核病。更糟的是,由于结核分枝杆菌具有对某些药物产生耐药性的能力,导致结核分枝杆菌很难针对。

 

幸运的是,哈佛医学院 Blavatnik 研究所的研究人员已经设计出一种算法,能够检测出治疗前对常用结核病药物的耐药性。在实验中,他们成功地以十分之一秒的时间准确预测了结核菌株对 10 种一线和二线药物的耐药性,而且比类似模型的预测精度更高。

 

 

该方法发表在《电子生物医学》(EBioMedicine)杂志上,并将被添加到哈佛医学院(Harvard Medical School)的 genTB 工具中。genTB 工具分析结核病数据并预测结核病耐药性。

 

哈佛医学院生物医学信息学助理教授、资深研究作者马哈·法哈特(Maha Farhat)在一份声明中说:“耐药结核病很难发现、很难治疗,而且预示着患者的预后很差。在诊断时能够迅速发现耐药性的全部情况,这对改善个别患者的预后和减少向他人传播都是至关重要的。”

 

正如 Farhat 和他的同事解释的那样,在每年确诊的数百万新结核病例中,大约 4%的人对至少两种药物有耐药性,十分之一的人对多种药物有耐药性。药物敏感性测试设备在发展中国家很难买到,即使在设备精良的实验室,测试结果也需要数周时间才能得到验证。

 

扫描 DNA 样本寻找耐药基因的新检测方法也有其局限性,主要是无法发现多种药物的耐药或检测出罕见的促进耐药的基因变异。至于全基因组测序测试,它们在检测二线药物耐药性方面往往表现不佳。

 

相比之下,研究人员利用机器学习算法来捕捉多种突变的影响。它包含两个模型:一个统计模型和一个“广泛而深入”的系统,该系统将每个突变编码为一个变量,该变量要么产生耐药性,要么没有。

 

“我们的目标是开发一个神经网络模型,这是一种人工智能,与大脑中神经元之间的连接形成方式大致相似,”该研究的第一作者迈克尔·陈(Michael Chen)说,“神经网络将两种形式的机器学习相互交叉,以识别基因变异对抗生素耐药性的综合影响。”

 

这两个人工智能系统对 3601 株耐一线和二线药物的结核菌株进行了培训,其中包括 1,228 株耐多药菌株,结果来自药物敏感性测试。为了测试它们的性能,论文的合著者从 792 个完全测序的结核病基因组的测试语料库中提取了样本喂养它们。

 

深度人工智能系统预测一线药耐药率 94%,预测二线药耐药率 90%,统计系统预测一线药耐药率 94%,预测二线药耐药率 88%。

 

这两种模型都能在十分之一秒内预测对一线和二线疗法的耐药性,而深度模型显示出预测极其罕见的基因突变影响的能力。研究人员声称,如果将该模型纳入临床试验,可以使耐药性检测更快、更准确。

 

“深度模型是一个决策工具,它结合了所有的数据和先进的生物学知识,即耐药性是由大型个体突变和许多不同突变之间的相互作用造成的,”该研究的合作者、哈佛医学院生物医学信息学教员安迪·比姆(Andy Beam)说。“我们的模型强调了人工智能在结核病方面的作用,但它的重要性远远超过结核病。”