2分钟内出结果!准过人类医生!这款心脏检测AI试验结果亮眼

以下文章来源于:药明康德

人工智能(AI)在医学领域中的应用一直备受关注。尤其是在分析医学影像图片方面,AI很早就被开发用于该领域。在今年的欧洲心脏病学会年会(ESC 2022)上,来自西达赛奈(Cedars-Sinai)医学中心Smidt心脏研究所的心脏病学家David Ouyang教授分享了一项前瞻性双盲试验,该研究在真实的临床环境中将AI模型与超声医师对经胸超声心动图评估的结果进行了比较,结果显示,就连经验丰富的心脏病学家都无法区分哪些结果是经“AI之手”得出的,哪些结果是来自于人类临床医生的判断。此外,相比于人类临床医生的初始评估结果,AI生成的结果需要专家校正的比例更少。


该研究中使用到的AI模型EchoNet-Dynamic是一种利用多个心脏周期的超声心动图视频进行训练的深度学习算法。在此前的研究中,该模型在分割左心室、估计射血分数和评估心肌病等关键项目中的表现超过了人类专家,在左室射血分数(LVEF)的评估方面,平均绝对误差仅为4.1-6.0%。

微信图片_20220905151748.png


在此次进行报告的EchoNet-RCT试验中,研究人员将3495例经胸超声心动图按1:1的比例随机分配给AI模型或平均拥有14年以上经验的超声医师进行初步评估,记录的报告内容包括LVEF的第一次读数或是将血液泵出到身体其余部分的心肌强度数据。随后,研究人员把AI模型和超声医师的报告混合后提交给资深心脏病学家进行最终的审评。

研究发现,与人类临床医生相比,心脏病专家对AI模型生成的报告进行的校正较少——AI组仅有16.8%的报告与心脏病专家评估的LVEF相比具有实质性的变化(数据差异>5%),而超声医师组的这一数据为27.2%。此外,即使是需要进行校正的数据,AI模型做出的即时读数相比于人类医生也更接近标准值。AI模型校正射血分数读数大部分在2.8个百分点以内,而人类医生的校正射血分数读数平均在3.8个百分点。最重要的是,AI模型平均在2分钟内就能完成对一名患者的读数,在效率方面也十分出色。

有趣的是,研究人员还要求参与的心脏病学家猜一猜手上的这份报告究竟是出自人类还是AI之手。从结果上来说,AI做出的报告足以“以假乱真“。心脏病学家只猜对了其中三分之一的报告,而剩下的报告要么无法分辨,要么直接猜错。

微信图片_20220905151752.jpg

图片来源:123RF

对于这项研究,Ouyang教授表示:“盲法试验可以防止人们对人工智能的偏见。这项研究的成功也说明了这类研究在正确的环境中的可行性很高。此外,研究结果也证明了如果以正确的方式开发和集成,AI算法可以简化原本繁琐但重要的任务、提高超声波读数的质量和效率,从而节省超声医师和心脏病专家的时间和精力。”

来自西北大学的心脏病学教授James Thomas在会上发表了点评:“如何在日常临床实践中证明AI模型的价值?或许盲法临床试验是一个不错的主意。这项研究表明与超声医师费力追踪超声扫描中的读数相比,AI模型似乎能够显著改善这项流程。如果这项研究能使超声医师不再需要花时间在这上面,他们得给研究人员颁发一块金牌!”

尽管这项研究的结果很突出,但大规模地将这个“计算机帮手”整合到现有的超声心动图系统之前还有待进一步的性能验证,以评估这款AI模型在不同健康中心的不同硬件设施上是否也有同样出色的表现。此外,获得监管机构的许可也是必要的条件。

“我们是不是可以期待未来有一天,会专门开设将获得FDA批准的AI算法纳入其中的应用商店呢?” Thomas教授如是说。


参考资料:

[1] ESC 2022: Ultrasound AI outperforms human clinicians in randomized, blinded study. Retrieved August 27, 2022, from https://www.fiercebiotech.com/medtech/esc-2022-ultrasound-ai-outperforms-human-clinicians-randomized-blinded-real-world-study
[2] Hot Line - AI assessment of LVEF is superior to sonographer assessment: Results from the EchoNet-RCT trial. Retrieved August 28, 2022, from https://www.escardio.org/Congresses-&-Events/ESC-Congress/Congress-news/hot-line-ai-assessment-of-lvef-is-superior-to-sonographer-assessment-results
[3] Ouyang, D., He, B., Ghorbani, A. et al. Video-based AI for beat-to-beat assessment of cardiac function. Nature 580, 252–256 (2020). https://doi.org/10.1038/s41586-020-2145-8