跳到主要内容

主题

诊断影像

诊断影像

AI在乳腺癌检测方面可与人类放射科医生媲美

15 Sep 2020
乳房X线照片示例
由AI识别出但被放射科医生遗漏的乳房X线照片的示例(左两幅图)和由放射科医生识别出但被所有三种AI算法遗漏的乳房X线照片的示例(右两幅)。 (礼貌:JAMA Network©2020美国医学会)

对三种用于乳腺癌检测的商业化人工智能(AI)系统进行比较后,发现它们中最好的系统与放射线医师一样出色。研究人员将该算法应用于在瑞典对近9000名妇女进行例行癌症筛查的过程中所拍摄的乳房X线照片数据库。结果表明,人工智能系统可以减轻筛查程序对放射科医生的负担。它们还可以减少通过此类程序而未被发现的癌症数量。

整个人群的筛查活动可以通过在肿瘤生长和扩散之前将其捕获来大大降低乳腺癌的死亡率。这些程序中的许多程序都采用“双重读取器”方法,其中每个乳房X线照片由两名放射线医师独立评估。这提高了手术的敏感性,这意味着可以捕捉到更多的乳房异常现象,但是却可能使临床资源紧张。如果可以证明基于AI的系统的有效性,则可以减轻这种压力。

Fredrik Strand

“我们研究的动机是对与乳腺钼靶筛查相关的良好AI算法的好奇心,”他说 弗雷德里克·斯特兰德卡罗林斯卡学院 在斯德哥尔摩。 “我在乳腺放射科工作,听说过许多公司都在销售他们的系统,但无法确切了解它们的性能。”

经过团队测试的算法背后的公司选择隐藏其身份。每个系统都是人工神经网络的一个变体,在细节上有所不同,例如其体系结构,所应用的图像预处理以及如何进行训练。

研究人员向算法中提供了来自 瑞典银幕年龄组 数据集。该样本包括739名在筛查后不到12个月被诊断出患有乳腺癌的妇女,以及8066名在24个月内未诊断出乳腺癌的妇女。第一和第二个人阅读器针对每个图像做出的二进制“正常/异常”决策也包括在数据集中,但算法无法访问。

三种AI算法以0到1的比例对每个乳房X线照片评分,其中1对应于存在异常的最大置信度。为了将这种方法转化为放射科医生使用的二元系统,Strand及其同事为每种AI算法选择了一个阈值,因此二元决策假定的特异性(正确分类的阴性病例比例)为96.6%,相当于该方法的平均特异性。第一读。这意味着对于每种算法,只有得分高于阈值的乳房X线照片被归类为异常情况。与之进行比较的基本事实包括筛查时或之后12个月内检测到的所有癌症。

在此系统下,研究人员发现,三种算法AI-1,AI-2和AI-3分别达到81.9%,67.0%和67.4%的灵敏度。相比之下,第一和第二位读者的平均阅读率为77.4%和80.1%。该算法确定的一些异常病例是那些患者的图像,人类阅读者将其分类为正常,但是在检查后不到一年的时间里(筛查程序之外)临床上接受了癌症诊断。

这表明AI算法可以帮助纠正假阴性,尤其是在基于单阅读器筛选的方案中使用时。 Strand及其同事通过测量人类和AI阅读器组合的性能来证明是这种情况:例如,将AI-1与人类第一阅读器的平均配对使用,可以将筛选期间检测到的癌症数量增加8%。但是,异常评估的总数(包括正确和错误肯定)总数增加了77%。研究人员说,因此,需要经过仔细的成本效益分析后,才决定使用单一的人类阅读器或高性能AI算法或人类与AI混合系统。

随着领域的发展,我们可以预期AI算法的性能将会提高。 “我不知道它们可能会变得多么有效,但是我确实知道有几种改进途径,”斯特兰德说。 “一种选择是将检查中的所有四张图像作为一个整体进行分析,这将使每个乳房的两种视图之间具有更好的相关性。另一个是将其与以前的图像进行比较,以便更好地识别发生了什么变化,因为癌症在过去几年中应该会不断增长。”

该研究的全部详细信息发表在 JAMA肿瘤学.

相关事件

版权©2020年由IOP 出版 Ltd和个人贡献者