Darmkrebs oder akute Divertikulitis Genauere Diagnose dank KI

Autor: Miriam Sonnet

Eine akute Divertikulitis von dem Kolonkarzinom abzugrenzen, ist oftmals problematisch. Eine akute Divertikulitis von dem Kolonkarzinom abzugrenzen, ist oftmals problematisch. © ART-STOCK-CREATIVE – stock.adobe.com

Mit Unterstützung von Künstlicher Intelligenz können akute Divertikulitis und Kolonkarzinom besser voneinander abgegrenzt werden. Die Diagnosegenauigkeit von Radiolog:innen erhöhte sich durch den Einsatz des Algorithmus substanziell.

Die akute Divertikulitis (AD) von ihrer häufigsten Differenzialdiagnose – dem Kolonkarzinom – abzugrenzen, ist oftmals problematisch. Der Grund: Viele Eigenschaften der beiden Krankheitsbilder überlappen sich in der Bildgebung. Eine Ergänzung der radiologischen Expertise mit Künstlicher Intelligenz (KI) könnte zu einer akkurateren Diagnose führen, konstatieren Dr. ­Sebastian ­Ziegelmayer, Technische Universität München, und Kolleg:innen. Das Team entwickelte einen Deep-Learning-Algorithmus, der zwischen AD und Darmkrebs in routinemäßig gewonnenen CT-Bildern unterscheiden kann.

Sie nutzten die Daten von 585 Personen, die sich aufgrund einer AD oder eines Darmtumors einer Operation unterzogen hatten und deren Diagnose histopathologisch bestätigt worden war. Die Wissenschaftler:innen unterteilten die Daten in eine Trainings-, eine Validierungs- und eine Testkohorte. 10 Radiolog:innen mit unterschiedlicher Erfahrung – solche in ärztlicher Weiterbildung mit weniger oder mehr als drei Jahren Erfahrung sowie zertifizierte Kolleg:innen – bewerteten die CT-Bilder und stellten die Diagnose AD oder Kolonkarzinom. Im Anschluss erhielten sie das Ergebnis des Algorithmus und durften ihre Meinung nochmals ändern.

Höhere Spezifität der Diagnose

Das alleinige KI-Unterstützungssystem erzielte in der Testkohorte eine Sensitivität von 83,3 % und eine Spezifität von 86,6 %, was den Ergebnissen erfahrener Radiolog:innen entsprach (85,5 % bzw. 86,6 %). Der negative (NPV) bzw. positive prädiktive Wert (PPV) betrug 83,8 % bzw. 86,2 %. Die KI ordnete 16 % der Befunde falsch-negativ ein, zu falsch-positiven Ergebnissen kam es in 13 % der Fälle.

Das diagnostische Ergebnis aller Radiolog:innen ähnelte dem des alleinigen KI-Unterstützungssystems. Die Erfahrung der Ärzt:innen spielte dabei eine große Rolle: Erwartungsgemäß schnitten die zertifizierten Kolleg:innen besser ab als diejenigen in Weiterbildung. Wurde das KI-Unterstützungssystem zusätzlich eingesetzt, verbesserten sich Sensitivität, Spezifität sowie PPV und NPV. Die Sensitivität stieg von 77,6 % ohne KI auf 85,6 % mit Algorithmus-Unterstützung und die Spezifität von 81,6 % auf 91,3 %. Zudem verringerte der KI-Support falsch-negative sowie falsch-positive Befunde.

Das KI-Unterstützungssystem war zum einen der Befundung durch die Radiolog:innen nicht unterlegen und erhöhte zum anderen die Genauigkeit der Diagnose, lautet das Fazit der Forschenden. 

Quelle:
Ziegelmayer S et al. JAMA Netw Open 2023; DOI: 10.1001/jamanetworkopen.2022.53370