Künstliche Intelligenz Divertikulitis oder Kolonkarzinom?
Daten von 585 Patienten ausgewertet
In die retrospektive Auswertung wurden die Daten von 585 Patienten eingeschlossen, die zwischen 2005 und 2020 aufgrund einer der beiden Erkrankungen operiert worden waren. Von allen lagen präoperative CT-Bilder vor.
Zunächst entwickelten die Wissenschaftler einen Deep-Learning-Algorithmus, der anhand der CT-Bilder zwischen Kolonkarzinom oder akuter Divertikulitis unterscheiden sollte. Anschließend werteten zehn Ärzte mit unterschiedlicher Erfahrung dieselben Bilder aus. Ihre Ergebnisse wurden mit den KI-basierten Diagnosen verglichen.
Das KI-System erreichte eine Sensitivität von 83,3 % und eine Spezifität von 86,6 %, was mindestens auf dem Niveau der durch die Ärzte gestellten Diagnosen lag. Diese kamen im Durchschnitt auf 77,6 % bzw. 81,6 %. Noch besser waren die Ergebnisse, wenn die Ärzte das KI-System zur Unterstützung bei der Diagnose nutzten (85,6 % bzw. 91,3 %).
Auch die Erfahrung der Ärzte war wichtig
Allerdings spielte dabei auch die Erfahrung der Mediziner eine Rolle: Insbesondere profitierten Assistenzärzte für Radiologie von der Unterstützung durch das KI-System. Bei ihnen zeigte sich eine Verbesserung der Sensitivität um 9,6 % und der Spezifität um 7,2 %. Bei den erfahreneren Fachärzten für Radiologie hingegen schlug die KI nur mit einem Plus von 4,5 % bzw. 4,7 % zu Buche.
Auch die Zahl der Fehldiagnosen konnte dank KI reduziert werden: Ohne Unterstützung lag die Rate der falsch-negativen Ergebnisse bei 22 % für alle Ärzte, bei 26 % für Assistenzärzte und bei 14 % für gestandene Radiologen. Mit Unterstützung fiel sie auf 14,3 %, 16,1 % bzw. 10,0 %. Insgesamt stieg durch Hinzunahme des KI-Systems der negativ-prädiktive Wert von 78,5 % auf 86,4 % und der positiv-prädiktive Wert von 80,9 % auf 90,8 %.
Quelle: Ziegelmayer S et al. JAMA Netw Open 2023; 6: e2253370; DOI: 10.1001/jamanetworkopen.2022.53370