Wie können Künstliche Intelligenz und riesige Datenmengen Kardiologen unterstützen?

Autor: Dr. Sascha Bock

Herzdaten schwirren längst durchs digitale Nirwana. Mit KI soll ihr Potenzial für Patienten ausgeschöpft werden. Herzdaten schwirren längst durchs digitale Nirwana. Mit KI soll ihr Potenzial für Patienten ausgeschöpft werden. © iStock/Arkadiusz Warguła

Netflix nutzt es, die Gesichtserkennung Ihres Smartphones auch und selbstfahrende Autos sowieso: Machine Learning. In der Kardiologie macht sich dieses Gebiet der Künstlichen Intelligenz ebenfalls breit. Doch was genau versteht man darunter? Und wo kann die Technik den Medizineralltag erleichtern?

Die Ziele sind hochgesteckt: Mithilfe des maschinellen Lernens sollen Therapien personalisiert, unnötige Diagnostik vermieden und Outcomes verbessert werden. Noch funktionieren die meisten intelligenten Computeralgorithmen in der Medizin aber anders, nämlich in Form sogenannter Expertensysteme. Diese nutzen Regeln zu einem gegebenen Thema, um über ein klinisches Szenario zu urteilen. Zwei US-Kollegen veranschaulichten es einst so: Expertensysteme arbeiten wie der ideale Medizinstudent, sie übertragen allgemeine Grundprinzipien auf einen neuen Patienten.1

Machine Learning hingegen geht Probleme wie ein Assistenzarzt an, der einen Kranken untersucht und schaut, was die Kombination des Gefundenen bedeutet, erklärten Dr. Ziad Obermeyer, Harvard Medical School, Boston, und Professor Dr. Ezekiel J. Emanuel, University of Pennsylvania, Philadelphia, weiter. Wie ein Arzt entwickeln Algorithmen aus Variablen – Alter, Anamnese, CT-Befunde etc. – Regeln bzw. Lösungen, indem sie Muster erkennen. Künstliches Wissen aus Erfahrung. Viel Erfahrung. Denn für ein gutes Ergebnis braucht die Software entsprechendes Futter.

75 nützliche Variablen allein aus CT-Angio und PET

Die schiere Menge an Informationen würde es einem Mediziner z.B. unmöglich machen, eine Prognose bezüglich des individuellen Infarktrisikos abzugeben. Machine Learning kann das, wie finnische und niederländische Forscher kürzlich zeigten.2 Jeweils 85 Variablen von 951 Patienten mit Brustschmerzen und intermediärem KHK-Risiko gaben sie in einen Algorithmus namens LogitBoost ein. Nur 10 klinische Parameter waren vertreten, die restlichen 75 Werte kamen aus CT-Angiographie und PET (u.a. Plaque, Stenosen, Flow).

Wiederholtes Durchrechnen macht Ergebnis zuverlässiger

Mit dem Wissen über das Sechs-Jahres-Follow-up konnte die Software das Auftreten von Tod oder Herzinfarkt mit 95,4%iger Genauigkeit vorhersagen und übertraf somit die klinische Einschätzung. Repetitives Durchrechnen ermöglichte es dem Algorithmus, geeignete Variablen in Bezug zueinander zu setzen. Grundsätzlich führt eine hohe Zahl solcher Wiederholungen zu einem zuverlässigeren Ergebnis.

Vor allem die Nuklearkardiologie sieht Professor Dr. Piotr J. Slomka vom Cedars-Sinai Medical Center in Los Angeles als Vorreiter in Sachen Künstlicher Intelligenz. Die Bilder bieten eine hervorragende Datenbasis, sagte der Kollege auf der diesjährigen International Conference on Nuclear Cardiology and Cardiac CT. Beispielsweise kann ein Programm bei Patienten mit Koronarstenosen die Erfolgsaussichten einer Revaskularisierung bestimmen, wenn es die Perfusion in der Myokardszintigraphie mitberücksichtigt.

Trotz all der Rechenvorgänge und Variablen soll das maschinelle Lernen für den behandelnden Arzt keine „black box“ sein. So gibt es die Möglichkeit, das Resultat über ein Balkendiagramm nachzuvollziehen. Die Software visualisiert dabei, wie Alter, Stress-Score, EKG oder andere herangezogene Merkmale im Einzelfall gewichtet wurden.

Entfernt man sich von Entscheidungsbäumen mit einer gewissen mathematischen Logik, landet man beim Deep Learning, einem Teilgebiet des Machine Learning. Über künstliche neuronale Netze lassen sich dadurch auch komplexe Fragen beantworten. In der medizinischen Forschung kommt es z.B. bei der Interpretation von Bildern zum Einsatz (Hautkrebsscreening, automatische Analyse von epikardialem Fettgewebe etc.). Um akzeptable Prognosen abzugeben, muss manche­ Software zunächst mit mehr als einer Million Bildern „trainieren“.

Qualitätssicherung und Übertragbarkeit

„Garbage in, garbage out“, sagen Informatiker scherzhaft. Die Phrase verdeutlicht: Über die Genauigkeit von Machine-Learning-Algorithmen – und damit auch über die Generalisierbarkeit – entscheidet die Qualität der Daten, mit denen sie gefüttert werden. Beruht ein ausgespucktes Ergebnis beispielweise auf fadenscheinigen Korrelationen, kann das dazu führen, dass die Eignung der Software für den klinischen Alltag überbewertet wird. In der Medizin behelfen sich einige Wissenschaftler deshalb mit einer Cross-Validierung. Dabei lässt der Algorithmus einen Teil der Patientendaten (z.B. 10 %) aus, wenn er „lernt“. An diesem Teil wird das Ergebnis aus den übrigen 90 % validiert. Das Spiel wiederholt sich neun Mal, immer unter Aussparung eines anderen Datenzehntels. So wollen die Forscher sicherstellen, dass ein Programm in unterschiedlichen Kohorten funktioniert.

Herzfehler bei Erwachsenen automatisch erkannt

Der Vorteil: Ein Arzt braucht keine weiteren Informationen einzugeben. In einer Studie der Arbeitsgruppe um Professor Dr. Dr. Gerhard-Paul Diller, Kardiologe am Universitätsklinikum Münster, z.B. genügte die Echokardiographie.3 Ein mit pathologischen und normalen Befunden geschulter Deep-Learning-Algorithmus stellte sein Können in der Ultraschall-Diagnostik von Erwachsenen mit angeborenem Herzfehler unter Beweis. Für den medizinischen Alltag kris­tallieren sich also mindestens drei Anwendungsgebiete heraus:
  • Prognose-/Risikoeinschätzung
  • (Ausschluss-)Diagnostik
  • radiologische und pathologische Befundung
Gerade dem Radiologen wird das maschinelle Lernen einen großen Teil der Arbeit abnehmen, meinen die eingangs erwähnten US-amerikanischen Kollegen. Denn „Algorithmen sind um 2 Uhr nachts genauso aufmerksam wie um 9 Uhr morgens“. Letztlich dreht es sich aber nicht um den Kampf Arzt vs. Maschine. Vorteile, die die digitale Unterstützung für Patienten mit sich bringt, stehen im Mittelpunkt. Wann die Technologie tatsächlich praxistauglich ist, hängt von der konkreten Aufgabe ab. Bei den prognostischen Tools könnte es schnell gehen. Allerdings bedarf es meist noch einer prospektiven Validierung der Programme.

Quellen:
1. Obermeyer Z, Emanuel EJ. N Engl J Med 2016; 375: 1216-1219; DOI: 10.1056/NEJMp1606181
2. Juarez-Orozco LE et al. International Conference on Nuclear Cardiology and Cardiac CT 2019
3. Diller GP et al. Eur Heart J Cardiovac Imaging 2019; DOI: doi.org/10.1093/ehjci/jey211