ANNA - die Blackbox, die Leben rettet

Wo die Realität endet, beginnt die „erweiterte Realität“ von Gerd Reis: So heißt die Abteilung am Deutschen Forschungszentrum für Künstliche Intelligenz, wo der Informatiker Maschinen nicht nur das Sehen beibringt – sondern auch das Verstehen.

Text Johannes Giesler
Illustration Liebana Goñi

27. Mai 2020

Illustration von Liebana Goñi von ANNA - ANNA - die Blackbox, die Leben rettet

Herr Reis, ihr Hauptgebiet ist die „Computer Vision“. Was ist das?

Da lernen Computer zu verstehen, was sie in Bildern sehen. Wobei man mit Begriffen wie verstehen, sehen oder Intelligenz, die aus dem Menschlichen entlehnt sind, aufpassen muss. Ja, Neuronale Netze (NN) tun etwas, das der menschlichen Kognition nahekommt. Aber es ist doch ganz anders. Ein Kind versteht nach einer einzigen Begegnung, was eine Katze ist. NN benötigen unzählige Trainingsrunden und Tausende Katzenbilder, um Katzen zuverlässig zu erkennen. Aber: Am Ende können sie es ähnlich gut wie Menschen, manchmal sogar besser. Und NN sind vielseitig. Egal, ob sie Katzen oder Krebsgewebe oder Straßenschilder erkennen sollen. Mein Forschungsgebiet ist deshalb sehr spannend, weil es Voraussetzung für zahlreiche Zukunftstechnologien ist: autonomes Fahren, medizinische Diagnoseverfahren oder Robotersehen.

Eine davon kennen Sie gut: Sie haben sich jahrelang mit medizinischen Diagnoseverfahren beschäftigt und dafür ein NN trainiert. Es, oder besser sie, heißt „ANNAcTRUS“. ANNA steht für „Artifizielle Neuronale Netzwerk-Analyse“.

Genau. ANNA ist eine Künstliche Intelligenz, die bei der Prostata-Krebs-Diagnose hilft.

Wie macht sie das?

ANNA sucht in Ultraschallbildern (TRUS) nach Mustern, die auf Krebs hindeuten. Wir haben sie mit Aufnahmen trainiert, die positive Diagnosen zeigen. Daraus hat sie gelernt, wie Krebs aussieht. Oder besser: Welche Bild-Muster auf Krebs hindeuten. Wie genau sie das macht, wissen wir nicht. Sie ist, wie die meisten NN, eine Blackbox.

ANNA performt schon heute besser als menschliche KollegInnen

Sie kennen die Lösung, nicht den Lösungsweg. Ist das aber nicht unmoralisch, die Gesundheit von Menschen einer Blackbox, in die Sie nicht hineinschauen können, anzuvertrauen?

Unmoralisch wäre es, sich stupide auf eine Maschine zu verlassen. Essenziell und am Ende auch haftbar sind immer noch die MedizinerInnen. ANNA trifft auch keine Entscheidungen. Sie markiert lediglich suspekte Bereiche in Bildern.

Sie ist also eine Unterstützung im klinischen Alltag.

Genau. Im Idealfall bestätigen MedizinerInnen ANNAs Vorschläge nur noch und führen gezielte Biopsien, also Gewebeentnahmen, an den markierten Bereichen durch. Die Behandlungshoheit liegt immer beim Menschen. NN sollten nie die letzte Wahrheit sein. Einer Menge von Zahlen können wir keine endgültige Entscheidung überlassen.

Illustration von Liebana Goñi von ANNA - ANNA - die Blackbox, die Leben rettet

Auch dann nicht, wenn NN Aufgaben besser und schneller lösen als Menschen?

Ich denke, dass NN und KI als Hilfsmittel eingesetzt werden sollten. ANNA ist in dem, was sie tut, besser als viele UrologInnen und liefert eine gleichbleibende Qualität. Zudem ist sie sehr schnell und spart so Zeit im klinischen Alltag. Ich sehe ANNA als Entlastung für den Menschen, nicht als Konkurrenz. ANNA kann mit ihrer Arbeit Zeit freischaufeln – etwa für mehr sprechende Medizin.

Wieso ist ANNA besser als viele MedizinerInnen?

Dafür muss ich ausholen: Hat ein Krebs die Prostata befallen, ist sehr wahrscheinlich der PSA-Wert erhöht – das Prostata-spezifische Antigen. Erhöhtes PSA ist aber nur ein Hinweis auf Krebs. Für den Nachweis und die Behandlung muss eine Gewebeprobe genommen und untersucht werden. Doch den Prostatakrebs zu finden, ist schwierig. Deshalb führen MedizinerInnen Biopsien durch. Wo, das wurde bislang mehr oder weniger nach Erfahrungswerten entschieden. ANNA schlägt nun anhand der Untersuchungsbilder Regionen vor, wo eine Biopsie vielversprechend ist. Sie erkennt Muster, die das menschliche Auge übersieht. Das liegt daran, dass unser Auge kantenverstärkend sieht und so virtuelle Muster entstehen und reale verschwimmen können. Biopsien mit ANNA haben eine 40 Prozent höhere Trefferquote bei der Hälfte an notwendigen Stanzen. Das entlastet PatientInnen und bietet eine verbesserte Versorgung.

In Zukunft wird digitale Medizin personalisiert

Gilt das auch für ExpertInnen mit jahrelanger Erfahrung?

Wir haben ANNA mit „durchschnittlichen MedizinerInnen“ verglichen. ExpertInnen, die im Laufe ihrer Arbeit viel Erfahrung gesammelt haben, können von KIs bisher kaum geschlagen werden. Die sind aber selten. MedizinerInnen sind Menschen, und es braucht lange, um einen entsprechenden Erfahrungsschatz aufzubauen.

Was ist die Herausforderung an einer Krebs-Diagnose?

Heutzutage sind die Bilder der Untersuchungen hochauflösend und multimodal. Das heißt, sie stammen vom Computertomographen, Magnetresonanztomographen und Ultraschall. MedizinerInnen müssen dann die unterschiedlichen Bilder und Darstellungsformen im Kopf fusionieren und bewerten. Eine Krebs-Diagnose erfordert gewaltige geistige Leistungen.

Immer mehr KIs, wie ANNA, werden in der Diagnostik eingesetzt. In einer medizinischen Studie hat kürzlich ein Computerprogramm Nierenversagen drei Tage vor dem Eintreten diagnostiziert. Eine andere KI hat eine Herz-Rhythmus-Störung gefunden – trotz unauffälligem Echokardiogramm.

Klingt beides für mich plausibel. Das sind Qualitäten, die durch Methoden der KI bald Alltag sein könnten. Vor allem die Bereiche „Vorhersage“ und „Personalisierte Präzisionsmedizin“ würden einen enormen Schritt machen.

Erklären Sie das, bitte.

Wenn KIs große medizinische Datenmengen durchsuchen, könnten sie beispielsweise Zusammenhänge zwischen genetischen Dispositionen, Ernährungsweisen, Arbeitsgewohnheiten und Erkrankungen finden. Mit diesem Wissen könnten KIs einem Menschen individuell Tipps geben für einen gesünderen Lebensstil und so die Entstehung von Krankheiten aktiv verhindern. Anstatt wie wir es heute handhaben, Krankheiten erst nach ihrem Auftreten zu behandeln.

Das wäre die von Ihnen genannte Vorhersage. Wie sieht es mit der Therapie aus?

Eine KI, die mit Verlaufsdaten von Behandlungen trainiert wurde, könnte Therapien verbessern: Indem sie vorhersagt, wie eine konkrete Behandlung auf einen Patienten in seinem Zustand wirken würde. Oder in welcher Dosis ein Medikament einer Patientin in ihrem aktuellen Zustand helfen würde. Therapien wären effizienter und zielgerichteter, MedizinerInnen müssten weniger unnötige Substanzen verschreiben.

Illustration von Liebana Goñi von ANNA - ANNA - die Blackbox, die Leben rettet

Forderung: Beipackzettel für Neuronale Netze

Dazu benötigen wir aber medizinische Daten in großem Umfang.

Nicht nur das. Es müssen repräsentative und vor allem gute Trainingsdaten sein. Und die Ergebnisse müssen auf breiter Basis bestätigt werden. Sonst wiederholt sich „Watson“: Watson ist eine KI des Softwareherstellers IBM. Er hat für PatientInnen im nordamerikanischen Raum, basierend auf ganz vielen Trainingsdaten, Therapievorschläge gemacht. Und die waren gut. Watson hat dort im Krankenhausalltag funktioniert. Als er später in Europa getestet wurde, lagen Watsons Therapievorschläge meist daneben. Vermutlich, weil Watson ausschließlich mit amerikanischen Gesundheitsdaten trainiert wurde und sich die Therapiemethoden auf beiden Kontinenten unterscheiden.

KIs funktionieren nicht universell – was bedeutet das für die Anwendung?

Sie funktionieren meist nur für die Domäne, mit deren Daten sie trainiert wurden. Bei Prostatakrebs ist es beispielsweise so, dass Studien über signifikante ethnische Unterschiede berichten.

Sie plädieren also für eine Art Beipackzettel für NN?

Es sollte klar sein, auf welcher Datendomäne das NN trainiert wurde. Nur innerhalb dieser Domäne sind verlässliche Antworten zu erwarten. Ein NN, das für Prostatakrebs trainiert wurde, kann definitiv nicht für Brustkrebs eingesetzt werden. Ebenso sollte ein Netzwerk, das mit Daten einer Ethnie trainiert wurde, nur mit größter Vorsicht bei einer anderen Ethnie verwendet werden.

Was ist mit nicht-spezifischen Attributen: Sind grundsätzlich mehr Daten beim Training besser?

Auch das nicht. Brustkrebs beispielsweise tritt meist bei Frauen auf. Ganz selten aber auch bei Männern. Würde das Attribut „Geschlecht“ beim Training des NN eine Rolle spielen, könnte es lernen, dass Männer fast nie Brustkrebs bekommen. „Männlich“ könnte dann als Ausschlusskriterium für Brustkrebs fungieren. Attribute, die das Ergebnis verfälschen, müssen vor dem Training rausgefiltert, oder währenddessen geeignet gewichtet werden.

Ansonsten würde das NN anhand bestimmter Attribute PatientInnen diskriminieren.

Richtig, wir haben früher eine Anwendung für das Krankheitsbild Autismus entwickelt. Bei schwarzen PatientInnen hat es völlig versagt. Das lag daran, dass das NN mit Youtube-Videos trainiert wurde. Die überwiegende Mehrzahl der Daten stammte von weißen Menschen. In schwarzen Gesichtern konnte das NN keine Muster erkennen.

Die Anti-Diskriminierungsstelle der Bundesregierung hat vor kurzem vor verzerrten Datensätzen bei der Entwicklung von NN gewarnt. Wie aber kommt man an umfassende Trainingsdaten im medizinischen Bereich, um bessere und sichere KIs zu entwickeln?

Schwierig. Ich plädiere aus technischer Sicht für ein europäisches Zentrum für Medizindaten, wo im Wesentlichen alle Daten anonymisiert eingepflegt werden und von denen NN lernen können. Wünschenswert wäre es, wenn sogar Daten aus der ganzen Welt an einem Ort gesammelt würden. Mit Hilfe einer entsprechenden Daten-Kuration könnten dann nicht-einschränkende, nicht-diskriminierende NN entwickelt werden. Eine Alternative könnte das föderierte Lernen darstellen, allerdings befindet sich die Forschung auf diesem Gebiet erst in den Anfängen.

Und wie sieht die Zukunft dann für KIs in der Medizin aus?

Heute sehen und erkennen NN Muster in Bildern und Daten. Das nächste große Ding wird die Beurteilung des Gesehenen sein. Dann folgt die Vorhersage von Erkrankungen und Krankheitsverläufen. Auf dem Massenmarkt werden als nächstes mobile Anwendungen auftauchen: Simple Programme, die auf Smartphones eine Erstversorgung oder eine Schnelldiagnose ermöglichen. Auch die Telemedizin wird sich weiterentwickeln, sodass man per Videoanruf jederzeit und überall einen virtuellen Arzt sprechen kann.


Ich möchte mit meinen Wissenstexten etwas mehr Verständnis finden und für andere schaffen. Kein Thema, das ich bisher bearbeitet habe, ist Schwarz oder Weiss. Erst im Grau dazwischen wird's spannend. Ich beschäftige mich zurzeit viel mit: gefährlicher Sprache, Zukunftstreiber und veganer Ernährung.
Illustration Liebana Goñi

Lesen Sie auch