Medizinische Diagnosen zu stellen und Behandlungspläne zu entwerfen, ist bislang eine Aufgabe von Ärzten. Doch ein fortschrittliches KI-Modell könnte dazu ähnlich gut oder sogar besser in der Lage sein. Das zeigt eine Studie, die für zahlreiche echte Patientenfälle ärztliche und KI-generierte Diagnosen und Entscheidungen verglichen hat. Vor allem wenn es darum ging, in der Notaufnahme schnelle Entscheidungen auf Basis begrenzter Information zu treffen, zeigte sich die KI gegenüber menschlichen Ärzten überlegen. Aus Sicht der Forschenden implizieren die Ergebnisse nicht, dass KI Ärzte ersetzen könnte. Als Unterstützung für medizinisches Fachpersonal könnten sie jedoch womöglich die Patientenversorgung verbessern.
KI-Sprachmodelle werden an großen Datenmengen trainiert, um möglichst menschenähnliche Antworten zu geben. Sie können Informationen analysieren und zusammenfassen, auf Fragen antworten und scheinbar empathisch auf menschliche Probleme eingehen. Doch gerade in sensiblen Bereichen gilt stets die Devise, dass man sich auf die KI-generierten Angaben nicht verlassen sollte. Denn da die Sprachmodelle lediglich Muster auswerten und reproduzieren, kann es leicht zu Fehlern kommen. Als besonders kritisch gelten Gesundheitsinformationen. Auch wenn inzwischen mehr und mehr Privatpersonen ChatGPT und Co zu ihren Symptomen befragen und sich medizinischen Rat erhoffen, haben bisherige Studien gezeigt, dass die KI zwar überzeugend und hilfreich klingen kann, teils aber gefährliche Fehlinformationen liefert.
Besser als Ärzte?
Zugleich werden KI-Modelle, die mit echten oder konstruierten medizinischen Fallberichten konfrontiert werden, immer besser darin, korrekte Diagnosen und Behandlungsvorschläge zu generieren. Wie gut sie darin schon sind, zeigt nun eine Studie von einem Team um Peter Brodeur vom Beth Israel Deaconess Medical Center in Boston. Die Forschenden ließen das Sprachmodell o1 von OpenAI zahlreiche standardisierte klinische Fälle sowie echte Fälle aus Notaufnahmen bewerten und verglichen seine Leistung dabei sowohl mit anderen KI-Modellen als auch mit der von menschlichen Ärzten.
Für die Studie bewerteten andere Ärzte die jeweiligen Diagnosen und Entscheidungen, ohne zu wissen, ob sie von einem Menschen oder von einer KI stammten. Das Ergebnis: „In allen Experimenten übertraf OpenAI o1 die Referenzwerte der menschlichen Ärzte und zeigte eine kontinuierliche Verbesserung gegenüber früheren Generationen klinischer KI-Entscheidungshilfen“, berichtet das Forschungsteam. So lieferte o1 im Vergleich zu menschlichen Ärzten häufiger korrekte Diagnosen und traf häufiger die richtigen Entscheidungen für den weiteren Behandlungsverlauf.
Vorteil in Akut-Situationen
„Die Leistungsunterschiede waren besonders ausgeprägt bei Fällen aus der Notaufnahme, wo die wenigsten Informationen über den Patienten vorliegen und die größte Dringlichkeit besteht, die richtige Entscheidung zu treffen“, berichten Brodeur und seine Kollegen. Während Ärzte hier aufgrund der begrenzten Informationen nur in etwa der Hälfte der Fälle richtig entschieden, lag die KI immerhin in etwa zwei Drittel der Fälle richtig. Dabei war sie in der Lage, auch fragmentierte, unstrukturierte Daten aus den Krankenakten effektiv zu nutzen.
Aus Sicht der Forschenden können diese Ergebnisse gravierende Auswirkungen auf die zukünftige medizinische Versorgung haben. „Obwohl der Einsatz von KI zur Unterstützung klinischer Entscheidungen manchmal als risikoreiches Unterfangen angesehen wird, könnte eine stärkere Nutzung dieser Werkzeuge dazu beitragen, die menschlichen und finanziellen Kosten von Diagnosefehlern, Verzögerungen und mangelndem Zugang zu mindern“, schreiben sie.
Kein Ersatz für Menschen
Einen Ersatz für menschliche Ärzte kann „Doktor-KI“ aus Sicht von Brodeur und seinem Team nicht darstellen. „Diagnosen sind wichtig, aber sie sind nicht alles in der Medizin“, erklärt Brodeurs Kollege Adam Rodman. Beispielsweise kommt es in der Notaufnahme nicht unbedingt darauf an, sofort die passende Diagnose zu kennen. Stattdessen geht es zunächst darum, kritisch gefährdete Patienten zu stabilisieren und anschließend die weiteren Behandlungsschritte einzuleiten. KI kann dabei womöglich eine hilfreiche Unterstützung liefern, aber nicht allein agieren. Zudem wurden in der Studie nur textbasierte Informationen getestet, während Bereiche wie auditive und visuelle Informationen, die in der klinischen Praxis ebenfalls wichtig sind, ausgespart wurden.
„Ich möchte nicht, dass irgendwelche KI-Arzt-Unternehmen versuchen, Ärzte aus dem Prozess herauszudrängen oder nur eine minimale klinische Aufsicht vorsehen. Als einer der leitenden Autoren dieser Studie glaube ich nicht, dass unsere Ergebnisse dies stützen“, sagt Rodman. „Was diese Ergebnisse hingegen stützen, ist eine solide und ehrgeizige Forschungsagenda, um herauszufinden, wie wir diese Technologien nutzen können, um das Leben der Patienten zu verbessern.“ Wichtig seien deshalb zukünftige Studien, die testen, inwieweit Ärzte mit KI-Unterstützung tatsächlich bessere Entscheidungen treffen, die sicher, wirksam und gerecht sind.
Quelle: Peter Brodeur (Beth Israel Deaconess Medical Center, Boston, Massachusetts, USA) et al., Science, doi: 10.1126/science.adz4433
Quelle:
www.wissenschaft.de



