Der Kardiologe und Forscher Dr. Eric Topol wird von vielen als eine der führenden Stimmen angesehen, die zur Diskussion über die Auswirkungen der Technologie auf das Gesundheitswesen beitragen.
Dr. Topol – der seit fast 20 Jahren als Gründer und Direktor des Scripps Research Translational Institute fungiert – teilte kürzlich seine Gedanken darüber mit, wie generative KI im klinischen Umfeld funktioniert. Während einer Grundsatzrede diesen Monat auf der Jahrestagung der Radiological Society of North America in Chicago sagte er, dass vorläufige Ergebnisse zwar beeindruckend erscheinen mögen, diese Ergebnisse jedoch möglicherweise nicht den komplexen Realitäten der klinischen Praxis standhalten.
Mehrere aktuelle Studien hätten ergeben, dass KI Ärzten bei klinischen Aufgaben wie der Differentialdiagnose überlegen sei, betonte Dr. Topol.
Einige Untersuchungen zeigen sogar, dass KI hybride Modelle übertrifft, also einen Arzt, der von KI unterstützt wird. Beispielsweise zeigte eine im Oktober in JAMA veröffentlichte Studie, dass ChatGPT von OpenAI eine diagnostische Genauigkeitsrate von 90 % erreichte – während Ärzte, die von ChatGPT unterstützt wurden, 76 % erreichten und Ärzte, die nur konventionelle Ressourcen nutzten, 74 % erreichten.
„So sollte es nicht funktionieren. „Es sollte sein, dass die kombinierte Hybridleistung die beste sein würde“, bemerkte Dr. Topol.
Dafür gebe es drei Gründe, fügte er hinzu.
Die Voreingenommenheit der Ärzte gegenüber der Automatisierung sei ein Faktor, der dazu führen könnte, dass die KI ein Hybridmodell übertrifft, bemerkte Dr. Topol. Ein weiterer Grund sei die Tatsache, dass Ärzte immer noch nur begrenzt mit generativen KI-Tools und deren bestmöglichem Einsatz vertraut seien, erklärte er.
Der dritte Grund ist, dass „es künstliche Experimente sind, die nicht der realen Welt entsprechen“, erklärte Dr. Topol.
Die meisten Studien, in denen generative KI im Gesundheitswesen getestet wird, werden in kontrollierten Umgebungen durchgeführt, wobei typischerweise simulierte Daten verwendet werden, die nicht von echten Patienten stammen, sagte er.
„Wir möchten noch nicht zu dem Schluss kommen, dass KI für diese Aufgaben besser ist als der Arzt plus KI – denn es handelt sich nicht um reale medizinische Aufgaben“, bemerkte Dr. Topol.
In einem Artikel vom April wurden mehr als 500 Studien zu großen Sprachmodellen im Gesundheitswesen analysiert und festgestellt, dass nur 5 % davon mit realen Patientendaten durchgeführt wurden, stellte er fest.
„Daher sollte der Schluss gezogen werden, dass es sich hierbei um vorläufige Ergebnisse handelt, die nicht unbedingt das sind, was wir sehen werden, wenn wir uns die Medizin in der realen Welt ansehen – die sich stark von der Silico-Medizin unterscheidet“, erklärte Dr. Topol.
Bei den meisten generativen KI-Anwendungsfällen im klinischen Bereich bleibe es noch abzuwarten, ob sie ihre Ärztekollegen übertreffen oder sogar mithalten können, sagte er. Dies gelte jedoch nicht für Modelle zum Aufzeichnen von Umgebungsnotizen, bemerkte Dr. Topol.
Krankenhäuser im ganzen Land setzen diese Tools – die von Unternehmen wie Abridge, Microsoft, Suki und DeepScribe verkauft werden – in realen Umgebungen ein, betonte er.
KI-Tools für die klinische Dokumentation beweisen ihre Fähigkeit, Arbeitsabläufe effektiv zu rationalisieren, die Genauigkeit zu erhöhen und den Verwaltungsaufwand für Ärzte um Stunden pro Tag zu reduzieren. Nach Ansicht von Dr. Topol deuten diese Ergebnisse darauf hin, dass die Zukunft der generativen KI im klinischen Umfeld weiterhin rosig sein könnte.
Foto: Carol Yepes, Getty Images