Daten sind eine der wichtigsten treibenden Kräfte bei der laufenden Transformation des Gesundheitswesens. Während die Branche ihre Fortschritte von faxbasierter Kommunikation und ausgedruckten Patientenformularen fortsetzt, entwickelt sich auch das Datenökosystem, das über Fortschritte bei den Pflegeergebnissen und der Gesundheitsökonomie informiert, weiter.
Doch während Unternehmen tiefer in ihre Datensätze eintauchen und untersuchen, wie künstliche Intelligenz (KI) und maschinelles Lernen (ML) dabei helfen können, neue Erkenntnisse zu gewinnen, muss eines im Vordergrund bleiben: die Datenqualität.
Datenqualität und Datenhygiene verstehen
Ein grundlegender Aspekt bei der Verarbeitung großer Datenmengen, insbesondere im Gesundheitswesen, ist die Datenhygiene. Datenhygiene bezieht sich auf die Prozesse, die sicherstellen, dass die Daten sauber, also frei von Duplikaten, sind und über verschiedene Quellen hinweg standardisierten und konsistenten Formaten folgen.
Datenhygiene ist ein entscheidender Aspekt des umfassenderen Begriffs der Datenqualität. Unter Datenqualität versteht man den Prozess der Überprüfung der Aktualität und Genauigkeit eines Datensatzes. Dieser Prozess umfasst die Prüfung auf Lücken in den Daten, bestätigt die Relevanz und stellt sicher, dass die Daten vollständig sind.
Datenqualität und Hygiene gehen Hand in Hand. Sie beginnen bereits bei der Datenaufnahme und ergreifen die erforderlichen Schritte, um zu bestätigen, dass die Daten für die Weiterführung in der Datenpipeline bereit sind. Nach diesen Prüfungen können die Daten als Grundlage für eine Vielzahl von Analysen und Algorithmen dienen, beispielsweise für Qualitätsmessungen und Risikobewertungsanalysen, die Rekrutierung von Mitarbeitern für klinische Studien oder das Umsatzzyklusmanagement. Es gibt unzählige Anwendungen von Daten im Gesundheitswesen, und jede davon ist in hohem Maße von einer starken, strengen Datenqualitäts- und Hygienestrategie abhängig.
Die Bedeutung der Datenhygiene
Gartner berichtet, dass mangelhafte Datenhygiene Unternehmen jährlich fast 13 Millionen US-Dollar kosten kann, was sich nicht nur negativ auf das Endergebnis auswirkt, sondern auch zu weiteren Ineffizienzen und Fragmentierung im Gesundheitswesen führen kann. Während sich die Daten weiter entlang der Datenpipeline bewegen, muss das Datenmanagement von der Frage „Sind diese Daten korrekt?“ bis zur Frage „Werden diese Daten ihren Zweck erfüllen?“ reichen.
Gute Daten können beispielsweise als sauber und genau angesehen werden, wenn alle Postleitzahlen im Datensatz vollständig sind und echte Postleitzahlen darstellen – es gibt keine fehlenden Zahlen oder falsche Postleitzahlen im Satz. Diese Daten können dann als Grundlage für Analysen in einem bestimmten Bereich dienen. Dies ermöglicht es Gesundheitsplänen, potenzielle Ungleichheiten zu erkennen und Analysen auf Bereiche mit hohen sozioökonomischen Risiken zu konzentrieren, wodurch ihre Gesundheitsbemühungen für die Bevölkerung verbessert werden und gleichzeitig die Geschwindigkeit und Genauigkeit erhöht wird, mit der sie auf die Bedürfnisse der Mitglieder eingehen. Aus Sicht der Biowissenschaften kann die Möglichkeit, anspruchsvolle Analysen anhand verifizierter Postleitzahlendaten durchzuführen, Verbesserungen bei der Rekrutierung von klinischen Studien und bei Diversitätsbemühungen unterstützen.
In jedem Anwendungsfall müssen gute Daten – und die Modelle, auf denen sie basieren – getestet werden, um sicherzustellen, dass das gewünschte Ergebnis mit einem gewissen Grad an Zuverlässigkeit erzielt wird, der von den ersten Überprüfungen auf Datenqualität, Hygiene und Sauberkeit abhängt. Die Qualität des Ergebnisses hängt tatsächlich von der Qualität der eingehenden Daten ab.
Darüber hinaus müssen Modelle auf Verzerrungen überprüft werden. Während Daten als sauber und genau angesehen werden können, können bei den Personen, die an den Daten arbeiten und die Modelle erstellen, inhärente Vorurteile vorhanden sein oder auftreten, wenn die Lösung nicht für den beabsichtigten Anwendungsfall verwendet wird. Um Modelle zu korrigieren und die systemischen Ungleichheiten im Gesundheitswesen zu bekämpfen, ist es von entscheidender Bedeutung, unser Bewusstsein für Voreingenommenheit zu schärfen und diese auf Voreingenommenheit zu prüfen.
Häufige Herausforderungen bei der Aufrechterhaltung der Datenqualität
Die Verwaltung der Datenqualität hört nie auf – es ist ein fortlaufender Prozess, um das Risiko zu verringern, dass fehlerhafte Daten die Ausgaben eines Systems infizieren, insbesondere angesichts der Möglichkeit, dass sich Daten im Laufe der Zeit ändern können.
Es versteht sich von selbst, dass im Gesundheitswesen besonders viel auf dem Spiel steht. Schlechte Daten können zu unerwünschten Pflegeerfahrungen oder verpassten Möglichkeiten für eine bessere Pflege führen. Bei der Risikoanpassung können schlechte Daten dazu führen, dass die Risikobewertung einer Bevölkerung fehlerhaft bestimmt wird. Wenn dies falsch gemacht wird, bedeutet dies, dass Mitglieder nicht wegen der richtigen Erkrankung behandelt werden oder möglicherweise nicht einmal die behandelten Erkrankungen aufweisen – alles aufgrund von Handlungen, die auf korrupten Daten basieren.
Auch unstrukturierte Daten können die Ergebnisse beeinflussen, insbesondere angesichts der Inkonsistenzen bei der Dateneingabe im gesamten Versorgungskontinuum. Es wird geschätzt, dass etwa 80 % der medizinischen Daten nach ihrer Erstellung unstrukturiert oder ungenutzt bleiben. Die Menge dieser Daten bietet erhebliche Möglichkeiten zur Nutzung, aber ihre unstrukturierte Natur macht ihre Nutzung schwierig.
Glücklicherweise stellt die Branche auf universellere Standards wie HL7® FHIR® um und übernimmt TEFCA, so dass die Organisationen, die als erste wirklich Datenstandardisierungsbemühungen annehmen, viel gewinnen können. Standardisierte Daten beginnen ihre Reise durch den Hygiene- und Sauberkeitsprozess bereits vor unstrukturierten Daten.
Letztendlich trägt die ständige Überwachung und Überprüfung der Daten, während sie durch die Datenpipeline fließen, dazu bei, sicherzustellen, dass die Datenqualität auch dann erhalten bleibt, wenn verschiedene Berührungen stattfinden und Daten aus verschiedenen Systemen übertragen werden.
KI anwenden, um neue Erkenntnisse zu gewinnen
Sobald eine starke Datenverwaltungsstrategie vorhanden ist, besteht der natürliche nächste Schritt darin, KI-gesteuerte Analysen zu entwickeln, um schneller innovativere Erkenntnisse zu gewinnen. Ausgefeilte Datenstrategien können KI sogar im gesamten Datenverwaltungsprozess nutzen, nicht nur am Ende der Datenpipeline, sondern auch zur Bereinigung neuer Daten und zur Verbesserung der Datenhygiene.
Da jedoch der Fokus auf KI-gesteuerte Prozesse zunimmt, muss der menschliche Touch im Gesundheitswesen erhalten bleiben. Organisationen stehen vor der Herausforderung, das richtige Gleichgewicht zwischen der Anpassung an menschliche Fehler und der Einrichtung eines „KI-Copiloten“ zu finden.
Einerseits kann KI dabei helfen, Dateneingabefehler, die in der gesamten Datenpipeline auftreten, zu erkennen und zu korrigieren. Wenn Front-End-Berechtigungsdaten für die Back-End-Antragskorrektur verwendet werden, aber eine falsche Adresse oder einen falschen Nachnamen enthalten, kann KI Rechnungsstellern dabei helfen, die erforderlichen Korrekturen vorzunehmen, bevor der Anspruch eingereicht wird – was ihren Cashflow verbessert und Reibungsverluste im Schadenprozess für Gesundheit verringert Pläne.
Dennoch muss KI eingesetzt werden, um Entscheidungen im Gesundheitswesen zu treffen und nicht das letzte Wort zu haben. Insbesondere bei Patientenkontakten kann KI Behandlungsoptionen hervorheben oder einen Diagnosevorschlag machen, aber es ist der Arzt im Raum, dem der Patient wahrscheinlich mehr vertraut und der normalerweise eine Beziehung zum Patienten hat. Beispielsweise ergab die Consumer Health Care-Umfrage von Deloitte aus dem Jahr 2024, dass das Misstrauen der Patienten gegenüber generativer KI zunimmt, sie sich jedoch viel wohler fühlen, wenn ihre Ärzte KI als unterstützendes Instrument zur Übermittlung von Informationen über Behandlungen, zur Interpretation von Diagnoseergebnissen und zur Unterstützung bei der Diagnose von Beschwerden oder Krankheiten einsetzen .
Blick in die Zukunft im Wandel des Gesundheitswesens
Saubere Daten und umfangreiche Sprachmodelle bestimmen den Weg für Fortschritte in der Patientenversorgung, der Ressourcennutzung, der Kostenverwaltung und der Verbesserung des Cashflows.
Datenqualität ist die Grundlage für innovative Entdeckungen. Gepaart mit der Leistungsfähigkeit der KI und geleitet durch menschliches Fachwissen ist die Chance, etwas zu bewirken, exponentiell größer, da diese drei Kräfte zusammenlaufen, um die Gesundheitsversorgung weiter und schneller voranzubringen.
Quelle: Getty Images, Peter Howell
Rajesh Viswanathan fungiert als Chief Technology Officer für Inovalon. In dieser Rolle leitet und verantwortet Herr Viswanathan alle Aspekte der Technologiestrategie, des Designs, der Entwicklung, der Tests, der Produktion, der Infrastruktur, des Betriebs, der Sicherheit und der Wartung des Unternehmens.
Vor Inovalon war Rajesh Vizepräsident für Cloud Native Services, Oracle Cloud Infrastructure (OCI) bei der Oracle Corporation, wo er für Engineering, Produktmanagement, Architektur und Lösungsentwicklung für die Cloud-native Plattform von OCI verantwortlich war. Bevor er zu Oracle kam, war Rajesh als Produkt- und Technikleiter für Entwicklungs- und Managementdienste bei Amazon Web Services (AWS) tätig, wo er mehrere neue Dienste gründete, baute, betrieb und skalierte, um das Cloud-Management von AWS zu vereinfachen, sowie AWS CloudFormation und AWS betrieb und skalierte ‚ Infrastructure-as-Code-Angebot und besaß und betrieb die Datenebene für EBS. Vor AWS war Rajesh als Principal Group Program Manager für Windows Live bei Microsoft tätig, und vor Microsoft war er als Senior Software Engineer und Architect für Netscape/AOL tätig.
Dieser Beitrag erscheint über das MedCity Influencers-Programm. Über MedCity Influencer kann jeder seine Sicht auf Wirtschaft und Innovation im Gesundheitswesen auf MedCity News veröffentlichen. Klicken Sie hier, um herauszufinden, wie.