Diese Frage wird in einem Artikel von Mukherjee et al. beantwortet. (2023). Die Autoren definieren eine „HEOR-Studie“ für dieses Papier als
…Evidenzstudien aus der realen Welt, die eine Sekundär-/Post-hoc-Analyse unter Verwendung von Daten aus randomisierten kontrollierten Studien (RCT) und eine versuchsinterne Kosten-Nutzen-Analyse durchführten, bei der das interessierende Ergebnis Kosten oder PROs waren, einschließlich präferenzbasierter Nutzen (z. B. EQ-5D).
Der am besten geeignete Ansatz zur Imputation fehlender Daten hängt von den Annahmen darüber ab, wie die Daten fehlen:
Vollständig zufällig fehlend (MCAR): Die beobachteten oder nicht beobachteten Werte aller Variablen in einer Studie haben keinen Einfluss auf die Wahrscheinlichkeit, dass eine Beobachtung zufällig fehlt (MAR). Die Wahrscheinlichkeit fehlender Daten für eine bestimmte Variable hängt mit den beobachteten Werten von Variablen (entweder beobachteten Werten anderer Variablen im Datensatz oder beobachteten Werten für dieselbe Variable zu früheren Zeitpunkten) im Datensatz zusammen, nicht jedoch mit den fehlenden Daten. Man kann nicht testen, ob MAR in einem Datensatz enthalten ist. Nicht zufällig vermisst (MNAR). In diesem Fall hängt die Wahrscheinlichkeit fehlender Daten für eine bestimmte Variable vom zugrunde liegenden Wert dieser bestimmten Variablen ab. MNAR kann ignorierbar (wenn fehlende Werte unabhängig vom Datenerfassungsprozess auftreten) oder nicht ignorierbar (wenn es eine strukturelle Ursache für den Fehlmechanismus gibt, der von unbeobachteten Variablen oder dem fehlenden Wert selbst abhängt) sein.
Um die fehlenden Daten zu beheben, stehen verschiedene Techniken zur Verfügung, darunter: Complete-Case-Analyse (CCA), Available-Case-Analyse (AC), Multiple Imputation (MI), Multiple Imputation by Chained Equation (MICE) und Predictive Mean Matching.
Um besser zu verstehen, welche Ansätze in der Gesundheitsökonomie und Ergebnisforschung (HEOR) häufig verwendet werden, führten die Autoren eine systematische Literaturrecherche in PubMed durch und untersuchten, welche Art von statistischen Methoden verwendet wurden, um fehlende Kosten-, Nutzen- oder patientenberichtete Ergebnismaße zu beheben.
Die Autoren fanden heraus, dass multiple Imputation, multiple Imputation durch verkettete Gleichung und vollständige Fallanalysen am häufigsten verwendet wurden:
Von 1433 identifizierten Aufzeichnungen wurden 40 Papiere einbezogen. Dreizehn Studien waren wirtschaftliche Bewertungen. In 30 Studien wurde die Mehrfachimputation verwendet, in 17 Studien die Mehrfachimputation mittels verketteter Gleichung, während in 15 Studien eine vollständige Fallanalyse zum Einsatz kam. Siebzehn Studien befassten sich mit fehlenden Kostendaten und 23 Studien mit fehlenden Ergebnisdaten. Elf Studien berichteten über eine einzige Methode, während 20 Studien mehrere Methoden verwendeten, um fehlende Daten zu beheben.
Die Autoren weisen darauf hin, dass sie zwar eine große Menge methodischer HEOR-Literatur zum Umgang mit fehlenden Daten in einem RCT-Kontext gefunden haben; Allerdings gab es nur sehr wenige Studien, die versuchten, diese Empfehlungen tatsächlich umzusetzen und die fehlenden Daten zuzurechnen. Den vollständigen Artikel können Sie hier lesen.