Welche Studien eignen sich für Nutzenbewertungen?

Nicht jede Studie eignet sich als Datenbasis für eine Nutzenbewertung. Hier erklären wir die Ausgangslage der meisten Nutzenbewertungen und die Kriterien, die sich daraus für klinische Studien ergeben.

Welche Studien eignen sich für Nutzenbewertungen? Eine sechsteilige Infografik. Teil zwei. Aussagekräftige Studien für Nutzenbewertungen erfüllen fünf Kriterien: Erstens: Interventionsstudie statt Beobachtungsstudie. Zweitens: Hypothesen liegen vor der Datenerhebung fest. Drittens: Vergleichsgruppe (Kontrollarm) existiert. Viertens: genug Teilnehmende für klare Aussagen. Fünftens: Verzerrungen (englisch: Bias) werden vermieden. Mehr zum ersten Kriterium: Interventionsstudie statt Beobachtungsstudie. Wenn man nur beobachtet, hat man viele Faktoren nicht unter Kontrolle: Nehmen zum Beispiel alle ihr Medikament zur selben Zeit? Unterscheiden sich die Gruppen in den Studienarmen? Unter kontrollierten Studienbedingungen hat man mehr Faktoren im Griff: Die Probandinnen und Probanden sowie die Umstände sind vergleichbar. So kann man Ursache-Wirkungs-Beziehungen erkennen. Dem IQWiG und ähnlichen Instituten wird gelegentlich vorgeworfen, auf vermeintlich lebensfernen Interventionsstudien zu beharren. Doch um Kausalzusammenhänge nachzuweisen, sind solche kontrollierten Studien nötig. Beobachtungsstudien sind an sich nicht schlechter: Sie beantworten nur andere Fragen.

Welche Studien eignen sich für Nutzenbewertungen? Eine sechsteilige Infografik. Teil drei. Mehr zum zweiten Kriterium: Zu prüfende Hypothesen müssen vor der Datenerhebung festgelegt werden. Was soll die Therapie bewirken? Bliebe das vor der Studie offen, könnte man sich hinterher Effekte aussuchen. Denn irgendwas findet sich immer. Ein Negativbeispiel: Man erhebt einen bunten Strauß an Parametern: Sterblichkeit, Schmerzen, Zahnfleischbluten, Übelkeit und so weiter. Ah, die Patientinnen hatten weniger Zahnfleischbluten: Also nützt ihnen der neue Wirkstoff! Erst die Daten, dann die Hypothesen: Das ist in Vorstudien manchmal sinnvoll, für Nutzenbewertungen aber untauglich. Bei einem prospektiven Design wird vorab definiert und im Studienprotokoll festgehalten, was die Studie belegen soll. Ein Positivbeispiel: Die Schmerzen sollen um mindestens die Hälfte zurückgehen. Das messen wir zum Zeitpunkt X mit der Skala Y. Erfüllt der Wirkstoff genau diese Kriterien? Dann hat er einen Nutzen. Andere Effekte sind dafür irrelevant.

Welche Studien eignen sich für Nutzenbewertungen? Eine sechsteilige Infografik. Teil vier. Mehr zum dritten Kriterium: Vergleichsmöglichkeiten durch Kontrollarme. Für kausale Aussagen muss man unterscheiden zwischen „nach“ und „wegen der Therapie“. Das ist nur durch Vergleiche möglich. Zum Beispiel kann man sich das Überleben im Zeitverlauf für eine neue Therapie und eine alte Therapie ansehen. Erst der Vergleich zeigt: Das Überleben verlängert sich aufgrund des neuen Wirkstoffs. Die neue Behandlung ist also die Ursache für die Verbesserung. Mehr zum vierten Kriterium: genug Teilnehmende für präzise Aussagen. Je weniger Personen an einer Studie teilnehmen, desto leichter können zum Beispiel Ausreißer in den Daten zu einem falschen Resultat führen. Im Beispieldiagramm suggerieren zunächst wenige Datenpunkte einen linearen Zusammenhang. Gibt es dagegen genug Daten, fallen die Ausreißer nicht mehr so ins Gewicht, und man erkennt einen umgekehrt u-förmigen Zusammenhang.

Welche Studien eignen sich für Nutzenbewertungen? Eine sechsteilige Infografik. Teil fünf. Mehr zum fünften Kriterium: Schutz vor Verzerrungen (Bias). Eines der größten Risiken bei klinischen Studien ist eine Verzerrung. Es gibt verschiedene Bias-Formen, von denen einige schon im Studiendesign angelegt sind. Mit dem richtigen Design kann man sie weitgehend ausschließen. Randomisierung hilft gegen den „Auswahl-Bias“, also etwa die Zuordnung bestimmter Patientinnen und Patienten in einen bestimmten Arm. Sie sorgt für eine faire Aufteilung bezüglich Vorerkrankungen, Alter und so weiter. Gerade unbekannte Störeinflüsse bekommt man nur durch Randomisierung in den Griff. Verblindung ist ein wirksamer Schutz vor Suggestion und Autosuggestion beim Protokollieren von Studienergebnissen. Einfach blind heißt, dass entweder die Teilnehmenden oder die Behandelnden nicht wissen, wer in welchem Arm ist. Bei einer Doppelblindstudie wissen es beide Seiten nicht. Das Intention-to-Treat-Prinzip sorgt dafür, dass alle Probandinnen in Probanden in der Analyse berücksichtigt werden, und zwar in dem Studienarm, in den sie anfangs hineingelost wurden. Das gilt auch, wenn sie die Studie verlassen oder die Behandlung gewechselt haben. So soll verhindert werden, dass die Ergebnisse in einem Arm fälschlich zu gut aussehen. Im Beispiel scheiden zwei von fünf Personen vorzeitig aus der Studie aus. Bei beiden hat die Therapie nicht angeschlagen. Bei zwei der drei Verbleibenden hat die Therapie geholfen. Zählen die aus der Studie ausgeschiedenen Personen nicht mit, entsteht der Eindruck, dass die Therapie in zwei Drittel der Fälle anschlägt. Nach dem Intention-to-Treat-Prinzip werden die Personen, die aus der Studie ausscheiden, dagegen mitgezählt. So zeigt sich: Die Therapie schlägt nur in zwei Fünftel der Fälle an.

Welche Studien eignen sich für Nutzenbewertungen?

Infografik zum Download

Download des Bildes in hoher Auflösung

Infografik Welche Studien eignen sich für Nutzenbewertungen?, PNG, 530 kB

Jens Flintrop

Pressesprecher

+49 221 35685-151

presse@iqwig.de

Susanne Breuer

Pressereferentin

+49 221 35685-158

presse@iqwig.de

Der IQWiG-Infodienst

Tagesaktuelle Informationen zu Projekten, Ausschreibungen, Stellenanzeigen und Veranstaltungen sowie unsere Pressemitteilungen abonnieren.

IQWiG-Infodienst abonnieren

Kontaktformular

Fragen zu Aufträgen, Publikationen und Pressemitteilungen können Sie über dieses E-Mail-Formular an uns richten.

zum Kontaktformular