Pharma Brief3 C Schaaber web


Wie gut sind Zulassungsstudien für Krebsmedikamente?

Wenn Medikamente gegen Krebs auf den Markt kommen, ist oft noch nicht bekannt, ob sie tatsächlich das Leben der PatientInnen verlängern. Jetzt ging eine AutorInnengruppe noch einen Schritt weiter: Sie überprüfte, was die Studien, die Hersteller bei der europäischen Behörde EMA einreichen, methodisch taugen.[1] Das Ergebnis ist ernüchternd.

Viele Krebsmittel werden auf Basis von Kriterien wie progressionsfreie Zeit oder Ansprechrate zugelassen. Dahinter steht die Annahme, diese Surrogatparameter könnten Auskunft über einen (noch nicht) nachgewiesenen Überlebensvorteil bieten. Jahre nach der Zulassung bestätigt sich die Hoffnung oft nicht, wir berichteten.[2],[3] 

Ein aktuelles Beispiel ist Venetoclax gegen multiples Myelom. Bei Auswertung der BELLINI-Studie hatten die PatientInnen doppelt so lang kein Tumorwachstum (22,4 versus 11,5 Monate), aber es waren doppelt so viele tot (21,1% versus 11,3%). Zwei Krebsforscher – einer davon war an der Studie selbst beteiligt – warnen: „Die Ergebnisse dieser Studie lehren uns eine wichtige Lektion über die Grenzen von Surrogatendpunkten, die Konsequenzen für die gesamte Onkologie haben, weit über das multiple Myelom hinaus.“ [4]

Qualität nimmt ab

Die AutorInnen um Huseyin Naci nahmen die 32 Zulassungen für Krebsmedikamente durch die EMA 2014-2016 genauer unter die Lupe. Es wurden dabei Angaben sowohl aus den Studienveröffentlichungen als auch den europäischen Bewertungsberichten (EPAR) der EMA berücksichtigt.

Erstes Ergebnis: Während von 2009-2013 noch 90% der Zulassungsstudien randomisiert waren, also dem höchsten Evidenzstandard entsprachen, traf das in der aktuellen Untersuchung nur noch für 75% zu. Immer mehr Krebsmedikamente werden auf Basis von einarmigen Studien – also ohne direkten Vergleich zugelassen. Aber selbst wenn es einen Vergleichsarm gab, war die gewählte Therapie öfters zweifelhaft.

Die Hersteller hatten 41 randomisierte Studien [5] eingereicht, nur bei diesen kann ein Vorteil gegenüber dem bisherigen Therapiestandard überhaupt zuverlässig erkannt werden. Bei 39 lagen genügend Informationen für eine Auswertung vor. Nur zehn Studien (26%) hatten Gesamtüberleben als primären Endpunkt, die übrigen Surrogatendpunkte.

Hälfte schwächelt

Bei 49% der Studien wurden schwerwiegende Schwächen beim Design, der Durchführung oder der Auswertung gefunden. Dabei waren Studien, die Surrogatendpunkte maßen, zu über der Hälfte (55%) methodisch schwach, Studien, die das Überleben maßen, dagegen wesentlich seltener (20%).

Viele Mängel in der Studiengestaltung und –durchführung fanden sich nur im EPAR wieder, aber nicht in den Artikeln, die in Fachzeitschriften veröffentlicht wurden. Dabei war aber auch die Informationstiefe im EPAR sehr unterschiedlich. Oftmals fehlten aussagekräftige Angaben auch dort.

Am häufigsten fehlten bei der Auswertung der Daten eine erhebliche Zahl der PatientInnen. Das stellt die Glaubwürdigkeit in Frage, insbesondere wenn die Ergebnisse der Studienarme nicht weit auseinanderliegen. Bei Nivolumab fehlten die Daten für 16,5% der Personen im Versuchsarm, aber nur weniger als 1% im Vergleichsarm. Es wurden auch keine Sensitivitätsanalysen durchgeführt, indem verschiedene Daten für die fehlende Werte eingesetzt wurden. Das ist ein etabliertes Verfahren, um etwas sicherer zu sein, ob die Lücken nicht zu einer Fehleinschätzung des Nutzens führen.

Geblinzelt

Nicht alle Studien waren verblindet (weder PatientIn noch BehandlerIn wissen welches der geprüften Medikamente gegeben wurde). Das kann zu Überschätzungen des Erfolgs führen: Bei Trametanib wurde die progressionsfreie Zeit sowohl vom behandelnden Personal als auch von verblindeten ExpertInnen bewertet. Erstere ermittelten ein Hazard Ratio (HR[6]) von 0,39 also einen deutlicheren Vorteil, die verblindeten nur 0,55. In der Publikation fand sich nur der günstigere Wert. Auf vollständige Verblindung wird oft wohl verzichtet, weil das kostengünstiger ist – man spart so teure Fachleute.

Generell wird kritisch angemerkt, dass die Lebensqualität in drei Viertel der Studien nicht gemessen wurde. Da die Medikamente häufig in einer palliativen Situation gegeben werden, also die Überlebensdauer der PatientInnen begrenzt ist, ein schweres Versäumnis.  (JS)

 

 Artikel aus dem Pharma-Brief 6/2019, S.5

[1] Naci H et al. (2019) Design characteristics, risk of bias, and reporting of randomised controlled trials supporting approvals of cancer drugs by European Medicines Agency, 2014-16: cross sectional analysis. BMJ; 366, p l5221

[2] Pharma-Brief (2017) Bescheidener Fortschritt. Nr. 8-9, S. 1

[3] Pharma-Brief (2017) Viel Lärm um nichts? Nr. 4, S. 4

[4] Shaji Kumar and Vincent Rajkumar SV (2019) Surrogate endpoints in randomised controlled trials: a reality check. Lancet; 394, p 281

[5] Die übrigen Studien waren nicht randomisiert (2) oder hatten gar keinen Vergleichsarm (11)

[6] Ein Hazard Ratio von 1 bedeutet, dass es keinen Unterschied gibt, also das Ereignis in beiden Gruppen gleich häufig eintritt. Kleinere Wert als 1 bedeuten einen Vorteil, höhere Werte einen Nachteil.