Das Problem mit klinischen Studien der Phase III

Klinische Phase-III-Studien sind die letzte Phase der Forschung, die erforderlich ist, bevor ein Medikament die Zulassung der US-amerikanischen Food and Drug Administration (FDA) erhält. Es sind zwei ziemlich umfangreiche Studien erforderlich, die zeigen sollen, dass das Medikament bei den getesteten Probanden sowohl sicher als auch wirksam ist.

Es gibt jedoch seit langem ein Problem mit solchen klinischen Studien, das der FDA seit langem bekannt ist, das jedoch nicht behoben werden kann. Sie wurden absichtlich entwickelt, um strenge Einschluss- und Ausschlusskriterien anzuwenden, die einen wesentlichen Teil der Bevölkerung ausschließen können. Mit anderen Worten, die Personen, an denen die Medikamente untersucht werden, sind nicht repräsentativ für die Personen, die die Medikamente nach der Zulassung tatsächlich erhalten.

Mit anderen Worten, klinische Phase-III-Studien sind gestapelt, um positive Ergebnisse für das untersuchte Medikament zu erzielen.

Eine neue Studie, die in der neuesten Ausgabe von veröffentlicht wurde Das amerikanische Journal of Psychiatry von Wisniewski und Kollegen (2009) beschlossen, die Hypothese auf den Prüfstand zu stellen, indem sie die großartigen Daten untersuchten, die durch das von der Regierung unterstützte STAR * D-Projekt generiert wurden. "STAR * D wurde mit umfassenden Einschluss- und minimalen Ausschlusskriterien entwickelt, um die Rekrutierung einer repräsentativen Stichprobe von behandlungssuchenden depressiven ambulanten Patienten sicherzustellen, die in typischen klinischen Umgebungen behandelt werden", stellten die Forscher fest.

Die Forscher teilten die STAR * D-Probanden in zwei Gruppen ein - diejenigen, die sich für eine klinische Phase-III-Studie qualifiziert hätten (die „Wirksamkeitsprobe“), und diejenigen, die keine hätten:

STAR * D hat insgesamt 4.041 Teilnehmer eingeschrieben, von denen 2.876 eine analysierbare Stichprobe bildeten (mit mindestens einem Besuch nach der Baseline und einer Punktzahl von 14 oder höher auf dem HAM-D). Von diesen konnten 2.855 in die Wirksamkeitsprobe (N = 635, 22,2%) oder die Nichtwirksamkeitsprobe (N = 2.220, 77,8%) eingeteilt werden.

Sie können ein interessantes Phänomen erkennen, das bereits auf der Klassifizierung der Forscher basiert. Nur 22,2 Prozent der Probanden im STAR * D hätten sich für eine klinische Phase-III-Studie qualifiziert. Die überwiegende Mehrheit der Probanden hätte sich nicht qualifiziert, was die Generalisierbarkeit und Nützlichkeit von Daten, die nur für 22,2 Prozent der Bevölkerung gelten würden, sofort in Frage stellt. (Frühere Untersuchungen haben ergeben, dass diese Zahl nur 9 Prozent betragen kann.)

Sie fanden auch heraus, dass die Wirksamkeitsprobe im Vergleich zur Nichtwirksamkeitsprobe von depressiven Menschen:

  • Kürzere Dauer der Depression
  • Niedrigere Raten früherer Selbstmordversuche
  • Niedrigere Raten von Drogenmissbrauch in der Familiengeschichte
  • Geringere Angstzustände und andere nicht depressive Symptome
  • Eher in einer psychiatrischen Spezialversorgung zu sehen
  • Weniger wahrscheinlich schwerwiegende Nebenwirkungen haben
  • Es ist weniger wahrscheinlich, dass ein schwerwiegendes unerwünschtes Ereignis auftritt (entweder psychiatrisch oder aufgrund der Medikamente).

All dies kann die Beobachtung der meisten Kliniker leicht erklären, dass Medikamente selten die Erwartungen erfüllen, die in von Experten überprüften Forschungsergebnissen gefunden und veröffentlicht wurden (der sogenannte „Goldstandard“):

Alle Ergebnismaße zeigten signifikante, aber bescheidene Unterschiede zwischen den Gruppen, wobei die Wirksamkeitsprobe im Durchschnitt bessere Ergebnisse erzielte. Diese Unterschiede waren in Richtung und Ausmaß der Wirkung konsistent, wenn sie in der primären und psychiatrischen Versorgung getrennt untersucht wurden.

Angesichts dieser Unterschiede zwischen den Gruppen ist die kleinere Wirksamkeitsprobe eindeutig nicht repräsentativ für die umfassendere, behandlungssuchende Bevölkerung. Folglich ist eine Patientenprobe, die die Einschlusskriterien für eine klinische Phase-III-Studie erfüllt, nicht repräsentativ für depressive Patienten, die in der typischen klinischen Praxis beobachtet werden, und die Ergebnisse der Phase-III-Studie sind möglicherweise optimistischer als die in der Praxis erzielten Ergebnisse. […]

Nach unserem Kenntnisstand ist die aktuelle Studie die erste, die die Unterschiede im Behandlungsergebnis untersucht. Insbesondere waren die Ansprech- und Remissionsraten schlechter und die Zeiten für Ansprechen und Remission waren bei Patienten, die für Wirksamkeitsstudien nicht in Frage kamen, länger. Aktuelle Wirksamkeitsstudien deuten daher auf ein optimistischeres Ergebnis hin, als es in der Praxis wahrscheinlich ist, und die Dauer einer angemessenen Behandlung, die aus Daten aus Wirksamkeitsstudien hervorgeht, ist möglicherweise zu kurz.

Es ist ein offensichtlicher Kompromiss, klinische Phase-III-Studien für eine breitere und repräsentativere Stichprobe von Patienten zu öffnen. Medikamente erfüllen nicht die Wirksamkeitsschwelle der FDA und werden daher nicht zugelassen. Sofern die FDA ihre Phase-III-Anforderungen nicht ändert, wird sich diese Situation daher wahrscheinlich nicht von selbst ändern, auch wenn sich in Kürze Daten ergeben, die zeigen, dass die Forschung grundlegend fehlerhaft ist.

In der Forschung ist die Auswahl Ihrer Stichprobe ein grundlegender Weg, um Ihre Ergebnisse zu gestalten. Die Forscher wissen dies natürlich und wählen häufig Einschluss- oder Ausschlusskriterien für ihre Stichprobe aus, die dazu führen, dass sie mit größter Wahrscheinlichkeit eine Signifikanz in ihren Daten finden. Wenn Sie wissen, worauf Sie bei der Stichprobe achten müssen (z. B. handelt es sich um eine randomisierte Stichprobe oder eine Convenience-Stichprobe? Sind die Einschluss- / Ausschlusskriterien zu streng? Sind sie repräsentativ für die Bevölkerung und die Demografie?), Können Sie viel über den tatsächlichen Nutzen erzählen und Generalisierbarkeit der Ergebnisse der Studie.

Die neuesten Forschungsergebnisse setzen eine lange Reihe ähnlicher Studien fort, die uns Aufschluss darüber geben, warum Medikamente selten so gut (oder mit so wenigen Nebenwirkungen) wirken, wie es ihre klinischen Studien gezeigt haben.

Wenn Sie also frustriert sind, dass Ihr Antidepressivum oder Ihre Psychopharmaka nicht so gut wirken wie beworben, kann dies einer der Gründe dafür sein - es ist in der Allgemeinbevölkerung nicht so wirksam wie bei der untersuchten Kirschprobe.

Referenz:

Stephen R. Wisniewski, A. John Rush, Andrew A. Nierenberg, Bradley N. Gaynes, Diane Warden, James F. Luther, Patrick J. McGrath, Philip W. Lavori, Michael E. Thase, Maurizio Fava und Madhukar H. Trivedi. (2009). Können die Ergebnisse der Phase-III-Studie mit Antidepressiva auf die klinische Praxis übertragen werden? Ein STAR * D-Bericht. Am J Psychiatry, 166 (5), 599 & ndash; 607.

!-- GDPR -->