Anzeige

Statistische Signifikanz vs. klinische Relevanz

Der Transfer von Studienergebnissen in den klinischen Alltag

Im folgenden Teil 6 unserer losen Reihe zum Thema „Evidenzbasierte Zahnmedizin – Was ist das?“ erläutert Plaque n Care-Chefredakteur Prof. Dr. Peter Hahner weitere Begriffe, die für ein besseres Verständnis von Studieninhalten wichtig sind. Vorangegangene Beiträge finden Sie unter www.pnc-aktuell.de/evidenzbasierte-zahnmedizin.

. NICKOA/Stock.Adobe.com
.
.

Ein Grundprinzip der Evidenzbasierten Medizin besteht darin, die Entscheidungsfindung in der Behandlungsplanung an den Ergebnissen klinischer Studien oder systematischer Reviews und Metaanalysen zu orientieren und sich nicht allein auf eigene oder als Expertenmeinung mitgeteilte Erfahrungswerte zu verlassen. Neben der Identifizierung geeigneter Studien zur Beantwortung der konkreten Fragestellung wirft die Übertragung der Studienergebnisse auf die klinische Situation immer wieder Probleme auf, wenn für eine bestehende Diagnose unterschiedliche Therapieoptionen existieren und miteinander verglichen werden sollen.

Eine alltägliche Frage, die trotz einer seit vielen Jahren mit immer wieder neuen Aspekten geführten Diskussion noch längst nicht entschieden ist, besteht in der Suche nach Verbesserungen des Ergebnisses der nicht chirurgischen parodontalen Therapie durch ergänzende und unterstützende Maßnahmen. Das Spektrum der Möglichkeiten umfasst unter anderem den Einsatz lokaler oder systemisch verabreichter Antibiotika, antiseptischer Wirkstoffe in unterschiedlichen Applikationsformen wie Spülungen, Lacke oder sogenannte Slow-Release-Devices, die antimikrobielle photodynamische Therapie (aPDT), Modulation des pathogenen Biofilms durch Probiotika oder auch parodontalchirurgische Interventionen.

Der eingehende Vergleich dieser Methoden ist im Rahmen dieses Beitrages sicherlich nicht zu leisten, einen aktuellen Überblick findet man in den kürzlich erschienenen Leitlinien der European Federation of Periodontology (EFP) [1], die dazu gehörenden Grundlagen in den parallel von der EFP publizierten systematischen Reviews und Metaanalysen (Literaturangaben siehe unter [1]). Im Folgenden sollen lediglich einige Begriffe erläutert werden, um das Verständnis beispielsweise dieser wichtigen Texte zu erleichtern.

Therapieergebnisvergleich anhand verschiedener Parameter

Anzeige

In einer kontrollierten klinischen Studie werden die Ergebnisse der unterschiedlichen Therapieansätze anhand von diagnostischen Parametern miteinander verglichen. Hierzu dient in der Parodontologie sehr häufig die Messung der Sondierungstiefen (ST), des klinischen Attachmentlevels (CAL) oder der Sondierungsblutung (Bleeding on Probing, BoP).

So könnte die Frage lauten, ob durch die Intervention A oder B die Sondierungstiefen oder der BoP-Index zu einem vorher definierten Zeitpunkt nach der Behandlung (z.B. nach 3, 6 oder 12 Monaten) stärker reduziert werden, was dann einen Hinweis auf eine effektivere Therapie gäbe. Die Hypothese, die mit dem klinischen Versuch überprüft werden soll, lautet also: Therapie A ist effektiver als Therapie B (oder umgekehrt). Die sogenannte Nullhypothese besagt, dass A und B gleich effektiv sind [2].

In einem einfachen Beispiel würden die Sondierungstiefen bei allen Probanden jeweils vor und nach der Intervention gemessen, für die beiden Vergleichsgruppen jeweils vor und nach der Intervention eine durchschnittliche Sondierungstiefe errechnet und für beide Gruppen die Differenz der durchschnittlichen Sondierungstiefen vor und nach der Intervention bestimmt.

Von einer statistischen Signifikanz für einen Unterschied von A und B wird gesprochen, wenn der Unterschied so groß ist, dass er nicht auch ein zufällig aufgetretenes Ereignis sein könnte, dass also die Nullhypothese als nicht zutreffend verworfen werden muss. Häufig wird ein Signifikanzniveau von ? = 5% gewählt, d.h., dass eine als signifikant errechnete Differenz zwischen A und B mit einer Wahrscheinlichkeit von 95% nicht Ergebnis eines Zufalls ist. Dem zugeordnet wird der sogenannte p-Wert (p = probability), der bei dem genannten Signifikanzniveau von 5% kleiner als 0,05 sein müsste [3].

Ob die Differenz zwischen A und B als statistisch signifikant berechnet wird, hängt neben der Größe der Differenz von der Zahl der Probanden in den beiden Untersuchungsgruppen ab. Je kleiner der tatsächliche Effekt – also die Differenz zwischen A und B – ist, desto größer muss die Zahl der Probanden sein, um einen signifikanten Unterschied erkennen zu können. Einer klinischen Studie geht daher eine Fallzahlschätzung voraus, bei der auf der Grundlage der von vorausgegangenen Tests angenommenen Effektgröße die Probandenzahl extrapoliert wird, um die nötige Trennschärfe (in der Regel als statistische Power bezeichnet) zur Erkennung eines signifikanten Ergebnisses zu erreichen [4].

Mögliche statistische Relevanz kleiner Differenzen

Das heißt aber umgekehrt auch, dass sich beim Vergleich großer Populationen auch sehr kleine Differenzen als statistisch signifikant herausstellen können. Beim Transfer von Studienergebnissen in die tägliche klinische Praxis muss also bedacht werden, ob ein signifikanter Unterschied zwischen der neuen Therapie A und der bisher praktizierten Alternative B auch für den Patienten so relevant ist, dass dies etwa einen höheren Aufwand oder auch ein erhöhtes Risiko für Nebenwirkungen rechtfertigt.

Dies gilt fast durchgängig für die eingangs erwähnten Ergänzungen zur nicht chirurgischen Parodontitistherapie: Wenn die bisherige Standardtherapie B, das subgingivale Débridement, beispielsweise durch eine lokale Antibiotikagabe oder den Einsatz der photodynamischen Therapie ergänzt werden soll, steigen Aufwand und Behandlungskosten. Ist das zu rechtfertigen, wenn angenommenerweise durch den Standard B eine durchschnittliche Reduktion der Sondierungstiefen um 1,5 mm zu erwarten ist, durch die neue Kombinationstherapie A (subgingivales Débridement + Ergänzung) die Sondierungstiefen im Durchschnitt um 1,7 mm geringer werden und dies ein statistisch signifikantes Ergebnis ist?

Zum Vergleich: Die Messungenauigkeit beim Sondieren parodontaler Taschen beträgt etwa 0,5 mm, gleichgültig, ob manuelle oder druckkalibrierte Sonden zum Einsatz kommen [5]. Wahrscheinlich wird es den meisten Behandlern schwerfallen, sich nur auf der Basis dieser Studieninformation zur Sondierungstiefenreduktion für Variante A zu entscheiden und ihren Patienten in der Therapiebesprechung die Überlegenheit einer solchen Methode zu kommunizieren.

Das Beispiel soll nun aber nicht belegen, dass eine evidenzbasierte Entscheidung auf Grundlage kontrollierter Studien grundsätzlich wenig hilfreich ist und den Ansprüchen einer individualisierten, personalisierten Medizin nicht gerecht wird. Es zeigt vielmehr, dass der Vergleich von Mittelwerten der Sondierungstiefen aus in der Regel mit erheblicher Streuung auftretenden Einzelmessungen kein idealer Ansatz zum Vergleich der Effektivität von A und B ist. Hier schließt sich die Suche nach einem besser geeigneten Untersuchungsparameter an.

True vs. Surrogate Endpoint

Der wichtigste Endpunkt einer Parodontitistherapie aus der Sicht von Patient und Behandler ist der langfristige Zahnerhalt, die Vermeidung weiterer künftiger Zahnverluste. Allerdings ist dieser Parameter, der auch als True Endpoint bezeichnet werden kann, für kontrollierte klinische Studien kaum geeignet, da auch bei rasch progressiv verlaufenden Parodontitisformen – zum Glück! – zu wenige Zahnverluste in üblichen Beobachtungszeiträumen auftreten. Also ist die Wahl eines Ersatzendpunktes (Surrogate Endpoint) erforderlich, und hierfür werden eben häufig die Parameter Sondierungstiefen, CAL und BoP mit den bereits erwähnten Einschränkungen herangezogen.

Aussagekräftiger bezüglich der klinischen Relevanz sind Untersuchungen, bei denen aus den Ergebnissen entscheidende zusätzliche Vorteile durch die Therapieergänzung für die Prognose eines einzelnen Zahnes oder des oralen Befundes insgesamt abzulesen sind. Dies lässt sich an der im Beispiel genannten Differenz der Sondierungstiefen von 0,2 mm nach Therapie A oder B kaum belegen. Daraus folgt unter anderem, dass auch in den oben erwähnten Leitlinien der EFP [1] an mehreren Stellen keine klare Empfehlung für eine adjuvante Therapie formuliert wird.

Ein geeigneter Endpunkt wäre das Erreichen eines stabilen parodontalen Zustandes: Es bietet sich die in der aktuellen Klassifikation definierte Diagnose klinischer parodontaler Gesundheit am reduzierten Parodontium mit einer Sondierungstiefe von ? 4 mm und einem negativen Blutungsergebnis (BoP -) an [6]. Die Frage in der Studie lautete dann: Bei wie vielen Zähnen oder Probanden kann klinische parodontale Gesundheit zusätzlich registriert werden, wenn die neue Therapie A anstelle der bisherigen Methode B zum Einsatz kommt? Ein anderer klinisch und auch für den Patienten relevanter Endpunkt wäre beispielsweise auch das Erreichen eines Befundes, der eine zusätzliche parodontalchirurgische Maßnahme erübrigte.

Das „Treat-to-Target“-Konzept

Ein vielversprechender Ansatz findet sich in dem kürzlich publizierten „Treat-to-Target“-Konzept, in dem ein klinischer Endpunkt beschrieben wird, der auf der Basis zahlreicher Untersuchungen als Grenze zwischen einem durch risikogerechte Erhaltungstherapie stabil zu haltenden parodontalen Befund und einer weiter progressiven Erkrankung gezogen werden kann [7]. Die Autoren schlagen einen klinischen Endpunkt von maximal 4 Messstellen mit einer Sondierungstiefe ? 5 mm vor und regen an, diese Grenze als einheitliches Zielkriterium in zukünftigen kontrollierten Studien zu verwenden. Dies wäre ein auch für die klinische Praxis relevanter Endpunkt, mit dem der Transfer von Studienergebnissen vereinfacht und damit wahrscheinlich auch die Akzeptanz der Evidenzbasierten Medizin allgemein verbessert werden könnte.

Weiterführende Links

Bildquellen sofern nicht anders deklariert: Unternehmen, Quelle oder Autor/-in des Artikels

Kommentare

Keine Kommentare.

Anzeige