Welchen Nutzen haben Parodontitisbehandlungen?

Wie kann man den Nutzen einer Parodontitistherapie bewerten? Welcher Endpunkt einer Therapie bietet sich dazu an?

Der eigentliche Endpunkt, der vorrangig interessieren würde, ist der Zahnverlust. Aber zu parodontitisbedingtem Zahnverlust kommt es erst nach vielen Jahren. So lange beobachten randomisierte kontrollierte Interventionsstudien (RCT, englisch: randomized controlled trials) häufig die Studienteilnehmer aber nicht nach. Daher muss man stellvertretend einen anderen Endpunkt nehmen, einen sogenannten Surrogatendpunkt, der analog zum Zahnverlust Ergebnisse abbildet. Bei dieser Nutzenbewertung wurde das Attachmentlevel als hierfür geeignet identifiziert, das den Zustand des Zahnhalteapparats misst.

Für die geschlossene mechanische Therapie (GMT) konnte – im Vergleich zu keiner Behandlung – ein Nutzen festgestellt werden: „Es ergab sich ein Hinweis auf einen Nutzen der GMT basierend auf dem Endpunkt Attachmentlevel.“ Was heißt das eigentlich?

Wir haben für die GMT einen Nutzennachweis mittlerer Stärke gefunden, und zwar zum Endpunkt Attachmentlevel. Wir unterscheiden 3 Grade des Nutzennachweises: den Anhaltspunkt als schwächste Form, dann den Hinweis und als stärkste Form den Beleg.

Für eine ergänzende chirurgische Zusatztherapie konnte kein Nutzen bestätigt werden. Bislang wird diese nach Ausbleiben des Erfolges einer Initialtherapie vielfach angewandt. Sollte man dies überdenken?

Aufgefallen ist uns dieses Ergebnis auch. Grundsätzlich bietet es sich an, solche Abweichungen von den wissenschaftlichen Grundlagen zu hinterfragen. Dafür ist Gelegenheit im nächsten Verfahrensschritt beim Gemeinsamen Bundesausschuss.

Laut Abschlussbericht gibt es für 6 Therapieansätze einen Hinweis auf oder Anhaltspunkte für einen (höheren) Nutzen, meist in Hinblick auf das Attachmentlevel (siehe Kasten). Beim Vorbericht konnte nur zwei Behandlungsarten – der klassischen mechanischen Therapie und der zusätzliche Gesprächsführung – ein Nutzen bescheinigt werden. Der Abschlussbericht fällt also deutlich positiver aus. Dies wird mit Änderungen in der Methodik begründet. Wie sind Sie vorgegangen?

Zunächst hatten wir gemeinsam mit den Stellungnehmenden überlegt, wo der Response-Cut-off für unsere Responderanalysen der Studien liegen sollte. Dieser Punkt definiert: Wann schlägt die Therapie an und wann schlägt sie nicht an? Als medizinisch plausible Schwelle wurde 0 mm festgelegt; der Attachmentverlust sollte also durch die Therapie zumindest gestoppt werden. Zu diesem Zeitpunkt wussten wir allerdings nicht, dass die Studienautoren selbst in der Regel keine Responderanalysen durchgeführt hatten. Aber auch der Versuch, diese Analysen selbst aus sogenannten Mittelwertdifferenzanalysen zu rechnen, scheiterte weitgehend, da nur in 8 Studien von den 35 RCTs, die wir eingeschlossen hatten, die Ergebnisse in einer für Responderanalysen geeigneten Art und Weise dargestellt waren.

Das waren also jene 8 Studien, die im Vorbericht für den Endpunkt Attachmentlevel zur Nutzenbewertung herangezogen werden konnten. Welchen Weg haben Sie dann eingeschlagen?

Im zweiten Schritt haben wir nun Folgendes getan: Uns lagen aus den Studien für den Endpunkt Attachmentlevel Mittelwertdifferenzanalysen vor. Diese Analysen erfassen den Unterschied des Attachmentlevels zwischen den Behandlungsgruppen nach Therapie. Wir konnten die Ergebnisse zu den Mittelwertdifferenzanalysen aber nicht einfach so aus den Studien zur Bewertung heranziehen. Denn z.B. bei großen Stichproben können schon kleinste Unterschiede zu statistisch signifikanten Effekten führen. Deshalb benötigten wir zunächst eine Bewertung darüber, welche statistisch signifikanten Werte auch gleichzeitig klinisch relevant sind. Hierzu bedarf es einer sogenannten Irrelevanzschwelle, jenseits derer der berichtete Wert liegen muss, damit von einem klinisch relevanten Unterschied zwischen den Behandlungsgruppen ausgegangen werden kann. Bei der Erörterung zum Vorbericht konnten wir uns gemeinsam mit allen Stellungnehmenden auf eine solche Irrelevanzschwelle verständigen. Damit war es möglich, bei allen eingeschlossenen Studien die Ergebnisse zum Attachmentlevel für die Nutzenbewertung heranzuziehen.

Das war ein Punkt, der dazu führte, dass Sie sehr viel mehr Aussagen zum Attachmentlevel auswerten und zur Nutzenbewertung heranziehen konnten. Darüber hinaus wurden für den Abschlussbericht noch weitere Studien einbezogen. Wie kam das?

Ein großes Problem für die Auswertung lag darin, dass für die Bestimmung des Attachmentlevels pro Patient sehr viele Messungen durchgeführt werden können, bis zu 6 Messungen pro Zahn. Diese Messungen sind abhängig voneinander, da sie von ein und demselben Patienten stammen. Man darf sie keinesfalls so betrachten, als seien sie unabhängig voneinander. Die fälschliche Betrachtung als unabhängig könnte nämlich dazu führen, dass man falsche, statistisch signifikante positive Effekte erhält. Nun gibt es aber biometrisch die Möglichkeit, solchen falsch positiven Ergebnissen entgegenzusteuern. Hier kommt der Intraklassenkorrelationskoeffizient (ICC) zum Tragen. Das ist ein Faktor, durch den die Varianz, also die Streuwerte um einen „Ergebniswert“ (Punktschätzung), korrigiert wird. Diesen Faktor muss man aber kennen, um ihn auf das Ergebnis anwenden zu können. In der Erörterung, die auf den Vorbericht folgte, boten uns Wissenschaftler der Universität Greifswald an, auf Basis ihrer SHIP-Studie und SHIP-Trend-Studie ICCs für End- und Veränderungswerte für Attachmentlevel zu liefern. Sie haben uns dann relativ schnell die ICC-Werte errechnet. Dadurch konnten wir zusätzliche Studien einbeziehen, die wir zuvor aufgrund der gerade beschriebenen Kriterienverletzung ausschließen mussten. Und schließlich konnte durch Nachrecherchen eine Anzahl neuer relevanter Studien identifiziert und für die Nutzenbewertung herangezogen werden.

Wie viele Studien konnten letztendlich eingeschlossen werden?

Das waren 61 Studien.

Auf dem Zahnärztetag 2017 wurde vehement gefordert, nicht nur RCTs zu berücksichtigen, sondern auch Kohortenstudien. Es war nicht der Fall. Warum?

Die Kurzfassung: Wenn RCTs existieren, erreicht man die höchste Ergebnissicherheit. Wenn man diese hat, muss man nicht auf die darunterliegenden Ebenen, also auf weniger sichere, heruntergehen. Wir haben ja nun für fast alle Fragestellungen RCTs gefunden; für alle weiteren sind RCTs möglich. Kohortenstudien, insbesondere die retrospektiven Kohortenstudien, haben aufgrund vieler verzerrender Faktoren eine hohe Ergebnisunsicherheit, was sehr problematisch ist.

Zu manchen Unterfragen, etwa zur mikrobiellen Diagnostik, lagen aber keine RCTs vor.

Ja, aber dazu sind ja RCTs möglich, auch zu Unterfragen bezüglich der Antibiotika kann man durchaus RCTs durchführen.

In welchem anderen Bereich wäre es nötig, noch weitere Studien durchzuführen?

Strukturierte Nachsorge! In diesem Bereich wäre das schon wichtig. Zwar wurde nun die IQuaD-Studie zur UPT* durchgeführt. Aber diese Studie betrifft nur die leichten Fälle von Parodontitis. Das Institut der Deutschen Zahnärzte (IDZ) hat kürzlich auf seiner Webseite eine Übersichtsarbeit veröffentlicht, die selbst den Bedarf einer RCT feststellte und sogar einen Vorschlag machte, wie eine solche Studie aussehen könnte.

Wenn Sie auf den Ablauf dieser Nutzenbewertung zurückschauen – was hätten Sie sich gewünscht?

Ich würde mir wünschen, dass man genauer hinschaut und offener dafür ist, was sich hinter unseren Aussagen verbirgt – bevor es zu Fehlinterpretationen kommt mit dem Tenor: „IQWIG sagt, die Therapie nutzt nichts und ist sinnlos.“ Das haben wir ja nie gesagt. Tatsächlich hatten wir festgestellt, dass der Nutzen noch unklar war – und zwar weil beispielsweise keine Studien vorlagen oder wir die Studienergebnisse in ihrer dargestellten Form für den Vorbericht nicht auswerten konnten.

Vielen Dank für das Interview!

Das Interview führte Dagmar Kromer-Busch.

* IQuaD-Studie zur UPT (Universität Dundee). Diese multizentrische RCT wurde mit über 1800 Teilnehmern aus Schottland mit 3 Jahren Nachbeobachtungszeit durchgeführt. Sie ist mittlerweile abgeschlossen. Eventuell werden die Studienergebnisse noch in die Beratungen des Gemeinsamen Bundesausschusses einfließen können.

Was ist nützlich?

Für die folgenden Therapien konnten die Wissenschaftler des IQWiG einen Nutzen, basierend auf dem Endpunkt Attachmentlevel, feststellen:

für die geschlossene mechanische Therapie gegenüber keiner Behandlung (ein Hinweis auf einen Nutzen der GMT)
für die GMT und die modifizierte Widman-Lappentechnik (mWLT) gegenüber keiner Behandlung (Anhaltspunkt für einen Nutzen)
für die GMT und Osteoplastik versus keine Behandlung ergab sich ein Anhaltspunkt für einen Nutzen
für die alleinige Lasertherapie gegenüber der GMT ergab sich ein Anhaltspunkt für einen höheren Nutzen
für einen höheren Nutzen der GMT mit ITOHEP-Verfahren (individuell angepasstes Mundhygiene-Schulungsprogramm) im Vergleich zur GMT + Mundhygiene-Standardunterweisung, basierend auf der Endpunktkategorie symptomatische Gingivitis (Anhaltspunkt)
für die ergänzende Lasertherapie gegenüber alleiniger GMT ergab sich ein Anhaltspunkt für einen höheren Nutzen, basierend auf der Endpunktkategorie symptomatische Gingivitis (Ergebnis unter Vorbehalt)
für ergänzende systemische Antibiotikabehandlung versus GMT (unter Vorbehalt gestellt)
GMT + chirurgische Taschenelimination (CTE) versus GMT: Es ergab sich ein Anhaltspunkt für einen geringeren Nutzen der ergänzenden CTE, basierend auf dem Endpunkt Attachmentlevel.

(Quelle: Abschlussbericht, s.u., „Kernaussagen“, S. iv–vii). Der Abschlussbericht des IQWiG „Systematische Behandlung von Parodontopathien“ (IQWiG-Berichte Nr. 602 vom 05.03.2018) ist hieronline abrufbar.

Bildquellen sofern nicht anders deklariert: Unternehmen, Quelle oder Autor/-in des Artikels

Mit methodischer Feinarbeit zu aussagekräftigeren Ergebnissen

Was ist nützlich?

Kommentare