- Einleitung
- Was bedeutet Leistungsbewertung im Rahmen der IVDR?
- Warum die IVDR die Messlatte höher legt: Die regulatorische Absicht hinter dem Begriff „ausreichende Nachweise“
- Das Lebenszyklusmodell: Leistungsnachweise als lebendiges System
- Erstellung eines fundierten Leistungsbewertungsplans
- Wie sieht ein fundierter Leistungsbeurteilungsbericht aus?
- Entwicklung von Belegen für die klinische Leistungsfähigkeit, die einer Überprüfung standhalten
- Beweisführung nach der IVDR: Von „Wir haben Daten“ zu „Das reicht aus“
- Marktüberwachung und PMPF: Die Leistungsfähigkeit langfristig nachweisen
- Rückverfolgbarkeit: Die Funktion, die eine PER überprüfbar und für KI extrahierbar macht
- Häufige Fragen an benannte Stellen und wie fundierte Leistungsdaten diesen zuvorkommen
- Fazit
Einleitung
Der Übergang zur EU-IVDR hat die Standards für den Leistungsnachweis für Hersteller von In-vitro-Diagnostika (IVD) auf praktische und zugleich tiefgreifende Weise grundlegend verändert. Unter der früheren IVDD stützte sich die Leistungsdokumentation häufig auf begrenzte Datensätze, unterschiedliche Studiendesigns und uneinheitliche Dokumentationspraktiken, die sich je nach Produkt und Markt stark voneinander unterschieden. Nach der EU-IVDR reichen solche Ansätze nur noch selten aus. Behörden und benannte Stellen erwarten von den Herstellern zunehmend, dass sie die Leistung anhand eines strukturierten, rückverfolgbaren und lebenszyklusbasierten Nachweissystems nachweisen, das einer wissenschaftlichen Überprüfung standhält und glaubwürdig bleibt, auch wenn die Produkte in unterschiedlichen Bevölkerungsgruppen, klinischen Umgebungen und unter sich weiterentwickelnden Versorgungsstandards eingesetzt werden.
Im Mittelpunkt dieses Rahmens steht die Leistungsbewertung gemäß der EU-IVDR: ein klar definierter, kontinuierlicher Prozess, der wissenschaftliche Validität, analytische Leistungsfähigkeit, klinische Leistungsfähigkeit und Erkenntnisse aus der Marktbeobachtung zu einer schlüssigen Evidenzdarstellung zusammenführt. Bei der Leistungsbewertung gemäß der IVDR geht es letztlich darum, eine Evidenzdarstellung zu erstellen, die wissenschaftlich fundiert, methodisch transparent und über den gesamten Lebenszyklus des Produkts hinweg nachhaltig ist. Ein vertretbarer Leistungsbewertungsbericht (PER) sollte wissenschaftliche Validität, analytische Leistung, klinische Leistung und Erkenntnisse aus dem Lebenszyklus klar zu einer einzigen schlüssigen Begründung für die Leistung und die Evidenzausreichendheit verknüpfen. In der Praxis bedeutet dies, die Generierung von Leistungsnachweisen mit einem einheitlichen Ansatz für die klinische und Leistungsbewertung in Einklang zu bringen, strenge Prinzipien der Studiendesigns wie Bias-Kontrolle und Endpunktwahl bei der Konzeption einer klinischen Leistungsstudie anzuwenden, Argumente zur Evidenzausreichendheit auf klinische IVDR-Evidenz zu stützen und sicherzustellen, dass das Vertrauen in die Lebenszyklusleistung durch IVDR-PMS, PMPF und PSUR aufrechterhalten wird.
Was bedeutet Leistungsbewertung im Rahmen der IVDR?
Gemäß der IVDR ist die Leistungsbewertung nicht lediglich die Durchführung von Studien und die Zusammenstellung der Ergebnisse. Es handelt sich um einen strukturierten Prozess, der in Anhang XIII beschrieben ist und nachweist, dass die Ergebnisse des Produkts wissenschaftlich relevant, analytisch zuverlässig und für den angegebenen Verwendungszweck klinisch aussagekräftig sind. Der Rahmen der IVDR stützt sich auf drei miteinander verknüpfte Säulen:
- Wissenschaftliche Validität, die den Zusammenhang zwischen dem Analyten (oder Marker) und dem klinischen Befund oder physiologischen Zustand belegt.
- Analytische Leistungsfähigkeit, die belegt und bestätigt, dass das Gerät den Analyten unter den vorgesehenen Einsatzbedingungen zuverlässig messen oder nachweisen kann.
- Klinische Leistungsfähigkeit, die belegt, dass das Ergebnis mit einem klinischen Zustand oder Ergebnis in der Zielpopulation und im vorgesehenen klinischen Umfeld korreliert.
Ein wichtiger praktischer Aspekt ist, dass diese Säulen keine isolierten Kontrollpunkte sind. Eine fundierte Leistungsbewertung gemäß IVDR zeigt eindeutig auf, wie sie zusammenwirken. Die wissenschaftliche Validität erklärt, warum der Analyt klinisch relevant ist, die analytische Leistungsfähigkeit erklärt, wie gut er gemessen werden kann, und die klinische Leistungsfähigkeit erklärt, was das Ergebnis in der klinischen Praxis bedeutet. Wenn diese Elemente aufeinander abgestimmt sind, bilden die Leistungsnachweise eine klare und glaubwürdige Darstellung. Sind sie hingegen fragmentiert oder inkonsistent begründet, wirken die Nachweise oft wie ein Flickenteppich, der eher Fragen seitens der benannten Stelle hervorruft.
Aus diesem Grund ist eine frühzeitige Planung so wichtig. Überzeugende Leistungsnachweise ergeben sich nicht aus der Menge der gesammelten Daten, sondern aus einer durchdachten Konzeption. Am Anfang steht eine präzise Definition des angestrebten Zwecks, gefolgt von einer klaren Zuordnung der Leistungsaussagen zu Endpunkten und der Abstimmung dieser Endpunkte auf geeignete Evidenzquellen und Studiendesigns. Dieser strukturierte Ansatz, der das Kernstück eines soliden Leistungsbewertungsplans (PEP) bildet, verringert Unstimmigkeiten, verbessert die Nachvollziehbarkeit und unterstützt die Erstellung eines fundierten Leistungsbewertungsberichts.
Warum die IVDR die Messlatte höher legt: Die regulatorische Absicht hinter dem Begriff „ausreichende Nachweise“
Die höheren Anforderungen der IVDR an die Evidenz beruhen auf einer einfachen politischen Realität. Die Ergebnisse von In-vitro-Diagnostika beeinflussen klinische Entscheidungen, und fehlerhafte oder unzuverlässige Ergebnisse können zu Fehldiagnosen, verzögerten Behandlungen, unnötigen Eingriffen oder verpassten Behandlungsmöglichkeiten führen. Die IVDR begegnet dieser seit langem bestehenden Variabilität, indem sie stärkeren Wert auf die Qualität und Hinlänglichkeit der Evidenz sowie auf die Kontinuität über den gesamten Lebenszyklus legt.
Der Begriff „ausreichend“ stellt den entscheidenden Wandel dar. Nach der IVDR reicht es nicht aus, lediglich nachzuweisen, dass Beweise vorliegen. Die Hersteller müssen nachweisen, dass die Beweise in Bezug auf Qualität, Quantität und Relevanz ausreichend sind, um den Verwendungszweck und die Angaben in der Kennzeichnung, der Gebrauchsanweisung und den Marketingunterlagen zu untermauern. Diese Beurteilung der Ausreichendheit erfolgt kontextabhängig. Ein In-vitro-Diagnostikum, das als Grundlage für klinische Entscheidungen mit erheblichen Auswirkungen dient, wird in der Regel höheren Erwartungen unterliegen als ein Produkt mit geringeren Auswirkungen, und Produkte in höheren Risikoklassen werden einer strengeren Prüfung unterzogen.
Dies ist ein Grund, warum in Diskussionen über die Evidenz im Rahmen der IVDR häufig auf die Leitlinie MDCG 2022-2 Bezug genommen wird. Sie hebt Grundsätze zur Evidenzgewinnung und -bewertung hervor, die methodische Transparenz und eine klare Begründung für die Hinlänglichkeit fördern. Zudem bekräftigt sie das Konzept, dass Evidenz im Laufe der Zeit gepflegt wird und nicht zum Zeitpunkt der CE-Kennzeichnung „eingefroren“ wird.
Für viele Hersteller besteht die praktische Erkenntnis darin, dass eine erfolgreiche IVDR-Einreichung von einer Evidenzbasis abhängt, bei der es ebenso sehr um die Argumentation wie um die Ergebnisse geht. Benannte Stellen achten in der Regel auf eine stichhaltige Argumentation: Warum diese Evidenz, warum diese Endpunkte, warum diese Populationen, warum diese Vergleichsgruppen und warum reicht dies angesichts des Verwendungszwecks und der Risikoklasse aus? Diese Argumentation bildet den Kern eines stichhaltigen IVDR-Leistungsbewertungsberichts.
Das Lebenszyklusmodell: Leistungsnachweise als lebendiges System
Ein weit verbreiteter Irrtum ist, dass die Leistungsbewertung mit der Erstellung des Berichts endet. Nach der IVDR ist dies nicht der Fall. Die Leistungsbewertung erstreckt sich über den gesamten Lebenszyklus des Produkts, und das System zur Leistungsnachweisführung muss in der Lage sein, sich an neue Informationen anzupassen.
Das Lebenszyklusmodell lässt sich als sich wiederholender Kreislauf verstehen:
- Die Strategie zur Beweissicherung planen und die Methodik festlegen.
- Erbringen Sie Belege hinsichtlich wissenschaftlicher Validität, analytischer Leistungsfähigkeit und klinischer Leistungsfähigkeit.
- Bewerten Sie die Qualität der Evidenz, das Verzerrungsrisiko und die Relevanz.
- Die Erkenntnisse sollen unter Wahrung der Rückverfolgbarkeit und mit klaren Schlussfolgerungen in den PER einfließen.
- Überwachen Sie die Leistung in der Praxis durch Marktüberwachung und Leistungsnachverfolgung nach dem Inverkehrbringen (PMPF).
- Aktualisieren Sie bei Bedarf die Belege, Aussagen und Schlussfolgerungen.
In diesem Zusammenhang ist der Leistungsbewertungsplan (PEP) weit mehr als nur eine formale Anforderung der IVDR. Ein gut konzipierter PEP stellt klar, was für ein bestimmtes Produkt als „ausreichende“ und angemessene Evidenz gilt, und schafft einen Rahmen für die Steuerung, wie neue Daten im Laufe der Zeit generiert, bewertet und integriert werden. Er fördert zudem die interne Abstimmung und ermöglicht es den Teams aus den Bereichen Zulassung, Klinik, Forschung und Entwicklung,RA sowie Post-Market, auf der Grundlage eines gemeinsamen Evidenzkonzepts zu arbeiten.
Ein ausgereiftes Lebenszyklusmodell fügt sich zudem nahtlos in die klinische Bewertung und Leistungsbewertung als übergreifende Disziplin ein. Viele Organisationen stellen fest, dass sich die Leistungsbewertung deutlich verbessert, wenn sie als funktionsübergreifender Prozess der Evidenz-Governance und nicht als isolierte Dokumentationsaufgabe behandelt wird. Wenn die Evidenz-Governance in den Lebenszyklus eingebettet ist, lässt sich das PER leichter pflegen, Audits lassen sich einfacher unterstützen, und die Interaktionen mit benannten Stellen verlaufen in der Regel vorhersehbarer.
Erstellung eines fundierten Leistungsbewertungsplans
Der Leistungsbewertungsplan (PEP) bildet die Grundlage für die Nachvollziehbarkeit. Er legt den Umfang fest, definiert die Quellen für die Nachweise und erläutert, wie diese bewertet werden. Bei vielen Bewertungen zeigt sich der Unterschied zwischen einer reibungslosen und einer schwierigen Überprüfung bereits im Plan: Ein solider Plan sorgt für Kohärenz; ein schwacher Plan zwingt den Prüfer dazu, Logik zu erschließen, die eigentlich explizit hätte dargelegt werden müssen.
Ein fundierter Plan legt in der Regel den Verwendungszweck des Produkts in praktischer Hinsicht dar. Dazu gehören die Zielgruppe, die Zielpatientengruppe, der vorgesehene klinische Kontext, die Probenarten sowie die Rolle des Tests im klinischen Ablauf (Screening, Diagnose, Triage, Überwachung, Prognose usw.). Anschließend werden die zu belegenden Leistungsangaben aufgeführt und jede Angabe den entsprechenden Evidenzquellen zugeordnet.
Der Plan sollte zudem festlegen, wie die Nachweise bewertet werden. Benannte Stellen akzeptieren selten die Aussage „es liegen Nachweise vor“, ohne dass die „Qualität der Nachweise“ klar erläutert wird. Indem im Plan festgelegt wird, wie die Qualität der Studien bewertet, wie Verzerrungen berücksichtigt und wie Einschränkungen interpretiert werden, wird methodische Stringenz demonstriert und die Stichhaltigkeit des abschließenden Leistungsbewertungsberichts gestärkt.
Schließlich sollte der Plan darlegen, wie Erkenntnisse aus der Zeit nach dem Inverkehrbringen einbezogen werden. Eine der wesentlichsten Neuerungen der IVDR ist die Erkenntnis, dass nicht davon ausgegangen werden kann, dass die Leistung allein aufgrund positiver Daten aus der Phase vor dem Inverkehrbringen stabil bleibt. Ein solider Plan legt dar, wie die Marktüberwachung und die Leistungsnachverfolgung nach dem Inverkehrbringen (PMPF) die Leistung im realen Einsatz bestätigen werden und wie diese Erkenntnisse in die laufende Bewertung und Dokumentation einfließen werden
Wie sieht ein fundierter Leistungsbeurteilungsbericht aus?
Ein stichhaltiger Leistungsbewertungsbericht (PER) gemäß der EU-IVDR ist nicht bloß eine Zusammenstellung von Studien. Es handelt sich um eine strukturierte, wissenschaftlich fundierte Darstellung, die die Leistung nachweist, die Hinlänglichkeit der Nachweise begründet und erläutert, wie die Leistung im Laufe der Zeit überwacht und aufrechterhalten wird.
Ein hochwertiger IVDR-Leistungsbewertungsbericht ermöglicht es einem Prüfer, mit minimalem Interpretationsaufwand folgende Fragen zu beantworten:
- Wozu ist das Gerät bestimmt und in welchem klinischen Kontext wird es eingesetzt?
- Auf welcher wissenschaftlichen Grundlage beruht der Zusammenhang zwischen dem Analyten und dem klinischen Befund?
- Wie zuverlässig arbeitet das Gerät unter den vorgesehenen Einsatzbedingungen?
- Inwieweit zeigt das Produkt in der Zielpopulation eine klinische Wirksamkeit?
- Inwiefern stützen die wissenschaftlichen Erkenntnisse die jeweilige Behauptung, und welche Einschränkungen bestehen?
- Warum reichen die Nachweise für den Verwendungszweck und die Risikoklassifizierung des Produkts aus?
- Wie tragen die Marktüberwachung und die Nachverfolgung der Leistungsfähigkeit nach dem Inverkehrbringen dazu bei, das Vertrauen in die Leistungsfähigkeit langfristig aufrechtzuerhalten?
Beabsichtigter Zweck als „Linse“ für alle Beweise
Einer der häufigsten Gründe, warum Leistungsnachweise schwer zu rechtfertigen sind, besteht darin, dass der Verwendungszweck auf einer allgemeinen Ebene beschrieben wird, während die Studien einen engeren oder anderen Kontext widerspiegeln. So verhält sich beispielsweise ein Test, der bei einer symptomatischen Population eingesetzt wird, anders als derselbe Test im Rahmen von Vorsorgeuntersuchungen. Unterschiede in der Krankheitsprävalenz, im Patientenspektrum, in den Vorhersagewerten und im Referenzstandard können zu unterschiedlichen Ergebnissen führen. Ein vertretbarer PER antizipiert diese Probleme, indem er den Verwendungszweck explizit darlegt und sicherstellt, dass die unterstützenden Nachweise mit diesem Verwendungszweck übereinstimmen.
Wissenschaftliche Validität als strukturiertes Argument
Wissenschaftliche Validität wird oft als eine Sammlung von Referenzen dargestellt, doch gemäß der IVDR soll sie als strukturierte und fundierte Argumentation fungieren. Sie sollte belegen, dass der Analyt in einem sinnvollen Zusammenhang mit der relevanten klinischen Erkrankung steht und dass dieser Zusammenhang den angegebenen Verwendungszweck des Produkts stützt.Die überzeugendsten Abschnitte zur wissenschaftlichen Validität stützen sich auf hochwertige Quellen wie klinische Leitlinien, Konsenserklärungen und peer-reviewte Übersichtsarbeiten, anstatt sich ausschließlich auf einzelne Studien zu stützen. Sie verdeutlichen zudem die Relevanz: warum die Evidenz für die Zielpopulation und den Verwendungszweck gilt.
Wenn die wissenschaftliche Fundiertheit schwach oder nur allgemein gehalten ist, fragen die benannten Stellen häufig, ob der Verwendungszweck des Produkts im Vergleich zum aktuellen Stand der Wissenschaft überbewertet ist. Aus diesem Grund ist es sinnvoll, die Argumentation zur wissenschaftlichen Fundiertheit an anerkannten Grundsätzen auszurichten, wie sie beispielsweise in MDCG 2022-2 beschrieben sind.
Analytische Leistungsfähigkeit als Zuverlässigkeit unter realen Bedingungen
Analytische Leistungsfähigkeit bedeutet, dass die Leistungsfähigkeit in messbare und wiederholbare Ergebnisse umgesetzt wird. Sie ist auch der Punkt, an dem das Studiendesign die routinemäßigen Anwendungsbedingungen realistisch widerspiegeln muss, einschließlich der Variabilität bei der Probenentnahme und -handhabung, von Umweltfaktoren, bedienerabhängigen Effekten (sofern zutreffend), Chargenschwankungen, potenziellen Störsubstanzen und der zeitlichen Drift der Messgeräte. Ein fundierter PER beschreibt nicht nur die Ergebnisse, sondern auch die Logik, die die analytischen Designs mit den vorgesehenen Anwendungsbedingungen verbindet.
Analytische Abschnitte gewinnen zudem an Aussagekraft, wenn sie einen Bezug zum Risikomanagement und zur Kennzeichnung herstellen. Bestehen bestimmte Einschränkungen, beispielsweise eine verminderte Leistungsfähigkeit bei Vorhandensein eines Störstoffs, wird die Nachvollziehbarkeit verbessert, wenn im PER erläutert wird, wie mit dieser Einschränkung umgegangen wird (Warnhinweise, Gebrauchsanweisungen, Akzeptanzkriterien, Qualitätskontrollmaßnahmen).
Die klinische Leistung als Test für die klinische Glaubwürdigkeit
Die klinische Leistungsfähigkeit ist für viele In-vitro-Diagnostika (IVD) der am stärksten unter die Lupe genommene Aspekt, da sie darüber entscheidet, ob ein Testergebnis im vorgesehenen Kontext einen aussagekräftigen Zusammenhang mit einem klinischen Zustand oder Ergebnis aufweist. Die zentrale Herausforderung besteht darin, dass die klinische Leistungsfähigkeit überbewertet werden kann, wenn das Studiendesign Verzerrungen mit sich bringt oder wenn Referenzstandards nicht korrekt angewendet werden. Aus diesem Grund sind die Verzerrungskontrolle, die Auswahl der Endpunkte und die Begründung der Referenzstandards von zentraler Bedeutung für eine fundierte klinische Evidenz.
Wenn es bei Nachweisen zur klinischen Leistungsfähigkeit um die diagnostische Genauigkeit geht, bietet QUADAS-2 einen nützlichen Ansatz. Dabei handelt es sich um ein häufig verwendetes Instrument zur Bewertung des Verzerrungspotenzials und der Anwendbarkeit in Studien zur diagnostischen Genauigkeit. QUADAS-2 konzentriert sich nicht darauf, ob die Ergebnisse positiv sind, sondern darauf, ob sie glaubwürdig sind. Eine zuverlässige Übersicht ist über QUADAS-2 (Universität Bristol) verfügbar. Hersteller müssen QUADAS-2 nicht als regulatorische Anforderung betrachten, doch ein Verständnis davon hilft dabei, die Studienberichterstattung an den Vorstellungen der Gutachter hinsichtlich der Glaubwürdigkeit auszurichten.
Diese Überlegungen gewinnen besondere Bedeutung, wenn klinische Leistungsergebnisse in fundierte regulatorische Schlussfolgerungen umgesetzt werden, da die Wahl der Studienkonzeption direkten Einfluss darauf hat, wie Prüfer die Glaubwürdigkeit und Anwendbarkeit bewerten. Ein strukturierter Ansatz zur Verzerrungskontrolle, Endpunktwahl, Begründung des Referenzstandards und Anwendbarkeitsbewertung – wie beispielsweise die bei der Konzeption einer klinischen Leistungsstudie beschriebene Methodik – trägt dazu bei, dass die klinischen Leistungsnachweise nicht nur statistisch fundiert, sondern auch klinisch aussagekräftig und im Sinne der IVDR prüfungsfähig sind.
Entwicklung von Belegen für die klinische Leistungsfähigkeit, die einer Überprüfung standhalten
Nachweise zur klinischen Leistungsfähigkeit sind nur dann stichhaltig, wenn sie eindeutig mit dem klinischen Behandlungsablauf und der Entscheidung verknüpft sind, zu der der Test beiträgt. Ein immer wiederkehrendes Problem bei Leistungsdossiers ist, dass Nachweise vorgelegt werden, ohne zu erläutern, wie das Ergebnis genutzt wird. Ein Screening-Test stellt andere Anforderungen an die Nachweisführung als ein Triage-Test; ein Überwachungstest stellt andere Anforderungen als ein diagnostischer Bestätigungstest.
Ein fundierter Ansatz beginnt damit, die Rolle des Tests zu klären:
- Welche klinische Entscheidung wird dadurch beeinflusst?
- Was passiert, wenn das Ergebnis positiv oder negativ ist?
- Welche Folgen haben falsch-positive und falsch-negative Ergebnisse?
- Welche Patientengruppen werden in der Praxis voraussichtlich getestet?
Sind diese Fragen geklärt, lassen sich Leistungsendpunkte leichter begründen. Kennzahlen zur diagnostischen Genauigkeit sind nicht nur statistische Werte, sondern stehen für Abwägungen. Der Sensitivität kann Vorrang eingeräumt werden, wenn eine nicht erkannte Erkrankung schwerwiegende Folgen hat. Der Spezifität kann Vorrang eingeräumt werden, wenn unnötige Eingriffe schwerwiegende Folgen haben. Vorhersagewerte gewinnen in Umgebungen mit geringer Prävalenz an Bedeutung, und eine stratifizierte Leistungsanalyse kann für wichtige Untergruppen gerechtfertigt sein, wenn sich in der klinischen Praxis signifikante Unterschiede zeigen.
Auch die Kontrolle von Verzerrungen spielt eine zentrale Rolle. Wenn bei der Patientenauswahl überproportional viele fortgeschrittene Fälle berücksichtigt werden, kann die Leistungsfähigkeit künstlich hoch erscheinen. Wenn sich die Referenzstandards zwischen den Standorten unterscheiden, können die Ergebnisse uneinheitlich ausfallen. Wird der Index-Test unter Kenntnis des Referenzstandards interpretiert, kann dies zu Verzerrungen führen. Eine fundierte Evidenzdarstellung berücksichtigt diese Risiken und erläutert, wie sie durch das Studiendesign gemindert werden.
Beweisführung nach der IVDR: Von „Wir haben Daten“ zu „Das reicht aus“
Eine der größten Herausforderungen bei der Leistungsbewertung gemäß der IVDR besteht darin, die Hinlänglichkeit der Nachweise zu begründen. Hersteller sind oft der Ansicht, dass umfangreiche Daten an sich schon überzeugend sein sollten, doch benannte Stellen beurteilen die Hinlänglichkeit unter anderen Gesichtspunkten: Übereinstimmung, Relevanz, Qualität und Begründung.
Die Hinlänglichkeit der Beweise wird im Kontext beurteilt. Zu den Faktoren, die häufig die Erwartungen an die Hinlänglichkeit beeinflussen, gehören:
- Risikoklasse und potenzieller Schaden durch fehlerhafte Ergebnisse
- Zweck und klinische Auswirkungen von Entscheidungen auf der Grundlage der Ergebnisse
- Komplexität des Tests und seine Auswertungsmöglichkeiten
- Verfügbarkeit alternativer Methoden und Versorgungsstandards
- Neuheit der Ansprüche bezüglich des Analyten oder der beabsichtigten Verwendung
- Die angegebene Bandbreite der Zielgruppen und Anwendungsbereiche
Hier erweist sich die MDCG-Leitlinie 2022-2 als besonders hilfreich, da sie den Gedanken bekräftigt, dass die Evidenzausreichendheit als fortlaufender Prozess begründet und aufrechterhalten werden muss. Zudem ermutigt sie die Hersteller implizit dazu, hinsichtlich der Einschränkungen Transparenz zu wahren und Unsicherheiten durch strukturierte Mechanismen nach dem Inverkehrbringen zu bewältigen.
Ein fundiertes PER enthält in der Regel eine ausdrückliche Begründung zur „Beweisführung“. Diese Begründung erläutert nicht nur, welche Nachweise vorliegen, sondern auch, warum diese für den beabsichtigten Zweck relevant und stichhaltig sind. Sie räumt ein, welche Aspekte die Nachweise nicht abdecken, und erläutert, wie die verbleibende Unsicherheit durch gezielte PMPF-Maßnahmen und die Überwachung nach dem Inverkehrbringen bewältigt wird.
In vielen Begutachtungen ist die Frage der Evidenzausreichendheit weit weniger umstritten, wenn sie transparent dargelegt wird und auf einer klaren regulatorischen Logik beruht. Wenn die Angaben angemessen abgegrenzt sind, die Endpunkte dem beabsichtigten klinischen Einsatz entsprechen, Einschränkungen anerkannt werden und Erkenntnisse aus der Nachmarktphase in das Evidenzsystem einfließen, wirkt die Begründung für die Evidenzausreichendheit schlüssig, vertretbar und im Verhältnis zum Verwendungszweck und Risiko des Produkts angemessen.
Marktüberwachung und PMPF: Die Leistungsfähigkeit langfristig nachweisen
Ein wesentliches Merkmal der IVDR ist ihre ausdrückliche Ausrichtung auf Nachweise über den gesamten Lebenszyklus. Medizinprodukte werden nicht nur beim Markteintritt bewertet; von ihnen wird erwartet, dass sie auch dann sicher und leistungsfähig bleiben, wenn sich die klinische Praxis, die Zielgruppen und die realen Anwendungsbedingungen weiterentwickeln. Aus diesem Grund ist die Überwachung nach dem Inverkehrbringen keine isolierte Aufgabe zur Einhaltung der Vorschriften. Sie ist Teil des Nachweissystems, das die Leistungsfähigkeit des Produkts nachweisbar sicherstellt.
Erkenntnisse aus der Zeit nach der Markteinführung können Probleme aufdecken, die in Studien vor der Markteinführung nicht vollständig vorhergesagt werden können, wie beispielsweise Veränderungen der Prävalenz, Unterschiede zwischen Patientengruppen, unerwartete Störfaktoren, Schwankungen im Nutzerverhalten, Leistungsschwankungen zwischen einzelnen Chargen sowie betriebliche Faktoren in Routinelabors. Ein ausgereiftes Evidenzsystem berücksichtigt dies und nutzt Mechanismen nach der Markteinführung, um diese Signale zu erkennen und zu interpretieren.
Der Rahmen für die Zeit nach dem Inverkehrbringen gemäß der IVDR umfasst eine strukturierte Planung der Marktüberwachung sowie gegebenenfalls Aktivitäten im Rahmen der Leistungsüberwachung nach dem Inverkehrbringen (PMPF). Bei der PMPF handelt es sich nicht einfach um „weitere Studien“. Es ist vielmehr eine gezielte Maßnahme zur Beantwortung spezifischer Fragen zur Leistungsfähigkeit, die nach der Bewertung vor dem Inverkehrbringen offen bleiben – Fragen, die sich auf klinische Untergruppen, Arbeitsabläufe in der Praxis, langfristige Trends oder die Ausweitung der Anwendungsbereiche beziehen können.
Die aussagekräftigsten Evidenzsysteme für den gesamten Lebenszyklus zeigen auf, wie Daten aus der Zeit nach dem Inverkehrbringen in die Leistungsbewertung einfließen. Dazu gehört, wie Signale erkannt, Trends bewertet und Schlussfolgerungen zur Leistung im Leistungsbewertungsbericht gemäß der IVDR aktualisiert werden. Diese Integration über den gesamten Lebenszyklus hinweg bildet den Kern der IVDR-Systeme PMS, PMPF und PSUR, in denen die Rückverfolgbarkeit von Evidenz zu einem praktischen Governance-Modell wird und nicht länger nur ein theoretisches Ideal bleibt.
Rückverfolgbarkeit: Die Funktion, die eine PER überprüfbar und für KI extrahierbar macht
Die Rückverfolgbarkeit ist einer der wichtigsten „stillen Erfolgsfaktoren“ im Rahmen der IVDR. Sie entscheidet darüber, ob ein Prüfer Ihrer Argumentation eindeutig folgen kann. Außerdem beeinflusst sie, wie gut KI-Suchwerkzeuge Ihre Inhalte extrahieren und zusammenfassen können: Klare Zusammenhänge zwischen Aussagen, Endpunkten, Belegen und Schlussfolgerungen erhöhen die „Antwortbereitschaft“.
Ein fundierter Leistungsbewertungsbericht (PER) macht die Nachvollziehbarkeit in der Regel nicht nur in Tabellen, sondern auch im Textteil sichtbar. Er erläutert:
- Der Verwendungszweck und der klinische Behandlungsablauf
- Die Ansprüche, die sich aus dem Verwendungszweck ergeben
- Die aus den Angaben abgeleiteten Endpunkte und Akzeptanzkriterien
- Die zur Untermauerung der einzelnen Endpunkte ausgewählten Evidenzquellen
- Die Bewertungslogik, die zur Gewichtung von Beweisen herangezogen wird
- Die aus dieser Bewertung abgeleiteten Schlussfolgerungen und Einschränkungen
- Die Mechanismen zur Überwachung und Aktualisierung der Leistungszuverlässigkeit nach der Markteinführung
Dieser Ansatz verringert den Aufwand bei der Überprüfung, da er „Lücken“ verhindert, die ein Prüfer sonst schließen müsste. Außerdem verbessert er die interne Governance: Wenn Nachweise nachvollziehbar sind, lassen sich Aktualisierungen besser bewältigen. Sie können genau feststellen, welche Aussage und welcher Endpunkt von neuen Informationen betroffen sind, und die Begründungen für die ausreichende Nachweiskraft entsprechend anpassen.
Organisationen, die die Rückverfolgbarkeit von Evidenz mit umfassenderen Verfahren zur klinischen und Leistungsbewertung verknüpfen, stellen häufig fest, dass Leistungsdaten im Laufe der Zeit an Nachhaltigkeit gewinnen. Der Schlüssel liegt darin, die Rückverfolgbarkeit als integralen Bestandteil des Evidenzsystems zu betrachten und nicht als nachträgliche Dokumentationsmaßnahme.
Häufige Fragen an benannte Stellen und wie fundierte Leistungsdaten diesen zuvorkommen
Benannte Stellen stellen häufig Fragen, die sich auf einige wenige vorhersehbare Bereiche konzentrieren. Ein fundiertes System zum Nachweis der Leistungsfähigkeit antizipiert diese Bereiche und geht proaktiv darauf ein.
Eine häufig gestellte Frage ist, ob die Studienpopulationen den vorgesehenen Anwendungszweck widerspiegeln. Erkenntnisse, die in einer begrenzten Population überzeugend erscheinen, rechtfertigen möglicherweise keine weitreichenden Aussagen. Eine weitere häufige Frage ist, ob der Referenzstandard angemessen ist und einheitlich angewendet wird; uneinheitliche Referenzstandards können die Glaubwürdigkeit der klinischen Leistungsfähigkeit untergraben, selbst wenn die Ergebnisse positiv erscheinen. Gutachter fragen zudem häufig, ob die Endpunkte den klinischen Nutzen widerspiegeln, d. h., ob die Leistungsmessgröße im vorgesehenen klinischen Entscheidungsprozess tatsächlich von Bedeutung ist.
Ein weiterer Bereich ist die Literaturverwertung. Benannte Stellen legen oft Wert auf eine kritische Bewertung der Literatur und nicht nur auf deren Zitierung. Sie möchten sehen, dass die Literatur relevant ist, dass deren Grenzen verstanden werden und dass Schlussfolgerungen nicht überbewertet werden. Dies steht im Einklang mit den in MDCG 2022-2 hervorgehobenen Grundsätzen zur Bewertung von Evidenz.
Schließlich wird die Planung für die Zeit nach der Markteinführung zunehmend genauer unter die Lupe genommen. Besteht Unsicherheit (was fast immer der Fall ist), erwarten die Prüfer einen angemessenen Plan, wie die Überwachung nach der Markteinführung und die PMPF diese Unsicherheit verringern und die Leistungsfähigkeit im Laufe der Zeit bestätigen werden. Ist die Steuerung der Nachmarkt-Evidenz kohärent, stärkt dies den gesamten PER, da dadurch gezeigt wird, dass das Vertrauen in die Leistungsfähigkeit kontinuierlich aufrechterhalten und nicht nur vorausgesetzt wird.
Fazit
Der EU-IVDR-Rahmen definiert die Leistungsbewertung neu als einen fortlaufenden Prozess und nicht als einmalige Dokumentationsmaßnahme. Von den Herstellern wird erwartet, dass sie nachweisen, dass Leistungsangaben wissenschaftlich fundiert, analytisch zuverlässig und klinisch aussagekräftig sind und dass diese Angaben auch angesichts des Fortschritts der wissenschaftlichen Erkenntnisse und der zunehmenden Verfügbarkeit von Daten aus der Praxis weiterhin vertretbar bleiben.
Ein fundierter Ansatz zur Leistungsbewertung gemäß IVDR basiert auf einer klaren Planung, einer schlüssigen Evidenzlogik und einer transparenten Rückverfolgbarkeit. Der Leistungsbewertungsplan bildet die methodische Grundlage, die den Verwendungszweck mit den Angaben, Endpunkten, Evidenzquellen und Bewertungsmethoden verknüpft. Der IVDR-Leistungsbewertungsbericht dient dann als Darstellung, die die Leistung belegt, die Hinlänglichkeit der Evidenz begründet, Einschränkungen anerkennt und erläutert, wie mit verbleibenden Unsicherheiten im Laufe der Zeit umgegangen wird.
Das Lernen nach der Markteinführung ist der letzte Baustein, der die Nachhaltigkeit von Leistungsnachweisen gewährleistet. Eine solide Überwachung nach der Markteinführung und gezielte PMPF-Maßnahmen machen die Leistungsbewertung zu einem lebendigen System, das die Leistung im Routineeinsatz bestätigt, aussagekräftige Trends erkennt und bei Bedarf angemessene Aktualisierungen der Nachweise und Schlussfolgerungen unterstützt. Wenn diese Elemente in eine kohärente Strategie für den gesamten Lebenszyklus integriert werden, ist die Leistungsbewertung mehr als nur eine Frage der Compliance: Sie wird zu einer tragfähigen Grundlage für das Vertrauen in diagnostische Ergebnisse und die Sicherheit bei der klinischen Entscheidungsfindung.
Wie Freyr helfen kann
Freyr unterstützt Hersteller von In-vitro-Diagnostika bei end-to-end – von der Festlegung des Verwendungszwecks über die Optimierung der Erstellung des Leistungsbewertungsplans bis hin zur Erstellung fundierter Leistungsbewertungsberichte, die den Erwartungen der benannten Stellen entsprechen. Darüber hinaus unterstützt Freyr Hersteller bei der Erstellung von MDR-konformen klinischen Bewertungsberichten (CERs) sowie bei der Entwicklung lebenszyklusbasierter klinischer Evidenzsysteme, die der Prüfung durch benannte Stellen standhalten.
Wenn Sie Unterstützung bei der Erhebung von Leistungsnachweisen, der Konzeption oder Bewertung von Studien, der Schließung von Evidenzlücken oder dem Aufbau eines nachvollziehbaren Evidenzsystems benötigen, das die Verpflichtungen im Bereich der Marktüberwachung, der postmarktbezogenen Sicherheitsüberwachung (PMPF) und der regelmäßigen Sicherheitsberichte (PSUR) integriert, wenden Sie sich an unsere Experten, die Sie in jeder Phase des IVDR-Evidenzzyklus begleiten.

Über den Autor
Dr. Radhika Ramachandran leitet das Global Regulatory Medical Writing Center of Excellence (CoE) bei Freyr Inc. und erstellt Zulassungsunterlagen sowie Strategien für globale Regulierungsrahmen im Bereich Medizinprodukte und In-vitro-Diagnostika (IVD). Mit über einem Jahrzehnt Erfahrung in den Bereichen Medizintechnik, klinische Forschung und Zulassungsstrategie ist sie auf die Entwicklung und Überprüfung von wirkungsvollen Zulassungsdokumenten spezialisiert, die den globalen Standards entsprechen, darunter EU MDR die EU-IVDR. Sie bietet MedTech-Unternehmen strategische Beratung und maßgeschneiderte Lösungen für das Verfassen von Zulassungsdokumenten und unterstützt sie bei Zulassungsanträgen und der Dokumentation des Produktlebenszyklus. Dr. Radhika hat einen Doktortitel in Biotechnologie und ist zertifizierte Medical Writerin, die an über 1.500 Zulassungsdokumenten mitgewirkt hat. Ihr aktueller Schwerpunkt liegt auf der Nutzung von künstlicher Intelligenz und digitaler Gesundheit zur Transformation des regulatorischen Medical Writing.
Häufig gestellte Fragen (FAQs)
Die Leistungsbewertung gemäß der EU-IVDR ist eine strukturierte wissenschaftliche Beurteilung, mit der nachgewiesen wird, dass die analytische Leistungsfähigkeit, die klinische Leistungsfähigkeit und die wissenschaftliche Validität eines In-vitro-Diagnostikums gemeinsam den Verwendungszweck des Produkts sowie die Einhaltung der allgemeinen Sicherheits- und Leistungsanforderungen stützen.
Nicht alle In-vitro-Diagnostika erfordern den gleichen Umfang an Leistungsstudien. Die IVD-Verordnung schreibt vor, dass die Nachweise zur analytischen und klinischen Leistungsfähigkeit in einem angemessenen Verhältnis zum Verwendungszweck und zur Risikoklasse des Produkts stehen müssen.
Das Q&A -Dokument MDCG 2025-5 enthält Erläuterungen zu Definitionen, Arten von IVDR-Leistungsstudien, Anwendbarkeitskriterien, den Aufgaben der Prüfer sowie zu den regulatorischen Anforderungen.
Die Leistungsbewertung gemäß der IVDR ist eine Verpflichtung, die sich über den gesamten Lebenszyklus erstreckt. Die Nachweise müssen aufbewahrt und entsprechend der Entwicklung der klinischen Praxis aktualisiert werden.