Umfassender Leitfaden zu den Anforderungen der IVDR an die Leistungsbewertung und den Leistungsnachweis

Lesezeit: 16 Minuten

Einleitung

Der Übergang zur EU-IVDR hat die Standards für den Leistungsnachweis für Hersteller von In-vitro-Diagnostika (IVD) auf praktische und zugleich tiefgreifende Weise grundlegend verändert. Unter der früheren IVDD stützte sich die Leistungsdokumentation häufig auf begrenzte Datensätze, unterschiedliche Studiendesigns und uneinheitliche Dokumentationspraktiken, die sich je nach Produkt und Markt stark voneinander unterschieden. Nach der EU-IVDR reichen solche Ansätze nur noch selten aus. Behörden und benannte Stellen erwarten von den Herstellern zunehmend, dass sie die Leistung anhand eines strukturierten, rückverfolgbaren und lebenszyklusbasierten Nachweissystems nachweisen, das einer wissenschaftlichen Überprüfung standhält und glaubwürdig bleibt, auch wenn die Produkte in unterschiedlichen Bevölkerungsgruppen, klinischen Umgebungen und unter sich weiterentwickelnden Versorgungsstandards eingesetzt werden.

Im Mittelpunkt dieses Rahmens steht die Leistungsbewertung gemäß der EU-IVDR: ein klar definierter, kontinuierlicher Prozess, der wissenschaftliche Validität, analytische Leistungsfähigkeit, klinische Leistungsfähigkeit und Erkenntnisse aus der Marktbeobachtung zu einer schlüssigen Evidenzdarstellung zusammenführt. Bei der Leistungsbewertung gemäß der IVDR geht es letztlich darum, eine Evidenzdarstellung zu erstellen, die wissenschaftlich fundiert, methodisch transparent und über den gesamten Lebenszyklus des Produkts hinweg nachhaltig ist. Ein vertretbarer Leistungsbewertungsbericht (PER) sollte wissenschaftliche Validität, analytische Leistung, klinische Leistung und Erkenntnisse aus dem Lebenszyklus klar zu einer einzigen schlüssigen Begründung für die Leistung und die Evidenzausreichendheit verknüpfen. In der Praxis bedeutet dies, die Generierung von Leistungsnachweisen mit einem einheitlichen Ansatz für die klinische und Leistungsbewertung in Einklang zu bringen, strenge Prinzipien der Studiendesigns wie Bias-Kontrolle und Endpunktwahl bei der Konzeption einer klinischen Leistungsstudie anzuwenden, Argumente zur Evidenzausreichendheit auf klinische IVDR-Evidenz zu stützen und sicherzustellen, dass das Vertrauen in die Lebenszyklusleistung durch IVDR-PMS, PMPF und PSUR aufrechterhalten wird.

Was bedeutet Leistungsbewertung im Rahmen der IVDR?

Gemäß der IVDR ist die Leistungsbewertung nicht lediglich die Durchführung von Studien und die Zusammenstellung der Ergebnisse. Es handelt sich um einen strukturierten Prozess, der in Anhang XIII beschrieben ist und nachweist, dass die Ergebnisse des Produkts wissenschaftlich relevant, analytisch zuverlässig und für den angegebenen Verwendungszweck klinisch aussagekräftig sind. Der Rahmen der IVDR stützt sich auf drei miteinander verknüpfte Säulen:

Wissenschaftliche Validität, die den Zusammenhang zwischen dem Analyten (oder Marker) und dem klinischen Befund oder physiologischen Zustand belegt.
Analytische Leistungsfähigkeit, die belegt und bestätigt, dass das Gerät den Analyten unter den vorgesehenen Einsatzbedingungen zuverlässig messen oder nachweisen kann.
Klinische Leistungsfähigkeit, die belegt, dass das Ergebnis mit einem klinischen Zustand oder Ergebnis in der Zielpopulation und im vorgesehenen klinischen Umfeld korreliert.

Ein wichtiger praktischer Aspekt ist, dass diese Säulen keine isolierten Kontrollpunkte sind. Eine fundierte Leistungsbewertung gemäß IVDR zeigt eindeutig auf, wie sie zusammenwirken. Die wissenschaftliche Validität erklärt, warum der Analyt klinisch relevant ist, die analytische Leistungsfähigkeit erklärt, wie gut er gemessen werden kann, und die klinische Leistungsfähigkeit erklärt, was das Ergebnis in der klinischen Praxis bedeutet. Wenn diese Elemente aufeinander abgestimmt sind, bilden die Leistungsnachweise eine klare und glaubwürdige Darstellung. Sind sie hingegen fragmentiert oder inkonsistent begründet, wirken die Nachweise oft wie ein Flickenteppich, der eher Fragen seitens der benannten Stelle hervorruft.

Aus diesem Grund ist eine frühzeitige Planung so wichtig. Überzeugende Leistungsnachweise ergeben sich nicht aus der Menge der gesammelten Daten, sondern aus einer durchdachten Konzeption. Am Anfang steht eine präzise Definition des angestrebten Zwecks, gefolgt von einer klaren Zuordnung der Leistungsaussagen zu Endpunkten und der Abstimmung dieser Endpunkte auf geeignete Evidenzquellen und Studiendesigns. Dieser strukturierte Ansatz, der das Kernstück eines soliden Leistungsbewertungsplans (PEP) bildet, verringert Unstimmigkeiten, verbessert die Nachvollziehbarkeit und unterstützt die Erstellung eines fundierten Leistungsbewertungsberichts.

Warum die IVDR die Messlatte höher legt: Die regulatorische Absicht hinter dem Begriff „ausreichende Nachweise“

Die höheren Anforderungen der IVDR an die Evidenz beruhen auf einer einfachen politischen Realität. Die Ergebnisse von In-vitro-Diagnostika beeinflussen klinische Entscheidungen, und fehlerhafte oder unzuverlässige Ergebnisse können zu Fehldiagnosen, verzögerten Behandlungen, unnötigen Eingriffen oder verpassten Behandlungsmöglichkeiten führen. Die IVDR begegnet dieser seit langem bestehenden Variabilität, indem sie stärkeren Wert auf die Qualität und Hinlänglichkeit der Evidenz sowie auf die Kontinuität über den gesamten Lebenszyklus legt.

Der Begriff „ausreichend“ stellt den entscheidenden Wandel dar. Nach der IVDR reicht es nicht aus, lediglich nachzuweisen, dass Beweise vorliegen. Die Hersteller müssen nachweisen, dass die Beweise in Bezug auf Qualität, Quantität und Relevanz ausreichend sind, um den Verwendungszweck und die Angaben in der Kennzeichnung, der Gebrauchsanweisung und den Marketingunterlagen zu untermauern. Diese Beurteilung der Ausreichendheit erfolgt kontextabhängig. Ein In-vitro-Diagnostikum, das als Grundlage für klinische Entscheidungen mit erheblichen Auswirkungen dient, wird in der Regel höheren Erwartungen unterliegen als ein Produkt mit geringeren Auswirkungen, und Produkte in höheren Risikoklassen werden einer strengeren Prüfung unterzogen.

Dies ist ein Grund, warum in Diskussionen über die Evidenz im Rahmen der IVDR häufig auf die Leitlinie MDCG 2022-2 Bezug genommen wird. Sie hebt Grundsätze zur Evidenzgewinnung und -bewertung hervor, die methodische Transparenz und eine klare Begründung für die Hinlänglichkeit fördern. Zudem bekräftigt sie das Konzept, dass Evidenz im Laufe der Zeit gepflegt wird und nicht zum Zeitpunkt der CE-Kennzeichnung „eingefroren“ wird.

Für viele Hersteller besteht die praktische Erkenntnis darin, dass eine erfolgreiche IVDR-Einreichung von einer Evidenzbasis abhängt, bei der es ebenso sehr um die Argumentation wie um die Ergebnisse geht. Benannte Stellen achten in der Regel auf eine stichhaltige Argumentation: Warum diese Evidenz, warum diese Endpunkte, warum diese Populationen, warum diese Vergleichsgruppen und warum reicht dies angesichts des Verwendungszwecks und der Risikoklasse aus? Diese Argumentation bildet den Kern eines stichhaltigen IVDR-Leistungsbewertungsberichts.

Das Lebenszyklusmodell: Leistungsnachweise als lebendiges System

Ein weit verbreiteter Irrtum ist, dass die Leistungsbewertung mit der Erstellung des Berichts endet. Nach der IVDR ist dies nicht der Fall. Die Leistungsbewertung erstreckt sich über den gesamten Lebenszyklus des Produkts, und das System zur Leistungsnachweisführung muss in der Lage sein, sich an neue Informationen anzupassen.

Das Lebenszyklusmodell lässt sich als sich wiederholender Kreislauf verstehen:

Die Strategie zur Beweissicherung planen und die Methodik festlegen.
Erbringen Sie Belege hinsichtlich wissenschaftlicher Validität, analytischer Leistungsfähigkeit und klinischer Leistungsfähigkeit.
Bewerten Sie die Qualität der Evidenz, das Verzerrungsrisiko und die Relevanz.
Die Erkenntnisse sollen unter Wahrung der Rückverfolgbarkeit und mit klaren Schlussfolgerungen in den PER einfließen.
Überwachen Sie die Leistung in der Praxis durch Marktüberwachung und Leistungsnachverfolgung nach dem Inverkehrbringen (PMPF).
Aktualisieren Sie bei Bedarf die Belege, Aussagen und Schlussfolgerungen.

In diesem Zusammenhang ist der Leistungsbewertungsplan (PEP) weit mehr als nur eine formale Anforderung der IVDR. Ein gut konzipierter PEP stellt klar, was für ein bestimmtes Produkt als „ausreichende“ und angemessene Evidenz gilt, und schafft einen Rahmen für die Steuerung, wie neue Daten im Laufe der Zeit generiert, bewertet und integriert werden. Er fördert zudem die interne Abstimmung und ermöglicht es den Teams aus den Bereichen Zulassung, Klinik, Forschung und Entwicklung,RA sowie Post-Market, auf der Grundlage eines gemeinsamen Evidenzkonzepts zu arbeiten.

Ein ausgereiftes Lebenszyklusmodell fügt sich zudem nahtlos in die klinische Bewertung und Leistungsbewertung als übergreifende Disziplin ein. Viele Organisationen stellen fest, dass sich die Leistungsbewertung deutlich verbessert, wenn sie als funktionsübergreifender Prozess der Evidenz-Governance und nicht als isolierte Dokumentationsaufgabe behandelt wird. Wenn die Evidenz-Governance in den Lebenszyklus eingebettet ist, lässt sich das PER leichter pflegen, Audits lassen sich einfacher unterstützen, und die Interaktionen mit benannten Stellen verlaufen in der Regel vorhersehbarer.

Erstellung eines fundierten Leistungsbewertungsplans

Der Leistungsbewertungsplan (PEP) bildet die Grundlage für die Nachvollziehbarkeit. Er legt den Umfang fest, definiert die Quellen für die Nachweise und erläutert, wie diese bewertet werden. Bei vielen Bewertungen zeigt sich der Unterschied zwischen einer reibungslosen und einer schwierigen Überprüfung bereits im Plan: Ein solider Plan sorgt für Kohärenz; ein schwacher Plan zwingt den Prüfer dazu, Logik zu erschließen, die eigentlich explizit hätte dargelegt werden müssen.

Ein fundierter Plan legt in der Regel den Verwendungszweck des Produkts in praktischer Hinsicht dar. Dazu gehören die Zielgruppe, die Zielpatientengruppe, der vorgesehene klinische Kontext, die Probenarten sowie die Rolle des Tests im klinischen Ablauf (Screening, Diagnose, Triage, Überwachung, Prognose usw.). Anschließend werden die zu belegenden Leistungsangaben aufgeführt und jede Angabe den entsprechenden Evidenzquellen zugeordnet.

Der Plan sollte zudem festlegen, wie die Nachweise bewertet werden. Benannte Stellen akzeptieren selten die Aussage „es liegen Nachweise vor“, ohne dass die „Qualität der Nachweise“ klar erläutert wird. Indem im Plan festgelegt wird, wie die Qualität der Studien bewertet, wie Verzerrungen berücksichtigt und wie Einschränkungen interpretiert werden, wird methodische Stringenz demonstriert und die Stichhaltigkeit des abschließenden Leistungsbewertungsberichts gestärkt.

Schließlich sollte der Plan darlegen, wie Erkenntnisse aus der Zeit nach dem Inverkehrbringen einbezogen werden. Eine der wesentlichsten Neuerungen der IVDR ist die Erkenntnis, dass nicht davon ausgegangen werden kann, dass die Leistung allein aufgrund positiver Daten aus der Phase vor dem Inverkehrbringen stabil bleibt. Ein solider Plan legt dar, wie die Marktüberwachung und die Leistungsnachverfolgung nach dem Inverkehrbringen (PMPF) die Leistung im realen Einsatz bestätigen werden und wie diese Erkenntnisse in die laufende Bewertung und Dokumentation einfließen werden

Wie sieht ein fundierter Leistungsbeurteilungsbericht aus?

Ein stichhaltiger Leistungsbewertungsbericht (PER) gemäß der EU-IVDR ist nicht bloß eine Zusammenstellung von Studien. Es handelt sich um eine strukturierte, wissenschaftlich fundierte Darstellung, die die Leistung nachweist, die Hinlänglichkeit der Nachweise begründet und erläutert, wie die Leistung im Laufe der Zeit überwacht und aufrechterhalten wird.

Ein hochwertiger IVDR-Leistungsbewertungsbericht ermöglicht es einem Prüfer, mit minimalem Interpretationsaufwand folgende Fragen zu beantworten:

Wozu ist das Gerät bestimmt und in welchem klinischen Kontext wird es eingesetzt?
Auf welcher wissenschaftlichen Grundlage beruht der Zusammenhang zwischen dem Analyten und dem klinischen Befund?
Wie zuverlässig arbeitet das Gerät unter den vorgesehenen Einsatzbedingungen?
Inwieweit zeigt das Produkt in der Zielpopulation eine klinische Wirksamkeit?
Inwiefern stützen die wissenschaftlichen Erkenntnisse die jeweilige Behauptung, und welche Einschränkungen bestehen?
Warum reichen die Nachweise für den Verwendungszweck und die Risikoklassifizierung des Produkts aus?
Wie tragen die Marktüberwachung und die Nachverfolgung der Leistungsfähigkeit nach dem Inverkehrbringen dazu bei, das Vertrauen in die Leistungsfähigkeit langfristig aufrechtzuerhalten?

Beabsichtigter Zweck als „Linse“ für alle Beweise

Einer der häufigsten Gründe, warum Leistungsnachweise schwer zu rechtfertigen sind, besteht darin, dass der Verwendungszweck auf einer allgemeinen Ebene beschrieben wird, während die Studien einen engeren oder anderen Kontext widerspiegeln. So verhält sich beispielsweise ein Test, der bei einer symptomatischen Population eingesetzt wird, anders als derselbe Test im Rahmen von Vorsorgeuntersuchungen. Unterschiede in der Krankheitsprävalenz, im Patientenspektrum, in den Vorhersagewerten und im Referenzstandard können zu unterschiedlichen Ergebnissen führen. Ein vertretbarer PER antizipiert diese Probleme, indem er den Verwendungszweck explizit darlegt und sicherstellt, dass die unterstützenden Nachweise mit diesem Verwendungszweck übereinstimmen.

Wissenschaftliche Validität als strukturiertes Argument

Wissenschaftliche Validität wird oft als eine Sammlung von Referenzen dargestellt, doch gemäß der IVDR soll sie als strukturierte und fundierte Argumentation fungieren. Sie sollte belegen, dass der Analyt in einem sinnvollen Zusammenhang mit der relevanten klinischen Erkrankung steht und dass dieser Zusammenhang den angegebenen Verwendungszweck des Produkts stützt.Die überzeugendsten Abschnitte zur wissenschaftlichen Validität stützen sich auf hochwertige Quellen wie klinische Leitlinien, Konsenserklärungen und peer-reviewte Übersichtsarbeiten, anstatt sich ausschließlich auf einzelne Studien zu stützen. Sie verdeutlichen zudem die Relevanz: warum die Evidenz für die Zielpopulation und den Verwendungszweck gilt.

Wenn die wissenschaftliche Fundiertheit schwach oder nur allgemein gehalten ist, fragen die benannten Stellen häufig, ob der Verwendungszweck des Produkts im Vergleich zum aktuellen Stand der Wissenschaft überbewertet ist. Aus diesem Grund ist es sinnvoll, die Argumentation zur wissenschaftlichen Fundiertheit an anerkannten Grundsätzen auszurichten, wie sie beispielsweise in MDCG 2022-2 beschrieben sind.

Analytische Leistungsfähigkeit als Zuverlässigkeit unter realen Bedingungen

Analytische Leistungsfähigkeit bedeutet, dass die Leistungsfähigkeit in messbare und wiederholbare Ergebnisse umgesetzt wird. Sie ist auch der Punkt, an dem das Studiendesign die routinemäßigen Anwendungsbedingungen realistisch widerspiegeln muss, einschließlich der Variabilität bei der Probenentnahme und -handhabung, von Umweltfaktoren, bedienerabhängigen Effekten (sofern zutreffend), Chargenschwankungen, potenziellen Störsubstanzen und der zeitlichen Drift der Messgeräte. Ein fundierter PER beschreibt nicht nur die Ergebnisse, sondern auch die Logik, die die analytischen Designs mit den vorgesehenen Anwendungsbedingungen verbindet.

Analytische Abschnitte gewinnen zudem an Aussagekraft, wenn sie einen Bezug zum Risikomanagement und zur Kennzeichnung herstellen. Bestehen bestimmte Einschränkungen, beispielsweise eine verminderte Leistungsfähigkeit bei Vorhandensein eines Störstoffs, wird die Nachvollziehbarkeit verbessert, wenn im PER erläutert wird, wie mit dieser Einschränkung umgegangen wird (Warnhinweise, Gebrauchsanweisungen, Akzeptanzkriterien, Qualitätskontrollmaßnahmen).

Die klinische Leistung als Test für die klinische Glaubwürdigkeit

Die klinische Leistungsfähigkeit ist für viele In-vitro-Diagnostika (IVD) der am stärksten unter die Lupe genommene Aspekt, da sie darüber entscheidet, ob ein Testergebnis im vorgesehenen Kontext einen aussagekräftigen Zusammenhang mit einem klinischen Zustand oder Ergebnis aufweist. Die zentrale Herausforderung besteht darin, dass die klinische Leistungsfähigkeit überbewertet werden kann, wenn das Studiendesign Verzerrungen mit sich bringt oder wenn Referenzstandards nicht korrekt angewendet werden. Aus diesem Grund sind die Verzerrungskontrolle, die Auswahl der Endpunkte und die Begründung der Referenzstandards von zentraler Bedeutung für eine fundierte klinische Evidenz.

Wenn es bei Nachweisen zur klinischen Leistungsfähigkeit um die diagnostische Genauigkeit geht, bietet QUADAS-2 einen nützlichen Ansatz. Dabei handelt es sich um ein häufig verwendetes Instrument zur Bewertung des Verzerrungspotenzials und der Anwendbarkeit in Studien zur diagnostischen Genauigkeit. QUADAS-2 konzentriert sich nicht darauf, ob die Ergebnisse positiv sind, sondern darauf, ob sie glaubwürdig sind. Eine zuverlässige Übersicht ist über QUADAS-2 (Universität Bristol) verfügbar. Hersteller müssen QUADAS-2 nicht als regulatorische Anforderung betrachten, doch ein Verständnis davon hilft dabei, die Studienberichterstattung an den Vorstellungen der Gutachter hinsichtlich der Glaubwürdigkeit auszurichten.

Diese Überlegungen werden besonders wichtig, wenn klinische Leistungsergebnisse in vertretbare regulatorische Schlussfolgerungen übersetzt werden, da Designentscheidungen direkt beeinflussen, wie Prüfer die Glaubwürdigkeit und Anwendbarkeit interpretieren. Ein strukturierter Ansatz zur Bias-Kontrolle, Endpunktauswahl, Begründung des Referenzstandards und Anwendbarkeitsbewertung, wie die in der Gestaltung einer klinischen Leistungsstudie beschriebene Methodik, trägt dazu bei, dass klinische Leistungsnachweise nicht nur statistisch fundiert, sondern auch klinisch bedeutsam und gemäß IVDR prüfbereit sind.

Entwicklung von Belegen für die klinische Leistungsfähigkeit, die einer Überprüfung standhalten

Nachweise zur klinischen Leistungsfähigkeit sind nur dann stichhaltig, wenn sie eindeutig mit dem klinischen Behandlungsablauf und der Entscheidung verknüpft sind, zu der der Test beiträgt. Ein immer wiederkehrendes Problem bei Leistungsdossiers ist, dass Nachweise vorgelegt werden, ohne zu erläutern, wie das Ergebnis genutzt wird. Ein Screening-Test stellt andere Anforderungen an die Nachweisführung als ein Triage-Test; ein Überwachungstest stellt andere Anforderungen als ein diagnostischer Bestätigungstest.

Ein fundierter Ansatz beginnt damit, die Rolle des Tests zu klären:

Welche klinische Entscheidung wird dadurch beeinflusst?
Was passiert, wenn das Ergebnis positiv oder negativ ist?
Welche Folgen haben falsch-positive und falsch-negative Ergebnisse?
Welche Patientengruppen werden in der Praxis voraussichtlich getestet?

Sind diese Fragen geklärt, lassen sich Leistungsendpunkte leichter begründen. Kennzahlen zur diagnostischen Genauigkeit sind nicht nur statistische Werte, sondern stehen für Abwägungen. Der Sensitivität kann Vorrang eingeräumt werden, wenn eine nicht erkannte Erkrankung schwerwiegende Folgen hat. Der Spezifität kann Vorrang eingeräumt werden, wenn unnötige Eingriffe schwerwiegende Folgen haben. Vorhersagewerte gewinnen in Umgebungen mit geringer Prävalenz an Bedeutung, und eine stratifizierte Leistungsanalyse kann für wichtige Untergruppen gerechtfertigt sein, wenn sich in der klinischen Praxis signifikante Unterschiede zeigen.

Auch die Kontrolle von Verzerrungen spielt eine zentrale Rolle. Wenn bei der Patientenauswahl überproportional viele fortgeschrittene Fälle berücksichtigt werden, kann die Leistungsfähigkeit künstlich hoch erscheinen. Wenn sich die Referenzstandards zwischen den Standorten unterscheiden, können die Ergebnisse uneinheitlich ausfallen. Wird der Index-Test unter Kenntnis des Referenzstandards interpretiert, kann dies zu Verzerrungen führen. Eine fundierte Evidenzdarstellung berücksichtigt diese Risiken und erläutert, wie sie durch das Studiendesign gemindert werden.

Beweisführung nach der IVDR: Von „Wir haben Daten“ zu „Das reicht aus“

Eine der größten Herausforderungen bei der Leistungsbewertung gemäß der IVDR besteht darin, die Hinlänglichkeit der Nachweise zu begründen. Hersteller sind oft der Ansicht, dass umfangreiche Daten an sich schon überzeugend sein sollten, doch benannte Stellen beurteilen die Hinlänglichkeit unter anderen Gesichtspunkten: Übereinstimmung, Relevanz, Qualität und Begründung.

Die Hinlänglichkeit der Beweise wird im Kontext beurteilt. Zu den Faktoren, die häufig die Erwartungen an die Hinlänglichkeit beeinflussen, gehören:

Risikoklasse und potenzieller Schaden durch fehlerhafte Ergebnisse
Zweck und klinische Auswirkungen von Entscheidungen auf der Grundlage der Ergebnisse
Komplexität des Tests und seine Auswertungsmöglichkeiten
Verfügbarkeit alternativer Methoden und Versorgungsstandards
Neuheit der Ansprüche bezüglich des Analyten oder der beabsichtigten Verwendung
Die angegebene Bandbreite der Zielgruppen und Anwendungsbereiche

Hier erweist sich die MDCG-Leitlinie 2022-2 als besonders hilfreich, da sie den Gedanken bekräftigt, dass die Evidenzausreichendheit als fortlaufender Prozess begründet und aufrechterhalten werden muss. Zudem ermutigt sie die Hersteller implizit dazu, hinsichtlich der Einschränkungen Transparenz zu wahren und Unsicherheiten durch strukturierte Mechanismen nach dem Inverkehrbringen zu bewältigen.

Ein fundiertes PER enthält in der Regel eine ausdrückliche Begründung zur „Beweisführung“. Diese Begründung erläutert nicht nur, welche Nachweise vorliegen, sondern auch, warum diese für den beabsichtigten Zweck relevant und stichhaltig sind. Sie räumt ein, welche Aspekte die Nachweise nicht abdecken, und erläutert, wie die verbleibende Unsicherheit durch gezielte PMPF-Maßnahmen und die Überwachung nach dem Inverkehrbringen bewältigt wird.

In vielen Überprüfungen werden ausreichende Nachweise weitaus weniger umstritten, wenn sie transparent dargelegt und auf einer klaren regulatorischen Logik basieren. Wenn Behauptungen angemessen formuliert sind, Endpunkte dem beabsichtigten klinischen Verwendungszweck entsprechen, Einschränkungen anerkannt werden und Erkenntnisse aus der Marktbeobachtung in das Nachweissystem integriert werden, liest sich die Begründung der ausreichenden Nachweise als kohärent, vertretbar und verhältnismäßig zum beabsichtigten Zweck und Risiko des Produkts.

Marktüberwachung und PMPF: Die Leistungsfähigkeit langfristig nachweisen

Ein wesentliches Merkmal der IVDR ist ihre ausdrückliche Ausrichtung auf Nachweise über den gesamten Lebenszyklus. Medizinprodukte werden nicht nur beim Markteintritt bewertet; von ihnen wird erwartet, dass sie auch dann sicher und leistungsfähig bleiben, wenn sich die klinische Praxis, die Zielgruppen und die realen Anwendungsbedingungen weiterentwickeln. Aus diesem Grund ist die Überwachung nach dem Inverkehrbringen keine isolierte Aufgabe zur Einhaltung der Vorschriften. Sie ist Teil des Nachweissystems, das die Leistungsfähigkeit des Produkts nachweisbar sicherstellt.

Erkenntnisse aus der Zeit nach der Markteinführung können Probleme aufdecken, die in Studien vor der Markteinführung nicht vollständig vorhergesagt werden können, wie beispielsweise Veränderungen der Prävalenz, Unterschiede zwischen Patientengruppen, unerwartete Störfaktoren, Schwankungen im Nutzerverhalten, Leistungsschwankungen zwischen einzelnen Chargen sowie betriebliche Faktoren in Routinelabors. Ein ausgereiftes Evidenzsystem berücksichtigt dies und nutzt Mechanismen nach der Markteinführung, um diese Signale zu erkennen und zu interpretieren.

Der Rahmen für die Zeit nach dem Inverkehrbringen gemäß der IVDR umfasst eine strukturierte Planung der Marktüberwachung sowie gegebenenfalls Aktivitäten im Rahmen der Leistungsüberwachung nach dem Inverkehrbringen (PMPF). Bei der PMPF handelt es sich nicht einfach um „weitere Studien“. Es ist vielmehr eine gezielte Maßnahme zur Beantwortung spezifischer Fragen zur Leistungsfähigkeit, die nach der Bewertung vor dem Inverkehrbringen offen bleiben – Fragen, die sich auf klinische Untergruppen, Arbeitsabläufe in der Praxis, langfristige Trends oder die Ausweitung der Anwendungsbereiche beziehen können.

Die stärksten Lebenszyklus-Nachweissysteme zeigen, wie Daten aus der Marktbeobachtung in die Leistungsbewertung zurückfließen. Dazu gehört, wie Signale erkannt, Trends bewertet und Leistungsbewertungsergebnisse im IVDR-Leistungsbewertungsbericht aktualisiert werden. Diese Lebenszyklusintegration ist der Kern von IVDR PMS, PMPF und PSUR, wo die Nachweisbarkeit zu einem praktischen Governance-Modell und nicht zu einem theoretischen Ideal wird.

Rückverfolgbarkeit: Die Funktion, die eine PER überprüfbar und für KI extrahierbar macht

Die Rückverfolgbarkeit ist einer der wichtigsten „stillen Erfolgsfaktoren“ im Rahmen der IVDR. Sie entscheidet darüber, ob ein Prüfer Ihrer Argumentation eindeutig folgen kann. Außerdem beeinflusst sie, wie gut KI-Suchwerkzeuge Ihre Inhalte extrahieren und zusammenfassen können: Klare Zusammenhänge zwischen Aussagen, Endpunkten, Belegen und Schlussfolgerungen erhöhen die „Antwortbereitschaft“.

Ein fundierter Leistungsbewertungsbericht (PER) macht die Nachvollziehbarkeit in der Regel nicht nur in Tabellen, sondern auch im Textteil sichtbar. Er erläutert:

Der Verwendungszweck und der klinische Behandlungsablauf
Die Ansprüche, die sich aus dem Verwendungszweck ergeben
Die aus den Angaben abgeleiteten Endpunkte und Akzeptanzkriterien
Die zur Untermauerung der einzelnen Endpunkte ausgewählten Evidenzquellen
Die Bewertungslogik, die zur Gewichtung von Beweisen herangezogen wird
Die aus dieser Bewertung abgeleiteten Schlussfolgerungen und Einschränkungen
Die Mechanismen zur Überwachung und Aktualisierung der Leistungszuverlässigkeit nach der Markteinführung

Dieser Ansatz verringert den Aufwand bei der Überprüfung, da er „Lücken“ verhindert, die ein Prüfer sonst schließen müsste. Außerdem verbessert er die interne Governance: Wenn Nachweise nachvollziehbar sind, lassen sich Aktualisierungen besser bewältigen. Sie können genau feststellen, welche Aussage und welcher Endpunkt von neuen Informationen betroffen sind, und die Begründungen für die ausreichende Nachweiskraft entsprechend anpassen.

Organisationen, die die Nachweisbarkeit mit umfassenderen Praktiken der klinischen und Leistungsbewertung in Einklang bringen, stellen oft fest, dass Leistungsnachweise im Laufe der Zeit nachhaltiger werden. Der Schlüssel liegt darin, die Nachweisbarkeit als Designmerkmal des Nachweissystems zu behandeln und nicht als nachträgliche Dokumentationsaktivität.

Häufige Fragen an benannte Stellen und wie fundierte Leistungsdaten diesen zuvorkommen

Benannte Stellen stellen häufig Fragen, die sich auf einige wenige vorhersehbare Bereiche konzentrieren. Ein fundiertes System zum Nachweis der Leistungsfähigkeit antizipiert diese Bereiche und geht proaktiv darauf ein.

Eine häufig gestellte Frage ist, ob die Studienpopulationen den vorgesehenen Anwendungszweck widerspiegeln. Erkenntnisse, die in einer begrenzten Population überzeugend erscheinen, rechtfertigen möglicherweise keine weitreichenden Aussagen. Eine weitere häufige Frage ist, ob der Referenzstandard angemessen ist und einheitlich angewendet wird; uneinheitliche Referenzstandards können die Glaubwürdigkeit der klinischen Leistungsfähigkeit untergraben, selbst wenn die Ergebnisse positiv erscheinen. Gutachter fragen zudem häufig, ob die Endpunkte den klinischen Nutzen widerspiegeln, d. h., ob die Leistungsmessgröße im vorgesehenen klinischen Entscheidungsprozess tatsächlich von Bedeutung ist.

Ein weiterer Bereich ist die Literaturverwertung. Benannte Stellen legen oft Wert auf eine kritische Bewertung der Literatur und nicht nur auf deren Zitierung. Sie möchten sehen, dass die Literatur relevant ist, dass deren Grenzen verstanden werden und dass Schlussfolgerungen nicht überbewertet werden. Dies steht im Einklang mit den in MDCG 2022-2 hervorgehobenen Grundsätzen zur Bewertung von Evidenz.

Schließlich wird die Planung für die Zeit nach der Markteinführung zunehmend genauer unter die Lupe genommen. Besteht Unsicherheit (was fast immer der Fall ist), erwarten die Prüfer einen angemessenen Plan, wie die Überwachung nach der Markteinführung und die PMPF diese Unsicherheit verringern und die Leistungsfähigkeit im Laufe der Zeit bestätigen werden. Ist die Steuerung der Nachmarkt-Evidenz kohärent, stärkt dies den gesamten PER, da dadurch gezeigt wird, dass das Vertrauen in die Leistungsfähigkeit kontinuierlich aufrechterhalten und nicht nur vorausgesetzt wird.

Fazit

Der EU-IVDR-Rahmen definiert die Leistungsbewertung neu als einen fortlaufenden Prozess und nicht als einmalige Dokumentationsmaßnahme. Von den Herstellern wird erwartet, dass sie nachweisen, dass Leistungsangaben wissenschaftlich fundiert, analytisch zuverlässig und klinisch aussagekräftig sind und dass diese Angaben auch angesichts des Fortschritts der wissenschaftlichen Erkenntnisse und der zunehmenden Verfügbarkeit von Daten aus der Praxis weiterhin vertretbar bleiben.

Ein fundierter Ansatz zur Leistungsbewertung gemäß IVDR basiert auf einer klaren Planung, einer schlüssigen Evidenzlogik und einer transparenten Rückverfolgbarkeit. Der Leistungsbewertungsplan bildet die methodische Grundlage, die den Verwendungszweck mit den Angaben, Endpunkten, Evidenzquellen und Bewertungsmethoden verknüpft. Der IVDR-Leistungsbewertungsbericht dient dann als Darstellung, die die Leistung belegt, die Hinlänglichkeit der Evidenz begründet, Einschränkungen anerkennt und erläutert, wie mit verbleibenden Unsicherheiten im Laufe der Zeit umgegangen wird.

Das Lernen nach der Markteinführung ist der letzte Baustein, der die Nachhaltigkeit von Leistungsnachweisen gewährleistet. Eine solide Überwachung nach der Markteinführung und gezielte PMPF-Maßnahmen machen die Leistungsbewertung zu einem lebendigen System, das die Leistung im Routineeinsatz bestätigt, aussagekräftige Trends erkennt und bei Bedarf angemessene Aktualisierungen der Nachweise und Schlussfolgerungen unterstützt. Wenn diese Elemente in eine kohärente Strategie für den gesamten Lebenszyklus integriert werden, ist die Leistungsbewertung mehr als nur eine Frage der Compliance: Sie wird zu einer tragfähigen Grundlage für das Vertrauen in diagnostische Ergebnisse und die Sicherheit bei der klinischen Entscheidungsfindung.

Wie Freyr helfen kann

Freyr unterstützt IVD-Hersteller bei der End-to-End-Leistungsbewertung, von der Definition des Verwendungszwecks und der Stärkung der Entwicklung des Leistungsbewertungsplans bis zur Erstellung vertretbarer Leistungsbewertungsberichte, die den Erwartungen der Benannten Stellen entsprechen. Darüber hinaus unterstützt Freyr Hersteller bei der Entwicklung von MDR-konformen klinischen Bewertungsberichten (CERs) und lebenszyklusbasierten klinischen Nachweissystemen, die der Prüfung durch Benannte Stellen standhalten.

Wenn Sie Unterstützung bei der Erhebung von Leistungsnachweisen, der Konzeption oder Bewertung von Studien, der Schließung von Evidenzlücken oder dem Aufbau eines nachvollziehbaren Evidenzsystems benötigen, das die Verpflichtungen im Bereich der Marktüberwachung, der postmarktbezogenen Sicherheitsüberwachung (PMPF) und der regelmäßigen Sicherheitsberichte (PSUR) integriert, wenden Sie sich an unsere Experten, die Sie in jeder Phase des IVDR-Evidenzzyklus begleiten.

Über den Autor

Dr. Radhika Ramachandran leitet das Global Regulatory Medical Writing Center of Excellence (CoE) bei Freyr Inc. und erstellt regulatorische Dokumentationen und Strategien für Medizinprodukte und In-vitro-Diagnostika (IVD) im Rahmen globaler regulatorischer Vorschriften. Mit über einem Jahrzehnt Erfahrung in MedTech, klinischer Forschung und regulatorischer Strategie ist sie spezialisiert auf die Entwicklung und Überprüfung von wirkungsvollen regulatorischen Dokumenten, die globalen Standards, einschließlich EU MDR und EU IVDR, entsprechen. Sie bietet MedTech-Unternehmen strategische Beratung und maßgeschneiderte Lösungen für das regulatorische Schreiben an und unterstützt sie bei regulatorischen Einreichungen und der Lebenszyklusdokumentation. Dr. Radhika hat einen Doktortitel in Biotechnologie und ist eine zertifizierte medizinische Autorin mit Beiträgen zu über 1.500 regulatorischen Dokumenten. Ihr aktueller Schwerpunkt liegt auf der Nutzung von künstlicher Intelligenz und digitaler Gesundheit zur Transformation des regulatorischen medizinischen Schreibens.

Blog-Tags

EU IVDR (2017/746)Leistungsbewertung (IVDR)Leistungsbewertungsbericht (PER)Klinische Evidenz & Ausreichende Evidenz Erwartungen Benannter Stellen PMS / PMPF / PSUR (Konformität über den gesamten Lebenszyklus)

Häufig gestellte Fragen (FAQs)

Was bedeutet Leistungsbewertung im Rahmen der EU-IVDR?

Die Leistungsbewertung gemäß der EU-IVDR ist eine strukturierte wissenschaftliche Beurteilung, mit der nachgewiesen wird, dass die analytische Leistungsfähigkeit, die klinische Leistungsfähigkeit und die wissenschaftliche Validität eines In-vitro-Diagnostikums gemeinsam den Verwendungszweck des Produkts sowie die Einhaltung der allgemeinen Sicherheits- und Leistungsanforderungen stützen.

Müssen für alle In-vitro-Diagnostika Leistungsstudien gemäß der IVDR durchgeführt werden?

Nicht alle In-vitro-Diagnostika erfordern den gleichen Umfang an Leistungsstudien. Die IVD-Verordnung schreibt vor, dass die Nachweise zur analytischen und klinischen Leistungsfähigkeit in einem angemessenen Verhältnis zum Verwendungszweck und zur Risikoklasse des Produkts stehen müssen.

Inwiefern steht MDCG 2025-5 im Zusammenhang mit Leistungsstudien gemäß der IVDR?

Das Q&A -Dokument MDCG 2025-5 enthält Erläuterungen zu Definitionen, Arten von IVDR-Leistungsstudien, Anwendbarkeitskriterien, den Aufgaben der Prüfer sowie zu den regulatorischen Anforderungen.

Ist die Leistungsbewertung gemäß der IVDR eine einmalige Anforderung?

Die Leistungsbewertung gemäß der IVDR ist eine Verpflichtung, die sich über den gesamten Lebenszyklus erstreckt. Die Nachweise müssen aufbewahrt und entsprechend der Entwicklung der klinischen Praxis aktualisiert werden.