Klinische Bewertung von SaMD KI-basierten Medizinprodukten: Anwendung der MDR-Grundsätze auf Algorithmen

6 Min. Lesezeit

Die Einführung der EU-Medizinprodukteverordnung 2017/745 hat die Anforderungen an die klinische Bewertung von Software als Medizinprodukt (SaMD) und KI-basierten Technologien verschärft und erweitert. Zwar gelten die Grundsätze der MDR gleichermaßen für Software und Hardware, doch kann sich Software nicht mehr ausschließlich auf vereinfachte Leistungskennzahlen stützen; stattdessen muss die klinische Bewertung auf soliden klinischen Nachweisen beruhen, die durch geeignete Software-Verifizierungs- und -Validierungsmaßnahmen sowie eine klinische Validierung untermauert werden, welche die klinische Leistung, die Akzeptanz des Nutzen-Risiko-Verhältnisses und die Evidenzausreichendheit über den gesamten Lebenszyklus des Produkts hinweg nachweisen.

Benannte Stellen prüfen zunehmend, wie Hersteller die klinische Leistungsfähigkeit, die Akzeptanz des Nutzen-Risiko-Verhältnisses und die ausreichende Evidenz über den gesamten Lebenszyklus für SaMD KI-basierte Produkte nachweisen und aufrechterhalten. Die wirksame Anwendung der MDR-Grundsätze auf algorithmische Technologien erfordert daher ein klares Verständnis der regulatorischen Erwartungen sowie einen strukturierten, lebenszyklusorientierten Ansatz für die Erarbeitung und Pflege klinischer Nachweise.

Grundsätze der klinischen Bewertung gemäß MDR in Bezug auf Software

Gemäß der MDR muss die klinische Bewertung nachweisen, dass ein Produkt seinen beabsichtigten medizinischen Zweck erfüllt und ein akzeptables Nutzen-Risiko-Profil aufweist. Dieser Prozess wird in erster Linie in der MDCG 2020-1 erwähnt und steht im Einklang mit den international anerkannten IMDRF-Leitlinien zur klinischen Bewertung von Software als Medizinprodukt (SaMD), in denen klinische Relevanz, ein valider klinischer Zusammenhang und evidenzbasierte Leistungsangaben im Vordergrund stehen. Die klinische Bewertung muss sich daher darauf konzentrieren, wie Software-Ausgaben klinisch bedeutsame Entscheidungen unterstützen, und nicht allein auf die technische Leistungsfähigkeit.

Die benannten Stellen erwarten von den Herstellern, dass sie darlegen, wie sich die Funktionen der Software in diagnostische, therapeutische oder entscheidungsunterstützende Vorteile für die vorgesehenen Anwender niederschlagen. Dazu gehört eine klare Definition des Verwendungszwecks, der Zielgruppe, des klinischen Kontexts und der Benutzerinteraktion. Unklarheiten in diesen Bereichen führen häufig zu Schwierigkeiten bei der Konformitätsbewertung.

Definition der klinischen Leistungsfähigkeit von Algorithmen

Eine der größten Herausforderungen bei der SaMD Bewertung SaMD ist die Definition und Messung der klinischen Leistungsfähigkeit. Im Gegensatz zu herkömmlichen Medizinprodukten lässt sich die Leistungsfähigkeit von Software nicht allein anhand physikalischer Eigenschaften oder durch Laborversuche beurteilen.

Die benannten Stellen erwarten, dass die klinische Leistungsfähigkeit anhand geeigneter Endpunkte nachgewiesen wird, die den tatsächlichen klinischen Einsatz widerspiegeln. Dazu können je nach Verwendungszweck der Software die diagnostische Genauigkeit, die Sensitivität und Spezifität, der Einfluss auf die klinische Entscheidungsfindung oder Messgrößen für das Patientenergebnis gehören.

Leistungskennzahlen müssen im Kontext der aktuellen klinischen Praxis und des aktuellen Stands der Technik begründet werden. Dies unterstreicht die Bedeutung fundierter klinischer Ansätze und Leistungsbewertungsmethoden, bei denen die Softwarevalidierung auf klinischen Belegen und nicht allein auf technischen Benchmarks basiert.

Quellen für klinische Evidenz zu SaMD KI-Geräten

Klinische Nachweise für SaMD aus verschiedenen Quellen stammen, darunter klinische Studien, Fachliteratur, retrospektive Datenanalysen, Real-World-Evidence und Daten aus der Praxis nach der Markteinführung. Die benannten Stellen prüfen, ob die ausgewählten Nachweisquellen der Risikoklasse, dem Neuheitsgrad und den klinischen Angaben der Software angemessen sind.

Wird Literatur herangezogen, müssen die Hersteller nachweisen, dass die veröffentlichten Daten direkt auf die jeweilige Softwareversion, die Algorithmuslogik und den Verwendungszweck anwendbar sind. Diese Anforderung macht häufig fundierte Protokolle für die Literaturrecherche zu Medizinprodukten sowie kritische Überprüfungen erforderlich, um die Relevanz und Reproduzierbarkeit der Ergebnisse sicherzustellen.

Bei KI-basierten Geräten spielen der Zugang zu Trainings- und Validierungsdatensätzen sowie Transparenz bei der Algorithmenentwicklung eine wesentliche Rolle für die Nachvollziehbarkeit der klinischen Bewertung.

Stand der Technik und Algorithmus-Benchmarking

Die Definition des Stands der Technik (SOTA) ist bei SaMD KI-Technologien aufgrund der raschen Innovation und der sich wandelnden klinischen Praxis besonders komplex. Die benannten Stellen erwarten, dass der Stand der Technik nicht nur vergleichbare Softwarelösungen, sondern auch alternative klinische Behandlungswege und nicht-softwarebasierte Interventionen berücksichtigt.

Ein Vergleich der Algorithmusleistung mit dem aktuellen Stand der Technik (SOTA) erfordert eine sorgfältige Begründung der Auswahl der Vergleichsgrößen und der Leistungsschwellenwerte. Unzureichende oder veraltete SOTA-Definitionen können Behauptungen über den klinischen Nutzen untergraben und Zweifel an der Evidenzbasis aufkommen lassen.

Diese Herausforderungen unterstreichen, wie wichtig es ist, die SOTA-Definitionen als dynamische Elemente im klinischen Bewertungsbericht zu pflegen und sie an sich weiterentwickelnde klinische Standards und technologische Möglichkeiten anzupassen.

Artikel 61 und die ausreichende Evidenz für SaMD

Der Nachweis ausreichender klinischer Evidenz gemäß Artikel 61 ist eine entscheidende Anforderung für SaMD KI-basierte Medizinprodukte. Die benannten Stellen prüfen, ob die verfügbaren klinischen Daten die Angaben zu Sicherheit und Leistung angemessen untermauern, wobei sie den Grad der Autonomie der Software, die klinischen Auswirkungen und das Risikoprofil berücksichtigen.

Bei adaptiven oder kontinuierlich lernenden Algorithmen müssen die Hersteller darlegen, wie die Evidenzausreichendheit über die Zeit hinweg gewährleistet wird, insbesondere wenn Software-Updates die Leistungsmerkmale verändern können. Diese Erwartung steht im Einklang mit der Leitlinie MDCG 2020-6 zu ausreichender klinischer Evidenz, in der die Verhältnismäßigkeit und eine lebenszyklusbasierte Evidenzbewertung hervorgehoben werden.

Verwaltung von Software-Updates und Änderungen im Lebenszyklus

Software-Updates stellen eine der größten regulatorischen Herausforderungen für KI-basierte Medizinprodukte dar, da die benannten Stellen von den Herstellern erwarten, dass sie sorgfältig prüfen, ob sich Änderungen auf die klinische Leistung, die Sicherheit oder das Nutzen-Risiko-Verhältnis auswirken.

Gemäß MDCG 2020-3 ist ein strukturierter Änderungsmanagementprozess unerlässlich, um sicherzustellen, dass Aktualisierungen, die erhebliche klinische Auswirkungen haben, wie beispielsweise das erneute Trainieren von Modellen, im Rahmen der klinischen Bewertung dokumentiert und durch geeignete Nachweise untermauert werden. Die Einbindung dieser Aktivitäten in umfassendere Verfahren zum Lebenszyklusmanagement von Medizinprodukten trägt dazu bei, die Rückverfolgbarkeit zu gewährleisten und das Vertrauen der Aufsichtsbehörden zu stärken.

Die Marktüberwachung (PMS) und die klinische Nachbeobachtung nach dem Inverkehrbringen (PMCF) spielen eine entscheidende Rolle bei der Überwachung der tatsächlichen Leistungsfähigkeit von Software und der Erkennung neu auftretender Risiken.

Nachmarktdaten für SaMD KI-Geräte

Gemäß der MDR sind Nachmarktdaten ein zentraler Bestandteil der klinischen Bewertung von SaMD. Die benannten Stellen erwarten, dass PMS-Systeme Leistungstrends, Nutzer-Feedback und Ergebnisse aus der Praxis im Zusammenhang mit der Software erfassen, um sicherzustellen, dass der Algorithmus in der klinischen Praxis sicher und wirksam bleibt.

PMCF im Dokument MDCG 2020-7 dargelegten PMCF sind erforderlich, um verbleibende Unsicherheiten zu beseitigen, insbesondere bei KI-Systemen, die in komplexen oder risikoreichen klinischen Umgebungen eingesetzt werden. Diese Erwartungen stehen im Einklang mit den allgemeinen regulatorischen Leitlinien der Europäischen Arzneimittelagentur zu digitaler Gesundheit und künstlicher Intelligenz, in denen die Bedeutung der lebenszyklusübergreifenden Überwachung adaptiver Technologien hervorgehoben wird.

Fazit: Anwendung der Grundsätze der klinischen Bewertung gemäß MDR auf Algorithmen

Zwar gelten die Grundsätze der MDR für alle Medizintechnikbereiche gleichermaßen, doch erfordern SaMD KI-basierte Produkte eine sorgfältige Anpassung der traditionellen klinischen Bewertungsmethoden. Die benannten Stellen erwarten von den Herstellern, dass sie während des gesamten Software-Lebenszyklus eine eindeutige klinische Relevanz, eine fundierte Leistungsvalidierung und eine kontinuierliche Evidenzausreichendheit nachweisen.

Hersteller, die die klinische Bewertung von SaMD einen kontinuierlichen, evidenzbasierten Prozess betrachten, der in die Marktüberwachung und das Änderungsmanagement integriert ist, sind besser in der Lage, die regulatorischen Erwartungen zu erfüllen und die Compliance aufrechtzuerhalten. Die durchdachte Anwendung der MDR-Grundsätze auf Algorithmen ist nicht nur für die behördliche Zulassung von entscheidender Bedeutung, sondern auch für die Aufrechterhaltung des Vertrauens in die softwaregestützte klinische Entscheidungsfindung.

Wie Freyr die klinische Bewertung von SaMD KI-Geräten unterstützt

Die klinische Bewertung von SaMD KI-basierten Produkten erfordert spezialisiertes Fachwissen an der Schnittstelle zwischen klinischer Wissenschaft, Zulassungsstrategie und Softwareentwicklung. Freyr unterstützt Hersteller bei der Erstellung fundierter klinischer Bewertungsberichte, der Festlegung geeigneter klinischer Leistungsendpunkte und der Abstimmung von Evidenzstrategien auf die MDR und internationale Leitlinien.

Die Experten von Freyr unterstützen Sie bei literaturbasierten Bewertungen, der Ermittlung von Lücken in der klinischen Evidenz, der Einbeziehung von Daten aus der Marktbeobachtung sowie bei der Zusammenarbeit mit benannten Stellen im Bereich softwaregesteuerter Technologien. Wenn Sie Unterstützung bei der klinischen Bewertung SaMD KI, der Erstellung von CERs oder der Evidenzstrategie im Rahmen EU MDR benötigen, wenden Sie sich an einen Freyr-Experten, um Ihre regulatorischen Herausforderungen zu besprechen.

Über den Autor

Dr. Radhika Ramachandran leitet das Global Regulatory Medical Writing Center of Excellence (CoE) bei Freyr Inc. und erstellt regulatorische Dokumentationen und Strategien für Medizinprodukte und In-vitro-Diagnostika (IVD) im Rahmen globaler regulatorischer Vorschriften. Mit über einem Jahrzehnt Erfahrung in MedTech, klinischer Forschung und regulatorischer Strategie ist sie spezialisiert auf die Entwicklung und Überprüfung von wirkungsvollen regulatorischen Dokumenten, die globalen Standards, einschließlich EU MDR und EU IVDR, entsprechen. Sie bietet MedTech-Unternehmen strategische Beratung und maßgeschneiderte Lösungen für das regulatorische Schreiben an und unterstützt sie bei regulatorischen Einreichungen und der Lebenszyklusdokumentation. Dr. Radhika hat einen Doktortitel in Biotechnologie und ist eine zertifizierte medizinische Autorin mit Beiträgen zu über 1.500 regulatorischen Dokumenten. Ihr aktueller Schwerpunkt liegt auf der Nutzung von künstlicher Intelligenz und digitaler Gesundheit zur Transformation des regulatorischen medizinischen Schreibens.

Häufig gestellte Fragen (FAQs)

Inwiefern unterscheidet sich die klinische Bewertung von SaMD KI-basierten Medizinprodukten gemäß EU MDR?

Gemäß EU MDR stehen bei der klinischen Bewertung von Software als Medizinprodukt (SaMD) und KI-basierten Medizinprodukten die klinische Relevanz, die klinische Leistungsfähigkeit und die Akzeptanz des Nutzen-Risiko-Verhältnisses im Vordergrund und nicht allein technische Kennzahlen. Die benannten Stellen erwarten Nachweise dafür, wie die Ergebnisse der Algorithmen klinische Entscheidungen in der Praxis unterstützen, wobei diese im Einklang mit dem Verwendungszweck, dem Stand der Technik und den Anforderungen an lebenszyklusbasierte Nachweise stehen müssen.

Welche klinischen Nachweise erwarten die benannten Stellen für SaMD KI-Algorithmen gemäß Artikel 61?

Die benannten Stellen prüfen gemäß Artikel 61, ob die klinischen Nachweise die Sicherheit und Leistung ausreichend belegen, wobei sie das Risiko und die klinischen Auswirkungen der Software berücksichtigen. Zu den zulässigen Nachweisen können klinische Untersuchungen, Fachliteratur, retrospektive Analysen, Real-World-Evidence und Daten aus der Praxis nach dem Inverkehrbringen gehören, sofern diese direkt auf die jeweilige Softwareversion, die Algorithmuslogik und den vorgesehenen klinischen Verwendungszweck anwendbar sind.

Warum ist der aktuelle Stand der Technik (SOTA) für das Benchmarking von KI-basierten Medizinprodukten von entscheidender Bedeutung?

Der Stand der Technik (SOTA) ist für das Benchmarking SaMD KI von entscheidender Bedeutung, da benannte Stellen Vergleiche mit der aktuellen klinischen Praxis, alternativen Technologien und nicht-softwarebasierten Interventionen erwarten. Schnelle Innovationen machen den Stand der Technik zu einem dynamischen Bezugspunkt, und veraltete Benchmarks können Behauptungen zum klinischen Nutzen, Gleichwertigkeitsargumente und die allgemeine Evidenzausreichendheit im Rahmen EU MDR untergraben.

Wie kann Freyr die klinische Bewertung von SaMD KI-basierten Produkten im Rahmen EU MDR unterstützen?

Freyr unterstützt die klinische Bewertung von SaMD KI-basierten Medizinprodukten durch die Erstellung fundierter klinischer Bewertungsberichte, die den Leitlinien EU MDR, der MDCG und der IMDRF entsprechen. Dazu gehören die Festlegung klinischer Leistungsendpunkte, die Durchführung literaturbasierter Bewertungen, die Beurteilung der Evidenzausreichendheit gemäß Artikel 61, die Einbeziehung von Daten aus der Marktbeobachtung sowie die Unterstützung der Hersteller im Austausch mit den benannten Stellen.