Die Einführung der EU-Medizinprodukteverordnung 2017/745 hat die Anforderungen an die klinische Bewertung von Software als Medizinprodukt (SaMD) und KI-basierten Technologien verschärft und erweitert. Zwar gelten die Grundsätze der MDR gleichermaßen für Software und Hardware, doch kann sich Software nicht mehr ausschließlich auf vereinfachte Leistungskennzahlen stützen; stattdessen muss die klinische Bewertung auf soliden klinischen Nachweisen beruhen, die durch geeignete Software-Verifizierungs- und -Validierungsmaßnahmen sowie eine klinische Validierung untermauert werden, welche die klinische Leistung, die Akzeptanz des Nutzen-Risiko-Verhältnisses und die Evidenzausreichendheit über den gesamten Lebenszyklus des Produkts hinweg nachweisen.
Benannte Stellen prüfen zunehmend, wie Hersteller die klinische Leistungsfähigkeit, die Akzeptanz des Nutzen-Risiko-Verhältnisses und die ausreichende Evidenz über den gesamten Lebenszyklus für SaMD KI-basierte Produkte nachweisen und aufrechterhalten. Die wirksame Anwendung der MDR-Grundsätze auf algorithmische Technologien erfordert daher ein klares Verständnis der regulatorischen Erwartungen sowie einen strukturierten, lebenszyklusorientierten Ansatz für die Erarbeitung und Pflege klinischer Nachweise.
Grundsätze der klinischen Bewertung gemäß MDR in Bezug auf Software
Gemäß der MDR muss die klinische Bewertung nachweisen, dass ein Produkt seinen beabsichtigten medizinischen Zweck erfüllt und ein akzeptables Nutzen-Risiko-Profil aufweist. Dieser Prozess wird in erster Linie in der MDCG 2020-1 erwähnt und steht im Einklang mit den international anerkannten IMDRF-Leitlinien zur klinischen Bewertung von Software als Medizinprodukt (SaMD), in denen klinische Relevanz, ein valider klinischer Zusammenhang und evidenzbasierte Leistungsangaben im Vordergrund stehen. Die klinische Bewertung muss sich daher darauf konzentrieren, wie Software-Ausgaben klinisch bedeutsame Entscheidungen unterstützen, und nicht allein auf die technische Leistungsfähigkeit.
Die benannten Stellen erwarten von den Herstellern, dass sie darlegen, wie sich die Funktionen der Software in diagnostische, therapeutische oder entscheidungsunterstützende Vorteile für die vorgesehenen Anwender niederschlagen. Dazu gehört eine klare Definition des Verwendungszwecks, der Zielgruppe, des klinischen Kontexts und der Benutzerinteraktion. Unklarheiten in diesen Bereichen führen häufig zu Schwierigkeiten bei der Konformitätsbewertung.
Definition der klinischen Leistungsfähigkeit von Algorithmen
Eine der größten Herausforderungen bei der SaMD Bewertung SaMD ist die Definition und Messung der klinischen Leistungsfähigkeit. Im Gegensatz zu herkömmlichen Medizinprodukten lässt sich die Leistungsfähigkeit von Software nicht allein anhand physikalischer Eigenschaften oder durch Laborversuche beurteilen.
Die benannten Stellen erwarten, dass die klinische Leistungsfähigkeit anhand geeigneter Endpunkte nachgewiesen wird, die den tatsächlichen klinischen Einsatz widerspiegeln. Dazu können je nach Verwendungszweck der Software die diagnostische Genauigkeit, die Sensitivität und Spezifität, der Einfluss auf die klinische Entscheidungsfindung oder Messgrößen für das Patientenergebnis gehören.
Leistungskennzahlen müssen im Kontext der aktuellen klinischen Praxis und des aktuellen Stands der Technik begründet werden. Dies unterstreicht die Bedeutung fundierter klinischer Ansätze und Leistungsbewertungsmethoden, bei denen die Softwarevalidierung auf klinischen Belegen und nicht allein auf technischen Benchmarks basiert.
Quellen für klinische Evidenz zu SaMD KI-Geräten
Klinische Nachweise für SaMD aus verschiedenen Quellen stammen, darunter klinische Studien, Fachliteratur, retrospektive Datenanalysen, Real-World-Evidence und Daten aus der Praxis nach der Markteinführung. Die benannten Stellen prüfen, ob die ausgewählten Nachweisquellen der Risikoklasse, dem Neuheitsgrad und den klinischen Angaben der Software angemessen sind.
Wird Literatur herangezogen, müssen die Hersteller nachweisen, dass die veröffentlichten Daten direkt auf die jeweilige Softwareversion, die Algorithmuslogik und den Verwendungszweck anwendbar sind. Diese Anforderung macht häufig fundierte Protokolle für die Literaturrecherche zu Medizinprodukten sowie kritische Überprüfungen erforderlich, um die Relevanz und Reproduzierbarkeit der Ergebnisse sicherzustellen.
Bei KI-basierten Geräten spielen der Zugang zu Trainings- und Validierungsdatensätzen sowie Transparenz bei der Algorithmenentwicklung eine wesentliche Rolle für die Nachvollziehbarkeit der klinischen Bewertung.
Stand der Technik und Algorithmus-Benchmarking
Die Definition des Stands der Technik (SOTA) ist bei SaMD KI-Technologien aufgrund der raschen Innovation und der sich wandelnden klinischen Praxis besonders komplex. Die benannten Stellen erwarten, dass der Stand der Technik nicht nur vergleichbare Softwarelösungen, sondern auch alternative klinische Behandlungswege und nicht-softwarebasierte Interventionen berücksichtigt.
Ein Vergleich der Algorithmusleistung mit dem aktuellen Stand der Technik (SOTA) erfordert eine sorgfältige Begründung der Auswahl der Vergleichsgrößen und der Leistungsschwellenwerte. Unzureichende oder veraltete SOTA-Definitionen können Behauptungen über den klinischen Nutzen untergraben und Zweifel an der Evidenzbasis aufkommen lassen.
Diese Herausforderungen unterstreichen, wie wichtig es ist, die SOTA-Definitionen als dynamische Elemente im klinischen Bewertungsbericht zu pflegen und sie an sich weiterentwickelnde klinische Standards und technologische Möglichkeiten anzupassen.
Artikel 61 und die ausreichende Evidenz für SaMD
Der Nachweis ausreichender klinischer Evidenz gemäß Artikel 61 ist eine entscheidende Anforderung für SaMD KI-basierte Medizinprodukte. Die benannten Stellen prüfen, ob die verfügbaren klinischen Daten die Angaben zu Sicherheit und Leistung angemessen untermauern, wobei sie den Grad der Autonomie der Software, die klinischen Auswirkungen und das Risikoprofil berücksichtigen.
Bei adaptiven oder kontinuierlich lernenden Algorithmen müssen die Hersteller darlegen, wie die Evidenzausreichendheit über die Zeit hinweg gewährleistet wird, insbesondere wenn Software-Updates die Leistungsmerkmale verändern können. Diese Erwartung steht im Einklang mit der Leitlinie MDCG 2020-6 zu ausreichender klinischer Evidenz, in der die Verhältnismäßigkeit und eine lebenszyklusbasierte Evidenzbewertung hervorgehoben werden.
Verwaltung von Software-Updates und Änderungen im Lebenszyklus
Software-Updates stellen eine der größten regulatorischen Herausforderungen für KI-basierte Medizinprodukte dar, da die benannten Stellen von den Herstellern erwarten, dass sie sorgfältig prüfen, ob sich Änderungen auf die klinische Leistung, die Sicherheit oder das Nutzen-Risiko-Verhältnis auswirken.
Gemäß MDCG 2020-3 ist ein strukturierter Änderungsmanagementprozess unerlässlich, um sicherzustellen, dass Aktualisierungen, die erhebliche klinische Auswirkungen haben, wie beispielsweise das erneute Trainieren von Modellen, im Rahmen der klinischen Bewertung dokumentiert und durch geeignete Nachweise untermauert werden. Die Einbindung dieser Aktivitäten in umfassendere Verfahren zum Lebenszyklusmanagement von Medizinprodukten trägt dazu bei, die Rückverfolgbarkeit zu gewährleisten und das Vertrauen der Aufsichtsbehörden zu stärken.
Die Marktüberwachung (PMS) und die klinische Nachbeobachtung nach dem Inverkehrbringen (PMCF) spielen eine entscheidende Rolle bei der Überwachung der tatsächlichen Leistungsfähigkeit von Software und der Erkennung neu auftretender Risiken.
Nachmarktdaten für SaMD KI-Geräte
Gemäß der MDR sind Nachmarktdaten ein zentraler Bestandteil der klinischen Bewertung von SaMD. Die benannten Stellen erwarten, dass PMS-Systeme Leistungstrends, Nutzer-Feedback und Ergebnisse aus der Praxis im Zusammenhang mit der Software erfassen, um sicherzustellen, dass der Algorithmus in der klinischen Praxis sicher und wirksam bleibt.
PMCF im Dokument MDCG 2020-7 dargelegten PMCF sind erforderlich, um verbleibende Unsicherheiten zu beseitigen, insbesondere bei KI-Systemen, die in komplexen oder risikoreichen klinischen Umgebungen eingesetzt werden. Diese Erwartungen stehen im Einklang mit den allgemeinen regulatorischen Leitlinien der Europäischen Arzneimittelagentur zu digitaler Gesundheit und künstlicher Intelligenz, in denen die Bedeutung der lebenszyklusübergreifenden Überwachung adaptiver Technologien hervorgehoben wird.
Fazit: Anwendung der Grundsätze der klinischen Bewertung gemäß MDR auf Algorithmen
Zwar gelten die Grundsätze der MDR für alle Medizintechnikbereiche gleichermaßen, doch erfordern SaMD KI-basierte Produkte eine sorgfältige Anpassung der traditionellen klinischen Bewertungsmethoden. Die benannten Stellen erwarten von den Herstellern, dass sie während des gesamten Software-Lebenszyklus eine eindeutige klinische Relevanz, eine fundierte Leistungsvalidierung und eine kontinuierliche Evidenzausreichendheit nachweisen.
Hersteller, die die klinische Bewertung von SaMD einen kontinuierlichen, evidenzbasierten Prozess betrachten, der in die Marktüberwachung und das Änderungsmanagement integriert ist, sind besser in der Lage, die regulatorischen Erwartungen zu erfüllen und die Compliance aufrechtzuerhalten. Die durchdachte Anwendung der MDR-Grundsätze auf Algorithmen ist nicht nur für die behördliche Zulassung von entscheidender Bedeutung, sondern auch für die Aufrechterhaltung des Vertrauens in die softwaregestützte klinische Entscheidungsfindung.
Wie Freyr die klinische Bewertung von SaMD KI-Geräten unterstützt
Die klinische Bewertung von SaMD KI-basierten Produkten erfordert spezialisiertes Fachwissen an der Schnittstelle zwischen klinischer Wissenschaft, Zulassungsstrategie und Softwareentwicklung. Freyr unterstützt Hersteller bei der Erstellung fundierter klinischer Bewertungsberichte, der Festlegung geeigneter klinischer Leistungsendpunkte und der Abstimmung von Evidenzstrategien auf die MDR und internationale Leitlinien.
Die Experten von Freyr unterstützen Sie bei literaturbasierten Bewertungen, der Ermittlung von Lücken in der klinischen Evidenz, der Einbeziehung von Daten aus der Marktbeobachtung sowie bei der Zusammenarbeit mit benannten Stellen im Bereich softwaregesteuerter Technologien. Wenn Sie Unterstützung bei der klinischen Bewertung SaMD KI, der Erstellung von CERs oder der Evidenzstrategie im Rahmen EU MDR benötigen, wenden Sie sich an einen Freyr-Experten, um Ihre regulatorischen Herausforderungen zu besprechen.
