L'entrée en vigueur du règlement européen 2017/745 relatif aux dispositifs médicaux a renforcé et élargi les exigences en matière d'évaluation clinique pour les logiciels considérés comme des dispositifs médicaux (SaMD) et les technologies basées sur l'intelligence artificielle. Si les principes du RDM s'appliquent de la même manière aux logiciels et au matériel, les logiciels ne peuvent plus se fonder uniquement sur des indicateurs de performance simplifiés ; l'évaluation clinique doit désormais s'appuyer sur des données cliniques solides, étayées par des activités appropriées de vérification et de validation des logiciels, ainsi que par une validation clinique démontrant la performance clinique, l'acceptabilité du rapport bénéfice-risque et la suffisance des données tout au long du cycle de vie du dispositif.
Les organismes notifiés examinent de plus en plus attentivement la manière dont les fabricants établissent et maintiennent les performances cliniques, l'acceptabilité du rapport bénéfice/risque et la suffisance des données tout au long du cycle de vie des SaMD des dispositifs basés sur l'intelligence artificielle. Une application efficace des principes du RDM aux technologies basées sur des algorithmes nécessite donc une compréhension claire des attentes réglementaires ainsi qu'une approche structurée et axée sur le cycle de vie pour la production et la mise à jour des données cliniques.
Principes d'évaluation clinique du RDM appliqués aux logiciels
En vertu du RDM, l'évaluation clinique doit démontrer qu'un dispositif remplit sa finalité médicale prévue et présente un profil bénéfice-risque acceptable. Ce processus est principalement évoqué dans le document MDCG 2020-1 et s'aligne en outre sur les recommandations de l'IMDRF, reconnues à l'échelle internationale, concernant l'évaluation clinique des logiciels considérés comme des dispositifs médicaux (SaMD), qui mettent l'accent sur la pertinence clinique, une association clinique valide et des allégations de performance fondées sur des données probantes. L'évaluation clinique doit donc se concentrer sur la manière dont les résultats du logiciel appuient des décisions cliniquement significatives plutôt que sur les seules performances techniques.
Les organismes notifiés attendent des fabricants qu'ils expliquent clairement en quoi les fonctionnalités du logiciel se traduisent par des avantages en matière de diagnostic, de traitement ou d'aide à la décision pour les utilisateurs visés. Cela implique notamment de définir clairement l'usage prévu, la population cible, le contexte clinique et l'interaction avec l'utilisateur. Toute ambiguïté dans ces domaines entraîne souvent des difficultés lors de l'évaluation de la conformité.
Définition des performances cliniques des algorithmes
L'un des principaux défis de l'évaluation SaMD consiste à définir et à mesurer leurs performances cliniques. Contrairement aux dispositifs traditionnels, les performances d'un logiciel ne peuvent être évaluées uniquement sur la base de caractéristiques physiques ou d'essais en laboratoire.
Les organismes notifiés attendent que les performances cliniques soient démontrées à l'aide de critères d'évaluation appropriés qui reflètent l'utilisation clinique réelle. Il peut s'agir, selon la finalité prévue du logiciel, de la précision diagnostique, de la sensibilité et de la spécificité, de l'impact sur la prise de décision clinique ou des mesures des résultats pour les patients.
Les indicateurs de performance doivent être justifiés dans le contexte de la pratique clinique actuelle et de l'état de l'art. Cela souligne l'importance de disposer d'approches cliniques et d'évaluation des performances solides, dans lesquelles la validation des logiciels repose sur des données cliniques plutôt que sur de simples critères techniques.
Sources de données cliniques pour les dispositifs SaMD d'IA
Les données cliniques relatives SaMD provenir de multiples sources, notamment des études cliniques, la littérature scientifique, des analyses rétrospectives de données, des données issues de la pratique clinique et des données post-commercialisation. Les organismes notifiés évaluent si les sources de données retenues sont adaptées à la classe de risque, au caractère novateur et aux allégations cliniques du logiciel.
Lorsque des publications sont utilisées, les fabricants doivent démontrer que les données publiées s'appliquent directement à la version spécifique du logiciel, à la logique de l'algorithme et à l'usage prévu. Cette exigence nécessite souvent la mise en place de protocoles rigoureux de recherche documentaire sur les dispositifs médicaux et de revues critiques afin de garantir la pertinence et la reproductibilité des résultats.
Pour les dispositifs basés sur l'IA, l'accès aux ensembles de données d'apprentissage et de validation, ainsi que la transparence concernant le développement des algorithmes, jouent un rôle essentiel dans la validité de l'évaluation clinique.
État de l'art et évaluation comparative des algorithmes
Définir l'état de l'art (SOTA) s'avère particulièrement complexe pour les technologies SaMD d'IA en raison de l'innovation rapide et de l'évolution constante des pratiques cliniques. Les organismes notifiés attendent que l'état de l'art reflète non seulement les solutions logicielles comparables, mais aussi les parcours cliniques alternatifs et les interventions non logicielles.
Pour évaluer les performances d'un algorithme par rapport à l'état de l'art (SOTA), il est nécessaire de justifier rigoureusement le choix des références et des seuils de performance. Des définitions de l'état de l'art (SOTA) insuffisantes ou obsolètes peuvent remettre en cause les allégations de bénéfice clinique et soulever des questions quant à la suffisance des données probantes.
Ces défis soulignent l'importance de maintenir les définitions de l'état de l'art (SOTA) comme des éléments évolutifs au sein du rapport d'évaluation clinique, en phase avec l'évolution des normes cliniques et des capacités technologiques.
Article 61 et suffisance des preuves pour les dispositifs médicaux logiciels ( SaMD)
La présentation de données cliniques suffisantes au titre de l'article 61 constitue une exigence essentielle pour SaMD les dispositifs basés sur l'intelligence artificielle (IA). Les organismes notifiés évaluent si les données cliniques disponibles étayent de manière adéquate les allégations relatives à la sécurité et aux performances, en tenant compte du niveau d'autonomie du logiciel, de son impact clinique et de son profil de risque.
En ce qui concerne les algorithmes adaptatifs ou à apprentissage continu, les fabricants doivent expliquer comment la suffisance des données probantes est maintenue au fil du temps, en particulier lorsque des mises à jour logicielles sont susceptibles de modifier les caractéristiques de performance. Cette exigence est conforme aux recommandations du document MDCG 2020-6 sur la suffisance des données cliniques, qui met l'accent sur la proportionnalité et l'évaluation des données probantes tout au long du cycle de vie du dispositif.
Gestion des mises à jour logicielles et des changements liés au cycle de vie
Les mises à jour logicielles constituent l'un des principaux défis réglementaires pour les dispositifs médicaux basés sur l'IA, car les organismes notifiés attendent des fabricants qu'ils évaluent rigoureusement si ces modifications ont une incidence sur les performances cliniques, la sécurité ou le rapport bénéfice/risque.
Conformément à la directive MDCG 2020-3, un processus structuré de gestion du changement est essentiel pour garantir que les mises à jour ayant un impact clinique significatif, telles que le réentraînement des modèles, soient documentées dans le cadre de l'évaluation clinique et étayées par des données probantes appropriées. L'intégration de ces activités dans les pratiques plus générales de gestion du cycle de vie des dispositifs médicaux contribue à maintenir la traçabilité et la confiance des autorités réglementaires.
La surveillance post-commercialisation (PMS) et le suivi clinique post-commercialisation (PMCF) jouent un rôle essentiel dans le contrôle des performances des logiciels en conditions réelles d'utilisation et dans l'identification des risques émergents.
Données post-commercialisation relatives aux dispositifs SaMD aux dispositifs d'IA
Dans le cadre du RDM, les données post-commercialisation constituent un élément central de l'évaluation clinique des SaMD. Les organismes notifiés attendent des systèmes de surveillance post-commercialisation qu'ils permettent de suivre les tendances en matière de performances, de recueillir les retours d'expérience des utilisateurs et d'analyser les résultats observés en conditions réelles liés au logiciel, afin de garantir que l'algorithme reste sûr et efficace dans la pratique clinique.
PMCF décrites dans le document MDCG 2020-7 sont nécessaires pour lever les incertitudes résiduelles, en particulier pour les systèmes d'IA déployés dans des contextes cliniques complexes ou à haut risque. Ces attentes s'inscrivent dans la lignée des orientations réglementaires plus générales de l'Agence européenne des médicaments concernant la santé numérique et l'intelligence artificielle, qui soulignent l'importance d'une surveillance tout au long du cycle de vie des technologies adaptatives.
Conclusion : Application des principes d'évaluation clinique du règlement MDR aux algorithmes
Si les principes du règlement MDR s'appliquent de manière uniforme à toutes les technologies des dispositifs médicaux, les dispositifs médicaux logiciels SaMD ceux basés sur l'intelligence artificielle (IA) nécessitent une adaptation minutieuse des méthodologies d'évaluation clinique traditionnelles. Les organismes notifiés attendent des fabricants qu'ils démontrent une pertinence clinique claire, une validation des performances justifiable et une suffisance des données tout au long du cycle de vie du logiciel.
Les fabricants qui abordent l'évaluation clinique des dispositifs médica SaMD un processus continu, fondé sur des données probantes et intégré à la surveillance post-commercialisation et à la gestion du changement sont mieux placés pour répondre aux attentes réglementaires et garantir leur conformité. Il est essentiel d'appliquer de manière réfléchie les principes du règlement MDR aux algorithmes, non seulement pour obtenir l'autorisation réglementaire, mais aussi pour préserver la confiance dans la prise de décision clinique assistée par logiciel.
Comment Freyr soutient l'évaluation clinique des dispositifs médicaux basés sur le logiciel ( SaMD des dispositifs d'intelligence artificielle (IA)
L'évaluation clinique des SaMD des dispositifs basés sur l'IA nécessite une expertise spécialisée à la croisée de la science clinique, de la stratégie réglementaire et du développement logiciel. Freyr aide les fabricants à élaborer des rapports d'évaluation clinique solides, à définir des critères d'évaluation de performance clinique appropriés et à aligner leurs stratégies en matière de données probantes sur le règlement MDR et les lignes directrices internationales.
Les experts de Freyr vous accompagnent dans la réalisation d'évaluations fondées sur la littérature, l'analyse des lacunes en matière de données cliniques, l'intégration des données post-commercialisation et les interactions avec les organismes notifiés pour les technologies basées sur des logiciels. Si vous avez besoin d'aide pour l'évaluation clinique SaMD de l'intelligence artificielle (IA), l'élaboration d'une évaluation comparative (CER) ou la mise en place d'une stratégie en matière de données cliniques dans le cadre EU MDR, contactez un expert de Freyr pour discuter de vos défis réglementaires.
