LE QUOTIDIEN : Vous publiez aujourd’hui le bilan de la mise en place de l’entrepôt des données de santé du CHU Nantes. Comment définiriez-vous ses grands principes ?
Pr PIERRE-ANTOINE GOURRAUD : L’usage secondaire des données de santé est déterminé par la question scientifique qui est posée. Dès le début nous avons insisté sur ce point : notre métier est d’accompagner cette question scientifique. Elle légitime un accès à des données et nous permet de définir celles qui seront nécessaires. Cette approche a été confirmée par notre expérience depuis 2018. Finalement, ce n’est pas l’aspect technique – les hébergeurs, les tailles des disques durs… – qui guide notre travail, c’est la question posée aux données.
Vous insistez aussi sur la gouvernance. De quoi s’agit-il ?
En effet, l’autre point important est la gouvernance des données c’est-à-dire qui a accès, à quoi, quand, comment… De plus, pour qu’un entrepôt de données de santé fonctionne, il faut un triumvirat qui travaille ensemble : une équipe de data scientists, un département recherche et innovation (DRI) et un département informatique. J’aime partager l’analogie d’une maison : nous en sommes les architectes, le DRI gère les finances et donne le permis de construire et les moyens ; et la direction informatique de l’hôpital s’occupe de la mise en œuvre. Enfin, nous attachons une grande importance au respect du travail de tous les professionnels de santé du CHU de Nantes. N’oublions pas que ces données sont coproduites par toute la communauté hospitalière – elles concernent finalement autant les patients que les soignants.
N’oublions pas que ces données sont coproduites par toute la communauté hospitalière
Justement, comment les professionnels de santé du CHU accueillent-ils la clinique des données ?
Dès le début, l’accent a été mis sur la gouvernance de données. Nous communiquons régulièrement sur ce que nous faisons. Ainsi pour chaque projet, les chefs de service concernés sont systématiquement informés. Et je rends des comptes annuellement en Commission médicale d’établissement (CME) pour montrer ce qui a été réalisé avec les données produites par la communauté. Nous avons souvent un regain de demandes suite à cette présentation. Nous sommes victimes de notre succès ! Le fait que je sois PU-PH et que nous soyons un service hospitalier classique avec des internes, des étudiants en master… rassure également.
Comment est composée votre équipe ?
Nous sommes une dizaine. L’équipe interdisciplinaire comprend des docteurs de santé publique, des data scientists, des informaticiens, des juristes, des épidémiologistes, des biostatisticiens, des directeurs de projets… Nous travaillons sur environ 200 projets par an (réalisés ou en cours). Nous avons deux à trois nouveaux projets par semaine. Pour certains d’ailleurs, nous n’utilisons pas l’entrepôt de données de santé (EDS) mais nous nous orientons vers le SNDS (Système national des données de santé, NDLR). Une des forces de notre équipe est son intégration dans le CHU. Nous travaillons avec des algorithmes de traitement automatique du langage naturel (TALN) qui exploitent le texte de 100 millions de documents comme les comptes rendus opératoires. Ces algorithmes sont adaptés et paramétrés à travers les échanges avec les professionnels, pour tenir compte des expressions ou acronymes utilisés.
L’entrepôt regroupe les données de plus de trois millions de patients, cela représente 100 millions de documents textuels et 750 millions de données structurées
Quels sont les types de projets menés ?
L’entrepôt regroupe les données de plus de trois millions de patients, cela représente 100 millions de documents textuels et 750 millions de données structurées. Nous intervenons sur trois types de projets de manière transversale à l’établissement.
Le premier consiste à identifier et caractériser des populations de patients spécifiques pour des essais cliniques, des cohortes de recherche ou des sous-populations pour des études. L’entrepôt de données change complètement la donne dans la capacité de l’établissement à identifier de manière transversale des patients. Avant, les équipes avaient au mieux une vision dans leur service, maintenant nous pouvons faire une recherche sur des maux particuliers, des codes, des thérapies ou des examens particuliers dans les dossiers de l’établissement.
Le deuxième axe porte sur l’enrichissement des bases de données existantes. Par exemple, pour l’observatoire français de la SEP qui a beaucoup de données d’établissement à travers le pays, nous avons regardé les informations que nous sommes capables de collecter. Nous vérifions si ce que nous trouvons correspond à ce qui était déjà dans la base et si d’autres éléments peuvent être ajoutés.
Enfin, un troisième type de projet repose sur le développement de nouvelles technologies grâce à l’accès aux documents textuels. Cela permet d’identifier des patients en particulier pour des études. Par exemple, nous avons pu travailler sur les césariennes réalisées en urgence en gynéco-obstétrique. Il n’existe pas de code dans les dossiers, mais il est systématiquement mentionné « code rouge » dans les comptes rendus. Ce n’est pas une information structurée et c’est toute la force des technologies de traitement automatique du langage. C’est dans ces documents textuels que se trouvent la finesse du raisonnement clinique. Nous travaillons aussi sur le suivi des dispositifs médicaux, comment à cinq ou dix ans ils influencent la qualité de vie, la consommation médicale des patients…
Créé en 2018, l’entrepôt regroupe des données depuis 2002. Comment gérez-vous le consentement des patients au partage de leurs données ?
Tous les patients, quand ils viennent ou reviennent au CHU, sont informés de l’existence de cet entrepôt depuis avril 2018. Ils peuvent s’opposer à ce que les données les concernant soient utilisées à des fins de recherche en écrivant à vosdonneespersonnelles@chu-nantes.fr. Nous avons par ailleurs exclu les données « hyperconfidentielles », cela concerne notamment des hommes politiques, des sportifs de haut niveau, des professionnels de l’établissement ou certains patients passés dans des services très particuliers. En pratique, nous avons très peu de demandes d’opposition. Les gens nous font confiance. Au moment du déploiement, nous avons mis en place cette information individuelle et l’avons doublé d’une campagne grand public dans le Journal du Pays-de-la-Loire. C’était la meilleure manière de toucher les gens de notre bassin d’influence. Nous réfléchissons à faire une nouvelle campagne sur notre bilan, de manière concertée avec les autres établissements du GCS Hugo et de notre Ouest Data Hub.
Pendant le confinement en 2020, le projet Argos permettait un suivi épidémiologique du Covid sur le territoire, en intégrant les données de SOS Médecin pour anticiper des regains d’activité aux urgences hospitalières. Il a depuis donné lieu au cas d’usage SynopseReact, intégré au projet Synopse. En quoi consiste-t-il ?
Historiquement, l’entrepôt de données de santé n’a pas vocation à sortir des murs. Pendant la crise Covid, nous avions cette expertise d’analyser les données pour suivre l’information au sein de l’établissement. Nous avons travaillé avec nos collègues de SOS Médecins et des laboratoires de ville (Bioliance) pour voir « numériquement » arriver les vagues de Covid. Notre gros enjeu était de partager des données qui relèvent de différentes entités, de manière sécurisée. Nous avons démontré qu’il était possible d’avoir une vision épidémiologique territoriale, comme une « météo santé ». Synopse pour Système Numérique d'Observation Populationnelle Santé Environnement, fait partie des projets soutenus par l’État dans le cadre du dispositif Territoires intelligents et durables de France 2030. Il s’agit de se préparer pour la prochaine crise sanitaire afin de définir de nouveaux outils utilisant des données de santé mais aussi environnementales et socio-économiques.
Stabiliser le financement permet de passer d’un entrepôt à visée de recherche à un véritable data pole au sein du CHU
Quel est le budget nécessaire pour la clinique des données ?
L’ordre de grandeur est d’un million d’euros par an pour l’ensemble de l’investissement de l’établissement. Un des enjeux des entrepôts de données de santé hospitaliers est un financement pérenne. Stabiliser cette enveloppe permet de passer d’un entrepôt à visée de recherche à un véritable data pole au sein du CHU.
Quels sont les autres enjeux pour les prochaines années ?
L’innovation et la collaboration. Nous avons montré que ces EDS sont une opportunité pour innover et nous devons continuer à travailler à de nouveaux algorithmes. Le deuxième élément est la collaboration. Nous avons développé un réseau de partenaires, en particulier avec le Ouest Data Hub. Nous ne mettons pas les données dans un pot commun mais nous coordonnons nos actions. Par exemple, nous avons développé au CHU un algorithme avec un peu d’IA qui a été cherché dans d’autres sources de données pour mettre à jour le statut vital de patients. 204 000 patients étaient décédés mais ça n’apparaissait pas dans les dossiers de l’hôpital car c’était intervenu hors les murs. Cet algorithme, nous l’avons partagé en open source. C’est une opportunité de créer de la « soli-data-rité », c’est-à-dire des usages solidaires des données.
Repères
2006-2008 : assistant hospitalo-universitaire de l’université Paul-Sabatier de Toulouse
2008 : fonde la société de conseil en biostatistiques, Methodomics
2009-2011 : postdoctorat de neurologie à l’université de Californie à San Francisco
2011-2017 : occupe plusieurs postes de professeur associé au sein du centre médical de l’université californienne
Septembre 2015 : retour en France du PU-PH pour lancer la clinique des données du CHU de Nantes dont il prend la direction et enseigner la biologie cellulaire et la santé numérique
Hommage des directeurs d’hôpital à Thomas Lauret, décédé à 53 ans
Les médecins saluent l’arrivée de leur consœur Geneviève Darrieussecq à la Santé… et poussent leurs agendas
Prévention des suicides de médecins : un bilan positif en Norvège
Deux hôpitaux sur trois endettés, les cliniques en bien meilleure santé