Aller au contenu principal

La statistique au service de la santé

Publié le 13/11/2023

En santé, la statistique vise à répondre à nombre de questions sur les épidémies, les traitements, l’état de santé d’une population... Un champ mathématique essentiel, d’autant plus que la quantité d’informations collectées croît exponentiellement avec les progrès du numérique. Valérie Garès, Maîtresse de Conférences à l’INSA Rennes et chercheuse à l’IRMAR (UMR CNRS 6625 - ENS rennes, CNRS, INSA rennes, Université de Rennes et Université de Rennes 2), présente le panorama de ses recherches dans ce domaine.

Dès ses débuts, Valérie Garès a contribué à faire progresser la statistique en santé, dans le cadre de sa thèse en mathématiques appliquées soutenue en 2014 à l’INSERM sur le risque de maladie d’Alzheimer. Elle a remis en cause un test utilisé pour les essais cliniques, qui s’avère peu adapté lorsqu’un traitement présente des effets tardifs, et a pu concevoir un test de détection de ces effets à retardement.


L’appariement de bases de données médicales

Après deux post-doctorats – l’un en Australie sur l’analyse des risques compétitifs appliquée à l’étude de récidives de cancer avec ou sans radiothérapie ; l’autre en France en épidémiologie sur les inégalités sociales en santé –, Valérie Garès a été recrutée à l’INSA Rennes en 2017. Depuis, elle travaille sur l’intégration de données. Le but de sa première recherche, poursuivie avec Jérémy Omer, Maître de Conférences à l’INSA Rennes, était d’enrichir des bases de données médicales existantes, mais avec une difficulté : les variables ne sont pas toutes codées sur la même échelle.

« Nous avons travaillé sur la cohorte ELFE1, qui suit 18 000 enfants depuis leur plus jeune âge, pour analyser comment différents facteurs agissent sur leur bien-être, développement et santé. » Deux vagues de recrutement se sont succédées, avec diverses modalités, notamment sur l’état de santé de la mère : "excellent", "très bien", "bien", "passable" ou "mauvais" dans la 1re vague, et "très bien", "bien", "moyen", "mauvais" ou "très mauvais" dans la 2e vague.

Valérie Garès et Jérémy Omer ont développé un modèle pour recoder ces variables afin qu’elles soient homogènes, via la "méthode mathématique de transport optimal". Le principe : rapprocher des individus d’une 1re base à d’autres individus d’une 2e base, pour créer un identifiant unique.

« Aujourd’hui, je travaille toujours sur le développement de ces modèles, avec les épidémiologistes de l’IRSET2 qui étudient l’impact de la pollution sur le développement de l’obésité ou de cancers »


La probabilité d’identifier des individus dans une base

Autre sujet d’exploration de Valérie Garès : l’enrichissement d’informations sur des patients précis dans une base, en utilisant les données d’une autre base. Pour ce faire, elle exploite des variables communes aux deux bases, appelées variables d’appariement. Le problème ? Ces variables sont de natures différentes, soit catégorielles (genre, etc.), soit quantitatives continues (dates d’hospitalisation, etc.).

« La thèse de Thanh Huan Vo, co-dirigée avec Guillaume Chauvet de l’ENSAI3 en collaboration avec l’EHESP4 et l’IRT b-com5, utilise les informations du SNDS6, qui gère les principales bases de données françaises (Assurance Maladie, hospitalisations, etc.), afin d’enrichir des registres médicaux. Pour faire correspondre les personnes, nous avons complété la "méthode probabiliste de couplage d’enregistrement" en tenant compte de la nature différente des variables qui permettent d’apparier les bases. L’objectif final : effectuer une analyse des durées de survie pour expliquer le risque d’accident cardiovasculaire (donnée enregistrée dans le registre AVC) par différentes variables (âge, sexe, type d’attaque, etc.) issues du SNDS. » Actuellement, Valérie Garès poursuit le développement de ces modèles dans le cadre de la thèse de Vanessa Cheuzeu, en collaboration avec l’université de Douala au Cameroun et Jean-François Dupuy, professeur en Mathématiques Appliquées à l’INSA Rennes. Une suite prometteuse...

« Il est donc possible d’enrichir les informations sur les individus dans une base de données, et c’est une réelle plus-value en santé, conclut Valérie Garès. À nous de veiller qu’elles ne soient pas appliquées pour des usages moins éthiques sur le respect des données personnelles ! »

 

1 Étude Longitudinale Française depuis l’Enfance
2 Institut de Recherche en Santé, Environnement et Travail
3 École Nationale de la Statistique et de l’Analyse de l’Information
4 École des Hautes Études en Santé Publique
5 IRT b-com est un Institut de Recherche Technologique privé basé à Rennes, qui explore, conçoit et fournit des innovations aux entreprises qui veulent développer leur compétitivité grâce au numérique
6 Système National des Données de Santé

 

Cet article est extrait du magazine "InsideLabs, la Recherche à l'INSA Rennes". Retrouvez l'intégralité du 2e numéro "Comment la technologie révolutionne la santé, le bien-être et la qualité de vie ?".

 

 

Retrouvez toutes nos actualités