Data & IA2 min de lecture

Data Science dans la pharma : 3 cas concrets

LauraAGATE IT

24 avril 2023

3 missions, 3 approches, des resultats mesurables

La data science dans la pharma, ce n'est pas du Kaggle. Les donnees de sante sont sensibles, les modeles doivent etre explicables, et le regulateur (ANSM, EMA) veut des preuves. Voici 3 cas concrets de missions realisees entre 2023 et 2025.

Cas 1 : prediction d'effets secondaires

Laboratoire de taille moyenne, phase de pharmacovigilance. On a entraine un modele XGBoost sur 120 000 rapports d'effets indesirables (base PySpark). Feature engineering sur les interactions medicamenteuses et les profils patients. Resultat : detection precoce amelioree de 28%, avec un recall de 0.84. Le modele a ete audite par l'equipe reglementaire avant mise en production.

Cas 2 : optimisation des essais cliniques

Biotech en phase II. Le ML a ete utilise pour predire le taux d'attrition des patients dans les cohortes. Modele de survie (Cox regression + random forest) entraine sur les donnees de 15 essais precedents. Gain : reduction de 18% du surdimensionnement des cohortes, soit environ 1,2M EUR d'economie par essai.

Cas 3 : imagerie medicale et Deep Learning

CHU partenaire d'un labo. Detection de lesions sur des IRM cerebrales avec un reseau U-Net implemente en PyTorch. Dataset : 8 000 images annotees par des radiologues. Augmentation de donnees agressive (rotation, flip, elastic deformation). AUC finale : 0.93. Le modele assiste les radiologues — il ne les remplace pas.

En pharma, un modele ML sans explicabilite, c'est un modele qui ne passera jamais en production. SHAP et LIME ne sont pas optionnels.

data sciencepharmamachine learningessais cliniquesprévision

Tous les articles

Laura

Consultant chez AGATE IT

Expert en data & ia, notre consultant partage ses retours d’expérience et ses bonnes pratiques pour vous aider dans vos projets.