Data Science dans la pharma : 3 cas concrets
3 missions, 3 approches, des resultats mesurables
La data science dans la pharma, ce n'est pas du Kaggle. Les donnees de sante sont sensibles, les modeles doivent etre explicables, et le regulateur (ANSM, EMA) veut des preuves. Voici 3 cas concrets de missions realisees entre 2023 et 2025.
Cas 1 : prediction d'effets secondaires
Laboratoire de taille moyenne, phase de pharmacovigilance. On a entraine un modele XGBoost sur 120 000 rapports d'effets indesirables (base PySpark). Feature engineering sur les interactions medicamenteuses et les profils patients. Resultat : detection precoce amelioree de 28%, avec un recall de 0.84. Le modele a ete audite par l'equipe reglementaire avant mise en production.
Cas 2 : optimisation des essais cliniques
Biotech en phase II. Le ML a ete utilise pour predire le taux d'attrition des patients dans les cohortes. Modele de survie (Cox regression + random forest) entraine sur les donnees de 15 essais precedents. Gain : reduction de 18% du surdimensionnement des cohortes, soit environ 1,2M EUR d'economie par essai.
Cas 3 : imagerie medicale et Deep Learning
CHU partenaire d'un labo. Detection de lesions sur des IRM cerebrales avec un reseau U-Net implemente en PyTorch. Dataset : 8 000 images annotees par des radiologues. Augmentation de donnees agressive (rotation, flip, elastic deformation). AUC finale : 0.93. Le modele assiste les radiologues — il ne les remplace pas.
En pharma, un modele ML sans explicabilite, c'est un modele qui ne passera jamais en production. SHAP et LIME ne sont pas optionnels.
Laura
Consultant chez AGATE IT
Expert en data & ia, notre consultant partage ses retours d’expérience et ses bonnes pratiques pour vous aider dans vos projets.