Partie 1/2
Imaginez 71 institutions médicales collaborant pour perfectionner une intelligence artificielle sans jamais partager les dossiers de leurs patients. Aucune donnée sensible ne quitte son lieu d’origine; l’algorithme, lui, apprend de tous. Ce n’est plus de la science-fiction: c’est l’apprentissage fédérée, une révolution technologique qui protège la vie privée tout en transformant la médecine de précision. Et si cette même approche pouvait transformer l'agriculture québécoise? Et si ce modèle présentait des pistes pour l’avenir agricole québécois?
Un défi commun : des trésors de données enfermés dans des silos
En médecine comme en agriculture, le même problème se pose : des quantités phénoménales de données précieuses dorment dans des systèmes isolés, incapables de communiquer entre eux. Chaque hôpital possède ses propres dossiers patients, ses images médicales, ses résultats de laboratoire. Chaque ferme, chaque club-conseil détient ses propres observations de dépistage, ses historiques de rendements, ses données météo.Résultat : les algorithmes d'intelligence artificielle, aussi sophistiqués soient-ils, sont entraînés sur des données limitées et peu diversifiées. Un modèle développé à partir des données d'un seul hôpital — ou d'une seule région agricole — sera performant... pour cet hôpital ou cette région. Mais sa capacité à généraliser, à prédire correctement dans d'autres contextes, reste limitée.
La solution évidente serait de centraliser toutes les données dans un immense réservoir commun. Mais c'est précisément là que le bât blesse : ni les patients, ni les producteurs agricoles ne souhaitent voir leurs informations personnelles ou professionnelles exposées à des tiers. La confidentialité n'est pas un caprice, c'est une exigence légitime et, dans le cas médical, une obligation légale.
La médecine ouvre la voie : des succès concrets
Face à ce dilemme apparent entre collaboration et confidentialité, le monde médical a développé une solution élégante : l'apprentissage fédéré. Le principe est simple à comprendre avec une analogie culinaire. Imaginez que vous voulez améliorer une recette de pâté chinois en combinant les secrets de plusieurs cuisiniers. L'approche traditionnelle consisterait à demander à chacun d'envoyer ses ingrédients dans une cuisine centrale. Avec l'apprentissage fédéré, c'est l'inverse : la recette voyage de cuisine en cuisine, s'améliore à chaque arrêt grâce aux ingrédients locaux, mais personne n'a jamais à partager ses ingrédients avec les autres.Les résultats en médecine sont spectaculaires. Voici trois exemples concrets qui démontrent la puissance de cette approche :
| COVID-19 - France, 2020, Au plus fort de la pandémie, deux hôpitaux français (Institut Gustave Roussy et Kremlin-Bicêtre APHP) ont développé en seulement 2 mois un modèle capable de prédire la sévérité de la maladie chez les patients hospitalisés. Le modèle analyse des images tomodensitométriques (Computed Tomography [CT]) des poumons, des rapports de radiologie et des données cliniques pour générer un « score de sévérité COVID-19 ». Tout cela sans qu'aucun dossier patient n'ait quitté son hôpital d'origine. Le code est maintenant disponible en source libre (open source) pour d'autres chercheurs. |
| Dépistage du cancer du sein — Collaboration internationale, Une étude internationale utilisant l'apprentissage fédéré pour l'analyse des mammographies a démontré que les modèles ainsi développés surpassent ceux entraînés sur les données d'une seule institution. Plus important encore : ces modèles se généralisent mieux, c'est-à-dire qu'ils conservent leur performance même lorsqu'ils sont appliqués aux données d'institutions qui n'ont pas participé à l'entraînement. |
| Détection de pneumonie — 71 institutions, Une étude à grande échelle impliquant 71 établissements de santé a montré que l'apprentissage fédéré peut égaler, voire surpasser, les performances des approches centralisées traditionnelles pour la détection de pneumonie sur radiographies thoraciques. La preuve que collaborer sans centraliser n'est pas un compromis de qualité — c'est parfois même un avantage. |
Ces succès ne sont pas isolés. Une revue systématique publiée en 2024 a recensé plus de 612 articles scientifiques sur l'apprentissage fédéré en santé. La radiologie et la médecine interne sont les spécialités les plus actives dans ce domaine. Et l'industrie pharmaceutique s'y met aussi : le consortium MELLODDY réunit 10 grandes compagnies pharmaceutiques qui collaborent pour accélérer la découverte de médicaments, chacune contribuant à améliorer les modèles sans jamais révéler ses données propriétaires.
Le parallèle avec l'agriculture est frappant
Remplacez « dossiers patients » par « données de rendement », « images médicales » par « images satellites », « hôpitaux » par « fermes et clubs-conseils », et vous obtenez exactement la même problématique — et la même solution potentielle.En médecine, l'objectif est de prédire les maladies et d'optimiser les traitements à partir de données sensibles (dossiers, imagerie, génomique) détenues par des hôpitaux et cliniques. En agriculture, l'objectif est de prédire l'apparition des ennemis de cultures et d'optimiser les interventions à partir de données tout aussi sensibles (rendements, pratiques, parcelles) détenues par des fermes et des clubs-conseils.
Dans les deux cas, le frein principal est le même : la confidentialité. Et dans les deux cas, l'apprentissage fédéré offre une voie de sortie.
Et si vs données devenaient vos meilleures alliées?
Auteur : Gatien Romuald Kenfack Nguemo, candidat au doctorat en télédétection — Université de Sherbrooke
Sources et références :
- Nature Digital Medicine — « The future of digital health with federated learning »
- PMC/NIH — « Federated machine learning in healthcare: A systematic review »
- Owkin — « Federated learning in healthcare: the future of collaborative clinical research »
- Projet INI Phytoprotection — Université de Sherbrooke, Université Laval, CÉROM, IRDA
L'IA appliquée à la phytoprotection préventive
