Infrastructure numérique intelligente : quand la médecine montre la voie à l'agriculture de précision

Partie 2/2

Auteurs : Gatien Romuald Kenfack Nguemo candidat au doctorat en télédétection — Université de Sherbrooke

Supposez un instant que tous les agronomes du Québec puissent bénéficier des observations accumulées par leurs collègues depuis 20 ans — sans que personne n'ait à révéler ses pratiques, ses rendements ou ses données de parcelles. C'est exactement ce que permet l'infrastructure numérique intelligente développée dans le cadre du projet INI en phytoprotection.

Le projet INI : de la médecine à nos champs

Au Québec, des chercheurs de l'Université de Sherbrooke, de l'Université Laval, du CÉROM et de l'IRDA ont entrepris de transposer ces principes éprouvés en médecine vers l'agriculture de précision. Le projet INI (Infrastructure Numérique Intelligente) en phytoprotection vise à prédire l'apparition de maladies et de mauvaises herbes dans le maïs et le soya.

Deux cibles prioritaires ont été identifiées : la sclérotiniose du soya et le chénopode blanc, une mauvaise herbe particulièrement tenace dans le maïs. L'objectif : fournir aux producteurs et aux conseillers des cartes de risque et des alertes ciblées pour mieux dépister, mieux cibler et réduire l'utilisation des pesticides.

L'infrastructure fonctionne comme un tableur intelligent à trois dimensions : d'un côté le temps (jour, mois, année), de l'autre l'espace (champ, MRC, région), et en hauteur les conditions (sol, météo, culture). Croisez ces dimensions avec les données historiques, et vous obtenez vos risques — exactement comme les entrepôts de données cliniques permettent aux médecins de croiser symptômes, génétique et historique pour personnaliser les traitements.

Les résultats préliminaires sont prometteurs : plus de 15 000 enregistrements sur l'abondance du chénopode blanc ont été intégrés, auxquels s'ajoutent 639 profils de sols et des données satellitaires avec un taux de réussite de 89 % pour l'estimation de l'humidité de surface.

Ce qui se passe ailleurs dans le monde

Le Québec n'est pas seul à explorer cette voie. En Europe, le « Code of Conduct on agricultural data sharing » encadre depuis 2018 les pratiques de partage de données entre producteurs, coopératives et entreprises technologiques. Aux États-Unis, plusieurs initiatives de « data trusts » agricoles permettent aux producteurs de mettre en commun leurs données tout en gardant le contrôle sur leur utilisation.

Ces expériences internationales confirment qu'il est possible de construire des infrastructures de données qui respectent à la fois la confidentialité individuelle et le bénéfice collectif. Le chemin a été tracé par la médecine; l'agriculture peut maintenant l'emprunter.

Pourquoi partager ses données fait peur

Demander à un producteur de partager ses données de rendement ou de dépistage, c'est un peu comme lui demander d'ouvrir son livre de comptes devant les voisins. Les craintes sont multiples et compréhensibles :

La peur du jugement : « Si mes données montrent un rendement inférieur à celui du voisin, que va-t-on penser de mes pratiques? »
L'avantage concurrentiel : « Mes méthodes sont le fruit de 20 ans d'expérience. Pourquoi les offrir gratuitement? »
La méfiance institutionnelle : « Qui contrôlera vraiment mes données? À qui profiteront-elles ultimement? »

À ces préoccupations s'ajoutent des obstacles techniques bien réels : des formats de fichiers incompatibles d'un logiciel de gestion à l'autre, des décennies d'observations sur papier impossibles à numériser automatiquement, et l'absence de vocabulaire commun entre les différents intervenants du milieu.

En médecine, ces mêmes craintes ont freiné le partage pendant des années. L'apprentissage fédéré a changé la donne en offrant des garanties concrètes.

Des garanties concrètes de confidentialité

L'infrastructure numérique intelligente développée dans le projet INI intègre plusieurs mécanismes de protection :

Les données restent locales. Avec l'apprentissage fédéré, vos données brutes ne quittent jamais votre ferme ou votre club-conseil. Seuls les « apprentissages » — c'est-à-dire les paramètres du modèle, pas les données elles-mêmes — circulent pour enrichir le modèle global. C'est exactement le même principe utilisé par les 71 hôpitaux pour la détection de pneumonie.
Anonymisation et agrégation. Les données utilisées pour entraîner les modèles sont transformées en tendances statistiques. Impossible de savoir quel champ appartient à qui, ni de retracer les pratiques individuelles d'un producteur. En médecine, ce processus suit des standards rigoureux comme le modèle OMOP (Observational Medical Outcomes Partnership).
Gouvernance partagée. Les décisions sur l'utilisation des modèles sont prises collectivement par les clubs-conseils et les organisations partenaires, pas par une seule institution. L'objectif est de créer un « commun numérique » — comme une coopérative de données — où chaque contributeur garde un droit de regard sur l'utilisation collective.

Plus on est nombreux, plus c'est fiable

Au-delà des garanties de confidentialité, pourquoi partager? La réponse tient dans un principe simple que les études médicales ont amplement démontré : un modèle de prédiction n'est aussi bon que les données qui l'alimentent.

Un algorithme entraîné sur 50 champs en Montérégie donnera des résultats corrects... pour la Montérégie. Le même algorithme nourri par des milliers d'observations provenant de toutes les régions du Québec, sur différents types de sols (argile, loam, sable) et dans des conditions météo variées, deviendra beaucoup plus robuste et fiable — y compris pour votre propre ferme.

C'est exactement ce qu'ont démontré les études sur les mammographies : les modèles fédérés, entraînés sur des données de plusieurs institutions, surpassent ceux développés localement. La diversité des données n'est pas un luxe — c'est la clé de la fiabilité.

Le principe est celui d'une coopérative : chacun met un peu, et tout le monde reçoit plus que sa mise. Sauf qu'ici, la « mise » ne vous appauvrit pas. Vos données restent chez vous. Ce que vous partagez, c'est leur intelligence — leur capacité à enrichir un modèle qui, en retour, vous aidera à mieux anticiper les risques dans vos propres champs.

Les leçons de la médecine sont claires

Première leçon : la confidentialité n'est plus un obstacle.
L'apprentissage fédéré protège vos données tout en permettant la collaboration. Les succès en médecine le prouvent : 71 institutions peuvent travailler ensemble sans qu'une seule donnée patient ne soit compromise

Deuxième leçon : la diversité des données améliore la précision.
Plus on partage, mieux on prédit — pour tout le monde. Les modèles fédérés surpassent les modèles locaux parce qu'ils apprennent de la variété.

Troisième leçon : une gouvernance partagée garantit l'équité.
Vos données enrichissent un modèle qui vous revient. C'est le principe du commun numérique : contribuer ensemble à un outil qui bénéficie à tous.

Et si vos données devenaient vos meilleures alliées pour participer à la construction d’un commun numérique agricole québécois?

Auteur : Gatien Romuald Kenfack Nguemo, candidat au doctorat en télédétection — Université de Sherbrooke

Sources et références :

Nature Digital Medicine — « The future of digital health with federated learning »
PMC/NIH — « Federated machine learning in healthcare: A systematic review »
Owkin — « Federated learning in healthcare: the future of collaborative clinical research »
Projet INI Phytoprotection — Université de Sherbrooke, Université Laval, CÉROM, IRDA