*En utilisant des techniques d’apprentissage profond, des chercheurs de l’Université de Zhejiang et de la société de gestion des risques Tongdun Technology, basés à Hangzhou, en Chine, ont amélioré les prévisions de rendement des cultures. Cette méthode prometteuse peut prendre en compte la manière dont le rendement des cultures est affecté par l’emplacement des terres agricoles, et peut aider à produire des prévisions plus précises pour les agriculteurs et les décideurs politiques.*
PrÉDICTION DU RENDEMENT DES CULTURES AMéliORéE GRÂCE à L’APPRENTISSAGE PROFOND
Les chercheurs de l’Université de Zhejiang et de l’entreprise de gestion des risques Tongdun Technology ont développé des techniques d’apprentissage profond pour améliorer les prévisions de rendement des cultures. Ces nouvelles méthodes permettent de prendre en compte l’emplacement des terres agricoles et d’obtenir des prévisions plus précises pour les agriculteurs et les décideurs politiques.
Les prévisions de rendement des cultures jouent un rôle essentiel dans l’agriculture et nécessitent traditionnellement de suivre des facteurs tels que les conditions météorologiques et le sol. Des prévisions précises permettent aux agriculteurs de prendre des décisions financières éclairées et aident les gouvernements à éviter des catastrophes telles que la famine. La situation actuelle de changement climatique et l’augmentation de la production alimentaire rendent ces prévisions encore plus importantes, car il y a moins de marge d’erreur. Le changement climatique accroît le risque de faibles rendements dans de nombreuses régions, ce qui pourrait entraîner une crise mondiale.
De nombreux facteurs utilisés pour prédire le rendement des cultures, tels que le climat, la qualité du sol et les méthodes de gestion des cultures, restent les mêmes, mais les techniques de modélisation sont devenues plus sophistiquées ces dernières années. Les techniques d’apprentissage profond permettent non seulement de calculer l’effet de variables telles que les précipitations et la température sur le rendement des cultures, mais aussi de comprendre comment elles s’influencent mutuellement. Par exemple, les avantages d’une pluie abondante peuvent être annulés par des températures extrêmement élevées. La manière dont les variables interagissent peut conduire à des résultats différents de ceux obtenus en examinant chaque variable individuellement.
Dans le cadre de leur étude, les chercheurs ont utilisé un réseau neuronal récurrent, une technique d’apprentissage profond qui permet de suivre les relations entre différentes variables dans le temps, afin de prendre en compte les “dépendances temporelles complexes” qui affectent le rendement des cultures. Selon Chao Wu, chercheur à l’Université de Zhejiang et l’un des auteurs de l’étude, les variables liées au rendement des cultures, telles que la température, l’ensoleillement et les précipitations, sont affectées par le temps : “Elles évoluent dans le temps, interagissent de manière complexe les unes avec les autres et leur impact sur le rendement des cultures est généralement cumulatif”.
Cette technique permet également d’inférer l’effet de variables difficiles à quantifier, comme les améliorations constantes des techniques de reproduction et de culture agricole. Par conséquent, leur modèle bénéficie de la prise en compte de tendances plus larges qui s’étendent au-delà d’une seule année.
Les chercheurs ont également souhaité intégrer des informations spatiales, telles que des informations sur la proximité entre deux régions agricoles, pour déterminer si leurs rendements en produits agricoles sont susceptibles d’être similaires. Pour ce faire, les chercheurs ont combiné leur réseau neuronal récurrent avec un réseau neuronal graphique représentant la distance géographique, afin de déterminer comment les prévisions pour des lieux spécifiques seraient impactées par leur environnement. En d’autres termes, les chercheurs ont pu inclure des informations sur les régions adjacentes pour chaque zone de terres agricoles et aider le modèle à apprendre des relations entre le temps et l’espace.
Les chercheurs ont testé leur nouvelle méthode sur les données de rendement du soja aux États-Unis publiées par le service des statistiques agricoles nationales. Ils ont utilisé des données climatiques telles que les précipitations, l’ensoleillement et la pression de vapeur ; des données sur le sol telles que la conductivité électrique, l’acidité et la composition du sol ; et des données de gestion telles que le pourcentage de parcelles cultivées. Le modèle a été entraîné sur les données de rendement du soja entre 1980 et 2013, puis testé sur les données de 2015 à 2017. Comparé aux modèles existants, la méthode proposée a donné des résultats significativement meilleurs que les modèles entraînés avec des méthodes non liées à l’apprentissage profond, et mieux que d’autres modèles d’apprentissage profond qui ne prenaient pas en compte les relations spatiales.
Dans leurs travaux futurs, les chercheurs souhaitent rendre les données d’entraînement plus dynamiques et ajouter des fonctionnalités de sécurité au processus d’entraînement du modèle. Actuellement, le modèle est entraîné sur des données agrégées, ce qui ne permet pas de conserver la confidentialité des données propriétaires. Cela pourrait poser problème si des données telles que les rendements des cultures et les pratiques de gestion agricole étaient consultées par des concurrents afin de tirer un avantage injuste sur le marché. Les données agricoles, telles que l’emplacement des exploitations et les rendements des cultures, pourraient également rendre les agriculteurs vulnérables aux escroqueries et aux vols. La possibilité de divulgation de données pourrait également décourager la participation, réduire la quantité de données disponibles pour l’entraînement et avoir un impact négatif sur la précision des modèles entraînés.
Les chercheurs espèrent utiliser une approche d’apprentissage fédérée pour entraîner les futurs modèles de rendement des cultures, ce qui permettrait de mettre à jour un modèle mondial tout en maintenant les différentes sources de données isolées les unes des autres.
Les chercheurs ont présenté leurs résultats lors de la 26e Conférence internationale sur le travail coopératif assisté par ordinateur, qui s’est tenue du 24 au 26 mai à Rio de Janeiro, au Brésil.