Prédiction des dynamiques spatio-temporelles des pollinisateurs par modèle d’apprentissage profond explicable.
ABG-132872 | Thesis topic | |
2025-07-11 | EU funding |

- Computer science
- Digital
- Data science (storage, security, measurement, analysis)
Topic description
Contexte scientifique
Cette thèse s’inscrit dans le cadre d’un projet européen INTERREG visant à surveiller les pollinisateurs dans les espaces verts de neuf pays européens.
Dans un contexte de transformation des écosystèmes modernes et d’urbanisation croissante, une gestion efficace de la biodiversité ainsi qu’un suivi rigoureux des populations de pollinisateurs sont essentiels. Ces insectes jouent un rôle fondamental dans le maintien des écosystèmes et la sécurité alimentaire. Toutefois, ils font face à des menaces grandissantes, notamment les changements climatiques, la fragmentation des habitats et les pressions d’origine anthropique.
L’essor des nouvelles technologies, notamment l’Intelligence Artificielle (IA), l’Analyse des Big Data (BDA) et les Capteurs Avancés (AS), ouvre de nouvelles perspectives pour l’étude et la préservation des pollinisateurs. Ces avancées permettent d’améliorer le suivi des populations, d’optimiser l’acquisition des données sur le terrain et de développer des modèles prédictifs pour mieux comprendre les dynamiques spatio-temporelles des pollinisateurs [1-2].
Cette thèse s’intéresse à deux défis majeurs dans le domaine du suivi écologique :
- Identification et estimation des espèces de pollinisateurs observées lors des "transect walk" [3] et grâce à un dispositif visuelle (caméra) [4] mis en place sur terrain,
- Prédiction de leur abondance et de leur répartition dans le temps et l’espace.
Le "transect walk" est une méthode de suivi écologique où un observateur parcourt un itinéraire défini en enregistrant les espèces rencontrées, permettant d’analyser leur diversité et leur abondance [1].
Concernant le premier défi, deux approches distinctes seront développées : l’une pour la détection des pollinisateurs et l’autre pour leur identification.
Pour relever le défi de la prédiction des dynamiques des populations de pollinisateurs, plusieurs pistes devront être explorées, notamment l’utilisation d’un Réseau de Convolution Graphique Spatio-Temporel Récurrent [5]. Un tel modèle pourrait exploiter les données collectées lors des transects walk ainsi que les séries temporelles des variations d’abondance des pollinisateurs afin d’estimer leur distribution future. L’exploration de combinaisons de méthodes, telles que les Réseaux de Convolution Graphique (GCN) et les Réseaux Long Short-Term Memory (LSTM), pourrait également permettre d’améliorer la précision des prédictions [6].
Des expériences approfondies seront menées sur des ensembles de données réelles provenant de divers écosystèmes (prairies, zones urbaines, ...) issues des partenaires nord-européen et permettront de valider l’efficacité du modèle proposé, démontrant sa capacité à identifier les corrélations spatio-temporelles entre les pollinisateurs et les variables environnementales, et à fournir des prévisions précises sur leur évolution à long terme.
Objectifs et résultats
Cette thèse visera à répondre à plusieurs verrous scientifiques liés au suivi et à la prédiction des pollinisateurs à partir de données issues de "transect walk" et de données visuelles :
1. Acquisition et qualité des données
Détection et identification des pollinisateurs : la reconnaissance des pollinisateurs à partir de données visuelles (images, vidéos) est un défi en raison de la diversité des espèces, des variations morphologiques et des conditions d’observation (luminosité, arrière-plan, etc.).
Manque de bases de données annotées : l’apprentissage automatique nécessite de grandes quantités de données étiquetées pour entraîner les modèles, or ces bases de données sont souvent limitées ou incomplètes pour les pollinisateurs.
Biais d’échantillonnage : les transects walk peuvent introduire des biais liés à la météo, à l’heure de la journée, ou à l’observateur (effet humain sur la présence des pollinisateurs).
2. Modélisation et analyse des données
Complexité des dynamiques spatio-temporelles : les populations de pollinisateurs varient en fonction de multiples facteurs environnementaux (floraison, climat, ...), ce qui rend difficile l’établissement de modèles prédictifs robustes.
Corrélation vs causalité : identifier les relations causales entre la présence des pollinisateurs et les variables environnementales est un défi, car de nombreux facteurs sont interconnectés.
Réduction de la dimensionnalité : les données écologiques sont souvent multidimensionnelles (espèces, localisation, climat, types de plantes visitées), ce qui peut entraîner un surajustement des modèles ou une perte d’information lors de la simplification des variables.
3. Défis liés aux modèles d’Intelligence Artificielle (IA)
Interprétabilité des modèles : les réseaux de neurones profonds et les transformers offrent de bonnes performances, mais leur boîte noire rend difficile l’interprétation des résultats.
Généralisation des modèles : un modèle entraîné sur un écosystème donné (ex. prairies) peut-il être transposé à un autre (ex. forêts, zones urbaines) ? L’adaptation aux contextes locaux reste un verrou important.
Besoins en calcul et en énergie : l’IA appliquée aux sciences écologiques nécessite des ressources computationnelles importantes, ce qui peut être un frein pour les chercheurs ayant un accès limité aux infrastructures de calcul. Le défi réside dans la proposition de modèles optimisés et non gourmand en utilisation de ressources.
4. Prédiction et applications
Robustesse des prévisions à long terme : les modèles de prédiction doivent prendre en compte des événements imprévisibles (changements climatiques extrêmes, destruction d’habitats) qui influencent fortement les populations de pollinisateurs.
Utilisation des résultats pour la gestion écologique : comment traduire les prédictions en recommandations concrètes pour la conservation des pollinisateurs ? L’intégration des résultats dans les politiques publiques et les pratiques agricoles reste un défi.
Programme prévisionnel de la thèse (3 ans)
Phase I : État de l’art et déploiement initial
- Data-based AI
- Knowledge-based AI
- Green AI
- Monitoring system
- Déploiement initial du prototype existant
- Collecte des premiers retours terrain
Phase II : Conception et mise en place du système de monitoring
- Affinement des méthodologies et des modèles
- Acquisition et prétraitement des données
- Amélioration continue du prototype en fonction des retours terrain
- Développement des premières versions opérationnelles
Phase III : Validation de l’approche
- Expérimentations sur des cas d’étude issus de différents écosystèmes
- Analyse des résultats et ajustements des modèles
- Comparaison avec les approches existantes
Phase IV : Valorisation et rédaction
- Rédaction du manuscrit de thèse
- Publication des résultats dans des revues et conférences
- Mise à disposition des composants logiciels développés pour la communauté
Références
[1] Kriouile, Y., Ancourt, C., Wegrzyn-Wolska, K., Bougueroua, L. (2024). Nested object detection using mask R-CNN: application to bee and varroa detection. Neural Comput & Applic 36, 22587–22609. https://doi.org/10.1007/s00521-024-10393-x
[2] Huet, J. C., Bougueroua, L., Kriouile, Y., Wegrzyn-Wolska, K., & Ancourt, C. (2022). Digital Transformation of Beekeeping through the Use of a Decision Making Architecture. Applied Sciences 12(21), 11179.
[3] Laurian Parmentier (2023). “Three-Strip Management”: Introducing a novel mowing method to generate architectural complexity in perennial flower margins to better support pollinators. Journal of Pollination Ecology 34(4), pp 267-283. DOI: 10.26786/1920-7603(2023)747
[4] Bjerge K, Alison J, Dyrmann M, Frigaard CE, Mann HMR, Høye TT (2023) Accurate detection and identification of insects from camera trap images with deep learning. PLOS Sustain Transform 2(3): e0000051. https://doi.org/10.1371/journal.pstr.0000051
[5] Bhatti, Uzair Aslam, Tang, Hao, Wu, Guilu, Marjan, Shah, Hussain, Aamir, (2023) Deep Learning with Graph Convolutional Networks: An Overview and Latest Applications in Computational Intelligence, International Journal of Intelligent Systems, 28 pages. https://doi.org/10.1155/2023/8342104
[6] Yong Yu, Xiaosheng Si, Changhua Hu, Jianxun Zhang, (2019) A Review of Recurrent Neural Networks: LSTM Cells and Network Architectures. Neural Comput 31(7): 1235–1270. doi: https://doi.org/10.1162/neco_a_01199
Starting date
Funding category
Funding further details
Presentation of host institution and host laboratory
Grande École d’ingénieurs généraliste du numérique depuis 1936, reconnue par la CTI, l’Efrei dispense les compétences scientifiques et techniques nécessaires à l’insertion et à la réussite de l’ingénieur. L’école indépendante est reconnue d’intérêt général (EESPIG), impliquant un réinvestissement constant dans la pédagogie et une participation active aux missions de l’enseignement supérieur (recherche, médiation scientifique, formation, collaboration internationale…). Depuis janvier 2022, l’Efrei a intégré l’université Paris Panthéon-Assas en tant qu’établissement-composante. Cela permet ainsi de structurer une recherche pluridisciplinaire entre le numérique et des thématiques comme le droit, la gestion, les médias ou l’écologie ouvrant la voie à de nouveaux sujets de recherche comme la legalTech. Grâce à son laboratoire de recherche, l’Efrei Research Lab, l’école assure l’excellence de sa formation par une recherche appliquée qui vient nourrir directement l’évolution des programmes.
L’Efrei Research Lab est aussi le laboratoire dédié au numérique de l’Université Paris Panthéon Assas. Il y développe une recherche multidisciplinaire au sein de cette université. Les travaux de recherche du laboratoire sont appliqués à deux domaines majeurs : les sciences du vivant (santé, éducation, sport, agriculture et biodiversité) et les territoires intelligents (entreprises, habitations, réseaux).
PhD title
Country where you obtained your PhD
Institution awarding doctoral degree
Graduate school
Candidate's profile
Master ou équivalent en informatique : science de données, IA, etc.
Vous possédez des connaissances en Data, Machine/Deep Learning, natural language processing, Machine Learning for time series, ainsi qu’un bon niveau en anglais.
Vous avez déjà un compte ?
Nouvel utilisateur ?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
Aérocentre, Pôle d'excellence régional
ANRT
ADEME
Nokia Bell Labs France
TotalEnergies
Institut Sup'biotech de Paris
Généthon
Groupe AFNOR - Association française de normalisation
Ifremer
CASDEN
Tecknowmetrix
ONERA - The French Aerospace Lab
CESI
SUEZ
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
MabDesign
PhDOOC
MabDesign
Laboratoire National de Métrologie et d'Essais - LNE