Where PhDs and companies meet
Menu
Login

Prédiction des dynamiques spatio-temporelles des pollinisateurs par modèle d’apprentissage profond explicable.

ABG-132872 Thesis topic
2025-07-11 EU funding
Logo de
EFREI Research Lab, université Panthéon-Assas
- Ile-de-France - France
Prédiction des dynamiques spatio-temporelles des pollinisateurs par modèle d’apprentissage profond explicable.
  • Computer science
  • Digital
  • Data science (storage, security, measurement, analysis)
Monitoring, Interprétation et exploitabilité des données, IA

Topic description

Contexte scientifique

 

Cette thèse s’inscrit dans le cadre d’un projet européen INTERREG visant à surveiller les pollinisateurs dans les espaces verts de neuf pays européens.

Dans un contexte de transformation des écosystèmes modernes et d’urbanisation croissante, une gestion efficace de la biodiversité ainsi qu’un suivi rigoureux des populations de pollinisateurs sont essentiels. Ces insectes jouent un rôle fondamental dans le maintien des écosystèmes et la sécurité alimentaire. Toutefois, ils font face à des menaces grandissantes, notamment les changements climatiques, la fragmentation des habitats et les pressions d’origine anthropique.

L’essor des nouvelles technologies, notamment l’Intelligence Artificielle (IA), l’Analyse des Big Data (BDA) et les Capteurs Avancés (AS), ouvre de nouvelles perspectives pour l’étude et la préservation des pollinisateurs. Ces avancées permettent d’améliorer le suivi des populations, d’optimiser l’acquisition des données sur le terrain et de développer des modèles prédictifs pour mieux comprendre les dynamiques spatio-temporelles des pollinisateurs [1-2].

Cette thèse s’intéresse à deux défis majeurs dans le domaine du suivi écologique :

  • Identification et estimation des espèces de pollinisateurs observées lors des "transect walk" [3] et grâce à un dispositif visuelle (caméra) [4] mis en place sur terrain,
  • Prédiction de leur abondance et de leur répartition dans le temps et l’espace.

Le "transect walk" est une méthode de suivi écologique où un observateur parcourt un itinéraire défini en enregistrant les espèces rencontrées, permettant d’analyser leur diversité et leur abondance [1].

Concernant le premier défi, deux approches distinctes seront développées : l’une pour la détection des pollinisateurs et l’autre pour leur identification.

Pour relever le défi de la prédiction des dynamiques des populations de pollinisateurs, plusieurs pistes devront être explorées, notamment l’utilisation d’un Réseau de Convolution Graphique Spatio-Temporel Récurrent [5]. Un tel modèle pourrait exploiter les données collectées lors des transects walk ainsi que les séries temporelles des variations d’abondance des pollinisateurs afin d’estimer leur distribution future. L’exploration de combinaisons de méthodes, telles que les Réseaux de Convolution Graphique (GCN) et les Réseaux Long Short-Term Memory (LSTM), pourrait également permettre d’améliorer la précision des prédictions [6].

Des expériences approfondies seront menées sur des ensembles de données réelles provenant de divers écosystèmes (prairies, zones urbaines, ...) issues des partenaires nord-européen et permettront de valider l’efficacité du modèle proposé, démontrant sa capacité à identifier les corrélations spatio-temporelles entre les pollinisateurs et les variables environnementales, et à fournir des prévisions précises sur leur évolution à long terme.

Objectifs et résultats

 

Cette thèse visera à répondre à plusieurs verrous scientifiques liés au suivi et à la prédiction des pollinisateurs à partir de données issues de "transect walk" et de données visuelles :

1. Acquisition et qualité des données

Détection et identification des pollinisateurs : la reconnaissance des pollinisateurs à partir de données visuelles (images, vidéos) est un défi en raison de la diversité des espèces, des variations morphologiques et des conditions d’observation (luminosité, arrière-plan, etc.).

Manque de bases de données annotées : l’apprentissage automatique nécessite de grandes quantités de données étiquetées pour entraîner les modèles, or ces bases de données sont souvent limitées ou incomplètes pour les pollinisateurs.

Biais d’échantillonnage : les transects walk peuvent introduire des biais liés à la météo, à l’heure de la journée, ou à l’observateur (effet humain sur la présence des pollinisateurs).

2. Modélisation et analyse des données

Complexité des dynamiques spatio-temporelles : les populations de pollinisateurs varient en fonction de multiples facteurs environnementaux (floraison, climat, ...), ce qui rend difficile l’établissement de modèles prédictifs robustes.

Corrélation vs causalité : identifier les relations causales entre la présence des pollinisateurs et les variables environnementales est un défi, car de nombreux facteurs sont interconnectés.

Réduction de la dimensionnalité : les données écologiques sont souvent multidimensionnelles (espèces, localisation, climat, types de plantes visitées), ce qui peut entraîner un surajustement des modèles ou une perte d’information lors de la simplification des variables.

3. Défis liés aux modèles d’Intelligence Artificielle (IA)

Interprétabilité des modèles : les réseaux de neurones profonds et les transformers offrent de bonnes performances, mais leur boîte noire rend difficile l’interprétation des résultats.

Généralisation des modèles : un modèle entraîné sur un écosystème donné (ex. prairies) peut-il être transposé à un autre (ex. forêts, zones urbaines) ? L’adaptation aux contextes locaux reste un verrou important.

Besoins en calcul et en énergie : l’IA appliquée aux sciences écologiques nécessite des ressources computationnelles importantes, ce qui peut être un frein pour les chercheurs ayant un accès limité aux infrastructures de calcul. Le défi réside dans la proposition de modèles optimisés et non gourmand en utilisation de ressources.

4. Prédiction et applications

Robustesse des prévisions à long terme : les modèles de prédiction doivent prendre en compte des événements imprévisibles (changements climatiques extrêmes, destruction d’habitats) qui influencent fortement les populations de pollinisateurs.

Utilisation des résultats pour la gestion écologique : comment traduire les prédictions en recommandations concrètes pour la conservation des pollinisateurs ? L’intégration des résultats dans les politiques publiques et les pratiques agricoles reste un défi.

Programme prévisionnel de la thèse (3 ans)

 

Phase I : État de l’art et déploiement initial

  • Data-based AI
  • Knowledge-based AI
  • Green AI
  • Monitoring system
  • Déploiement initial du prototype existant
  • Collecte des premiers retours terrain

Phase II : Conception et mise en place du système de monitoring

  • Affinement des méthodologies et des modèles
  • Acquisition et prétraitement des données
  • Amélioration continue du prototype en fonction des retours terrain
  • Développement des premières versions opérationnelles

Phase III : Validation de l’approche

  • Expérimentations sur des cas d’étude issus de différents écosystèmes
  • Analyse des résultats et ajustements des modèles
  • Comparaison avec les approches existantes

Phase IV : Valorisation et rédaction

  • Rédaction du manuscrit de thèse
  • Publication des résultats dans des revues et conférences
  • Mise à disposition des composants logiciels développés pour la communauté

 

Références

[1] Kriouile, Y., Ancourt, C., Wegrzyn-Wolska, K., Bougueroua, L. (2024). Nested object detection using mask R-CNN: application to bee and varroa detection. Neural Comput & Applic 36, 22587–22609. https://doi.org/10.1007/s00521-024-10393-x

[2] Huet, J. C., Bougueroua, L., Kriouile, Y., Wegrzyn-Wolska, K., & Ancourt, C. (2022). Digital Transformation of Beekeeping through the Use of a Decision Making Architecture. Applied Sciences 12(21), 11179.

[3] Laurian Parmentier (2023). “Three-Strip Management”: Introducing a novel mowing method to generate architectural complexity in perennial flower margins to better support pollinators. Journal of Pollination Ecology 34(4), pp 267-283. DOI: 10.26786/1920-7603(2023)747

[4] Bjerge K, Alison J, Dyrmann M, Frigaard CE, Mann HMR, Høye TT (2023) Accurate detection and identification of insects from camera trap images with deep learning. PLOS Sustain Transform 2(3): e0000051. https://doi.org/10.1371/journal.pstr.0000051

[5] Bhatti, Uzair Aslam, Tang, Hao, Wu, Guilu, Marjan, Shah, Hussain, Aamir, (2023) Deep Learning with Graph Convolutional Networks: An Overview and Latest Applications in Computational Intelligence, International Journal of Intelligent Systems, 28 pages. https://doi.org/10.1155/2023/8342104

[6] Yong Yu, Xiaosheng Si, Changhua Hu, Jianxun Zhang, (2019) A Review of Recurrent Neural Networks: LSTM Cells and Network Architectures. Neural Comput 31(7): 1235–1270. doi: https://doi.org/10.1162/neco_a_01199

 

Starting date

2025-10-06

Funding category

EU funding

Funding further details

Projet Européen INTERREG, CDD de 3 ans

Presentation of host institution and host laboratory

EFREI Research Lab, université Panthéon-Assas

Grande École d’ingénieurs généraliste du numérique depuis 1936, reconnue par la CTI, l’Efrei dispense les compétences scientifiques et techniques nécessaires à l’insertion et à la réussite de l’ingénieur. L’école indépendante est reconnue d’intérêt général (EESPIG), impliquant un réinvestissement constant dans la pédagogie et une participation active aux missions de l’enseignement supérieur (recherche, médiation scientifique, formation, collaboration internationale…). Depuis janvier 2022, l’Efrei a intégré l’université Paris Panthéon-Assas en tant qu’établissement-composante. Cela permet ainsi de structurer une recherche pluridisciplinaire entre le numérique et des thématiques comme le droit, la gestion, les médias ou l’écologie ouvrant la voie à de nouveaux sujets de recherche comme la legalTech. Grâce à son laboratoire de recherche, l’Efrei Research Lab, l’école assure l’excellence de sa formation par une recherche appliquée qui vient nourrir directement l’évolution des programmes.

L’Efrei Research Lab est aussi le laboratoire dédié au numérique de l’Université Paris Panthéon Assas. Il y développe une recherche multidisciplinaire au sein de cette université. Les travaux de recherche du laboratoire sont appliqués à deux domaines majeurs : les sciences du vivant (santé, éducation, sport, agriculture et biodiversité) et les territoires intelligents (entreprises, habitations, réseaux).

PhD title

Doctorat en informatique

Country where you obtained your PhD

France

Institution awarding doctoral degree

Université Panthéon Assas

Graduate school

EGIC (economie, gestion, information et communication)

Candidate's profile

Master ou équivalent en informatique : science de données, IA, etc.

Vous possédez des connaissances en Data, Machine/Deep Learning, natural language processing, Machine Learning for time series, ainsi qu’un bon niveau en anglais.

2025-09-08
Partager via
Apply
Close

Vous avez déjà un compte ?

Nouvel utilisateur ?