Extraction semi-automatique d’annotations sémantiques pour la préservation du patrimoine culturel : Intégration et exploitation de thésaurus spécialisés
| ABG-134912 | Stage master 2 / Ingénieur | 6 mois | 600 |
| 07/01/2026 |
- Informatique
Établissement recruteur
Site web :
Le Laboratoire d'Informatique et d'Automatique pour les Systèmes (LIAS) est un laboratoire de recherche affilié à l’Université de Poitiers et à l’ISAE-ENSMA. Nos travaux de recherche, ancrés dans les fondements théoriques des mathématiques, de la théorie du signal, de l'informatique théorique et du génie électrique, sont à la frontière des Sciences et Technologies de l'Information et de la Communication (STIC) et des Sciences pour l'Ingénieur (SPI).
Le LIAS, composé de trois équipes aux expertises complémentaires, met en œuvre son savoir-faire pour aborder un large spectre d'applications. De la gestion de l'énergie au traitement des eaux, en passant par la modélisation informatique des systèmes complexes, la gestion des données et l’aide à la décision, la conception modulaire des systèmes embarqués et les dynamiques de population d'oiseaux, nos chercheurs apportent une réelle plus-value à ces domaines variés. Notre laboratoire se distingue par sa capacité à combiner des approches académiques pointues avec des applications concrètes pour relever les défis de demain.
Le LIAS compte un total de 39 enseignants-chercheurs, dont 50 % détiennent une Habilitation à Diriger des Recherches (HDR), répartis entre les sections 27, 61 et 63 du Conseil National des Universités. En outre, le laboratoire bénéficie du soutien de 1 ingénieur de recherche en informatique, 1 ingénieur d'études en électronique, 1 technicien en informatique et 2 adjointes en gestion administrative. Ces professionnels contribuent à la vitalité et au bon fonctionnement du laboratoire, permettant ainsi de mener à bien nos projets de recherche interdisciplinaires. Le LIAS est également constitué d’une vingtaine de doctorants qui participent activement à nos travaux de recherche.
Description
Contexte
L’étude du patrimoine repose sur des données hétérogènes provenant de sources multiples (mesures, croquis, photographies, acquisitions 3D, etc.), souvent difficiles à manipuler en raison de la fragilité ou de l’inaccessibilité des objets. Le projet ANR DIGITALIS vise à développer des outils numériques dédiés à la gestion, à la pérennisation, à la réutilisation et à la visualisation de ces données. Le laboratoire LIAS, partenaire du projet ANR, travaille sur la conception de méthodes et de structures pour gérer des données complexes de manière interopérable. Dans le cadre du projet ANR DIGITALIS, cette expertise est utilisée pour proposer un modèle
de données dédié au patrimoine, permettant aux experts de partager et d’enrichir leurs annotations sur des objets patrimoniaux. Ce besoin s’inscrit dans la continuité de travaux existants, comme le modèle sémantique CIDOC CRM, qui vise à assurer la traçabilité et l’annotation des objets numériques dans le domaine historique. Le principal enjeu est d’automatiser l’extraction des données vers ce modèle, une tâche complexe et chronophage, d’autant plus que les
historiens maîtrisent peu ce formalisme et que les informaticiens ne sont pas spécialistes du patrimoine.
Le laboratoire LIAS a obtenu des résultats en explorant l’usage de l’IA générative pour transformer des données textuelles issues de fouilles archéologiques en représentations conformes au modèle CIDOC CRM.
Objectifs
Les objectifs du stage sont multiples à vise à compléter les travaux obtenus.
Le premier objectif porte sur le compromis entre précision, performance et impact environnemental, ainsi que sur les enjeux de vie privée liés aux déploiements cloud ou locaux. Le stagiaire devra donc reprendre les résultats existants et les évaluer sur différents modèles d’IA générative, qu’ils soient hébergés dans le cloud ou exécutés localement via des modèles à poids ouverts de plus petite taille. Cela permettra au stagiaire de se familiariser avec les
concepts de base de l’IA générative et des travaux développés par le laboratoire LIAS dans ce domaine.
Le deuxième objectif porte sur la capacité à référencer les sources (mesures, croquis, photographies, acquisitions 3D, etc.) utilisées pour produire les annotations. Cette question, non traitée dans nos travaux initiaux, est pourtant essentielle pour assurer la traçabilité des annotations. Le stagiaire devra ainsi explorer des solutions permettant d’intégrer explicitement la notion de source dans le processus de génération des annotations. Cela permettra au stagiaire de se familiariser avec le modèle CIDOC CRM.
Le troisième objectif, qui constitue la contribution principale de ce stage, porte sur l’intégration de vocabulaires contrôlés, tels que des thésaurus, dans le processus de génération des annotations. Cette intégration vise à améliorer la cohérence et la qualité des annotations, notamment en facilitant la gestion des synonymes (par exemple : église <=> lieu de culte).
Ce stage recherche sera encadré par un doctorant travaillant sur des problématiques similaires, ainsi que deux chercheurs du laboratoire LIAS spécialisés dans le domaine de l’IA générative et du patrimoine. Une publication scientifique serait attendue à l’issue du stage, en fonction des résultats obtenus.
À noter enfin que le laboratoire LIAS proposera l’an prochain un financement de thèse dans le domaine de la gestion des données. Le stage constituera une excellente opportunité de découvrir le laboratoire et son environnement de recherche. Le stagiaire intéressé pourra candidater à ce financement, et sa candidature fera l’objet d’une attention particulière.
Profil
Le candidat devra être titulaire d’un Master 2 ou d’un diplôme d’ingénieur et posséder des connaissances en développement logiciel et manipulation de modèles d'IA générative. Un bon niveau en français et en anglais est nécessaire.
Prise de fonction
Vous avez déjà un compte ?
Nouvel utilisateur ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
TotalEnergies
Laboratoire National de Métrologie et d'Essais - LNE
SUEZ
Groupe AFNOR - Association française de normalisation
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Servier
Nokia Bell Labs France
Ifremer
ANRT
ADEME
Medicen Paris Region
Institut Sup'biotech de Paris
Tecknowmetrix
Aérocentre, Pôle d'excellence régional
ONERA - The French Aerospace Lab
Généthon
Nantes Université
