Représentation sémantique et hiérarchisation de la valeur commerciale à l’aide de graphes de similarité
| ABG-134403 | Stage master 2 / Ingénieur | 5 mois | 650€ |
| 15/11/2025 |
- Informatique
- Science de la donnée (stockage, sécurité, mesure, analyse)
Établissement recruteur
Laboratoire CReSTIC, Université de Reims Champagne-Ardenne, Campus Moulin de la Housse, Reims (équipe TS)
Description
Contexte
Ce stage s’inscrit dans le cadre d’une thèse CIFRE menée entre Chochoy Conseil, société de conseil commercial, et le laboratoire CReSTIC de l’Université de Reims Champagne-Ardenne.
La recherche vise à modéliser la valeur commerciale exprimée dans les documents d’entreprise selon trois axes principaux :
- Retour sur investissement (ROI),
- Obligation (légale, réglementaire ou sécuritaire),
- Notoriété (image de marque, attractivité, reconnaissance).
Les formulations de ces valeurs sont souvent implicites et dispersées dans des documents non structurés, ce qui rend leur organisation et leur hiérarchisation particulièrement complexes.
Le but applicatif final est de concevoir des schémas d’adressage sous forme de graphe, permettant de représenter et relier l’ensemble des éléments de valeur identifiés (ROI, obligation, notoriété, etc.) dans les documents. Ce graphe servira à cartographier les composantes d’une offre et leurs interactions, de manière à pouvoir ultérieurement retrouver, comparer ou générer des descriptions synthétiques et cohérentes des offres commerciales.
Objectif du stage
L’objectif du stage est de développer une approche sémantique pour représenter, organiser et hiérarchiser les expressions de la valeur commerciale à partir de phrases issues de documents d’entreprise.
Le cœur du travail portera sur la modélisation du sens, à l’aide de modèles de langage préentraînés ou génératifs, afin de construire un graphe de similarité multi échelle regroupant les phrases selon leur proximité sémantique et leur appartenance aux différentes catégories de valeur.
Ce graphe pourra être exploré à différents niveaux de précision, de la vue globale des dimensions de valeur jusqu’aux éléments constitutifs d’une offre commerciale, et fera l’objet d’un volet de parcours interactif d’abord textuel, puis vocal.
Ce graphe constituera une représentation structurée des composantes d’une offre commerciale, permettant de retrouver, analyser ou reconstituer automatiquement les éléments de valeur à partir des informations extraites.
Divers
- Durée du stage : 5 mois minimum.
- Début du stage : Janvier-Mars 2026.
- Lieu du stage : Laboratoire CReSTIC, Université de Reims Champagne-Ardenne, Campus Moulin de la Housse, Reims (équipe TS).
Rémunération : gratification légale.
Profil
• Diplôme d’ingénieur ou Master en Intelligence Artificielle, Big Data, ou traitement de données.
• Maîtrise des langages Python, avec une solide expérience dans les bibliothèques scientifiques et de machine learning telles que Numpy, Scikit- learn, et Pytorch.
• Compréhension approfondie des concepts fondamentaux en NLP ; une expérience antérieure en NLP est un plus.
• Motivation, curiosité et autonomie.
Prise de fonction
Vous avez déjà un compte ?
Nouvel utilisateur ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
CESI
ANRT
Généthon
Institut Sup'biotech de Paris
ADEME
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
ONERA - The French Aerospace Lab
Tecknowmetrix
MabDesign
Aérocentre, Pôle d'excellence régional
Nokia Bell Labs France
Ifremer
SUEZ
CASDEN
PhDOOC
Groupe AFNOR - Association française de normalisation
TotalEnergies
MabDesign
Laboratoire National de Métrologie et d'Essais - LNE



