Où docteurs et entreprises se rencontrent
Menu
Connexion

Stagiaire Ingénieur.e Data - Industrialisation d’un pipeline ETL

ABG-133589 Stage master 2 / Ingénieur 6 mois 735 euros
29/09/2025
Logo de
ADLIN Science
Grenoble Auvergne-Rhône-Alpes France
  • Science de la donnée (stockage, sécurité, mesure, analyse)
  • Biologie
  • Informatique
data,ETL,Python
28/11/2025

Établissement recruteur

Nous croyons que la médecine de demain sera sous le signe de la personnalisation pour chaque patient, grâce à l’émergence des sciences omiques permise par une plus grande collaboration entre les acteurs de la recherche publique et privés.

Société à mission, nous avons à coeur de devenir un acteur majeur de l’essor de la médecine de précision en valorisant la recherche scientifique publique.

Dans ce sens, ADLIN Science développe, et mets à disposition une plateforme logiciel permettant de structurer et d’analyser les données cliniques ainsi que les données de qualité, interopérables. ADLIN permet aux biologistes, aux bio-informaticiens et aux data scientistes de travailler et de collaborer au sein d’équipes multidisciplinaires de façon plus efficace en valorisant économiquement et scientifiquement leurs données.

Permettre aux chercheurs de valoriser à leur plein potentiel leurs travaux grâce à des collaborations actives à forte valeur ajouté, permettant l’essor de la médecine personnalisée dans un cadre de protection des données et de la propriétés intellectuel strict.

Description

Localisation : Grenoble ou Paris
Type de contrat : Stage de 6 mois
Date de démarrage : Février - Mars 2025

L'offre complète est disponible ici : https://adlin-science.notion.site/Stagiaire-Ing-nieur-Data-Industrialisation-d-un-pipeline-ETL-2716407f769880509f57dad7efb37f7b.

En tant que stagiaire data vous contribuerez activement à l’industrialisation d’un pipeline ETL (Extraction - Transform - Load) dédié à l’intégration de données de recherche publiques (omiques et cliniques), disponibles sur des entrepôts tels que GEO, GDC, etc.

L’objectif du stage est de transformer un ensemble de scripts exploratoires en une solution générique, robuste et évolutive, capable de gérer des volumes de données croissants et de s’adapter à de nouvelles sources et formats. Selon l’avancement et les intérêts du/de la stagiaire, une ouverture du stage pourra consister à se concentrer sur la partie “Extract” afin d’automatiser l’acquisition des données depuis de nouvelles sources.

Responsabilités

  • Industrialiser les scripts existants : packaging, modularisation
  • Mettre en place une gestion du versioning des scripts et des données
  • Concevoir une architecture scalable pour anticiper l’augmentation du volume et de la diversité des données
  • Implémenter des formats de sortie compatibles avec nos outils internes et automatiser le chargement (”Load”) dans ces outils
  • Mettre en place des tests
  • Ouverture possible : requêtage et extraction de données depuis différentes sources (bases, APIs, fichiers)

Quelle sera votre place dans l’équipe ?

Au sein de notre équipe Data & Analytics, qui fonctionne en petit comité, vous bénéficierez d'une grande autonomie. Vous collaborerez toutefois avec les autres membres de l'équipe qui continueront à faire évoluer le pipeline.

Profil

  • En dernière année d’une formation d’ingénieure généraliste, informatique ou biotechnologique avec une spécialisation en data, ou d’un master en data management
  • Bonnes bases en Python
  • Connaissances en ETL / pipelines de données
  • Compréhension des modèles de données et des formats standards (CSV, JSON, TSV, etc.)
  • Notions de contrôle qualité et de nettoyage de données
  • Connaissances en Git, Gitlab
  • Intérêt prononcé pour les données biomédicales et la recherche
  • Autonomie, organisation et curiosité technique
  • Esprit d’équipe et capacité à documenter et partager ses travaux

Prise de fonction

02/02/2026
Partager via
Postuler
Fermer

Vous avez déjà un compte ?

Nouvel utilisateur ?