Stagiaire Ingénieur.e Data - Industrialisation d’un pipeline ETL
ABG-133589 | Master internship | 6 months | 735 euros |
2025-09-29 |

- Data science (storage, security, measurement, analysis)
- Biology
- Computer science
Employer organisation
Website :
Nous croyons que la médecine de demain sera sous le signe de la personnalisation pour chaque patient, grâce à l’émergence des sciences omiques permise par une plus grande collaboration entre les acteurs de la recherche publique et privés.
Société à mission, nous avons à coeur de devenir un acteur majeur de l’essor de la médecine de précision en valorisant la recherche scientifique publique.
Dans ce sens, ADLIN Science développe, et mets à disposition une plateforme logiciel permettant de structurer et d’analyser les données cliniques ainsi que les données de qualité, interopérables. ADLIN permet aux biologistes, aux bio-informaticiens et aux data scientistes de travailler et de collaborer au sein d’équipes multidisciplinaires de façon plus efficace en valorisant économiquement et scientifiquement leurs données.
Permettre aux chercheurs de valoriser à leur plein potentiel leurs travaux grâce à des collaborations actives à forte valeur ajouté, permettant l’essor de la médecine personnalisée dans un cadre de protection des données et de la propriétés intellectuel strict.
Description
Localisation : Grenoble ou Paris
Type de contrat : Stage de 6 mois
Date de démarrage : Février - Mars 2025
L'offre complète est disponible ici : https://adlin-science.notion.site/Stagiaire-Ing-nieur-Data-Industrialisation-d-un-pipeline-ETL-2716407f769880509f57dad7efb37f7b.
En tant que stagiaire data vous contribuerez activement à l’industrialisation d’un pipeline ETL (Extraction - Transform - Load) dédié à l’intégration de données de recherche publiques (omiques et cliniques), disponibles sur des entrepôts tels que GEO, GDC, etc.
L’objectif du stage est de transformer un ensemble de scripts exploratoires en une solution générique, robuste et évolutive, capable de gérer des volumes de données croissants et de s’adapter à de nouvelles sources et formats. Selon l’avancement et les intérêts du/de la stagiaire, une ouverture du stage pourra consister à se concentrer sur la partie “Extract” afin d’automatiser l’acquisition des données depuis de nouvelles sources.
Responsabilités
- Industrialiser les scripts existants : packaging, modularisation
- Mettre en place une gestion du versioning des scripts et des données
- Concevoir une architecture scalable pour anticiper l’augmentation du volume et de la diversité des données
- Implémenter des formats de sortie compatibles avec nos outils internes et automatiser le chargement (”Load”) dans ces outils
- Mettre en place des tests
- Ouverture possible : requêtage et extraction de données depuis différentes sources (bases, APIs, fichiers)
Quelle sera votre place dans l’équipe ?
Au sein de notre équipe Data & Analytics, qui fonctionne en petit comité, vous bénéficierez d'une grande autonomie. Vous collaborerez toutefois avec les autres membres de l'équipe qui continueront à faire évoluer le pipeline.
Profile
- En dernière année d’une formation d’ingénieure généraliste, informatique ou biotechnologique avec une spécialisation en data, ou d’un master en data management
- Bonnes bases en Python
- Connaissances en ETL / pipelines de données
- Compréhension des modèles de données et des formats standards (CSV, JSON, TSV, etc.)
- Notions de contrôle qualité et de nettoyage de données
- Connaissances en Git, Gitlab
- Intérêt prononcé pour les données biomédicales et la recherche
- Autonomie, organisation et curiosité technique
- Esprit d’équipe et capacité à documenter et partager ses travaux
Starting date
Vous avez déjà un compte ?
Nouvel utilisateur ?
Get ABG’s monthly newsletters including news, job offers, grants & fellowships and a selection of relevant events…
Discover our members
ONERA - The French Aerospace Lab
Généthon
Nokia Bell Labs France
Aérocentre, Pôle d'excellence régional
Groupe AFNOR - Association française de normalisation
SUEZ
MabDesign
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Tecknowmetrix
Ifremer
Laboratoire National de Métrologie et d'Essais - LNE
TotalEnergies
PhDOOC
ADEME
MabDesign
ANRT
CASDEN
Institut Sup'biotech de Paris
CESI