Étude du déséquilibre de classes dans les architectures d’apprentissage profond dans les pathologies médicales.
| ABG-135346 | Stage master 2 / Ingénieur | 5 mois | environ 550 euros |
| 30/01/2026 |
- Informatique
Établissement recruteur
Site web :
L’équipe « Images & Modèles » du laboratoire LIS est spécialisée dans l’analyse d’images, avec une partie de son activité portée sur la caractérisation des images par des techniques d’apprentissage et de classification.
Le LIS Laboratoire d’Informatique et Systèmes est une Unité Mixte de Recherche (UMR) sous tutelles du Centre National de la Recherche Scientifique (CNRS) rattachée à l’Institut des sciences de l’information et de leurs interactions, de l’Université d’Aix-Marseille et de l’Université de Toulon.
Description
Les avancées récentes dans l’imagerie médicale et l’apprentissage automatique, en l’occurrence l’apprentissage profond, ont vu l’émergence de plusieurs modèles de classification permettant l’aide au diagnostic pour la détection précoce de pathologies médicales (cancer du pancréas et cancer cutané). L’apprentissage de ces modèles repose sur des bases de données annotées par des experts pour distinguer les lésions malignes des lésions bénignes. Ces données médicales présentent, par nature, un déséquilibre important entre les classes (malade et sain). Ce déséquilibre naturel pose un grand défi pour les modèles de classification.
Dans ce stage, nous proposant de s’attaquer à ce problème de déséquilibre de classes dans le cadre de deux pathologies qui sont la détection du mélanome et la détection du cancer du pancréas. La détection du mélanome reposera sur des images dermoscopiques, tandis que la détection du cancer du pancréas se fera sur des images issues de l’écho-endoscopie. Dans les deux cas, les bases de données annotées sont très déséquilibrées. Cette distribution asymétrique est due au fait que certains types de lésions sont moins fréquents que d’autres, ce qui se répercute sur les bases de données existantes. Diverses méthodes ont été proposées dans la littérature pour réduire le biais induit sur des modèles entrainés sur des jeux de données déséquilibres [1, 2]. Dans le cadre de ce stage, nous envisageons de traiter ce problème en poussant plus loin nos travaux sur les fonctions de coût [3, 4]. Nous souhaitons notamment étudier les approches basées sur la perte de marge. Par exemple, nous pourrons envisager une modification la cross entropie loss function de manière à encourager une grande marge relative entre les étiquètes rares et dominantes ; nous pouvons nous s’inspirer pour cela des travaux de [5].
[1] Lu YANG et al. « A Survey on Long-Tailed Visual Recognition ». en. In : Int J Comput Vis 130.7 (juill. 2022), p. 1837-1872. ISSN : 1573-1405. DOI : 10.1007/ s11263-022-01622-8.
[2] Yifan ZHANG et al. Deep Long-Tailed Learning : A Survey. arXiv :2110.04596 [cs]. Oct. 2021. DOI : 10.48550/arXiv.2110.04596.
[3] Foahom Gouabou, A. C., Iguernaissi, R., Damoiseaux, J. L., Moudafi, A., & Merad, D. (2022). End-to-End Decoupled Training: A Robust Deep Learning Method for Long-Tailed Classification of Dermoscopic Images for Skin Lesion Classification. Electronics, 11(20), 3275
[4] Foahom Gouabou, A. C., Iguernaissi, R., Damoiseaux, J. L., Moudafi, A., & Merad, D. (2022). End-to-End Decoupled Training: A Robust Deep Learning Method for Long-Tailed Classification of Dermoscopic Images for Skin Lesion Classification. Electronics, 11(20), 3275
[5] Youngkyu HONG et al. « Disentangling label distribution for long-tailed visual recognition ». In Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2021, p. 6626-6636. DOI : 10.48550/arXiv.2012. 00321.
Profil
- Formation de Master 2 recherche ou école d’ingénieur en informatique ;
- Maîtrise de l’apprentissage automatique et compétences avancées en vision par ordinateur ;
- Excellentes compétences en programmation (Python) ;
- Passion et rigueur, intérêt pour la recherche.
Prise de fonction
Vous avez déjà un compte ?
Nouvel utilisateur ?
Vous souhaitez recevoir nos infolettres ?
Découvrez nos adhérents
Tecknowmetrix
ONERA - The French Aerospace Lab
Institut Sup'biotech de Paris
TotalEnergies
SUEZ
ASNR - Autorité de sûreté nucléaire et de radioprotection - Siège
Nokia Bell Labs France
Medicen Paris Region
ADEME
Aérocentre, Pôle d'excellence régional
Laboratoire National de Métrologie et d'Essais - LNE
Groupe AFNOR - Association française de normalisation
Ifremer
Servier
ANRT
Nantes Université
Généthon

