Où docteurs et entreprises se rencontrent
Menu
Connexion

Étude du déséquilibre de classes dans les architectures d’apprentissage profond dans les pathologies médicales.

ABG-135346 Stage master 2 / Ingénieur 5 mois environ 550 euros
30/01/2026
Logo de
Laboratoire LIS, UMR 7020
Marseille Provence-Alpes-Côte d'Azur France
  • Informatique
déséquilibre de classes , classification, apprentissage, vision par ordinateur, imagerie médicale

Établissement recruteur

L’équipe « Images & Modèles » du laboratoire LIS est spécialisée dans l’analyse d’images, avec une partie de son activité portée sur la caractérisation des images par des techniques d’apprentissage et de classification.

Le LIS Laboratoire d’Informatique et Systèmes est une Unité Mixte de Recherche (UMR) sous tutelles du Centre National de la Recherche Scientifique (CNRS) rattachée à l’Institut des sciences de l’information et de leurs interactions, de l’Université d’Aix-Marseille et de l’Université de Toulon.

Description

Les avancées récentes dans l’imagerie médicale et l’apprentissage automatique, en l’occurrence l’apprentissage profond, ont vu l’émergence de plusieurs modèles de classification permettant l’aide au diagnostic pour la détection précoce de pathologies médicales (cancer du pancréas et cancer cutané). L’apprentissage de ces modèles repose sur des bases de données annotées par des experts pour distinguer les lésions malignes des lésions bénignes. Ces données médicales présentent, par nature, un déséquilibre important entre les classes (malade et sain). Ce déséquilibre naturel pose un grand défi pour les modèles de classification.

Dans ce stage, nous proposant de s’attaquer à ce problème de déséquilibre de classes dans le cadre de deux pathologies qui sont la détection du mélanome et la détection du cancer du pancréas. La détection du mélanome reposera sur des images dermoscopiques, tandis que la détection du cancer du pancréas se fera sur des images issues de l’écho-endoscopie. Dans les deux cas, les bases de données annotées sont très déséquilibrées. Cette distribution asymétrique est due au fait que certains types de lésions sont moins fréquents que d’autres, ce qui se répercute sur les bases de données existantes. Diverses méthodes ont été proposées dans la littérature pour réduire le biais induit sur des modèles entrainés sur des jeux de données déséquilibres [1, 2].  Dans le cadre de ce stage, nous envisageons de traiter ce problème en poussant plus loin nos travaux sur les fonctions de coût [3, 4]. Nous souhaitons notamment étudier les approches basées sur la perte de marge. Par exemple, nous pourrons envisager une modification la cross entropie loss function de manière à encourager une grande marge relative entre les étiquètes rares et dominantes ; nous pouvons nous s’inspirer pour cela des travaux de [5].

 

[1] Lu YANG et al. « A Survey on Long-Tailed Visual Recognition ». en. In : Int J Comput Vis 130.7 (juill. 2022), p. 1837-1872. ISSN : 1573-1405. DOI : 10.1007/ s11263-022-01622-8.

[2] Yifan ZHANG et al. Deep Long-Tailed Learning : A Survey. arXiv :2110.04596 [cs]. Oct. 2021. DOI : 10.48550/arXiv.2110.04596.

[3] Foahom Gouabou, A. C., Iguernaissi, R., Damoiseaux, J. L., Moudafi, A., & Merad, D. (2022). End-to-End Decoupled Training: A Robust Deep Learning Method for Long-Tailed Classification of Dermoscopic Images for Skin Lesion Classification. Electronics, 11(20), 3275

[4] Foahom Gouabou, A. C., Iguernaissi, R., Damoiseaux, J. L., Moudafi, A., & Merad, D. (2022). End-to-End Decoupled Training: A Robust Deep Learning Method for Long-Tailed Classification of Dermoscopic Images for Skin Lesion Classification. Electronics, 11(20), 3275

[5] Youngkyu HONG et al. « Disentangling label distribution for long-tailed visual recognition ». In Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2021, p. 6626-6636. DOI : 10.48550/arXiv.2012. 00321.

Profil

- Formation de Master 2 recherche ou école d’ingénieur en informatique ;

- Maîtrise de l’apprentissage automatique et compétences avancées en vision par ordinateur ; 

- Excellentes compétences en programmation (Python) ;                                                                                              

- Passion et rigueur, intérêt pour la recherche.

Prise de fonction

Dès que possible
Partager via
Postuler
Fermer

Vous avez déjà un compte ?

Nouvel utilisateur ?