Where PhDs and companies meet
Menu
Login

MESR : Utilisation de l'Intelligence Artificielle pour évaluer le Traitement Spatial opéré par les Prothèses Auditives // ENACT : Artificial Intelligence for Spatial Sound Processing Evaluation in Hearing Aids

ABG-139165
ADUM-71893
Thesis topic
2026-05-19
Université de Lorraine
Vandoeuvre-lès-Nancy - Grand Est - France
MESR : Utilisation de l'Intelligence Artificielle pour évaluer le Traitement Spatial opéré par les Prothèses Auditives // ENACT : Artificial Intelligence for Spatial Sound Processing Evaluation in Hearing Aids
  • Electronics
Prothèse Auditive, Directivité adpatative, Environnement sonore complexe, Apprentissage profond, Apprentissage auto-supervisé, Traitement spatial du son
Hearing aids, Adaptive directivity, Complex sound environment, Deep learning, Self-supervised learning, Spatial sound processing

Topic description

La perte auditive touche plus de 1,5 milliard de personnes dans le monde [1] et entraîne des répercussions psychosociales et cognitives [2]. En France, la réforme « 100 % Santé » a amélioré l'accès aux aides auditives [3], mais comprendre la parole dans le bruit reste difficile. Les fabricants développent des algorithmes intégrant directivité adaptative et réduction du bruit pour améliorer l'intelligibilité. Souvent associés à l'IA, ils détectent les sources sonores et ajustent les microphones. Leur efficacité reste toutefois difficile à évaluer avec les méthodes actuelles. Cette étude vise à mesurer les performances de ces algorithmes dans le bruit.

L'évaluation des performances des traitements adaptatifs peut être réalisée par des méthodes subjectives (tests d'intelligibilité) très chronophages ou objectives avec l'estimation d'indicateurs psychoacoustiques à partir des signaux en sortie d'appareil auditif. Cependant ces indicateurs présentent des limites, au-delà du fait qu'ils ne permettent pas de caractériser le filtrage spatial opéré par les aides auditives. Parmi les plus actuels : HASPI 2.0 (2021) ne prédit pas l'intelligibilité dans des environnements spatialisés et MBSTOI (2018) ne prend pas en compte les pertes auditives. Wu Y-H et al. [4] ont proposé une méthode d'évaluation de cette directivité en utilisant un signal sonde et un bruit tournant autour de la prothèse auditive. Aubreville et al. [5] l'ont appliquée en 2015, mais la variation séquentielle du bruit peut influencer les résultats.

Le travail de thèse a pour objectif de développer une nouvelle méthode permettant d'obtenir des diagrammes polaires de captation sonore représentatifs du filtrage spatial des aides auditives récentes. Inspirée des travaux de Hagerman et Olofsson [6], cette méthode sépare l'énergie sonore provenant de différentes directions dans un environnement à 360° sans dépendre de la direction du signal interférent. Les résultats préliminaires indiquent son efficacité pour divers systèmes microphoniques directionnels et pour des aides auditives récentes bénéficiant de la connectivité binaurale [7].

La première phase de ce projet consiste à étendre cette nouvelle méthode à des scénarios acoustiques complexes avec plusieurs sources ou locuteurs. Cette approche nécessitera de reproduire chaque scénario acoustique dans des conditions de laboratoire, où chaque source peut être diffusée indépendamment afin d'appliquer la méthode de Hagerman et Olofsson [6]. Cette méthode pourra aussi être utilisée avec des signaux utiles autres que la parole (signaux d'alarme ou d'alerte) dans un objectif préventif, par exemple en environnement de travail. Toutefois, la grande diversité des environnements sonores et les contraintes de temps limitent l'exhaustivité des diagrammes polaires obtenus en laboratoire.

La deuxième étape du projet sera consacrée à l'utilisation de méthodes d'IA pour surmonter ces limitations et proposer des modèles capables d'évaluer la performance de la directivité adaptative des aides auditives dans des scénarios réels. Nous nous appuierons sur des approches de filtrage spatial [8, 9] et sur des environnements acoustiques simulés [10] afin d'identifier des scénarios acoustiques canoniques à explorer lors des sessions d'enregistrement. Pour entraîner le modèle, les données enregistrées avec les aides auditives seront utilisées en complément de données simulées. Afin d'améliorer la robustesse aux scénarios réels, nous explorerons l'exploitation de données enregistrées en conditions écologiques, via un prétraitement par séparation de sources [8, 9] ou par apprentissage auto-supervisé [11].

À partir des diagrammes polaires de captation obtenus, une corrélation avec les indicateurs psychoacoustiques existants sera réalisée. De plus, les indices binauraux dérivés des modèles et des mesures seront comparés avec ceux des modèles HRTF pour les personnes normo-entendantes. Enfin, cette approche pourra être validée par des tests d'écoute.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Hearing loss affects more than 1.5 billion people worldwide [1] and leads to psychosocial and cognitive consequences [2]. In France, the “100% Health” reform has improved access to hearing aids [3], but understanding speech in noisy environments remains difficult. Manufacturers are developing algorithms that integrate adaptive directivity and noise reduction to improve speech intelligibility. Often combined with artificial intelligence, these systems detect sound sources and dynamically adjust the microphones. However, their effectiveness remains difficult to evaluate with current assessment methods. This study aims to measure the performance of these algorithms in noisy environments.

The evaluation of the performance of adaptive processing can be carried out using subjective methods (e.g., speech audiometry in noise), which are time-consuming, and objective methods based on psychoacoustic indicators estimation from the hearing aid output signals. However, these indicators have limitations: beyond the fact that they fail to capture the spatial filtering performed by hearing aids, even the most recent metrics—such as HASPI 2.0 (2021)—do not predict speech intelligibility in spatialized environments, and MBSTOI (2018) does not account for hearing loss. Studies, such as those by Wu Y-H et al. [4] and Aubreville et al. [5], proposed a method for evaluating adaptive directivity but encountered limitations, particularly related to the variable noise position.

This PhD research aims to develop a novel method for obtaining polar sound capture diagrams that illustrate how modern hearing aids perform spatial filtering. Inspired by Hagerman and Olofsson's work [6], this method separates sound energy from different directions in a 360° environment without relying on interfering signal direction. Preliminary results indicate its effectiveness for various directional microphone systems and recent hearing aids with binaural connectivity [7].

The first phase of this project involves extending this new method to complex acoustic scenarios involving multiple sound sources or speakers.
Laboratory-controlled environments will be used to isolate each sound source and apply the Hagerman and Olofsson's method [6]. It will be possible to apply this method for determining polar sound capture diagrams to target signals other than speech (e.g., alarm or warning signals), for preventive purposes, for example in a workplace environment. However, because of the wide sound environments diversity that must be considered, time constraints limit the completeness of polar diagrams obtained in the laboratory [7].

The second step of the project will be dedicated to leveraging AI method to overcome this issue and propose models that could assess hearing aids adaptative directivity performance in real-world scenarios. We propose to rely on existing spatial filtering approaches [8, 9] and simulated acoustics environments [10] to identify canonical acoustic scenarios to be explored during recorded sessions. To train the model, the data recorded with hearing aids will be used together with simulated data. Finally, in order to improve robustness to real-world scenarios, we will explore the possibility to exploit data recorded in ecological conditions using either source separation pre-processing [8, 9] or self-supervised learning [11].

Throughout the research, the project will assess how polar sound capture diagrams complement existing psychoacoustic indicators. The correlation between diagram characteristics and intelligibility metrics (SII, HASPI 2.0, MBSTOI) will be examined. Moreover, binaural indices derived from models and measurements will be compared with normal-hearing HRTF. Finally, we will eventually validate the approach by confronting it to listening test results.
------------------------------------------------------------------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Début de la thèse : 01/11/2026

Funding category

Funding further details

Financement d'un établissement public Français

Presentation of host institution and host laboratory

Université de Lorraine

Institution awarding doctoral degree

Université de Lorraine

Graduate school

608 SIMPPÉ - SCIENCES ET INGENIERIES DES MOLECULES, DES PRODUITS, DES PROCEDES ET DE L'ÉNERGIE

Candidate's profile

Traitement du signal audio, acoustique et programmation. Des compétences en apprentissage profond et auto-supervisé dans le domaine de l'IA seraient un atout.
Audio signal processing, acoustics, and programming. Skills in deep learning and self-supervised learning in AI would be an asset.
2026-05-31
Partager via
Apply
Close

Vous avez déjà un compte ?

Nouvel utilisateur ?