Détail du poste
Établissement : Université de Lorraine École doctorale : IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES Laboratoire de recherche : LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications Direction de la thèse : Sabeur ARIDHI ORCID 0000000236573762 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-05-31T23:59:59 Cette thèse s'intéresse aux défis de l'apprentissage automatique sur des données complexes et hétérogènes, en particulier en santé. Elle aborde des enjeux clés comme l'apprentissage multimodal (combiner textes, images, signaux), l'explicabilité des modèles, l'intégration de connaissances (via des ontologies), l'apprentissage distribué (notamment fédéré), et le passage à l'échelle des modèles. Les objectifs sont de développer des méthodes robustes, explicables, et scalables, en intégrant des connaissances, et en respectant la confidentialité des données. Ces approches seront appliquées dans le cadre du projet RHU I-DEAL, visant à améliorer les systèmes d'aide à la décision clinique pour le suivi de la maladie de Crohn, avec des données multimodales collectées à distance. La démarche est itérative, avec un développement méthodologique, une validation sur des benchmarks, et une application concrète sur les données cliniques du projet. L'apprentissage automatique appliqué à des données complexes et hétérogènes
soulève aujourd'hui plusieurs défis fondamentaux en informatique :
apprentissage multimodal : comment apprendre efficacement à partir de
sources hétérogènes (texte, signal, image, données structurées) avec
données manquantes et bruitées ;
explicabilité : comment concevoir des modèles interprétables ou capables de
fournir des explications fiables, stables et utiles ;
intégration de connaissances : comment combiner apprentissage
statistique et connaissances structurées (ontologies, knowledge graphs) ;
apprentissage distribué et fédéré : comment apprendre à partir de données
réparties sans centralisation, en présence d'hétérogénéité ;
passage à l'échelle : comment concevoir des modèles et pipelines capables
de gérer de grands volumes de données, de modalités et d'utilisateurs tout en
restant efficaces.
Ces défis sont au coeur de plusieurs domaines de recherche en IA moderne,
notamment le multimodal learning, le trustworthy AI, les knowledge-enhanced
models, et les distributed learning systems. Cette thèse vise à développer des méthodes avancées d'apprentissage multimodal,
à la fois explicables, robustes, scalables et distribuées, pour l'analyse de données
hétérogènes en santé. Les objectifs scientifiques et méthodologiques sont les
suivants :
Concevoir des modèles d'apprentissage multimodal capables d'intégrer
efficacement des données hétérogènes (texte, audio, vidéo, questionnaires).
Développer des approches robustes aux données bruitées, incomplètes ou
manquantes.
Proposer des méthodes d'explicabilité permettant de produire des
interprétations fiables, transparentes et exploitables en contexte clinique.
Intégrer des connaissances structurées (ontologies, expertise métier) au sein
des modèles afin d'améliorer leur pertinence et leur interprétabilité.
Mettre en oeuvre des stratégies d'apprentissage distribué, en particulier
fédéré, respectant les contraintes de confidentialité des données sensibles.
Optimiser l'efficacité computationnelle des modèles et garantir leur passage à
l'échelle.
Ces développements méthodologiques seront appliqués et évalués dans le cadre du
projet ANR RHU I-DEAL, dédié à la conception de systèmes d'aide à la décision
clinique pour le suivi de la maladie de Crohn, à partir de données multimodales
issues du suivi patient à distance. Approche itérative combinant :
développement méthodologique,
validation sur benchmarks,
adaptation au cas du projet RHU I-DEAL,
évaluation multi-critères (performance, explicabilité, robustesse, scalabilité,
coût de communication (fédéré)).
Le profil recherché
Un master en informatique, IA, data science ;
bases solides en machine learning, Python (scikit-learn, PyTorch ou
équivalent)
Une maîtrise de l'apprentissage automatique (apprentissage profond) ;
Un bon niveau d'anglais (écrit et oral) ;
D'excellentes compétences rédactionnelles.
Atouts :
-multimodal learning
-XAI
-knowledge graphs
-distributed systems / federated learning
-optimisation / HPC
Publiée le 14/04/2026 - Réf : b566ab4e27c7969c2cba50c3de4ce0f5