Pas de salaire renseigné
Thèse Apprentissage de Représentations Multimodales pour l'Aide à la Décision en Radiologie Rachidienne à Partir d'Images Irm H/F
Télécom Paris
- Paris - 75
- CDD
- Bac +5
- Service public d'état
Détail du poste
Établissement : Télécom Paris
École doctorale : Ecole Doctorale de l'Institut Polytechnique de Paris
Laboratoire de recherche : Laboratoire de Traitement et Communication de l'Information
Direction de la thèse : Pietro GORI ORCID 0000000334568529
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-04-15T23:59:59
La prise de décision clinique en pathologies de la colonne vertébrale repose largement sur l'analyse conjointe de multiples acquisitions IRM, obtenues selon des protocoles variés et couvrant différentes régions anatomiques . En pratique, l'évaluation de pathologies telles que la sténose du canal rachidien, la sténose foraminale, la sclérose en plaque, etc. implique l'interprétation de séquences IRM hétérogènes (T1, T2, STIR, diffusion, etc.)[1], acquises avec des résolutions, des champs de vue, des orientations et des contrastes différents, souvent de manière incomplète ou irrégulière selon les patients et les centres.
Bien que l'apprentissage profond ait permis des avancées significatives dans l'analyse automatique de l'IRM rachidienne, la majorité des approches actuelles reposent sur des données fortement standardisées, mono-séquence ou rigidement alignées [2,3]. Ces hypothèses sont rarement vérifiées en pratique clinique, où les examens présentent une grande variabilité inter-sites, inter-machines et inter-protocoles. Les modèles existants peinent ainsi à exploiter efficacement la complémentarité des différentes acquisitions et à se généraliser à des contextes réels caractérisés par des données incomplètes, des champs de vue partiels, des orientations non canoniques et des contrastes variables.
Les travaux récents en apprentissage multimodal se concentrent principalement sur des fusions simples de modalités visuelles reposant sur des stratégies de concaténation ou de fusion tardives, sans prendre pleinement en compte les spécificités de l'imagerie médicale 3D ni les relations anatomiques entre acquisitions de géométries et de résolutions différentes.
Cette thèse vise à développer de nouvelles approches d'apprentissage multimodal pour l'intégration robuste d'IRM rachidiennes hétérogènes, en tenant compte des variations de résolution, de champ de vue, d'orientation et de contraste. L'objectif est de concevoir des modèles capables d'apprendre des représentations conjointes à partir de multiples acquisitions 3D, même lorsque celles-ci sont partielles, désalignées ou incomplètes, et de tirer parti de leur complémentarité pour améliorer la segmentation anatomique, la détection de lésions, la classification de sévérité et la caractérisation des pathologies rachidiennes.
Ces travaux s'inscrivent dans une perspective de transférabilité et de généralisation inter-sites, avec pour ambition de proposer des modèles exploitables en contexte clinique réel, capables de s'adapter à la diversité des protocoles d'acquisition et de fournir des sorties robustes et cliniquement pertinentes.
L'objectif de cette thèse est de développer de nouvelles méthodes d'apprentissage multimodal capables d'intégrer de manière cohérente et robuste des acquisitions IRM hétérogènes de la colonne vertébrale. Le travail vise à concevoir des stratégies tenant compte des variations de résolution, de champ de vue, d'orientation et de contraste entre les différentes séquences, tout en améliorant la qualité et la transférabilité des représentations apprises. Une attention particulière sera portée à l'intégration d'acquisitions partielles, désalignées ou incomplètes, fréquentes en pratique clinique, afin de permettre un apprentissage efficace malgré l'hétérogénéité des protocoles d'imagerie. Ce travail se basera notamment sur les travaux antérieurs des deux laboratoires, tels que TotalSpineSeg ou le modèle de segmentation de la moëlle épinière multi contraste [2,4] et les travaux en apprentissage de représentations [10,11].
Il s'agira également d'explorer des approches capables de modéliser la complémentarité informationnelle entre différentes séquences et géométries d'acquisition, et de tirer parti de leurs relations anatomiques et spatiales pour améliorer la segmentation, la détection de lésions, la classification de sévérité et la caractérisation des pathologies rachidiennes. Les méthodes développées seront évaluées sur divers jeux de données multi-séquences et multi-sites, couvrant des tâches de segmentation anatomique, de classification de pathologies dégénératives et de caractérisation de lésions de la moelle épinière et de la colonne vertébrale.
La prise de décision clinique en pathologies rachidiennes repose de plus en plus sur l'analyse conjointe de multiples acquisitions IRM, combinant différentes séquences, résolutions et orientations. En pratique, ces images sont souvent analysées séparément ou sélectionnées de manière ad hoc, malgré leur complémentarité essentielle pour le diagnostic et l'évaluation de la sévérité. Les modèles actuels de deep learning privilégient des données fortement standardisées ou des approches mono-séquence, et restent peu adaptés à la diversité des acquisitions rencontrées en contexte réel. Il existe donc un besoin crucial de méthodes multimodales capables de tirer parti de la richesse et de l'hétérogénéité de l'imagerie IRM pour améliorer la robustesse, la généralisation et la pertinence clinique des modèles appliqués à la colonne vertébrale.
La thèse développera des méthodes d'apprentissage auto-supervisé multimodal combinant différents types d'acquisitions IRM de la colonne vertébrale. L'accent sera mis sur la gestion de l'hétérogénéité des données d'imagerie, incluant les variations de résolution, de champ de vue, d'orientation, de contraste et de séquences, ainsi que sur la prise en compte des acquisitions partielles, désalignées ou manquantes. Pour se faire la thèse se basera sur plusieurs datasets publiques telles que:
LumbaDisc : 2000 participants sur 8 sites avec 3 acquisitions T2w axiale, T2w sagittal et T1w sagittal avec des annotations pour la classification de pathologies dégénératives lombaires [5]
Spine Generic : 267 participants sur plus de 20 sites avec plusieurs acquisitions : T1w, T2w, T2star etc. [6]
Whole spine : 60 participants sur deux sites avec 2 acquisitions T1w et T2w. [7]
MS-multi-spine challenge : 100 participants avec 2 acquisitions parmi T2w, MP2RAGE, STIR, PSIR avec annotation des lésions de sclérose en plaque. [8]
Et des datasets privés contenant plusieurs milliers d'acquisitions avec plusieurs pathologies représentées notamment la sclérose en plaque et les compressions du canal rachidien.
Des stratégies de fusion multimodale et de transfert entre jeux de données seront explorées afin d'assurer la robustesse des représentations apprises et leur capacité de généralisation à des contextes cliniques variés et multi-sites. Des approches permettant de modéliser la complémentarité informationnelle entre différentes acquisitions et de tirer parti de leurs relations anatomiques et spatiales seront étudiées. Les données longitudinales seront également intégrées afin de modéliser l'évolution des pathologies rachidiennes et la progression des lésions dans le temps. Les modèles développés seront évalués en termes de performance, de généralisabilité et de pertinence clinique, à partir de bases publiques (notamment celles citées ci-dessus) et de cohortes partenaires, sur des tâches telles que la segmentation anatomique, la détection de lésions et la classification de sévérité.
Le profil recherché
ou domaine similaire
Fort intérêt pour l'imagerie médicale et les applications de santé
Expérience pratique avec des frameworks de deep learning (par ex. PyTorch, TensorFlow)
Solides compétences en programmation (de préférence en Python)
Une familiarité avec l'apprentissage automatique, la vision par ordinateur ou le traitement de données multimodales est un atout
Très bonnes compétences en communication écrite et orale en anglais
Niveau d'anglais requis: Avancé: Vous pouvez parler la langue de manière plus complexe, spontanée et sur des sujets variés.
Publiée le 17/03/2026 - Réf : 1e2016a089f2c0c51c788366db1f702b
Créez votre compte Hellowork et activez votre alerte
Thèse Apprentissage de Représentations Multimodales pour l'Aide à la Décision en Radiologie Rachidienne à Partir d'Images Irm H/F
- Paris - 75
- CDD
Finalisez votre candidature
sur le site du
partenaire
Créez votre compte
Hellowork et postulez
sur le site du
partenaire !
sur le site du partenaire
Hellowork et postulez
sur le site du partenaire !
Ces offres pourraient aussi
vous intéresser
Testez votre correspondance
Chargement du chat...
{{title}}
{{message}}
{{linkLabel}}