Thèse Etude des Représentations Latentes des Llms Seuls ou en Architecture Multi-Agents au Travers de l'Interprétabilité par Concepts et de la Géométrie H/F

Doctorat.Gouv.Fr

  • Paris - 75
  • CDD
  • Bac +5
  • Service public d'état
Lire dans l'app

Détail du poste

Établissement : Université Paris-Saclay GS Sciences de l'ingénierie et des systèmes École doctorale : Interfaces : matériaux, systèmes, usages Laboratoire de recherche : Mathématiques et Informatique pour la Complexité et les Systèmes - EA 4037 Direction de la thèse : Céline HUDELOT ORCID 0000000338494133 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-07-01T23:59:59 Ce projet de thèse s'intéresse à la manière dont les grands modèles de langage (LLMs) et les transformers multimodaux organisent l'information en interne, en particulier à la géométrie de leurs espaces de représentation. Malgré de bonnes performances empiriques, les mécanismes de généralisation de ces modèles restent mal compris.

La question centrale est : comment les concepts et les connaissances sont-ils structurés dans les activations latentes d'un modèle, et comment cette structure est-elle liée à la fiabilité, la robustesse et la contrôlabilité ?

Le projet poursuit six objectifs articulés : (1) développer des estimateurs géométriques robustes (ex. dimension intrinsèque) adaptés aux activations de transformeurs en haute dimension ; (2) identifier des *sous-espaces conceptuels* - des représentations stables et distribuées de concepts, stables entre les couches et les versions du modèle ; (3) distinguer ce qu'un modèle *encode* de ce qu'il *utilise causalement* lors de la génération ; (4) suivre l'évolution des structures géométriques au cours de l'entraînement ; (5) tester si des métriques géométriques peuvent prédire la généralisation et les performances hors-distribution ; (6) étendre ces analyses aux contextes multimodaux et agentiques.

Le plan sur trois ans progresse de la formalisation et de la reproduction des baselines (Année 1), au développement méthodologique et à la découverte empirique (Année 2), jusqu'à la consolidation et la rédaction de la thèse (Année 3). Les modèles de langage basés sur l'architecture transformer affichent de bonnes performances empiriques, mais les mécanismes de généralisation restent mal compris. On observe que les activations apprises n'occupent qu'une petite partie de leur espace ambiant, ce qui peut entraîner une anisotropie, rendant les distances et similarités cosinus moins informatives sémantiquement. Les méthodes existantes de comparaison de représentations (SVCCA, CKA) permettent de comparer des couches, mais n'identifient pas les bonnes coordonnées conceptuelles. Par ailleurs, les features pertinentes sont souvent distribuées plutôt que localisées, et la décodabilité d'un concept ne prouve pas son utilisation causale par le modèle. Enfin, la notion même de concept linéaire dépend du produit scalaire choisi : la géométrie est donc une hypothèse de modélisation à part entière, ce qui motive un programme de recherche centré sur la formalisation et l'analyse des objets de l'espace latent. Le projet poursuit six objectifs articulés : (1) développer des estimateurs géométriques robustes (ex. dimension intrinsèque) adaptés aux activations de transformeurs en haute dimension ; (2) identifier des *sous-espaces conceptuels* - des représentations stables et distribuées de concepts, stables entre les couches et les versions du modèle ; (3) distinguer ce qu'un modèle *encode* de ce qu'il *utilise causalement* lors de la génération ; (4) suivre l'évolution des structures géométriques au cours de l'entraînement ; (5) tester si des métriques géométriques peuvent prédire la généralisation et les performances hors-distribution ; (6) étendre ces analyses aux contextes multimodaux et agentiques.

Le profil recherché

Master 2 recherche, diplôme d'ingénieur ou formation équivalente en informatique, en mathématiques appliquées ou en intelligence artificielle. Une bonne connaissances des modèles de langue et des aspects plus théoriques du machine learning est attendu

Publiée le 29/06/2026 - Réf : 2df091a82c463b59a3da6abdb1d1ed26

Postuler
Créez votre compte
Hellowork et postulez

sur le site du partenaire !

Ces offres pourraient aussi
vous intéresser

DELPHARM recrutement
DELPHARM recrutement
Voir l’offre
il y a 20 jours
Inrae Transfert recrutement
Inrae Transfert recrutement
Orsay - 91
CDD
Télétravail occasionnel
Voir l’offre
il y a 9 jours
Voir plus d'offres
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Nous suivre sur :
Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact