Thèse Etude des Représentations Latentes des Llms Seuls ou en Architecture Multi-Agents au Travers de l'Interprétabilité par Concepts et de la Géométrie H/F
Doctorat.Gouv.Fr
- Paris - 75
- CDD
- Bac +5
- Service public d'état
Détail du poste
Établissement : Université Paris-Saclay GS Sciences de l'ingénierie et des systèmes École doctorale : Interfaces : matériaux, systèmes, usages Laboratoire de recherche : Mathématiques et Informatique pour la Complexité et les Systèmes - EA 4037 Direction de la thèse : Céline HUDELOT ORCID 0000000338494133 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-07-01T23:59:59 Ce projet de thèse s'intéresse à la manière dont les grands modèles de langage (LLMs) et les transformers multimodaux organisent l'information en interne, en particulier à la géométrie de leurs espaces de représentation. Malgré de bonnes performances empiriques, les mécanismes de généralisation de ces modèles restent mal compris.
La question centrale est : comment les concepts et les connaissances sont-ils structurés dans les activations latentes d'un modèle, et comment cette structure est-elle liée à la fiabilité, la robustesse et la contrôlabilité ?
Le projet poursuit six objectifs articulés : (1) développer des estimateurs géométriques robustes (ex. dimension intrinsèque) adaptés aux activations de transformeurs en haute dimension ; (2) identifier des *sous-espaces conceptuels* - des représentations stables et distribuées de concepts, stables entre les couches et les versions du modèle ; (3) distinguer ce qu'un modèle *encode* de ce qu'il *utilise causalement* lors de la génération ; (4) suivre l'évolution des structures géométriques au cours de l'entraînement ; (5) tester si des métriques géométriques peuvent prédire la généralisation et les performances hors-distribution ; (6) étendre ces analyses aux contextes multimodaux et agentiques.
Le plan sur trois ans progresse de la formalisation et de la reproduction des baselines (Année 1), au développement méthodologique et à la découverte empirique (Année 2), jusqu'à la consolidation et la rédaction de la thèse (Année 3). Les modèles de langage basés sur l'architecture transformer affichent de bonnes performances empiriques, mais les mécanismes de généralisation restent mal compris. On observe que les activations apprises n'occupent qu'une petite partie de leur espace ambiant, ce qui peut entraîner une anisotropie, rendant les distances et similarités cosinus moins informatives sémantiquement. Les méthodes existantes de comparaison de représentations (SVCCA, CKA) permettent de comparer des couches, mais n'identifient pas les bonnes coordonnées conceptuelles. Par ailleurs, les features pertinentes sont souvent distribuées plutôt que localisées, et la décodabilité d'un concept ne prouve pas son utilisation causale par le modèle. Enfin, la notion même de concept linéaire dépend du produit scalaire choisi : la géométrie est donc une hypothèse de modélisation à part entière, ce qui motive un programme de recherche centré sur la formalisation et l'analyse des objets de l'espace latent. Le projet poursuit six objectifs articulés : (1) développer des estimateurs géométriques robustes (ex. dimension intrinsèque) adaptés aux activations de transformeurs en haute dimension ; (2) identifier des *sous-espaces conceptuels* - des représentations stables et distribuées de concepts, stables entre les couches et les versions du modèle ; (3) distinguer ce qu'un modèle *encode* de ce qu'il *utilise causalement* lors de la génération ; (4) suivre l'évolution des structures géométriques au cours de l'entraînement ; (5) tester si des métriques géométriques peuvent prédire la généralisation et les performances hors-distribution ; (6) étendre ces analyses aux contextes multimodaux et agentiques.
Le profil recherché
Publiée le 29/06/2026 - Réf : 2df091a82c463b59a3da6abdb1d1ed26