Détail du poste
Doctorant F/H Évaluation en boîte noire des capacités de manipulation cognitive des modèles d'IA
Niveau de diplôme exigé : Bac +5 ou équivalent
Fonction : Doctorant
A propos du centre ou de la direction fonctionnelle
Le centre de recherche Inria de l'Université Grenoble Alpes regroupe un peu moins de 600 personnes réparties au sein de 27 équipes de recherche et 8 services support à la recherche.
Son effectif est distribué sur 3 campus à Grenoble, en lien étroit avec les laboratoires et les établissements de recherche et d'enseignement supérieur (Université Grenoble Alpes, CNRS, CEA, INRAE, ...), mais aussi avec les acteurs économiques du territoire.
Présent dans les domaines du calcul et grands systèmes distribués, logiciels sûrs et systèmes embarqués, la modélisation de l'environnement à différentes échelles et la science des données et intelligence artificielle, Inria Grenoble - Rhône-Alpes participe au meilleur niveau à la vie scientifique internationale par les résultats obtenus et les collaborations tant en Europe que dans le reste du monde.
Contexte et atouts du poste
Ce doctorat sera effectué dans le cadre d'une collaboration Inria-Inalco financée par le centre d'évaluation de l'IA (INESIA). Le doctorant sera co-encadré par Antoine Boutet (Prof. Insa Lyon, membre de l'équipe Privatics Inria) et Claude Castelluccia (Directeur de Recherche Inria, équipe Privatics)
Mission confiée
Contexte et motivation
Les modèles d'intelligence artificielle à usage général (notamment les grands modèles de langage) sont désormais capables d'interagir de manière fluide avec les individus et de produire des contenus influençant leurs perceptions, leurs jugements et leurs décisions. Le cadre réglementaire européen (AI Act) identifie explicitement les risques liés aux capacités d'influence et de manipulation de ces systèmes, incluant la désinformation, la persuasion ciblée et l'exploitation des biais cognitifs.
Cependant, l'évaluation de ces risques demeure aujourd'hui largement insuffisante. Les approches expérimentales centrées sur l'individu sont limitées par des contraintes éthiques et méthodologiques, tandis que les approches en «boîte blanche» nécessitent un accès aux modèles, rarement disponible. Il en résulte un manque critique de méthodes robustes permettant d'évaluer, de manière indépendante et à grande échelle, les capacités de manipulation cognitive des systèmes d'IA.
Problématique
Dans quelle mesure est-il possible de détecter, caractériser et mesurer les capacités d'influence et de manipulation cognitive des modèles d'IA, en l'absence d'accès à leurs mécanismes internes, et comment ces capacités contribuent-elles à un risque cognitif systémique ?
Objectifs scientifiques
Cette thèse vise à développer une méthodologie d'évaluation en boîte noire des capacités de manipulation des modèles d'IA. Les objectifs principaux sont :
-Définir une typologie des mécanismes d'influence (persuasion, biais normatifs, cadrage discursif, etc.) dans les sorties des modèles ;
-Concevoir un protocole expérimental automatisé, inspiré des techniques de sécurité informatique (fuzzing), pour explorer systématiquement les comportements des modèles ;
- Développer des métriques quantitatives permettant de mesurer l'influence (orientation normative, cohérence, intensité persuasive) ;
-Mettre en oeuvre une analyse à grande échelle des réponses générées par différents modèles (comparaison inter-LLMs) ;
-Formaliser le concept de risque cognitif systémique, en lien avec les cadres réglementaires et de sécurité.
Contributions attendues
La thèse ambitionne de produire :
-Un cadre méthodologique robuste pour l'évaluation des capacités d'influence des IA ;
-Des outils d'analyse automatisée des contenus générés ;
-Des indicateurs quantitatifs de manipulation cognitive ;
-Une caractérisation comparative des modèles existants ;
- Une formalisation théorique du risque cognitif dans les systèmes d'IA.
Principales activités
Principales activés
La thèse ambitionne de produire :
-Un cadre méthodologique robuste pour l'évaluation des capacités d'influence des IA ;
-Des outils d'analyse automatisée des contenus générés ;
-Des indicateurs quantitatifs de manipulation cognitive ;
-Une caractérisation comparative des modèles existants ;
- Une formalisation théorique du risque cognitif dans les systèmes d'IA.
Profil de l'étudiant recherché
Le candidat ou la candidate devra être titulaire d'un Master en informatique ou équivalent, avec de solides compétences en intelligence artificielle et en {sécurité informatique. Une expérience ou un intérêt marqué pour le traitement automatique des langues (TAL) constituera un atout.
Un fort intérêt pour les approches interdisciplinaires est attendu, notamment à l'interface avec les \textbf{sciences cognitives}, la psychologie ou le droit du numérique. La capacité à travailler à l'intersection de plusieurs domaines scientifiques sera essentielle.
Le candidat devra également faire preuve de rigueur scientifique, d'autonomie, et de bonnes capacités en anglais.
Compétences
- Master en informatique ou équivalent
- Solides compétences en intelligence artificielle et en sécurité informatique
- Rigueur scientifique, Autonomie
- Bon niveau d'anglais.
Avantages
- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
- Possibilité de télétravail 90 jours/an fixes ou flottants et aménagement du temps de travail
- Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
- Prestations sociales, culturelles et sportives (Association de gestion des oeuvres sociales d'Inria)
- Accès à la formation professionnelle
- Participation Protection Sociale Complémentaire sous conditions
Rémunération
2 200 euros brut /mois
Bienvenue chez INRIA
A propos d'Inria
Inria est l'institut national de recherche dédié aux sciences et technologies du numérique. Il emploie 2600 personnes. Ses 215 équipes-projets agiles, en général communes avec des partenaires académiques, impliquent plus de 3900 scientifiques pour relever les défis du numérique, souvent à l'interface d'autres disciplines. L'institut fait appel à de nombreux talents dans plus d'une quarantaine de métiers différents. 900 personnels d'appui à la recherche et à l'innovation contribuent à faire émerger et grandir des projets scientifiques ou entrepreneuriaux qui impactent le monde. Inria travaille avec de nombreuses entreprises et a accompagné la création de plus de 200 start-up. L'institut s'eorce ainsi de répondre aux enjeux de la transformation numérique de la science, de la société et de l'économie.
La carte
655 Avenue de l'Europe
38330 Montbonnot-Saint-Martin
Publiée le 05/05/2026 - Réf : 832d16d7752c177923e1c4c9d05b70fc