Complétez votre profil pour recevoir des offres adaptées.

Mon espace

Mes CV vus

Mes candidatures

Mes alertes

Mon profil

Paramètres

Déconnexion

Missions d'intérim
Offres de stage
Offres en alternance
Créer mon alerte
Déposer mon CV
Salaire brut net

Téléchargez l'app et postulez dans les premiers !

Diffuser ma première offre Déjà client

Téléchargez l'app et postulez dans les premiers !

Se connecter S'inscrire Formation

Téléchargez l'app et postulez dans les premiers !

Trouver mon job s
Trouver mon entreprise s
Accès recruteur
- Diffuser ma première offre
- Déjà client
Télécharger l’app

Emploi
- Missions d'intérim
- Offres de stage
- Offres en alternance
- Créer mon alerte
- Déposer mon CV
- Salaire brut net
Formation
Emploi
Emploi
Mon compte
- Se connecter Mon compte
- S'inscrire
- Mon espace
- Mes CV vus
- Mes candidatures
- Mes alertes
- Mon profil
- Paramètres
- Déconnexion

Ingénieur d'Étude en Traitement Automatique des Langues H/F CNRS

Paris 5e - 75
CDD
Service public des collectivités territoriales

Lire dans l'app

Détail du poste

Le cadre général du travail est celui de l'évaluation des grands modèles génératifs (giga modèles de langue ou LLM) multilingues, c'est-à-dire des modèles génératifs qui prennent en charge plus d'une langue. La question principale qui se pose est celle de la mesure du niveau de "multilinguisme" d'un modèle - pour le formuler de manière simple "combien (et quelles) de langues le modèle est-il capable de prendre en charge (et avec quel niveau de qualité)"? Ce travail de réflexion méthodologique s'inscrit dans le cadre du projet européen LLM4EU qui vise à développer des modèles et des cadres d'évaluation pour toutes les langues officielles de l'UE.

Contexte scientifique

Les outils de traitement des langues s'appuyant sur des grands modèles de langue dits génératifs ont en quelques années atteint des niveaux très élevés de performance pour des tâches complexes. Ils sont aujourd'hui largement présents dans nos environnements numériques de travail pour accéder à l'information, l'analyser, la reformuler, ou encore pour générer des contenus originaux. Avec la large diffusion de ces technologies, l'analyse des performances réelles, des risques et des limitations de ces modèles se pose de manière accrue. Lorsque ces modèles sont multilingues, une dimension de l'évaluation doit concerner le niveau de multilinguisme d'un modèle.

Cette évaluation est difficile, faute de pouvoir (en général) accéder directement à partir de l'analyse des données et protocoles d'apprentissage et doit donc être effectuée en "boîte noire" à partir de requêtes soumises à un modèle entraîné. Il existe de multiples tâches et parangons monolingues, surtout pour l'anglais, mais la qualité et variété de ces parangons est très inégalement répartie entre langues. Une seconde difficulté est liée à la nécessité de comparer les performances entre langues: or dans cette comparaison, des facteurs multiples peuvent entrer en ligne de compte, certains liés au modèle, mais d'autres qui sont intrinsèques aux langues considérées.

Dans un premier temps, le travail visera à construire des mesures robustes applicables à des modèles qui rendent accessibles les représentations et les distributions de probabilité qui sont manipulées: pour ces modèles nous étudierons la validité de plusieurs métriques inspirées de la théorie de l'information (compression, perplexité), et à les déployer sur une infrastructure ouverte. Dans un second temps, le travail visera à étudier des méthodes pour minimiser les différences entre langues et rendre les métriques plus directement comparables -- par exemple en utilisant des transcodages "universels" plus équitables entre langues (par translittération, phonétisation, etc.). En parallèle, on s'intéressera à généraliser les métriques proposées pour les modèles ouverts à des modèles fermés.

Activités
La personne recrutée travaillera en collaboration avec les membres du laboratoire travaillant sur le traitement des langues; plus largement, elle entretiendra des collaborations au sein du projet "LLM4EU" (dans d'autres laboratoires du CNRS, et plus généralement d'autres partenaires du projet), pour évaluer les grands modèles de langue multilingues, en particulier pour mesurer leurs compétences linguistiques; puis à rendre compte de ce travail dans des articles et communications scientifiques. Une partie significative de l'activité sera de nature expérimentale et demandera de conduire des expériences sur les (grands) modèles de l'état de l'art.
Compétences
Nous recherchons une personne hautement motivée:
- titulaire d'un diplôme de master ou école d'ingénieur récent en intelligence artificielle avec des compétences en apprentissage profond, traitement automatique des langues, recherche d'information ou traduction automatique.
- maitrisant Python et des plateformes d'apprentissage profond et des principaux frameworks pour manipuler des modèles de langue et les algorithmes de génération de textes;
- maîtrisant français et anglais scientifique (écrit et oral), un intérêt général pour les langues sera un plus.
Contexte de travail

La personne recrutée travaillera à l'Institut des Systèmes Intelligents et de Robotique, un laboratoire pluridisciplinaire de Sorbonne Université du CNRS, au sein de l'équiple "Machine Learning and Deep Learning for Information Access" (MLIA - https://www.isir.upmc.fr/equipes/mlia/), qui s'intéresse à l'apprentissage automatique et à ses applications, en particulier en traitement des langues. Situé sur le corpus de Jussieu, au centre de Paris, l'ISIR regroupe plus de 250 membres et est un acteur majeur de l'IA et de la Robotique en Europe (https://www.isir.upmc.fr).
La personne recrutée travaillera à l'Institut des Systèmes Intelligents et de Robotique, un laboratoire pluridisciplinaire de Sorbonne Université du CNRS, au sein de l'équiple "Machine Learning and Deep Learning for Information Access" (MLIA - https://www.isir.upmc.fr/equipes/mlia/), qui s'intéresse à l'apprentissage automatique et à ses applications, en particulier en traitement des langues. Situé sur le corpus de Jussieu, au centre de Paris, l'ISIR regroupe plus de 250 membres et est un acteur majeur de l'IA et de la Robotique en Europe (https://www.isir.upmc.fr).
Contraintes et risques

Travail sur écran, sans autre risque particulier.
Travail sur écran, sans autre risque particulier.

Pas de salaire renseigné

Le recruteur n'a pas communiqué le salaire pour cette offre, ou n'a pas souhaité l'afficher.

Publiée le 16/11/2025 - Réf : UMR7222-FRAYVO-004 Nombre de Postes

Créez une alerte

Pour être informé rapidement des nouvelles offres, merci de préciser les critères :

Métier

Localité

Type de contrat

CDI

CDD

Intérim

Stage

Alternance

Indépendant

Franchise

Associé

Fonctionnaire

Freelance

Stage de lycée

Ingénieur d'Étude en Traitement Automatique des Langues H/F

CNRS

Paris 5e - 75
CDD

Publiée le 16/11/2025 - Réf : UMR7222-FRAYVO-004 Nombre de Postes

Finalisez votre candidature
sur le site du recruteur

Créez votre compte pour postuler
sur le site du recruteur !

Voir plus d'offres

Recherches similaires

Offre emploi Ingénieur
Offre emploi Logistique
Offre emploi Cariste
Offre emploi Préparateur de commande
Offre emploi Manutentionnaire
Offre emploi Magasinier
Offre emploi Agent de quai
Entreprises Logistique
Entreprises Ingénieur
Entreprises Paris
Offre emploi Fonction publique
Offre emploi Collectivités
Offre emploi Fonction publique territoriale
Offre emploi Etude
Offre emploi Langues
Offre emploi Fonction publique Paris
Offre emploi Anglais Paris
Offre emploi Collectivités Paris
Offre emploi Fonction publique territoriale Paris
Offre emploi CDD Paris
CNRS Paris
CNRS Ingénieur

Voir plus Voir moins

Initialisation…

Testez votre correspondance

Chargement du chat...

Accueil
Offre emploi
Offre emploi Paris
Offre emploi Logistique Paris
Offre emploi Ingénieur Paris
Ingénieur d'Étude en Traitement Automatique des Langues H/F

Les sites

HelloCV
Helloworkplace
BDM
Jobijoba
Maformation
Diplomeo

L'emploi

Offres d'emploi par métier
Offres d'emploi par ville
Offres d'emploi par entreprise
Offres d'emploi par mots clés

L'entreprise

Qui sommes-nous ?
On recrute
Accès client

Les apps

Nous suivre sur :

Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact

Ingénieur d'Étude en Traitement Automatique des Langues H/F CNRS

Détail du poste

Finalisez votre candidature sur le site du recruteur Créez votre compte pour postuler sur le site du recruteur !

Recherches similaires

Finalisez votre candidature
sur le site du recruteur

Créez votre compte pour postuler
sur le site du recruteur !