Aller au contenu principal
INRIA recrutement

Ingénieur de Recherche Alignement Post-Training H/F INRIA

  • Paris - 75
  • CDD
  • Télétravail partiel
  • 12 mois
  • Bac +5
  • Service public des collectivités territoriales
Lire dans l'app

Détail du poste

Ingénieur de recherche (alignement, post-training)

Type de contrat : CDD

Contrat renouvelable : Oui

Niveau de diplôme exigé : Bac +5 ou équivalent

Fonction : Ingénieur scientifique contractuel

Niveau d'expérience souhaité : Jeune diplômé

Contexte et atouts du poste

Dans le cadre du projet BPI Scribe, en partenariat avec les sociétés LightOn, Aleia le CNRS/Idris,l' objectif est d'étendre et de développer des jeux de resources nécessaires au post training de modèles de langue spécialisés.

Mission confiée

Contexte:

L'un des aspects cruciaux des LLMs est leurs capacités à analyser des documents complexes tels que des documents financiers complexes, prospectus d'émission ou rapports annuels, dont l'analyse pose des difficultés considérables aux modèles de langage (LLMs). Ces textes sont souvent longs, très structurés, et contiennent des informations interdépendantes dispersées sur des dizaines, voire des centaines de pages. Un prospectus, par exemple, mêle sections narratives (stratégie, risques, gouvernance) et annexes techniques riches en tableaux et en notes explicatives. Pour en extraire du sens, il faut relier des éléments situés à des endroits éloignés - un chiffre dans un tableau de flux de trésorerie n'est interprétable qu'en fonction d'hypothèses comptables mentionnées ailleurs, ou de définitions juridiques données en amont. Les LLMs peinent encore à effectuer ce type de raisonnement transversal, limités par la taille de leur contexte et leur difficulté à interpréter la logique des renvois internes, des formules et des structures tabulaires. Les tableaux posent un problème particulièrement aigu : ils encodent l'information de manière implicite (hiérarchies d'en-têtes, regroupements, alignements) que les modèles textuels restituent mal. Pour explorer ces limites, nous avons déjà créé un jeu de données multimodal associant texte et tableaux chiffrés, sous forme de questions-réponses (Q&A), afin d'évaluer la capacité des modèles à naviguer entre différents types de contenu et à relier des informations dispersées.

Dans un premier temps, nous prévoyons désormais de l'étendre avec des questions mobilisant de longs contextes, simulant des raisonnements multi-sections proches des usages réels, et dans un second temps, transformer ce jeu de données Q&A en corpus "Instruct" pour le français, une ressource encore largement absente dans l'écosystème actuel. Cette démarche vise à combler un double manque : celui de données francophones adaptées à l'entraînement d'instructions complexes, et celui de benchmarks capables de mesurer la compréhension intégrée du texte et du tableau dans les documents financiers.

Supervision
Le ou la personne recrutée sera sous la responsabilité scientifique de Djamé Seddah.

Principales activités

Activité de recherche et de developpement : état de l'art, analyse, développement, etc.

Avantages

- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
- Possibilité de télétravail et aménagement du temps de travail
- Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
- Prestations sociales, culturelles et sportives (Association de gestion des oeuvres sociales d'Inria)
- Accès à la formation professionnelle
- Sécurité sociale

A propos d'Inria

Inria est l'institut national de recherche dédié aux sciences et technologies du numérique. Il emploie 2600 personnes. Ses 215 équipes-projets agiles, en général communes avec des partenaires académiques, impliquent plus de 3900 scientifiques pour relever les défis du numérique, souvent à l'interface d'autres disciplines. L'institut fait appel à de nombreux talents dans plus d'une quarantaine de métiers différents. 900 personnels d'appui à la recherche et à l'innovation contribuent à faire émerger et grandir des projets scientifiques ou entrepreneuriaux qui impactent le monde. Inria travaille avec de nombreuses entreprises et a accompagné la création de plus de 200 start-up. L'institut s'eorce ainsi de répondre aux enjeux de la transformation numérique de la science, de la société et de l'économie.

Publiée le 04/12/2025 - Réf : be2b70eee1c751d193ec781ed7d6aa51

Ingénieur de Recherche Alignement Post-Training H/F

INRIA
  • Paris - 75
  • CDD
Publiée le 04/12/2025 - Réf : be2b70eee1c751d193ec781ed7d6aa51

Finalisez votre candidature

sur le site du recruteur

Créez votre compte pour postuler

sur le site du recruteur !

Ces offres pourraient aussi
vous intéresser

GTA Energies recrutement
Paris 12e - 75
CDI
37 000 - 45 000 € / an
Voir l’offre
il y a 25 jours
Cyclife SAS recrutement
Voir l’offre
il y a 28 jours
Voir plus d'offres
Initialisation…
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Application Android (nouvelle fenêtre) Application ios (nouvelle fenêtre)
Nous suivre sur :
Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact