Complétez votre profil pour recevoir des offres adaptées.

Mon espace

Mes CV vus

Mes candidatures

Mes alertes

Mon profil

Paramètres

Déconnexion

Missions d'intérim
Offres de stage
Offres en alternance
Créer mon alerte
Déposer mon CV
Salaire brut net

Téléchargez l'app et postulez dans les premiers !

Diffuser ma première offre Déjà client

Téléchargez l'app et postulez dans les premiers !

Se connecter S'inscrire Formation

Téléchargez l'app et postulez dans les premiers !

Trouver mon job s

Trouver mon entreprise s

Accès recruteur

Diffuser ma première offre

Déjà client

Emploi

Missions d'intérim

Offres de stage

Offres en alternance

Créer mon alerte

Déposer mon CV

Salaire brut net

Formation

Se connecter

S'inscrire

Trouver mon job s

Trouver mon entreprise s

Mon espace

Mes CV vus

Mes candidatures

Mes alertes

Mon profil

Paramètres

Déconnexion

Pas de salaire renseigné

Le recruteur n'a pas communiqué le salaire pour cette offre, ou n'a pas souhaité l'afficher.

Thèse Traduction Fiable de Droit en Code H/F
Institut Polytechnique de Paris Télécom Paris

Paris - 75
CDD
Bac +5
Service public d'état

Lire dans l'app

Les missions du poste

Les systèmes juridiques font face à une crise de complexité. Pour y répondre, gouvernements et économistes s'appuient de plus en plus sur des jumeaux numériques des systèmes légaux afin d'anticiper l'impact de nouvelles lois (ex. : LexImpact.an.fr) et d'identifier les lacunes réglementaires. Une condition préalable essentielle à ces analyses computationnelles est le Law-as-Code : la traduction des règles en langage naturel en programmes exécutables par machine. Bien que la formalisation manuelle puisse produire un code de haute qualité, elle est coûteuse en temps et difficile à généraliser. Les grands modèles de langage (LLM) ont révolutionné la génération de code, ce qui en fait des candidats naturels pour surmonter le goulot d'étranglement que représente la traduction du droit en code.

L'application directe des LLM à ce problème ouvert soulève plusieurs défis majeurs. D'abord, la traduction du droit en code exige une précision sémantique stricte, mais il n'existe actuellement aucune méthode satisfaisante pour évaluer la qualité du code généré. Ensuite, le processus implique des dépendances au niveau du document, et non des fonctions isolées, et doit s'adapter à divers langages de programmation spécialisés. Enfin, le manque d'interprétabilité des LLM rend leur raisonnement invérifiable, empêchant les experts du domaine de faire confiance aux résultats.

Ce projet propose un système pour traduire les textes juridiques en une Représentation Intermédiaire (IR) formellement définie, délégant l'exécution à un moteur symbolique. Trois objectifs principaux soutiennent cette approche : (1) établir un benchmark complet et rigoureux basé sur l'exécution ; (2) faire progresser les IR et résoudre les dépendances documentaires ; (3) valider le système dans des workflows vérifiables, intégrant l'humain dans la boucle.

Les benchmarks actuels en Law-as-Code sont fragmentés, et les métriques d'évaluation reposent souvent sur des similitudes textuelles superficielles (ex. : BLEU), sans capturer la sémantique ni la logique. Ce projet vise à créer un benchmark unifié en agrégeant des jeux de données comme SARA, Catala, OpenFisca et OpenExempt. Il définira une procédure et une métrique standard basées sur la précision d'exécution : la performance sera mesurée par la capacité du code généré à produire le résultat juridique correct, et non par sa ressemblance avec un code de référence.

Les méthodes existantes de génération de code fonctionnent bien pour des fonctions simples et autonomes, écrites en langages courants. Mais elles peinent avec les textes juridiques, dont les clauses sont interdépendantes à l'échelle de documents entiers et peuvent impliquer des langages de programmation spécifiques. Ce projet abordera ces défis via :

(a) une IR structurée, assez expressive pour la logique juridique mais suffisamment contrainte pour être vérifiable, et gérant les dépendances inter-documents ;
(b) des méthodes pour traduire le texte juridique en IR, utilisant un LLM comme parseur sémantique, avec décodage contraint et fine-tuning ;
(c) un interpréteur capable de mapper l'IR vers un langage cible (ex. : Python, Catala), préservant la sémantique et la traçabilité par rapport au texte source.

Les systèmes Law-as-Code opèrent dans des environnements critiques où « presque correct » est inacceptable. Ce projet dépassera les métriques automatisées en menant des études avec des programmeurs professionnels (ex. : développeurs Catala). La valeur pratique d'un modèle sera évaluée par sa capacité à accélérer le travail des humains et à éviter les erreurs. Des études utilisateurs compareront les candidats générés par le modèle, mesurant lisibilité, auditabilité et gain de temps dans des workflows réalistes. Cela conduira naturellement à un cadre human-in-the-loop. Cette approche combine l'efficacité des LLM et la fiabilité de la supervision humaine, visant une robustesse adaptée au déploiement réel.

Legal systems face a crisis of complexity. To address this, governments and economists increasingly rely on digital twins of legal systems to anticipate the impact of new laws (e.g., LexImpact.an.fr) and identify regulatory gaps [1 ]. A critical prerequisite for computational analyses is Law-as-Code: the translation of natural language rules into machine-executable programs. While manual formalization can yield high-quality code, it is labor-intensive and scales poorly [ 2]. Large Language Models (LLMs) have revolutionized code generation [ 3], making them natural candidate, to overcome the bottleneck of translating law into code. However, they do not yet match the high standard of correctness required for legal systems. This project directly addresses this challenge by developping a robust framework to translate legal text into formally-defined Intermediate Representations (IRs), utilizing a human-in-the-loop workflow to ensure semantic accuracy and executability.
Applying LLMs directly to the Law-as-Code problem presents several core challenges. First,
law-to-code requires strict semantic accuracy, yet there are currently no satisfactory methods to evaluate the quality of the generated code. Standard metrics like BLEU or semantic similarity are insufficient for logic-heavy domains where a single negated clause reverses the legal outcome.
Second, the translation process involves document-level dependencies rather than standard
function-level generation. Legal statutes are rarely self-contained; they reference definitions,
exceptions, and conditions spread across vast codebooks. Existing code generation methods, while effective for small-scale functions [ 4], struggle with these long-form interdependencies [5, 6 ]. Finally, the lack of interpretability in LLM generation makes the reasoning process unverifiable, preventing domain experts from trusting the outputs. In high-stakes environments, such as tax law or social benefits, mostly correct is unacceptable.

(voir PDF)

(voir PDF)

Le profil recherché

Le candidat idéal doit être titulaire d'un master en informatique, en intelligence artificielle ou dans un domaine connexe. Les compétences requises sont les suivantes :

- Une excellente maîtrise de Python et des frameworks de Deep Learning (PyTorch/TensorFlow).

- Une expérience en traitement automatique du langage naturel (TALN), en particulier avec les grands modèles de langage, ou en méthodes formelles.

- Un vif intérêt pour les liens entre Droit, Logique et Informatique.

- Une connaissance des logiques symboliques (Prolog, Catala) constitue un atout significatif.

Bienvenue chez Institut Polytechnique de Paris Télécom Paris

Établissement : Institut Polytechnique de Paris Télécom Paris
École doctorale : Ecole Doctorale de l'Institut Polytechnique de Paris
Laboratoire de recherche : Laboratoire de Traitement et Communication de l'Information
Direction de la thèse : Fabian SUCHANEK ORCID 0000000171892796
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-04-14T23:59:59

Publiée le 17/03/2026 - Réf : 70861b99cebb45c2b630f170575542ef

Créez votre compte Hellowork et activez votre alerte

Métier

Localité

Type de contrat

CDI

CDD

Intérim

Stage

Alternance

Indépendant

Franchise

Associé

Fonctionnaire

Freelance

Stage de lycée

Thèse Traduction Fiable de Droit en Code H/F

Institut Polytechnique de Paris Télécom Paris

Paris - 75
CDD

Postuler sur le site du partenaire Publiée le 17/03/2026 - Réf : 70861b99cebb45c2b630f170575542ef

Postuler sur le site du partenaire

Finalisez votre candidature
sur le site du partenaire

Créez votre compte
Hellowork et postulez
sur le site du partenaire !

Voir plus d'offres

Recherches similaires

Job Traducteur
Job Service
Job Baby sitter
Job Aide à domicile
Job Coiffeuse
Job Assistante maternelle
Job Nounou
Entreprises Service
Entreprises Traducteur
Entreprises Paris

Initialisation…

Testez votre correspondance

Chargement du chat...

Accueil
Job
Job Paris
Job Service Paris
Job Traducteur Paris
Thèse Traduction Fiable de Droit en Code H/F

Les sites

HelloCV
Helloworkplace
BDM
Jobijoba
Maformation
Diplomeo

L'emploi

Offres d'emploi par métier
Offres d'emploi par ville
Offres d'emploi par entreprise
Offres d'emploi par mots clés

L'entreprise

Qui sommes-nous ?
On recrute
Accès client

Les apps

Nous suivre sur :

Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact

Thèse Traduction Fiable de Droit en Code H/F Institut Polytechnique de Paris Télécom Paris

Les missions du poste

Le profil recherché

Bienvenue chez Institut Polytechnique de Paris Télécom Paris

Finalisez votre candidature sur le site du partenaire Créez votre compte Hellowork et postulez sur le site du partenaire !

Recherches similaires

Thèse Traduction Fiable de Droit en Code H/F
Institut Polytechnique de Paris Télécom Paris

Finalisez votre candidature
sur le site du partenaire

Créez votre compte
Hellowork et postulez
sur le site du partenaire !