Complétez votre profil pour recevoir des offres adaptées.

Mon espace

Mes CV vus

Mes candidatures

Mes alertes

Mon profil

Paramètres

Déconnexion

Missions d'intérim
Offres de stage
Offres en alternance
Créer mon alerte
Déposer mon CV
Salaire brut net

Téléchargez l'app et postulez dans les premiers !

Diffuser ma première offre Déjà client

Téléchargez l'app et postulez dans les premiers !

Se connecter S'inscrire Formation

Téléchargez l'app et postulez dans les premiers !

Trouver mon job s

Trouver mon entreprise s

Accès recruteur

Diffuser ma première offre

Déjà client

Emploi

Missions d'intérim

Offres de stage

Offres en alternance

Créer mon alerte

Déposer mon CV

Salaire brut net

Formation

Se connecter

S'inscrire

Trouver mon job s

Trouver mon entreprise s

Mon espace

Mes CV vus

Mes candidatures

Mes alertes

Mon profil

Paramètres

Déconnexion

Pas de salaire renseigné

Le recruteur n'a pas communiqué le salaire pour cette offre, ou n'a pas souhaité l'afficher.

Thèse Enact Analyse Automatique des Biais dans les Publications Scientifiques H/F
Doctorat_Gouv

Grand Est
CDD
Bac +5
Service public d'état

Lire dans l'app

Détail du poste

Établissement : Université de Lorraine
École doctorale : IAEM - INFORMATIQUE - AUTOMATIQUE - ELECTRONIQUE - ELECTROTECHNIQUE - MATHEMATIQUES
Laboratoire de recherche : LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Direction de la thèse : Karen FORT ORCID 0000000207238850
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-04-24T23:59:59

Le rendu faussé des résultats est une cause de biais en recherche encore peu étudiée [Boutron et al., 2010]. Les problèmes rencontrés incluent la non-publication ou la publication tardive d'études, les omissions ou les interprétations erronées des résultats dans les résumés, ainsi que la présentation et l'interprétation biaisées des résultats visant à convaincre le lecteur de bénéfices non étayés par les principaux résultats. L'enjeu est de taille, car une publication faussée peut nuire à la confiance de la communauté scientifique et de la société envers la recherche. Parmi les risques figurent également le déploiement de systèmes insuffisamment précis pour l'usage prévu, car les bénéfices ont été surestimés et les inconvénients minimisés, voire ignorés [Buolamwini et al., 2018]. Le traitement automatique des langues peut permettre d'identifier ces problèmes grâce au développement de l'analyse automatique de textes permettant d'identifier les affirmations scientifiques et de les confronter aux résultats de la recherche [Koroleva et al., 2020 ; Bleuze, 2024]. S'appuyant sur ces travaux récents, il est nécessaire de perfectionner la caractérisation automatique des affirmations et des résultats en exploitant le contenu des résumés et des textes intégraux des publications scientifiques, ainsi que d'autres types de sources telles que les figures et les tableaux.
L'objectif de cette thèse est l'analyse des biais dans les publications scientifiques. Les méthodes d'identification automatique des liens de causalité entre les énoncés dans les articles peuvent être utilisées à cette fin. L'un des résultats attendus est la constitution d'un corpus de liens de causalité entre les énoncés présents dans les résumés et les textes intégraux de publications scientifiques en anglais. Par exemple, dans (Lu et al. 2022), nous pouvons considérer des énoncés du résumé et des résultats décrivant le même aspect du travail: Résumé: «Les expériences menées sur l'ensemble de données DAIC-WOZ montrent que les performances de l'algorithme se sont considérablement améliorées, avec une erreur absolue moyenne (MAE) de 4,48 et une erreur quadratique moyenne (RMSE) de 5,37.» Résultats: «Le résultat expérimental de la MAE s'est rapidement amélioré, passant de 4,96 à 4,48 après l'ajout du module Transformer Encoder.» On constate que l'amélioration «considérable» correspond à 0,48 point pour la MAE, tandis que la RMSE, mentionnée dans le résumé, n'est pas décrite dans les résultats. Nous nous concentrerons sur deux sous-domaines scientifiques différents, pour lesquels nous avons déjà de l'expérience et des corpus disponibles: le domaine biomédical et le traitement automatique des langues.
Dans ce contexte, il faudra constituer un corpus de publications scientifiques. extraire des énoncés des résumés d'articles - en particulier les affirmations -, les aligner avec des énoncés décrivant le même contenu dans le texte intégral et analyser en détail les liens entre eux. L'extraction et l'alignement s'appuieront sur des travaux antérieurs: Bleuze et al. (2024) permettent l'identification automatique des affirmations et peuvent être utilisés pour extraire des énoncés pertinents des résumés et des textes intégraux afin de les apparier. Des mesures de similarité de phrases peuvent également être utilisées pour faciliter l'appariement des phrases des résumés et des textes intégraux. Le doctorant analysera ensuite automatiquement les relations sémantiques entre les phrases des résumés et leurs équivalents les plus «similaires» dans les textes intégraux, et évaluera si les affirmations présentes dans les textes intégraux figurent également dans les résumés. L'étude explorera la cohérence du contenu entre les résumés et les textes intégraux, ainsi que la sélection du contenu opérée par les résumés à partir du contenu intégral d'un article.

Inadequate reporting is an understudied cause of bias in research [Boutron et
al. 2010, Macleod et Al. 2014]. Problems include, but are not limited to, non-reporting or delayed reporting of studies, omissions from or misinterpretation of results in abstracts, distorted reporting and interpretation of study results to convince the reader of benefits not supported by the main findings. These issues have been studied in biomedical research with publication guidelines being proposed to improve the quality of reporting [Ghimire et al. 2014]. There is much at stake here, as inadequate reporting can negatively impact the trust of the research community and society in scientific research. Risks also include poor decision-making due to distorted results, such as deployment of systems that are not accurate enough for their intended usage because benefits have been over-estimated and drawbacks minimized or even not considered at all [Buolamwini et al. 2018]. Natural Language processing can contribute further interventions through the development of automatic text analysis to identify scientific claims and contrast them with research results [Koroleva et al. 2020, Bleuze, 2024]. Building on this recent work, there is a need to advance the automatic characterization of claims and results by leveraging content from both the abstracts and full text scientific publications as well as other types of sources such as figures, and tables.

The objective of this project is to analyze a corpus of scientific publications for entailment between statements in the abstracts vs. full text, including information retrieval models, dense vector representations.

The PhD student will build a corpus of scientific publications in the biomedical domain. They will extract statements from an article abstract - in particular, claims -, align them with statements describing the same content in the article full text and further analyze the entailement between them.
The extraction and alignment will build on previous work: Bleuze et al (2024) supports the automatic identification of claims and can be used to extract statements of interest from abstracts and full text to pair them. Sentence similarity measures can also be used to support the pairing of sentences from abstract and full text.
The PhD student will analyze the semantic relationships between abstract sentences and their most «similar» counterpart in full text, and assess whether claims made in the full text are present in abstracts. The study will explore the consistency of content in abstracts vs. full text as well as the content selection operationalized by abstracts from the full content of an article.

Le profil recherché

- anglais courant
- Master en TAL
- intérêt démontré pour la création de corpsu et les questions éthiques
- Maîtrise de Python
- Utilisation de LLM

Publiée le 24/03/2026 - Réf : 4f7e8e413a6cd384d11b801b4c3b1a40

Créez votre compte Hellowork et activez votre alerte Créez une alerte

Métier

Localité

Type de contrat

CDI

CDD

Intérim

Stage

Alternance

Indépendant

Franchise

Associé

Fonctionnaire

Freelance

Stage de lycée

Thèse Enact Analyse Automatique des Biais dans les Publications Scientifiques H/F

Doctorat_Gouv

Grand Est
CDD

Postuler sur le site du partenaire Publiée le 24/03/2026 - Réf : 4f7e8e413a6cd384d11b801b4c3b1a40

Postuler sur le site du partenaire

Finalisez votre candidature
sur le site du partenaire

Créez votre compte
Hellowork et postulez

sur le site du partenaire !

Voir plus d'offres

Recherches similaires

Job Ingénieur chimiste
Job Chimie
Job Épinal
Job Remiremont
Job Vittel
Job Gérardmer
Job Neufchâteau
Job Mirecourt
Job Rambervillers
Job Contrexéville
Job Saint-Dié-des-Vosges
Job La Bresse
Job Technicien de laboratoire
Job Préleveur
Job Opérateur chimie
Job Ingénieur en chimie et matériaux
Job Technicien préleveur
Entreprises Chimie
Entreprises Ingénieur chimiste
Entreprises Épinal
Entreprises Ardennes
Job Fonction publique
Job Été
Job Anglais
Job Université
Job Scientifique

Voir plus Voir moins

Initialisation…

Testez votre correspondance

Chargement du chat...

Accueil
Job
Job Grand Est
Job Ardennes
Job Ingénieur chimiste Ardennes
Thèse Enact Analyse Automatique des Biais dans les Publications Scientifiques H/F

Les sites

HelloCV
Helloworkplace
BDM
Jobijoba
Maformation
Diplomeo

L'emploi

Offres d'emploi par métier
Offres d'emploi par ville
Offres d'emploi par entreprise
Offres d'emploi par mots clés

L'entreprise

Qui sommes-nous ?
On recrute
Accès client

Les apps

Nous suivre sur :

Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact

Thèse Enact Analyse Automatique des Biais dans les Publications Scientifiques H/F Doctorat_Gouv

Détail du poste

Le profil recherché

Finalisez votre candidature sur le site du partenaire

Recherches similaires

Thèse Enact Analyse Automatique des Biais dans les Publications Scientifiques H/F
Doctorat_Gouv

Finalisez votre candidature
sur le site du partenaire