Aller au contenu principal

Data Scientist Spécialiste de la Fouille de Données H/F

Institut de Recherche pour le Développement (IRD)

  • Paris 6e - 75
  • Fonctionnaire
  • Bac +5
  • Service public d'état
Lire dans l'app

Les missions du poste

Sous la responsabilité de Caroline Doucouré, responsable de l'équipe « EcosFAIR » et en étroite relation avec la D-DUNI et la Groupe de travail Intelligence Artificielle de l'IRD, l'ingénieur ou l'ingénieure mettra en oeuvre des méthodes et des outils de fouille de texte dans le but de valoriser le patrimoine documentaire de l'IRD. En coordination avec les ingénieurs de la science de l'information, il ou elle élaborera des prototypes de service pour répondre aux besoins des scientifiques, des partenaires et de la gouvernance.

Les activités principales de l'ingénieur seront les suivantes :

· Organiser les corpus de documents dédiés pour les scientifiques, à partir du système d'information documentaire Horizon pleins textes

· Mettre en place des protocoles et des méthodologies de créations automatisées des corpus pour répondre aux besoins des unités de recherche, des partenaires sud et de la gouvernance

· Fouiller les informations dans les corpus de documents de la base Horizon

· Mettre en oeuvre l'apprentissage ou le fine-tuning (RAG) de modèles larges de langages (LLM) à partir de corpus de documents et de la base Horizon

· Prototyper et tester les services auprès des scientifiques et de la gouvernance

En lien avec l'équipe de gestion du patrimoine documentaire :

· Participation au maintien et enrichissement du fonds documentaire de l'IRD

· Participer à des communautés nationales et internationales de pratiques sur la fouille de texte dans les bibliothèques numériques

· Participer aux développements des statistiques d'usage des documents numériques à l'IRD.

· Participer à des réseaux métiers

Le profil recherché

Compétences en programmation et bonne compréhension des structures de données,

· Maîtrise des méthodes et outils de fouille de textes, et de traitement du langage naturel (NLP/TAL),

· Maîtrise des méthodes d'apprentissage automatique et de l'analyse statistique,

· Maîtrise de Linux

· Connaissances des bases de données documentaires scientifiques

Vous faites preuve des qualités humaines suivantes :

· Vous êtes rigoureux et savez organiser votre travail en autonomie.

· Vous faites preuve de curiosité et vous avez de bonnes capacités d'adaptation.

· Vous possédez un esprit d'analyse et de synthèse ainsi que des compétences rédactionnelles.

· Vous disposez d'un bon relationnel.

· Vous avez un goût prononcé pour le travail en équipe dans un environnement multiculturel.

Bienvenue chez Institut de Recherche pour le Développement (IRD)

Rattaché au pôle science de l'IRD, la Mission Science Ouverte (MSO) coordonne et met en oeuvre la feuille de route de l'IRD pour une science ouverte et partagée vers tous les scientifiques de l'institut et également vers leurs partenariats Sud. Déployée dans les délégations Occitanie (Montpellier), Île-de-France (Aubervilliers) et Sud-Est (Marseille), elle assure la gestion du fonds documentaire et patrimonial de l'institut, offre des services documentaires aux scientifiques et anime un réseau de centres de documentation à l'international. S'appuyant sur les dispositifs numériques de science ouverte, la MSO administre et accompagne les scientifiques dans l'utilisation de ces dispositifs pour assurer le partage et l'ouverture de leur production, notamment des données de recherche. Elle anime le réseau de référents données et développe des communautés de pratiques numériques en informatique scientifique afin de mutualiser les connaissances, outils et retours d'expérience au sein de l'Institut et auprès de ses partenaires.

Vous serez basé à Condorcet ou à Montpellier et vous intégrerez l'équipe EcosFAIR (Écosystème pour des productions scientifiques FAIR) de la MSO. Elle est composée de 7 ingénieurs et techniciens des métiers du numérique et des sciences de l'information.

Publiée le 05/03/2026 - Réf : 2026-2172142

Data Scientist Spécialiste de la Fouille de Données H/F

Institut de Recherche pour le Développement (IRD)
  • Paris 6e - 75
  • Fonctionnaire
Postuler sur le site du partenaire Publiée le 05/03/2026 - Réf : 2026-2172142

Finalisez votre candidature

sur le site du partenaire

Créez votre compte pour postuler

sur le site du partenaire !

Ces offres pourraient aussi
vous intéresser

Safran recrutement
Safran recrutement
Voir l’offre
il y a 22 jours
Gi Group Consulting recrutement
Voir l’offre
il y a 14 jours
AXA en France recrutement
AXA en France recrutement
Voir l’offre
il y a 16 jours
Voir plus d'offres
Initialisation…
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Nous suivre sur :
Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact