Aller au contenu principal
Inrae recrutement

Ingénieur·e en Data Science H/F Inrae

Paris - 75
CDD
Résumé de l'offre
  • Bac +5
  • Service public autres

Détail du poste

La Direction pour la Science Ouverte (DipSO) participe à la définition et à la mise en oeuvre de la politique de Science Ouverte de l'Institut. Pour répondre à ses missions, il est essentiel pour la DipSO d'identifier les tendances et les émergences du domaine afin d'en anticiper les évolutions. La DipSO, organisation multi-site impliquant un travail en réseau, est composée de quatre pôles. Afin de répondre aux besoins d'analyse informationnels du management scientifique, la DipSO développe des outils et des méthodes pour observer et suivre l'activité scientifique et son impact.

Contexte :

La recherche évolue et produit un flux d'informations de plus en plus hétérogène et massif. Les sources de données se multiplient et il faut de plus en fouiller dans des textes pour extraire les informations souhaitées. Une exploitation (fouille de données et de textes, data visualisation) combinée de ces données est primordiale pour avoir une vision synthétique et pertinente de la production scientifique, afin d'éclairer l'aide à la décision. Pour répondre à ces enjeux, la DipSO a entamé une montée en compétences en science des données et en analyses statistiques et de données textuelles, dans laquelle s'intègre ce poste.

L'ingénieur.e apportera son savoir-faire dans plusieurs projets de production d'analyses stratégiques, à partir de corpus de données hétérogènes, en appui au management scientifique et fonctionnel de l'institut. Dans ce cadre, la personne recrutée sera en interaction avec des professionnels de l'information scientifique (bibliomètres, veilleur.se.s notamment) et des informaticiens (développeur.se.s et data scientists).

Mission principale
L'ingénieur.e recruté.e apportera un appui méthodologique et technique au pôle dédié à l'analyse de l'information via un panel d'activités telles que :
· Les prétraitements (extraction et homogénéisation du contenu textuel) de différents corpus de données textuelles hétérogènes (sources, formats). Ces prétraitements devront exploiter des outils et méthodes d'analyse de corpus de texte (informations structurées ou non structurées), voire des modèles de langues, en se basant sur un langage de programmation (R, Python...) et des bibliothèques adaptées.
· La production d'analyses exploratoires à partir des jeux de données issus de l'étape de prétraitement (analyses statistiques descriptives voire multifactorielles).
· Le regroupement de documents sur la base de similarités (classification non supervisée voire supervisée).
· Le développement de scripts visant l'automatisation des traitements et analyses relevant du text-mining. Il s'agira d'améliorer des scripts existants ou d'en créer de nouveau, et de tester différentes méthodes.
· La rédaction de rapports et contribution au développement d'une bibliothèque de workflows d'analyse (notebooks).

Le profil recherché

Niveau minimum requis : Bac +5 ou expérience significative dans un poste similaire

Compétences / savoir-faire :

1. Maîtriser les outils et méthodes d'analyse de données textuelles (statistiques et fouille de texte).

2. Maîtriser le nettoyage, les prétraitements nécessaires à l'exploitation des données textuelles (qualité des données).

3. Une connaissance des Large Language Models (LLMs) serait appréciée.
Afficher la suite
4. Être à l'aise avec la programmation (expérience d'outils ; maîtrise du R ou Python obligatoire) ainsi que les outils informatiques dédiés à l'activité à distance.

5. Une maîtrise des notebooks serait bienvenue.

6. Des connaissances du monde de la recherche et une culture scientifique dans le domaine de l'agronomie, de l'agroécologie et/ou des sciences de l'environnement seraient des plus.

Capacités / savoir-être :

1. Rigueur, esprit d'analyse et de synthèse

2. Capacité à travailler à distance et en réseau

3. Proactivité, autonomie appréciée

4. Sens du contact/relationnel et capacité de transfert appréciés

Pour candidater

Faites parvenir un CV et une lettre de motivation détaillée indiquant pourquoi vous postulez sur ce poste et quelles sont vos compétences et vos expériences au regard de l'offre. Après présélection des dossiers, une audition des candidat(e)s retenu(e)s sera organisée à partir de la semaine 11 en visio (date à fixer en fonction de la disponibilité des recruteurs).

Hellowork a estimé le salaire pour ce métier à Paris

Le recruteur n'a pas communiqué le salaire de cette offre mais Hellowork vous propose une estimation (fourchette variable selon l'expérience).

Estimation basée sur les données INSEE et les offres d’emploi similaires.

Estimation basse

45 000 € / an 3 750 € / mois 24,72 € / heure

Salaire brut estimé

53 800 € / an 4 483 € / mois 29,56 € / heure

Estimation haute

67 500 € / an 5 625 € / mois 37,09 € / heure

Cette information vous semble-t-elle utile ?

Merci pour votre retour !

Ingénieur·e en Data Science H/F
  • Paris - 75
  • CDD
Publiée le 05/04/2025 - Réf : 2025-1825816

Finalisez votre candidature

sur le site du recruteur

Créez votre compte pour postuler

sur le site du recruteur !

Ces offres pourraient aussi
vous intéresser

KARAVEL GROUPE recrutement
Paris 10e - 75
CDI
🏡 Télétravail partiel
Voir l’offre
il y a 28 jours
Altim recrutement
Altim recrutement
Élancourt - 78
CDI
48 000 - 58 000 € / an
🏡 Télétravail occasionnel
Voir l’offre
il y a 25 jours
KPMG recrutement
KPMG recrutement
Courbevoie - 92
CDI
Voir l’offre
il y a 24 jours
Voir plus d'offres
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Application Android (nouvelle fenêtre) Application ios (nouvelle fenêtre)
Informations légales CGU Politique de confidentialité Gérer les traceurs Aide et contact
Nous suivre sur :