
Ingénieur·e en Data Science H/F Inrae
Paris - 75 CDD- Bac +5
- Service public autres
Détail du poste
La Direction pour la Science Ouverte (DipSO) participe à la définition et à la mise en oeuvre de la politique de Science Ouverte de l'Institut. Pour répondre à ses missions, il est essentiel pour la DipSO d'identifier les tendances et les émergences du domaine afin d'en anticiper les évolutions. La DipSO, organisation multi-site impliquant un travail en réseau, est composée de quatre pôles. Afin de répondre aux besoins d'analyse informationnels du management scientifique, la DipSO développe des outils et des méthodes pour observer et suivre l'activité scientifique et son impact.
Contexte :
La recherche évolue et produit un flux d'informations de plus en plus hétérogène et massif. Les sources de données se multiplient et il faut de plus en fouiller dans des textes pour extraire les informations souhaitées. Une exploitation (fouille de données et de textes, data visualisation) combinée de ces données est primordiale pour avoir une vision synthétique et pertinente de la production scientifique, afin d'éclairer l'aide à la décision. Pour répondre à ces enjeux, la DipSO a entamé une montée en compétences en science des données et en analyses statistiques et de données textuelles, dans laquelle s'intègre ce poste.
L'ingénieur.e apportera son savoir-faire dans plusieurs projets de production d'analyses stratégiques, à partir de corpus de données hétérogènes, en appui au management scientifique et fonctionnel de l'institut. Dans ce cadre, la personne recrutée sera en interaction avec des professionnels de l'information scientifique (bibliomètres, veilleur.se.s notamment) et des informaticiens (développeur.se.s et data scientists).
Mission principale
L'ingénieur.e recruté.e apportera un appui méthodologique et technique au pôle dédié à l'analyse de l'information via un panel d'activités telles que :
· Les prétraitements (extraction et homogénéisation du contenu textuel) de différents corpus de données textuelles hétérogènes (sources, formats). Ces prétraitements devront exploiter des outils et méthodes d'analyse de corpus de texte (informations structurées ou non structurées), voire des modèles de langues, en se basant sur un langage de programmation (R, Python...) et des bibliothèques adaptées.
· La production d'analyses exploratoires à partir des jeux de données issus de l'étape de prétraitement (analyses statistiques descriptives voire multifactorielles).
· Le regroupement de documents sur la base de similarités (classification non supervisée voire supervisée).
· Le développement de scripts visant l'automatisation des traitements et analyses relevant du text-mining. Il s'agira d'améliorer des scripts existants ou d'en créer de nouveau, et de tester différentes méthodes.
· La rédaction de rapports et contribution au développement d'une bibliothèque de workflows d'analyse (notebooks).
Le profil recherché
Niveau minimum requis : Bac +5 ou expérience significative dans un poste similaire
Compétences / savoir-faire :
1. Maîtriser les outils et méthodes d'analyse de données textuelles (statistiques et fouille de texte).
2. Maîtriser le nettoyage, les prétraitements nécessaires à l'exploitation des données textuelles (qualité des données).
3. Une connaissance des Large Language Models (LLMs) serait appréciée.
Afficher la suite
4. Être à l'aise avec la programmation (expérience d'outils ; maîtrise du R ou Python obligatoire) ainsi que les outils informatiques dédiés à l'activité à distance.
5. Une maîtrise des notebooks serait bienvenue.
6. Des connaissances du monde de la recherche et une culture scientifique dans le domaine de l'agronomie, de l'agroécologie et/ou des sciences de l'environnement seraient des plus.
Capacités / savoir-être :
1. Rigueur, esprit d'analyse et de synthèse
2. Capacité à travailler à distance et en réseau
3. Proactivité, autonomie appréciée
4. Sens du contact/relationnel et capacité de transfert appréciés
Pour candidater
Faites parvenir un CV et une lettre de motivation détaillée indiquant pourquoi vous postulez sur ce poste et quelles sont vos compétences et vos expériences au regard de l'offre. Après présélection des dossiers, une audition des candidat(e)s retenu(e)s sera organisée à partir de la semaine 11 en visio (date à fixer en fonction de la disponibilité des recruteurs).
Hellowork a estimé le salaire pour ce métier à Paris
Le recruteur n'a pas communiqué le salaire de cette offre mais Hellowork vous propose une estimation (fourchette variable selon l'expérience).
Estimation basée sur les données INSEE et les offres d’emploi similaires.
Estimation basse
45 000 € / an 3 750 € / mois 24,72 € / heureSalaire brut estimé
53 800 € / an 4 483 € / mois 29,56 € / heureEstimation haute
67 500 € / an 5 625 € / mois 37,09 € / heureCette information vous semble-t-elle utile ?
Merci pour votre retour !
- Paris - 75
- CDD
Créez une alerte
Pour être informé rapidement des nouvelles offres, merci de préciser les critères :
Finalisez votre candidature
sur le site du recruteur
Créez votre compte pour postuler
sur le site du recruteur !
sur le site du recruteur
sur le site du recruteur !
Ces offres pourraient aussi
vous intéresser



Recherches similaires
- Emploi Ingénieur
- Emploi Logistique
- Emploi Cariste
- Emploi Préparateur de commande
- Emploi Manutentionnaire
- Emploi Magasinier
- Emploi Agent de quai
- Entreprises Logistique
- Entreprises Ingénieur
- Entreprises Paris
- Emploi Data
- Emploi Fonction publique
- Emploi Scientifique
- Emploi Statistiques
- Emploi Agronomie
- Emploi Fonction publique Paris
- Emploi Cdd Paris
- Emploi Definition Paris
- Emploi Data Paris
- Inrae Paris
- Inrae Ingénieur
{{title}}
{{message}}
{{linkLabel}}