Détail du poste
Description du Poste Les Missions Contexte : Le Centre National de la Recherche Scientifique (CNRS) recrute un·ingénieur de recherche (H/F) en intelligence artificielle avec une expertise en IA générative, apprentissage profond et architectures agentiques afin de concevoir, développer et mettre en oeuvre des services avancés de découverte, d'exploration et d'analyse de données du système Terre. Le poste s'inscrit dans les activités de l'infrastructure de recherche nationale Data Terra et du projet européen Horizon Europe GenAI4Earth, coordonné par le CNRS. Le projet rassemble 17 partenaires académiques et industriels issus de dix pays européens autour du développement de nouvelles générations de services d'IA pour les données environnementales, géospatiales et scientifiques.MissionsL'ingénieur de recherche (H/F) développera des méthodes et services avancés d'intelligence artificielle pour la découverte, l'intégration et l'analyse de données scientifiques multimodales dans le cadre des activités du projet européen GenAI4Earth et du noeud EOSC de Data Terra.Les travaux porteront notamment sur :- le développement d'architectures RAG et d'agents IA pour l'exploration conversationnelle de catalogues de données scientifiques hétérogènes,la construction de représentations sémantiques (embeddings, indexation vectorielle) unifiées de métadonnées et données scientifiques (images, séries temporelles, signaux),- le développement et l'évaluation de modèles fondation appliqués aux données environnementales et géophysiques, en particulier à travers l'exploitation de méthodes d'apprentissage auto-supervisé (self-supervised learning) pour l'analyse de flux de données massifs et faiblement annotés ;- l'opérationnalisation de services IA dans des environnements de production à haut niveau de maturité technologique (TRL supérieur à 7). L'Activité Activités principales :Activité 1 : IA générative et découverte sémantique de données scientifiques Système Terre (40%)Cette activité concerne la conception et le développement d'architectures d'IA générative et agentique pour la découverte de données scientifiques multimodales à partir de catalogues et infrastructures de données environnementales européennes. Les développements incluront notamment :- l'utilisation d'architectures Retrieval-Augmented Generation (RAG) et d'agents IA basés sur LangChain ou des frameworks équivalents,- l'intégration de modèles d'embeddings open-source (Nomic, BGE, E5 ou équivalents) et des moteurs de recherche vectorielle,- l'orchestration de modèles de langage open-source (familles Mistral ou équivalentes) pour l'enrichissement et complétion automatique de métadonnées scientifiques, et la recherche sémantique appliquée aux catalogues de données.Activité 2 : Modèles fondation pour les données pour les données scientifiques Système Terre (40%)Cette activité concerne le développement d'architectures de modèles fondation appliqués aux données spécifiques du système Terre (séries temporelles de capteurs, données et signaux sismologiques, données géospatiales, et données contextuelles issues de modélisation). Les travaux incluront :- l'utilisation de techniques apprentissage auto-supervisé pour signaux et séries temporelles adaptées aux représentations multimodales des données environnementales,- la conception de backbone de modèles fondation spécialisés pour les données du système Terre.Activité 3 : Ingénierie IA et contribution au déploiement en environnements de production (20%)Cette activité concerne la contribution (en lien avec des ingénieurs spécialistes) à l'industrialisation des développements IA des activités #1 et #2 pour les rendre opérationnels dans des environnements de production sous la forme de services à haut niveau de maturité technologique (TRL supérieur à 7). Les travaux mobiliseront en particulier l'utilisation de pipelines distribués, de techniques MLOps / LLMOps, le monitoring, l'explicabilité et l'évaluation des modèles, et leur documentation. Activités secondaires, au cas par cas :- Assurer une veille technologique et scientifique en IA générative et agentique et mener des actions de formation pour les personnels de l'infrastructure de recherche Data Terra,- Participer à l'animation scientifique des activités IA de Data Terra, - Participer à la diffusion des résultats scientifiques (publications, workshops, démonstrateurs, formations).- Contribuer à la rédaction de dossiers de réponse aux appels à projets ou aux appels d'offres impliquant l'Intelligence Artificielle. Votre Profil Compétences Profil recherché : Doctorat ou diplôme d'ingénieur avec expérience significative en IA, science des données, traitement du signal ou disciplines connexes,- Très bonne maîtrise du développement Python/Julia et des frameworks IA modernes (PyTorch, Hugging Face, Lightning, LangChain, etc.),- Expérience en apprentissage profond, modèles génératifs ou modèles fondation,- Compétences en traitement de données multimodales (images, signaux, séries temporelles, données géospatiales),- Connaissance des architectures RAG, embeddings et moteurs de recherche vectorielle,- Expérience en infrastructures cloud/HPC et environnements GPUIntérêt pour les données environnementales,Savoir-faire :- Analyser un besoin scientifique et le traduire en spécification technique opérationnelle,- Piloter et structurer un projet de bout en bout (planification, reporting, respect des délais),- Expérience dans des projets internationaux multi-partenaires et capacité à s'intégrer dans des environnements collaboratifs complexes,- Très bonnes compétences rédactionnelles pour la production de rapports, livrables et documentations - Maîtriser le français et l'anglais écrit et oral.- Anticiper les évolutions technologiques et proposer des orientations techniques pertinentes.Savoir-être : - Sens de l'initiative, autonomie, rigueur,- Vision stratégique et esprit d'innovation- Capacités d'organisation, d'encadrement et d'animation- Goût pour le travail en équipe et en mode projet. Votre Environnement de Travail Le poste s'inscrit dans un environnement international de premier plan consacré aux infrastructures numériques scientifiques, à la science ouverte, aux données FAIR du système Terre, et aux modèles fondation pour les sciences environnementales. La personne recrutée rejoindra l'équipe de Data Terra, et interagira avec plusieurs infrastructures et projets européens majeurs à l'interface entre IA, géosciences, données environnementales et calcul scientifique.Localisation du poste : UAR Data Terra dans une de ses trois antennes géographiques à Strasbourg (EOST), à Paris (IPSL) ou à Paris (MNHN). L'activité requiert des déplacements fréquents en Europe. Contraintes et risques Aucun risque Rémunération et avantages Rémunération 2200 à 2500 € ajustable selon le niveau d'expérience Congés et RTT annuels 44 jours Pratique et Indemnisation du TT Pratique et indemnisation du TT Transport Prise en charge à 75% du coût et forfait mobilité durable jusqu'à 300€ À propos de l'offre Référence de l'offre UAR2013-JEAMAL-004 Secteur d'activité Sciences du vivant, de la terre et de l'environnement Emploi type Ingenieur biologiste en analyse de donnees (H/F) Expérience souhaitée 1 à 4 années À propos du CNRS Le CNRS est un acteur majeur de la recherche fondamentale à une échelle mondiale. Le CNRS est le seul organisme français actif dans tous les domaines scientifiques. Sa position unique de multi-spécialiste lui permet d'associer les différentes disciplines pour affronter les défis les plus importants du monde contemporain, en lien avec les acteurs du changement. Le CNRS Les métiers de la recherche
Publiée le 02/06/2026 - Réf : fb5c73a5d270956f29d81dc7f5eaf11b