Les missions du poste
Vous êtes à la recherche d'une entreprise pour votre stage estival en data science et IA ?
Rejoignez notre équipe R&D et Prototypage IA à Issy-Les-Moulineaux en tant que stagiaire Data Scientist IA, à partir de Juin 2026 pour un stage de 4 à 6 mois !
Contexte de la mission :
Face au dérèglement climatique, les sinistres liés aux épisodes de sécheresse se multiplient. Le traitement de ces dossiers nécessite l'analyse minutieuse de rapports d'expertise sécheresse, qui sont souvent des documents longs, complexes, hétérogènes et fournis sous forme de documents scannés (PDF, images). L'objectif de ce stage est de concevoir un prototype capable d'automatiser la lecture et la compréhension de ces documents afin d'en extraire les informations clés (constats de dommages, causes identifiées, préconisations de travaux, chiffrages, etc.).
Au sein du Data Office de la MACIF, le Pôle R&D et Prototypage IA intervient dans les phases d'idéation, maturation et prototypage des besoins de nos partenaires dès lors que ceux-ci ne sont pas couverts par une offre de service existante. L'équipe travaille notamment sur des cas d'usage innovants tels que la prévention du risque climatique et l'exploration de nouvelles solutions IA.
Encadré(e) par un(e) Data Scientist Senior, vous serez en charge de bout en bout d'un projet de Document AI (Intelligence Artificielle appliquée aux documents). Vos missions s'articuleront autour des axes suivants :
? État de l'art : Réaliser une veille technologique sur les méthodes d'extraction d'information dans les documents scannés (OCR avancés, modèles multimodaux de type LayoutLM, Donut, LLMs appliqués au document, etc.).
? Traitement de la donnée : Explorer, nettoyer et structurer un corpus de rapports d'expertise réels (anonymisés) pour constituer un jeu de données d'entraînement et d'évaluation.
? Expérimentation et Modélisation : Mettre en place des pipelines d'extraction combinant reconnaissance de caractères (OCR) et traitement du langage naturel (NLP).
? Entraîner, fine-tuner ou utiliser des modèles pré-entraînés (LLMs / Vision-Language Models) pour extraire les entités nommées et les relations complexes.
? Prototypage : Développer un prototype fonctionnel (Proof of Concept) démontrant la faisabilité technique et la valeur métier de la solution.
? Évaluation : Définir les métriques de performance pertinentes et évaluer la robustesse des modèles face à la diversité des formats de rapports.
Le profil recherché
- Compétences techniques :
? Excellente maîtrise du langage Python.
? Bonnes connaissances en Machine Learning et Deep Learning.
? Une première expérience (projet académique ou personnel) en NLP et/ou en Computer Vision / OCR est fortement recommandée.
? Maîtrise des librairies standards de l'écosystème IA : PyTorch, TensorFlow, Hugging Face (Transformers), spaCy, scikit-learn, etc. La connaissance de l'écosystème Google Vertex AI et des outils comme Googe Document AI est un plus.
- Savoir-être : Vous êtes curieux(se), autonome, force de proposition et vous aimez résoudre des problèmes complexes. Vous avez le goût du défi technique et un bon esprit de synthèse.
Infos complémentaires
Les étapes de recrutement
Les étapes de recrutement peuvent varier selon l'offre à laquelle vous postulez.
-
Envoyez-nous votre candidature via notre site internet ou un site de recrutement
-
Notre équipe ressources humaines analysera votre candidature
-
Si votre candidature est retenue, nous vous contacterons afin d'effectuer une pré-qualif
-
Si votre candidature n'est pas retenue, vous recevrez un message pour vous en informer
-
Vous rencontrez votre interlocuteur RH et votre futur manager pour un entretien
-
Vous serez contacté.e par votre interlocuteur RH vous informe de la décision
-
Macif en images
Publiée le 27/04/2026 - Réf : 29235282 2026-8917