Les missions du poste
- Concevoir, entraîner, optimiser et déployer des modèles de Machine Learning et Deep Learning (NLP, LLM, embeddings).
- Développer et maintenir des pipelines ML robustes (entraînement, évaluation, monitoring, CI/CD).
- Construire des architectures RAG incluant : ingestion de documents, stratégie de chunking, embeddings, vector stores, pipelines de retrieval & génération.
- Implémenter des applications LLM avec LangChain / LangGraph (agents, tools, retrievers, flows).
- Déployer des microservices IA (API FastAPI / Flask) et gérer leur scalabilité en production.
- Optimiser l'inférence et les performances : latence, consommation GPU, parallélisation, batching.
- Collaborer avec les équipes Data Engineering, Produit et Dev pour industrialiser les solutions.
- Surveiller les modèles en production (drift, performance, dérive des données).
Le profil recherché
- Excellente maîtrise de Python (structuration du code, tests unitaires, design patterns).
- Expertise en NLP / Deep Learning : PyTorch, TensorFlow, Transformers (HuggingFace).
- Expérience concrète sur des projets LLM, finetuning, prompt engineering.
- Maîtrise des architectures RAG : embeddings, vector stores (FAISS, Chroma, Milvus...), retrieval.
- Expérience sur LangChain / LangGraph / LlamaIndex.
- Solide niveau en API engineering : FastAPI, Flask.
- Connaissances MLOps :
- Docker, CI/CD (GitLab, GitHub Actions, Azure DevOps...)
- MLflow, Weights & Biases, DVC
- Kubernetes (souhaité), orchestration (Airflow / Prefect)
- Maîtrise d'un cloud : AWS, GCP ou Azure (un plus si Azure OpenAI, Bedrock, Vertex AI).
Compétences appréciées :
- Connaissance des bases vectorielles avancées (SHARED / HNSW / IVF).
- Optimisation GPU, quantization (GPTQ, GGUF, vLLM).
- Expérience en ingestion de documents (OCR, parsing PDF/HTML).
- Expérience LLMOps (observabilité, monitoring, guardrails).
Profil attendu :
- Autonomie & pragmatisme : capable de poser un diagnostic, proposer une solution et la livrer.
- Culture GenAI & LLM : curiosité forte, veille active, envie d'expérimenter et d'améliorer en continu.
- Collaboration fluide : bon communicant, à l'aise avec les équipes Produit, Data et Software.
- Orientation impact : focus sur le concret, la performance et la valeur métier plutôt que l'expérimentation théorique.
Inetum en images
Publiée le 11/06/2026 - Réf : SYNCSF-fr-20251126-082822