Senior ai Engineer - Llm - Agentic ai - Mistral ai - Platform Engineering H/F

Wikeys

  • Paris 1er - 75
  • CDI
  • Bac +5
  • Services aux Entreprises
  • Exp. 5 ans min.
Lire dans l'app

Détail du poste

Dans le cadre d'un programme IA Générative stratégique à l'échelle groupe, nous recherchons un Senior AI Engineer capable d'industrialiser des solutions GenAI souveraines basées sur la plateforme Mistral AI dans un environnement bancaire critique, sécurisé et fortement réglementé.

Le contexte est particulièrement stimulant techniquement : déploiement massif de LLMs, architectures agentiques avancées, optimisation d'inférence, sécurisation des usages IA, orchestration multi-agents et industrialisation MLOps à grande échelle.

Vous rejoindrez une équipe transverse IA Gen composée d'AI Engineers, Platform Engineers, MLOps, Data Engineers, Security Engineers et Product teams afin de construire les futurs standards IA du Groupe.

Enjeux techniques du programme

- Déploiement enterprise-scale de modèles Mistral
- Construction de plateformes GenAI souveraines et sécurisées
- Développement d'agents IA autonomes et multi-agents
- Industrialisation de pipelines LLMOps / MLOps
- Optimisation performance / latence / coût GPU
- Gouvernance IA, sécurité et conformité AI Act
- Détection d'hallucinations et contrôle qualité des outputs
- Observabilité et monitoring des systèmes IA en production
- Intégration des solutions IA dans le SI bancaire critique

Vos responsabilités

Engineering LLM & GenAI

- Concevoir et développer des applications IA générative robustes exploitant Mistral et autres LLM open-source/propriétaires
- Construire des architectures RAG avancées adaptées à des usages enterprise-scale
- Implémenter des pipelines de prompting complexes :

- few-shot
- chain-of-thought
- structured prompting
- tool calling
- function calling
- context management
- Optimiser les performances d'inférence, la qualité des réponses et la consommation des ressources
- Évaluer les modèles selon des métriques :

- hallucination rate
- factuality
- latency
- token efficiency
- cost efficiency

Agentic AI & Multi-Agent Systems

- Développer des architectures multi-agents distribuées
- Implémenter des mécanismes de coordination, supervision et fallback agents
- Gérer les contextes conversationnels complexes et les interactions user-agent
- Travailler avec :

- LangChain
- LangGraph
- CrewAI
- AutoGen
- Semantic Kernel
- MCP servers / tool ecosystems

AI Platform & MLOps

- Industrialiser les déploiements IA dans des environnements Kubernetes sécurisés
- Construire des pipelines CI/CD dédiés aux modèles et applications IA
- Mettre en place : model versioning/prompt versioning/evaluation pipelines/observabilit
- Participer à l'optimisation GPU / inference serving
- Collaborer étroitement avec les équipes DevOps et Platform Engineering

AI Safety / Security / Compliance

- Implémenter des guardrails et mécanismes de contrôle
- Garantir la conformité :

- RGPD
- AI Act
- auditabilité
- explicabilité
- sécurité des données
- Participer aux stratégies de gouvernance IA du Groupe

Stack technique cible

Langages & Frameworks

- Python
- FastAPI
- Pydantic
- AsyncIO

LLM / GenAI

- Mistral AI
- OpenAI
- Claude
- Llama
- Hugging Face
- vLLM
- Ollama
- Transformers

Agentic Frameworks

- LangChain
- LangGraph
- CrewAI
- AutoGen
- Semantic Kernel

RAG / Search

- Vector DB
- Embeddings
- Hybrid Search
- Reranking
- Knowledge Retrieval

Infra / Cloud / MLOps

- Docker
- Kubernetes
- Helm
- CI/CD
- MLflow
- GitLab CI
- Observability stacks

Profil recherché

- 5+ années d'expérience en Software Engineering / AI Engineering
- Expérience solide en GenAI et architectures LLM en production
- Forte expertise Python et engineering backend
- Expérience concrète sur des systèmes agentiques
- Très bonne compréhension des problématiques d'industrialisation IA
- Expérience en environnement critique ou réglementé fortement appréciée
- Capacité à intervenir sur des sujets architecture, performance et sécurité

Très gros plus

- Expérience Mistral AI
- Déploiement self-hosted de LLMs
- Optimisation inference serving
- Fine-tuning / PEFT / LoRA
- Expérience GPU workloads
- Expérience plateforme IA enterprise
- Banking / Finance / Cybersecurity background

WIKEYS est une entreprise spécialisée dans le conseil,

Fondée en 2010, la société WIKEYS offre ses services dans les activités de conseil et de mise en oeuvre de solutions logiciels , développe ses expertises et ses lignes de services pour accompagner ses clients dans l'optimisation de leur performance et leurs enjeux de transformation.

Infos complémentaires

32 - 48 K€ brut annuel

Publiée le 04/06/2026 - Réf : 178810362W

Postuler
Créez votre compte
Hellowork et postulez

sur le site du partenaire !

Ces offres pourraient aussi
vous intéresser

Paris 20e - 75
CDI
48 000 - 55 000 € / an
Voir l’offre
il y a 17 jours
Hymaïa recrutement
Paris 2e - 75
CDI
50 000 - 65 000 € / an
Voir l’offre
il y a 19 jours
Externatic recrutement
Levallois-Perret - 92
CDI
41 000 - 47 000 € / an
Télétravail partiel
Voir l’offre
il y a 22 jours
Voir plus d'offres
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Nous suivre sur :
Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact