Détail du poste
Le contexte
Notre client renforce son équipe IAP (Industrial AI Platform), en charge des fondations IA mutualisées du groupe. L'équipe conçoit, déploie et opère des services IA critiques : RAG, LLM Gateway, observabilité, sécurité. Les environnements sont cloud et conteneurisés, avec des exigences fortes de disponibilité, de traçabilité et de supervision.
En tant que DevOps, vous intervenez en support des équipes de développement IA pour garantir la robustesse et la fiabilité des services en production.
Vos missions
- Mettre en oeuvre et maintenir les chaînes CI/CD des services de la plateforme IAP
- Garantir la stabilité, la performance et la résilience des environnements d'exécution (dev, recette, production)
- Définir et implémenter une stratégie d'observabilité (logs, métriques, traces) sur l'ensemble des services de la plateforme
- Mettre en place des alertes pertinentes basées sur des SLO/SLI afin de détecter proactivement les incidents
- Contribuer à l'analyse des incidents en exploitant les logs applicatifs, métriques et données persistées
- Automatiser les déploiements et standardiser les pratiques DevOps de la plateforme IA
Environnement technique
- Cloud et conteneurs : AWS, Kubernetes, Terraform
- CI/CD et DevOps : Jenkins, GitLab CI, Infrastructure as Code
- Observabilité et monitoring : Datadog (APM, logs, métriques, tracing distribué, dashboards, alerting avancé), Langfuse (suivi des interactions LLM, évaluation des réponses, tracing IA)
- Pipelines et data : Kafka
- Plateforme IA : LiteLLM, Mistral, GPT, Claude
- Vector stores : FAISS, Qdrant, Milvus, ElasticSearch
- Bases de données RDS : PostgreSQL, MongoDB (interrogation et analyse à des fins de diagnostic)
- Sécurité et conformité : intégration SI, respect de la Charte IA Groupe
Vous justifiez d'une expérience confirmée en DevOps et maîtrisez :
- Les plateformes cloud et Kubernetes en environnement de production
- Les pratiques CI/CD, l'Infrastructure as Code et l'automatisation
- L'analyse d'incidents complexes en croisant logs, métriques et requêtes en base de données
- La lecture et l'interrogation de bases relationnelles pour comprendre le comportement des services
Vous avez une sensibilité aux enjeux de sécurité, de conformité et de gouvernance des plateformes IA.
Une expérience sur les sujets suivants est appréciée : création de dashboards dynamiques (Datadog), mise en place de métriques custom (business et technique), tracking des prompts et réponses, monitoring de la dérive des réponses (qualité), analyse des hallucinations, suivi de la latence par provider (OpenAI, Anthropic, etc.).
TecHunt cherche un(e) consultant(e) pour accompagner un acteur du secteur bancaire dans la recherche d'un DevOps IA.
Infos complémentaires
Publiée le 15/05/2026 - Réf : 178700431W