Senior DevOps Engineer - ai Platform - Aws - Gpu Infrastructure H/F

Wikeys

  • Paris 1er - 75
  • CDI
  • Bac +2
  • Bac +3, Bac +4
  • Bac +5
  • Services aux Entreprises
  • Exp. 5 ans min.
Lire dans l'app

Détail du poste

Dans le cadre d'un programme stratégique d'industrialisation de l'IA Générative à l'échelle Groupe, nous recherchons un DevOps / Platform Engineer capable de concevoir, sécuriser et scaler les infrastructures supportant les plateformes Mistral AI et Prisme AI dans un environnement bancaire critique et fortement réglementé.

Le programme IA Gen vise à construire une plateforme souveraine d'IA générative et agentique capable de supporter des cas d'usage massifs, avec de fortes contraintes :

- haute disponibilité
- scalabilité GPU
- sécurité enterprise
- observabilité avancée
- conformité réglementaire
- optimisation des performances et des coûts

Vous rejoindrez une équipe transverse composée d'AI Engineers, Platform Engineers, Security Engineers, Architects, MLOps et équipes Infrastructure.

Enjeux techniques du programme

- Déploiement enterprise-scale de plateformes LLM
- Orchestration de workloads IA intensifs CPU/GPU
- Industrialisation de pipelines MLOps / LLMOps
- Scalabilité Kubernetes multi-environnements
- Observabilité temps réel des systèmes IA
- Sécurisation des infrastructures GenAI
- Déploiement hybride AWS + On-Prem
- Automatisation complète des déploiements IA
- Optimisation inference serving & consommation GPU

Vos responsabilités

Infrastructure & Platform Engineering

- Concevoir et maintenir des infrastructures cloud et on-prem hautement disponibles pour les plateformes IA générative
- Déployer et administrer des clusters Kubernetes dédiés aux workloads IA et LLM
- Optimiser l'allocation des ressources :

- CPU
- GPU
- mémoire
- stockage
- networking
- Gérer la scalabilité horizontale et verticale des plateformes IA
- Participer à l'architecture des plateformes de serving LLM et inference APIs

DevOps / CI-CD / Automation

- Construire et industrialiser des pipelines CI/CD pour :

- modèles IA
- APIs IA
- applications agentiques
- composants MLOps
- Automatiser les déploiements et rollback sécurisés
- Mettre en place des stratégies GitOps et Infrastructure as Code
- Garantir :

- reproductibilité
- traçabilité
- auditabilité
- résilience des déploiements

Kubernetes / Container Platform

- Administrer des environnements Kubernetes complexes et distribués
- Déployer des architectures containerisées haute performance
- Optimiser :

- scheduling
- autoscaling
- GPU allocation
- pod resiliency
- service mesh
- Travailler sur :

- Helm
- Operators
- ingress
- networking policies
- workload isolation

Observabilité / Monitoring / Reliability

- Mettre en place des stacks d'observabilité avancées :

- Prometheus
- Grafana
- ELK
- OpenTelemetry
- distributed tracing
- Définir des métriques de performance spécifiques aux workloads IA :

- latency
- inference throughput
- GPU utilization
- token generation rate
- uptime
- Implémenter :

- alerting
- incident response
- anomaly detection
- capacity planning

Sécurité & Conformité

Stack technique cible

Cloud / Infra

- AWS
- Hybrid Cloud
- On-Prem Infrastructure

Container & Orchestration

- Docker
- Kubernetes
- Helm
- Kustomize

CI/CD & Automation

- GitLab CI
- GitHub Actions
- ArgoCD
- Terraform
- Ansible

Monitoring & Observability

- Prometheus
- Grafana
- ELK
- Loki
- OpenTelemetry

AI / LLM Platform

- Mistral AI
- Prisme AI
- LLM serving infrastructure
- GPU workloads
- Inference APIs

Profil recherché

- 5+ années d'expérience en DevOps / Platform Engineering / SRE
- Très forte expertise Kubernetes en production
- Expérience solide AWS + environnements hybrides
- Maîtrise des pipelines CI/CD et Infrastructure as Code
- Expérience sur des plateformes critiques à forte volumétrie
- Bonne compréhension des problématiques MLOps / LLMOps
- Expérience workloads GPU ou IA fortement appréciée
- Background banque / finance / environnement réglementé apprécié

Très gros plus

- Expérience plateformes IA Générative
- Déploiement de modèles LLM self-hosted
- GPU scheduling / NVIDIA stack
- Kubernetes GPU operators
- Serving haute performance
- Infrastructure IA souveraine
- SRE / Reliability Engineering
- Sécurisation plateformes IA enterprise

WIKEYS est une entreprise spécialisée dans le conseil,

Fondée en 2010, la société WIKEYS offre ses services dans les activités de conseil et de mise en oeuvre de solutions logiciels , développe ses expertises et ses lignes de services pour accompagner ses clients dans l'optimisation de leur performance et leurs enjeux de transformation.

Infos complémentaires

32 - 48 K€ brut annuel

Publiée le 04/06/2026 - Réf : 178810596W

Postuler
Créez votre compte
Hellowork et postulez

sur le site du partenaire !

Ces offres pourraient aussi
vous intéresser

SANEF recrutement
SANEF recrutement
Voir l’offre
il y a 15 jours
Altim recrutement
Altim recrutement
Meudon - 92
CDI
45 000 - 55 000 € / an
Télétravail occasionnel
Voir l’offre
il y a 1 jour
Voir plus d'offres
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Nous suivre sur :
Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact