Run Management - Team Lead IA H/F

collectivite

  • Paris - 75
  • Freelance
  • Bac +2
  • Bac +3, Bac +4
  • Bac +5
  • Services aux Entreprises
  • Exp. 5 ans min.
Lire dans l'app

Détail du poste

Information importante

Type de contrat:

Freelance

Taux journalier :

Salaire selon profil

Localisation :

Paris, France

Date de démarrage :

4 à 8 semaines

Mode de travail :

Hybride

Publié le :

26 mai 2026

Le besoin

Objectif du poste

Suivi de la disponibilité, la performance et la résilience des plateformes IA / Data / LLM déployées 100 % sur Kubernetes. Vous pilotez le RUN (opérations quotidiennes, incidents, évolutions mineures) d'une équipe offshore de 3 personnes, garantissant une prise en charge fluide des incidents, la mise en oeuvre des correctifs et l'optimisation continue des ressources. Vous assurez également la coordination entre les équipes produit, les équipes d'infrastructure et les fournisseurs afin d'aligner les exigences métier avec les contraintes techniques.

2. Contexte

Équipe : 3 ingénieurs (DevOps/Infra / Data) basés offshore, travail majoritairement asynchrone.

Portefeuille : 3 produits majeurs - plateforme d'inférence LLM, pipeline de datascience, service de mise à disposition de modèles IA.

Environnement technique : Kubernetes (cluster(s) onprem & cloud hybride), Helm, Argo CD, CI/CD (GitLab / Jenkins), observabilité (Prometheus / Grafana, Loki), secrets management (Vault), gestion des GPU (NVIDIA GRID).

Méthodologie : Agile (Scrum/Kanban) - tableau JIRA, suivi ITSM (ServiceNow).

3. Missions principales

Domaine Responsabilités

Gestion du RUN - Supervision des alertes, incidents et changements ;

- Coordination du triage (L1 L2 L3) avec l'équipe offshore ;

- Rédaction & maintenance des runbooks, playbooks et SOP ;

- Suivi du MTTR, escalades et reporting aux parties prenantes.

Incident Management & RCA - Conduite d'enquêtes postmortem (RCA) ;

- Mise en place d'actions correctives et préventives ;

- Gestion du carnet d'incidents dans ServiceNow (SNOW).

Optimisation des plateformes - Monitoring des métriques (latence, utilisation GPU, capacité des noeuds) ;

- Propositions d'optimisation (autoscaling, rightsizing, tuning des ressources) ;

- Gestion des patchs de sécurité et suivi des CVE.

Automation & CI/CD

- Automatisation des tâches récurrentes (scripts Python, Terraform, Ansible) ;

- Intégration des bonnes pratiques GitOps.

Collaboration & gouvernance - Interface avec les Product Owners, les équipes DataScience et les fournisseurs d'infrastructure ;

- Participation aux cérémonies Scrum/Kanban (standup, grooming, retro) ;

- Veille à la conformité ITSM (processes, KPI, SLA).

Support aux utilisateurs - Gestion des demandes d'accès, des droits RBAC et de la documentation technique ;

- Formation ponctuelle (onboarding) des nouveaux membres de l'équipe offshore.

4. Profil recherché

Domaine Exigences

Expérience - 5 + ans d'expérience en exploitation (Run/Production) d'environnements Kubernetes à grande échelle ;

- Expérience confirmée avec des équipes offshore ou distribuées (3 personnes minimum).

Compétences techniques

- Kubernetes, Helm, Argo CD ;

- Scripting Python (débogage, packaging : venv, poetry, uv) ;

- Notions Data Science : pandas, numpy ;

- CI/CD (GitLab, Jenkins), IaC (Terraform, Ansible) ;

- Observabilité (Prometheus, Grafana, Loki) ;

- Gestion des GPU (NVIDIA GRID) ;

- Sécurité production : gestion CVE, RBAC, Vault.

Méthodologies ITSM & Agile - Maîtrise de ServiceNow (SNOW) et des processus ITIL ;

- Gestion de tickets JIRA, expérience Scrum/Kanban.

Compétences soft - Leadership d'une petite équipe distante ; capacité à communiquer clairement en asynchrone ;

- Esprit d'analyse et résolution d'incidents ;

- Rédaction technique (runbooks, rapports d'incident) ;

- Sens du service client interne, diplomatie et capacité à gérer les priorités conflictuelles.

Langues Français courant, anglais professionnel (écrit et oral).

Formation Bac +5 en informatique, génie logiciel, systèmes d'information ou équivalent.

Publiée le 11/06/2026 - Réf : b1a8c275d2df7c1a41cb8e292b7de1ec

Postuler
Créez votre compte
Hellowork et postulez

sur le site du partenaire !

Ces offres pourraient aussi
vous intéresser

Paris 20e - 75
CDI
48 000 - 55 000 € / an
Voir l’offre
il y a 24 jours
BDO recrutement
BDO recrutement
Lille - Paris
CDI
50 000 - 60 000 € / an
Télétravail partiel
Voir l’offre
il y a 22 jours
Externatic recrutement
Paris 13e - 75
CDI
80 000 - 100 000 € / an
Télétravail partiel
Voir l’offre
il y a 20 jours
Voir plus d'offres
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Nous suivre sur :
Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact