OVHCloud emploi
OVHCloud recrutement

Senior Sre - Kubernetes Managé H/F OVHCloud

  • France
  • CDI
  • Bac +2
  • Bac +3, Bac +4
  • Bac +5
  • Secteur informatique • ESN
  • Exp. 3 ans min.
Lire dans l'app

Les compétences pour ce job

  • IaaS
  • Intelligence artificielle
  • Kubernetes

Détail du poste

Au sein de votre équipe #OneTeam

- Rejoindre la Product Unit Public Cloud et plus particulièrement l'équipe en charge de la conception, de l'évolution et de l'exploitation de notre offre Kubernetes managé. Vous intégrerez une équipe qui développe et opère une plateforme Kubernetes utilisée par un grand nombre de clients, reposant sur des infrastructures distribuées complexes. La fiabilité, la performance, la disponibilité, la sécurité et l'évolutivité sont les enjeux structurants de cette plateforme.
- En tant que Site Reliability Engineer expérimenté, vous interviendrez au coeur du fonctionnement de la plateforme Kubernetes (control plane, controllers, reconciliation loops, API server, etcd) afin de garantir la stabilité et l'évolutivité du produit. Au sein d'OVHcloud, nous adoptons une approche de développement augmentée par l'IA, où l'IA générative est intégrée aux pratiques quotidiennes : conception, développement, tests, revue de code et documentation.

Vos principales responsabilités

- Garantir la disponibilité, la performance et la résilience de la plateforme haute disponibilité.
- Concevoir, faire évoluer et maintenir des architectures distribuées robustes, scalables et sécurisées.
- Développer des mécanismes d'automatisation, de supervision et d'auto-remédiation (Infrastructure as Code, scripts, controllers Kubernetes).
- Contribuer à l'industrialisation, à l'automatisation et à l'amélioration continue des mécanismes de fiabilité.
- Définir et faire évoluer les pratiques de supervision, d'observabilité et d'AIOps (métriques, logs, alerting, tracing distribué, détection d'anomalies, corrélation d'événements et analyse prédictive).
- Participer aux analyses d'incidents majeurs, implémenter les actions correctives durables et exploiter les capacités de l'IA pour accélérer l'identification des causes racines.
- Intégrer la rotation d'astreinte de l'équipe afin d'assurer la continuité de service à nos clients (après une période de formation et de montée en compétence).

Votre futur impact

Dans 6 mois

- Vous aurez pris vos marques au sein de la Product Unit Public Cloud. Vous comprendrez l'architecture de notre offre Kubernetes managé, ses spécificités techniques et les défis de scalabilité associés.
- Vous aurez pleinement intégré l'approche de développement augmentée par l'IA, en utilisant quotidiennement l'IA générative pour la conception, le code ou la documentation.
- Vous aurez commencé à contribuer activement à l'automatisation et à l'industrialisation des mécanismes de fiabilité de la plateforme.
- Vous serez autonome sur le périmètre pour intégrer sereinement la rotation d'astreinte de l'équipe.

Et dans 1 an

- Vous aurez joué un rôle clé dans l'évolution du control plane et des composants internes de notre offre Kubernetes pour soutenir la croissance de nos clients.
- Vous aurez fait progresser nos pratiques d'AIOps et d'observabilité en mettant en place des systèmes avancés de détection d'anomalies et d'analyse prédictive.
- Vous aurez optimisé nos processus de gestion des incidents majeurs grâce à l'orchestration de workflows autonomes et de chaînes agentiques.
- Vous serez devenu un référent technique au sein de l'équipe, capable de guider les choix d'architectures distribuées complexes.

C

Le profil recherché

Compétences requises:
- Vous possédez de solides connaissances des technologies IaaS (réseau, load balancing, etc.), des serveurs, du stockage, de la virtualisation et des infrastructures distribuées.
- Vous maîtrisez l'environnement GNU/Linux (Debian like) et possédez une bonne connaissance du fonctionnement interne de Kubernetes (en tant que client ou administrateur).
- Vous avez une expérience solide en automatisation d'infrastructure (Infrastructure as Code) et en scripting (Golang/Python, Bash).
- Vous disposez de connaissances approfondies des principes de supervision, d'observabilité et des outils de tracing system.
- Vous intégrez nativement les règles de sécurité informatique dans vos déploiements.
- Vous êtes autonome, capable de vous adapter à un contexte technologique changeant et d'évoluer dans un environnement à forte criticité.

C'est un +

- Vous avez déjà une expérience en prompt engineering et une bonne compréhension des principes des chaînes agentiques ou des workflows autonomes (orchestration d'agents, gestion d'outils/fonctions, boucles de rétroaction).

Senior SRE - Kubernetes managé

Les avantages

  • Une politique de télétravail flexible
  • Un plan d'actionnariat salarié
  • Un programme de reconnaissance de l'ancienneté
  • Des subventions vacances et sport
  • Des équipes multi-culturelles
  • Une plateforme de développement de compétences ouverte à tous
  • Un engagement fort dans le développement durable
  • Des plateformes d'accompagnement en ligne pour vous et votre famille

Les étapes de recrutement

Les étapes de recrutement peuvent varier selon l'offre à laquelle vous postulez.

  • Entretien téléphonique avec l'équipe recrutement

  • Entretien physique ou en visio avec un recruteur

  • Test technique si le poste l'exige

  • Entretien manager et rencontre avec l'équipe

  • Debriefing avec le recruteur et proposition d'embauche le cas échéant

Publiée le 01/07/2026 - Réf : b5a5ba003efcc4cfdc6cb3221ee73295

Postuler
Créez votre compte
Hellowork et postulez

sur le site du recruteur !

Ces offres pourraient aussi
vous intéresser

SUEZ recrutement
SUEZ recrutement
Voir l’offre
il y a 2 jours
Nutribio recrutement
Voir l’offre
il y a 13 jours
Voir plus d'offres
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Nous suivre sur :
Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact