Site Reliability Engineer - n H/F OVHCloud
- Roubaix - Paris
- CDI
- Bac +5
- Secteur informatique • ESN
- Exp. 5 ans min.
Les compétences pour ce job
- Anglais technique
- Kubernetes
- Docker
Détail du poste
Au sein de votre équipe #OneTeam
- Rejoindre l'équipe Digital Tools, responsable de la chaîne de déploiement, de l'observabilité et des opérations des plateformes OVHcloud (sites e-commerce et espace client).
- Jouer un rôle central dans la mise en production et la fiabilité des services exposés à des millions d'utilisateurs.
Vos principales responsabilités
- Concevoir et maintenir les pipelines de déploiement (CI/CD) pour assurer des livraisons fiables et rapides.
- Piloter le provisioning et la gestion de l'infrastructure (bare metal, VM, containers) via l'Infrastructure as Code (IaC).
- Orchestrer les workloads sur Kubernetes en garantissant la scalabilité et la résilience des services.
- Assurer l'amélioration continue de l'observabilité (métriques, logs, alerting, dashboards, post-mortems).
- Automatiser les opérations récurrentes pour réduire la charge opérationnelle et renforcer la stabilité.
- Contribuer à la définition des standards d'architecture et des bonnes pratiques de déploiement.
- Participer aux astreintes et à la gestion des incidents de production pour apporter une réponse structurée.
Votre futur impact
Dans 6 mois
- Vous aurez pris en main l'écosystème Kubernetes et les pipelines CI/CD existants de l'équipe Digital Tools.
- Vous aurez contribué à l'automatisation d'au moins un processus opérationnel majeur pour réduire les interventions manuelles.
- Vous serez pleinement intégré au cycle des astreintes et capable de diagnostiquer les incidents sur les plateformes e-commerce.
Et dans 1 an
- Vous deviendrez le référent technique sur l'évolution des outils d'observabilité et de monitoring (Prometheus, Grafana).
- Vous aurez piloté la mise en oeuvre de nouveaux standards d'Infrastructure as Code impactant l'ensemble de la chaîne de livraison.
- Vous proposerez des optimisations architecturales innovantes pour améliorer la résilience globale des services face à de fortes montées en charge.
C
Le profil recherché
- Vous justifiez d'une expérience de 5 ans minimum dans un rôle d'ingénieur infrastructure, SRE ou DevOps.
- Vous maîtrisez les outils d'IaC et de gestion de configuration comme Ansible, Puppet ou Terraform.
- Vous possédez une expertise avancée en Kubernetes, Docker et les architectures Cloud Native (Helm, Mesh).
- Vous concevez et exploitez des pipelines CI/CD complexes (GitLab CI, GitHub Actions, ArgoCD).
- Vous gérez couramment les outils d'observabilité tels que Prometheus, Grafana ou Sentry.
- Vous développez des scripts d'automatisation en Go, Python ou Bash.
- Vous parlez et écrivez un anglais technique fluide pour collaborer dans un contexte international.
C'est un +
- Vous avez déjà travaillé sur des plateformes e-commerce à très fort trafic.
Site Reliability Engineer - F/H/N
Les avantages
- Une politique de télétravail flexible
- Un plan d'actionnariat salarié
- Un programme de reconnaissance de l'ancienneté
- Des subventions vacances et sport
- Des équipes multi-culturelles
- Une plateforme de développement de compétences ouverte à tous
- Un engagement fort dans le développement durable
- Des plateformes d'accompagnement en ligne pour vous et votre famille
Les étapes de recrutement
Les étapes de recrutement peuvent varier selon l'offre à laquelle vous postulez.
-
Entretien téléphonique avec l'équipe recrutement
-
Entretien physique ou en visio avec un recruteur
-
Test technique si le poste l'exige
-
Entretien manager et rencontre avec l'équipe
-
Debriefing avec le recruteur et proposition d'embauche le cas échéant
-
OVHCloud en images
Publiée le 01/07/2026 - Réf : 1c61204c3f37ca2efed2414087866474