Aller au contenu principal
OVHCloud emploi
OVHCloud recrutement

Site Reliability Engineer H/F OVHCloud

Cesson - 77
CDI
Résumé de l'offre
  • Secteur informatique • ESN
La liberté d’innover, l’ambition d’un leader mondial de l’IT. Une entreprise qui met l'humain au cœur de son projet.

Détail du poste

Au sein de votre équipe NOS
- Vous intégrerez une équipe internationale (principalement basée en France et au Canada), dédiée aux opérations de notre produit "Hosted Private Cloud" (ou HPC).
- Vous serez en charge du maintien en conditions opérationnelles de ce produit, afin de garantir les engagements de service qu'OVHcloud prend auprès de ses clients.

Vos principales responsabilités
- Assurer le maintien en conditions opérationnelles du produit HPC, en participant à la gestion des incidents, des changements, et des problèmes dans le cadre des processus établis;
- Résoudre les alertes techniques et les incidents remontés par nos sondes de surveillance ou remontés par nos équipes opérationnelles;
- Alimenter de manière rigoureuse la base de connaissances de notre produit HPC;
- Implémenter des correctifs dans le code source du produit HPC afin d'empêcher toute reproduction d'un incident;
- Implémentez une amélioration sur le produit HPC lorsque vous en identifiez une;
- Participer à la rédaction et à l'exécution des « post mortems » des incidents majeurs afin d'identifier et de réaliser les plans d'action nécessaires à l'amélioration de la qualité de nos services;
- Veiller à l'amélioration de l'observabilité du produit HPC, en implémentant des sondes, alertes associées et indicateurs de suivis;
- Travailler sur un produit en constante évolution basé sur les technologies VMware, Veeam, et Zerto;
- Faire preuve de polyvalence et d'ingéniosité technique pour répondre aux problématiques.

xx

C

Le profil recherché

ompétences requises :
- Formation en informatique ou en technologie de l'information
- Expérience d'au moins 3 ans dans un rôle en administration de système ou de SRE
- Très bonne maîtrise des environnements Linux
- Experience avec la technologie VMware (lignes de commande)
- Expérience avec des technologies de management d'infrastructure ansible, terraform, bastion
- Expérience significative en développement, idéalement dans le langage Perl, GO ou Python
- Experience dans le developement logiciel en equipe
- Experience avec les outils de développement tel que git ou jira
- Bonne compréhension des environnements réseau complexes sécurisés
- Maîtrise de l'anglais de niveau intermédiaire, parlé et écrit
- Autonomie et sens analytique
- Esprit autodidacte
- Capacité de s'adapter dans un environnement en constante évolution

C'est un +
- Connaissance ou expérience avec Veeam
- Experience liée à la sécurité de l'environnement
- Experience ou connaissance sur le hardenning à l'échelle
- Experience avec la méthode agile

Site Reliability Engineer H/F/N

Au sein de votre équipe NOS
- Vous intégrerez une équipe internationale (principalement basée en France et au Canada), dédiée aux opérations de notre produit "Hosted Private Cloud" (ou HPC).
- Vous serez en charge du maintien en conditions opérationnelles de ce produit, afin de garantir les engagements de service qu'OVHcloud prend auprès de ses clients.

Vos principales responsabilités
- Assurer le maintien en conditions opérationnelles du produit HPC, en participant à la gestion des incidents, des changements, et des problèmes dans le cadre des processus établis;
- Résoudre les alertes techniques et les incidents remontés par nos sondes de surveillance ou remontés par nos équipes opérationnelles;
- Alimenter de manière rigoureuse la base de connaissances de notre produit HPC;
- Implémenter des correctifs dans le code source du produit HPC afin d'empêcher toute reproduction d'un incident;
- Implémentez une amélioration sur le produit HPC lorsque vous en identifiez une;
- Participer à la rédaction et à l'exécution des « post mortems » des incidents majeurs afin d'identifier et de réaliser les plans d'action nécessaires à l'amélioration de la qualité de nos services;
- Veiller à l'amélioration de l'observabilité du produit HPC, en implémentant des sondes, alertes associées et indicateurs de suivis;
- Travailler sur un produit en constante évolution basé sur les technologies VMware, Veeam, et Zerto;
- Faire preuve de polyvalence et d'ingéniosité technique pour répondre aux problématiques.

xx

C

0 / 17

Infos complémentaires

PROCESS DE RECRUTEMENT 1. Échange dans les 2 à 4 semaines avec notre hiring officer : Julie 2. Entretien avec le manager : Morgan
3. Rencontre possible avec l'équipe ou un pair

Site Reliability Engineer H/F
  • Cesson - 77
  • CDI

Pour les postes éligibles :

🏠 Télétravail partiel
Publiée le 16/04/2025 - Réf : 54c5448a8092aeebac1e93f0da96e18d

Finalisez votre candidature

sur le site du recruteur

Créez votre compte pour postuler

sur le site du recruteur !

Voir plus d'offres
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Application Android (nouvelle fenêtre) Application ios (nouvelle fenêtre)
Informations légales CGU Politique de confidentialité Gérer les traceurs Aide et contact
Nous suivre sur :