

Site Reliability Engineer H/F OVHCloud
Cesson - 77 CDI- Secteur informatique • ESN
Détail du poste
Au sein de votre équipe NOS
- Vous intégrerez une équipe internationale (principalement basée en France et au Canada), dédiée aux opérations de notre produit "Hosted Private Cloud" (ou HPC).
- Vous serez en charge du maintien en conditions opérationnelles de ce produit, afin de garantir les engagements de service qu'OVHcloud prend auprès de ses clients.
Vos principales responsabilités
- Assurer le maintien en conditions opérationnelles du produit HPC, en participant à la gestion des incidents, des changements, et des problèmes dans le cadre des processus établis;
- Résoudre les alertes techniques et les incidents remontés par nos sondes de surveillance ou remontés par nos équipes opérationnelles;
- Alimenter de manière rigoureuse la base de connaissances de notre produit HPC;
- Implémenter des correctifs dans le code source du produit HPC afin d'empêcher toute reproduction d'un incident;
- Implémentez une amélioration sur le produit HPC lorsque vous en identifiez une;
- Participer à la rédaction et à l'exécution des « post mortems » des incidents majeurs afin d'identifier et de réaliser les plans d'action nécessaires à l'amélioration de la qualité de nos services;
- Veiller à l'amélioration de l'observabilité du produit HPC, en implémentant des sondes, alertes associées et indicateurs de suivis;
- Travailler sur un produit en constante évolution basé sur les technologies VMware, Veeam, et Zerto;
- Faire preuve de polyvalence et d'ingéniosité technique pour répondre aux problématiques.
xx
C
Nos étapes de recrutement
Les étapes de recrutement peuvent varier selon l’offre à laquelle vous postulez.
-
Entretien téléphonique avec l'équipe recrutement
-
Entretien physique ou en visio avec un recruteur
-
Test technique si le poste l'exige
-
Entretien manager et rencontre avec l'équipe
-
Debriefing avec le recruteur et proposition d'embauche le cas échéant
Le profil recherché
ompétences requises :
- Formation en informatique ou en technologie de l'information
- Expérience d'au moins 3 ans dans un rôle en administration de système ou de SRE
- Très bonne maîtrise des environnements Linux
- Experience avec la technologie VMware (lignes de commande)
- Expérience avec des technologies de management d'infrastructure ansible, terraform, bastion
- Expérience significative en développement, idéalement dans le langage Perl, GO ou Python
- Experience dans le developement logiciel en equipe
- Experience avec les outils de développement tel que git ou jira
- Bonne compréhension des environnements réseau complexes sécurisés
- Maîtrise de l'anglais de niveau intermédiaire, parlé et écrit
- Autonomie et sens analytique
- Esprit autodidacte
- Capacité de s'adapter dans un environnement en constante évolution
C'est un +
- Connaissance ou expérience avec Veeam
- Experience liée à la sécurité de l'environnement
- Experience ou connaissance sur le hardenning à l'échelle
- Experience avec la méthode agile
Site Reliability Engineer H/F/N
Au sein de votre équipe NOS
- Vous intégrerez une équipe internationale (principalement basée en France et au Canada), dédiée aux opérations de notre produit "Hosted Private Cloud" (ou HPC).
- Vous serez en charge du maintien en conditions opérationnelles de ce produit, afin de garantir les engagements de service qu'OVHcloud prend auprès de ses clients.
Vos principales responsabilités
- Assurer le maintien en conditions opérationnelles du produit HPC, en participant à la gestion des incidents, des changements, et des problèmes dans le cadre des processus établis;
- Résoudre les alertes techniques et les incidents remontés par nos sondes de surveillance ou remontés par nos équipes opérationnelles;
- Alimenter de manière rigoureuse la base de connaissances de notre produit HPC;
- Implémenter des correctifs dans le code source du produit HPC afin d'empêcher toute reproduction d'un incident;
- Implémentez une amélioration sur le produit HPC lorsque vous en identifiez une;
- Participer à la rédaction et à l'exécution des « post mortems » des incidents majeurs afin d'identifier et de réaliser les plans d'action nécessaires à l'amélioration de la qualité de nos services;
- Veiller à l'amélioration de l'observabilité du produit HPC, en implémentant des sondes, alertes associées et indicateurs de suivis;
- Travailler sur un produit en constante évolution basé sur les technologies VMware, Veeam, et Zerto;
- Faire preuve de polyvalence et d'ingéniosité technique pour répondre aux problématiques.
xx
C
Raisons de nous rejoindre
-
Une politique de télétravail flexible
-
Un plan d'actionnariat salarié
-
Un programme de reconnaissance de l'ancienneté
-
Des subventions vacances et sport
-
Des équipes multi-culturelles
-
Une plateforme de développement de compétences ouverte à tous
-
Un engagement fort dans le développement durable
-
Des plateformes d'accompagnement en ligne pour vous et votre famille
Infos complémentaires
PROCESS DE RECRUTEMENT 1. Échange dans les 2 à 4 semaines avec notre hiring officer : Julie 2. Entretien avec le manager : Morgan
3. Rencontre possible avec l'équipe ou un pair
Créez une alerte
Pour être informé rapidement des nouvelles offres, merci de préciser les critères :
Finalisez votre candidature
sur le site du recruteur
Créez votre compte pour postuler
sur le site du recruteur !
sur le site du recruteur
sur le site du recruteur !
Recherches similaires
{{title}}
{{message}}
{{linkLabel}}