OVHCloud emploi
OVHCloud recrutement

Site Reliability Engineer - Object Storage - N H/F OVHCloud

  • Roubaix - 59
  • CDI
  • Bac +5
  • Secteur informatique • ESN
  • Exp. - 1 an
  • Exp. 1 à 7 ans
  • Exp. + 7 ans
Lire dans l'app

Détail du poste

Au sein de votre équipe #OneTeam

- Vous évoluerez au sein de l'Unité Object Storage qui gère l'ensemble des offres du même nom chez OVHcloud et dont l'ambition est de construire l'offre la plus performante et efficace du marché.
- En tant que Site Reliability Engineer dans ce département, afin de renforcer nos équipes et d'accélérer notre croissance, vous nous accompagnerez dans l'évolution, l'industrialisation et le maintien en condition opérationnelle de l'ensemble de nos produits.

Vos principales responsabilités

Vous utilisez et intégrez des assistants de code IA (et des agents IA dans vos workflows) pour relever les défis suivants :

- Améliorer les usages d'agents IA (assistants, automatisations) pour optimiser le monitoring, l'alerting et la détection d'incidents sur les plateformes Object Storage.
- Concevoir et intégrer des agents intelligents capables d'assister ou d'automatiser les workflows de résolution d'incidents et d'amélioration continue.
- Contribuer à diminuer le MTTD (Mean Time to Detection) et le MTTR (Mean Time to Recovery) via l'automatisation pilotée par ces agents et par vos procédures.
- Assurer la haute disponibilité, la fiabilité et la sécurité des plateformes Object Storage ; vous suivez les indicateurs de performance et participez à leurs améliorations.
- Assurer que les clients reçoivent un support technique complet lorsque c'est nécessaire et vous mettez en oeuvre, appliquez et automatisez les procédures pour résoudre les problèmes courants.
- Contribuer aux évolutions des outils de déploiement, de packaging, de monitoring et d'alerting, avec une intégration fluide des agents et des outils d'IA dans l'infrastructure existante et les projets futurs.
- Challenger les architectures logicielles et matérielles pour en améliorer les performances, la haute disponibilité et la scalabilité.
- Suivre l'adoption des produits et les usages clients, et vous collaborerez avec les équipes techniques et commerciales pour enrichir backlog et roadmap.
- Rédiger la documentation technique et les runbooks liés aux agents IA, aux automatisations et aux scénarios d'incident.

Votre futur impact

Dans 6 mois vous

- Serez monté en compétences sur l'environnement technique de nos clusters Object Storage et aurez contribué à le faire évoluer (Automatisation, Supervision, Industrialisation, fix techniques ...).
- Aurez participé en binome aux cycles de RUN de nos plateformes (traitement de demandes clients, traitement des alertes).
- Aurez découvert les différents usages de nos produits par nos clients.

Et dans 1 an vous

- Serez un élément moteur dans nos process d'amélioration continue.
- Participerez aux évolutions majeures de nos solutions.
- Participerez aux cycles d'astreintes de notre équipe SRE.
- Participerez aux cycles de RUN en autonomie.

\_

C

Le profil recherché

Compétences requises:
- Vous êtes à l'aise en administration GNU/Linux.
- Expérience en intégration / utilisation d'agents IA (LLM) dans votre travail quotidien.
- Vous maitrisez un ou plusieurs langages de scripting (Python).
- Vous avez une expérience en automatisation et déploiement (Puppet, Ansible).
- Vous avez déjà travaillé sur des architectures micro services complexes.
- Vous maitrisez les outils de supervision et d'observabilité (Icinga / Prometheus / Alertmanager).
- Vous avez fait de l'orchestration d'infrastructure à grande échelle (Temporal).

C'est un +

- Vous avez une connaissance des API AWS S3.
- Vous avez déjà travailler sur des gros volumes de données.

Site Reliability Engineer - Object Storage F/H/N

Les avantages

  • Une politique de télétravail flexible
  • Un plan d'actionnariat salarié
  • Un programme de reconnaissance de l'ancienneté
  • Des subventions vacances et sport
  • Des équipes multi-culturelles
  • Une plateforme de développement de compétences ouverte à tous
  • Un engagement fort dans le développement durable
  • Des plateformes d'accompagnement en ligne pour vous et votre famille

Les étapes de recrutement

Les étapes de recrutement peuvent varier selon l'offre à laquelle vous postulez.

  • Entretien téléphonique avec l'équipe recrutement

  • Entretien physique ou en visio avec un recruteur

  • Test technique si le poste l'exige

  • Entretien manager et rencontre avec l'équipe

  • Debriefing avec le recruteur et proposition d'embauche le cas échéant

La carte

2 Rue Kellermann

59100 Roubaix

Localiser le poste

Publiée le 21/05/2026 - Réf : e0ad3a63f72453612d215e7082546683

Créez votre compte
Hellowork et postulez

sur le site du recruteur !

Ces offres pourraient aussi
vous intéresser

Promod recrutement
Promod recrutement
Voir l’offre
il y a 3 jours
Midas recrutement
Villeneuve-d'Ascq - 59
CDI
Voir l’offre
il y a 24 jours
Dalkia recrutement
Dalkia recrutement
Saint-André-lez-Lille - 59
CDI
Voir l’offre
il y a 16 jours
Voir plus d'offres
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Nous suivre sur :
Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact