Détail du poste
Dans le cadre de la migration des infrastructures historiques onpremise (datacenters) vers le cloud groupe, nous recherchons une personne pour venir renforcer les équipes SRE.
Objectif du poste :
Garantir la fiabilité, la disponibilité, la scalabilité et la maintenabilité des systèmes dans un contexte de migration cloud à grande échelle, en appliquant rigoureusement les principes SRE.
Vous devrez fournir les prestations suivantes :
- Missions principales
1. Fiabilité & production
- Définir et piloter les SLO/SLI des services critiques
- Mettre en place et exploiter les Error Budgets
- Participer à la gestion des incidents et astreintes
- Rédiger des postmortems blameless exploitables et actionnables
2. Automatisation & réduction du toil
- Identifier et supprimer le toil opérationnel
- Automatiser tout ce qui est répétitif, manuel ou non scalable
- Développer des outils internes en Python
- Industrialiser l'infrastructure via Infrastructure as Code
3. Migration Cloud
- Accompagner la migration des workloads depuis les datacentres vers le cloud du groupe
- Adapter les architectures pour garantir fiabilité, résilience et observabilité
- Participer aux choix techniques et aux patterns SRE cloud-native
4. Collaboration transverse
- Travailler étroitement avec :
équipes applicatives
équipes infrastructure
équipes sécurité
- Challenger les équipes sur la "production readiness"
- Imposer les standards SRE
Publiée le 02/06/2026 - Réf : 4052984