Les missions du poste
L'hébergement d'applications sensibles aux interruptions sur des datacenters distribués, également connu sous le terme " edge computing ", requiert une compréhension approfondie des risques de défaillance afin de mettre en place des mécanismes de résilience adaptés [1]. L'orchestrateur de conteneurs de virtualisation Kubernetes associé à une architecture de monitoring Prometheus peut limiter les temps d'interruption à quelques secondes lors d'une panne grâce à des mécanismes de reconstruction automatique [2], [3]. Pour ramener ce délai à moins d'une seconde, il est nécessaire de déployer des ressources de secours de manière anticipée sur d'autres sites de virtualisation [4]. Le calcul du nombre requis de sites [5] dépend cependant de la connaissance de la disponibilité de chacun d'entre eux, c'est-à-dire du rapport entre la durée où le service est réellement actif et la durée d'observation. Le développement récent de Jumeaux Numériques [6] pour l'exploitation automatisée des réseaux d'infrastructure offre une opportunité pour mettre en application une méthode de calcul automatique de cet indicateur de disponibilité.
L'objectif de cette thèse est de modéliser la statistique des défaillances des éléments d'infrastructure et de développer un apprentissage supervisé de paramètres du modèle, dans le but de construire, pour un Jumeau Numérique, un indicateur de disponibilité par site de virtualisation.
Verrous
1) Identifier les états dégradés d'une infrastructure de virtualisation.
2) Identifier les informations pertinentes permettant de caractériser ces états dégradés.
3) Construire et entrainer un modèle permettant de prédire l'occurrence d'une prochaine défaillance sur un site de virtualisation afin de calculer un indicateur de disponibilité.
4) Prototyper le déploiement du modèle dans une chaîne de mesure temps réel Prometheus.
Références
[1] T. Chalermarrewong, Failure Prediction of Data Centers Using Time Series and Fault Tree Analysis. 2012
[2] A. Samir, Self-Adaptive Healing for Containerized Cluster Architectures with Hidden Markov Models, 2019
[3] D. Tazzioli, Stateful Service Migration Support for Kubernetes-based Orchestration in Industry 4.0, 2024
[4] K. Sayad, Dynamic Orchestration of Communication Resources Deployment for Resilient Coordination in Critical Infrastructures Network, 2021
[5] I. Narayanan, Right-sizing Geo-distributed Data Centers for Availability and Latency, 2017
Le profil recherché
Bonnes connaissances en mathématiques appliquées (apprentissage automatisé, calcul de disponibilité, calcul de complexité algorithmique, ...).
Formation demandée (master, diplôme d'ingénieur, doctorat, domaine scientifique et technique ...)
Master dans le domaine de l'informatique et algorithmique.
Expériences souhaitées (stages, ...)
Une expérience comme un stage en recherche dans le domaine des réseaux de télécommunication ou des systèmes informatiques et la connaissance de l'environnement Kubernetes serait un plus.
Infos complémentaires
Les étapes de recrutement
Les étapes de recrutement peuvent varier selon l'offre à laquelle vous postulez.
-
Proposition d’entretien ou réponse négative dans les 15 jours après votre candidature
-
Entretien en visio ou présentiel avec le/la consultant(e) en recrutement sous 15 jours
-
Rencontre en visio ou présentiel avec le/la manager
-
Votre candidature est retenue, félicitations ! Vous recevez votre proposition d'embauche
-
Bienvenue chez Orange :) votre programme d’intégration démarre
-
En cas de réponse négative, nous restons à votre disposition pour un debrief
-
Orange en images
Publiée le 16/04/2026 - Réf : 29102878 2026-51771