Les missions du poste
Votre rôle est d'effectuer un travail de thèse sur : " Synthèse sémantique et compaction de graphes temporels pour Jumeaux Numériques"
Contexte global et problématique du sujet
Les jumeaux numériques (Digital Twins, DTs) génèrent des volumes massifs de données structurées en graphes spatio-temporels connectant entités physiques et logiques. Le stockage de ces historiques devient critique en termes de passage à l'échelle (milliards de noeuds). Les solutions actuelles (Neo4j, TimescaleDB) ne permettent pas de concilier sémantique riche (ontologies), temporalité explicite et multi-résolution (niveaux de détails). La problématique centrale est de concevoir un moteur de stockage capable d'ajuster automatiquement la granularité et la précision des données en fonction du contexte, tout en garantissant la traçabilité de l'information. Au sein de l'équipe, nous avons développé un système de gestion de base de données orientées graphe temporellesl : Clock-G. Il servira de socle pour développer et mettre en oeuvre les idées élaborées durant la thèse. Et pour aller plus loin, pour valider des cas d'usage, l'équipe a développé une plateforme de jumeaux numériques qui profitera d'un stockage Clock-G.
Objectif scientifique - résultats et verrous à lever
L'objectif de la thèse est de concevoir un moteur de stockage et de requêtage sémantique "auto-synthétisant". Les verrous à lever sont :
Temporalité multi-échelle : Modéliser la continuité des graphes via des flux fragmentés (type LDES).
Compaction sémantique : Fusionner des entités sémantiques dans le graph en respectant strictement les contraintes ontologiques.
Approximation contrôlée : Mesurer et borner la perte d'information induite par la condensation (via une fonction de coût dédiée).
Requêtage adaptatif : Développer le langage TQSL (Temporal Query-aware Semantic Language) pour piloter la résolution au moment de la requête.
Contributions attendues
Modèle formel de graphe sémantique temporel multi-résolution (spatio-temporel + sémantique).
Algorithmes de compaction sémantique et temporelle (lossy/lossless) inspirés des approches Graph Summarization et Temporal Rollup.
Métriques de fidélité et de "qualité d'approximation" pour quantifier la perte d'information.
Prototype de moteur de stockage et de requêtage adaptatif, intégré à une plateforme de jumeaux numériques (Thing'in ou Clock-G).
Évaluation expérimentale sur cas d'usage (réseau télécom).
Le profil recherché
Compétences scientifiques :
Maîtrise des technologies du Web Sémantique (RDF, OWL, SPARQL).
Connaissances en théorie des graphes et algorithmique.
Intérêt pour l'IA (Graph Neural Networks) et les systèmes distribués.
Compétences techniques : Développement Java/Python/Go, usage de bases de données NoSQL (Graphes).
Qualités personnelles : Rigueur scientifique, capacité d'abstraction, aisance rédactionnelle en français et anglais
Infos complémentaires
Les étapes de recrutement
Les étapes de recrutement peuvent varier selon l'offre à laquelle vous postulez.
-
Proposition d’entretien ou réponse négative dans les 15 jours après votre candidature
-
Entretien en visio ou présentiel avec le/la consultant(e) en recrutement sous 15 jours
-
Rencontre en visio ou présentiel avec le/la manager
-
Votre candidature est retenue, félicitations ! Vous recevez votre proposition d'embauche
-
Bienvenue chez Orange :) votre programme d’intégration démarre
-
En cas de réponse négative, nous restons à votre disposition pour un debrief
-
Orange en images
Publiée le 29/04/2026 - Réf : 29270761 2026-52281