Aller au contenu principal

Thèse Exploration et Optimisation des Architectures Raid et des Technologies de Virtualisation pour des Serveurs de Données Haute Performance H/F

Doctorat.Gouv.Fr

  • Paris - 75
  • CDD
  • BEP, CAP
  • Bac
  • Service public d'état
Lire dans l'app

Détail du poste

Établissement : Université Paris-Saclay GS Informatique et sciences du numérique École doctorale : Sciences et Technologies de l'Information et de la Communication Laboratoire de recherche : Laboratoire en Informatique Haute Performance pour le Calcul et la simulation Direction de la thèse : Marc PERACHE ORCID 0000000316152749 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-05-31T23:59:59 Le monde de la simulation est en constante évolution, demandant aux supercalculateurs des ressources toujours plus nombreuses et variées. Cette évolution est due à deux facteurs : l'accroissement des dimensions spatiales et temporelles utilisées dans les simulations et l'utilisation de méthodes disruptives, comme l'intelligence artificielle et de manière plus prospective l'informatique quantique. Le besoin croissant en stockage de données nécessite donc d'avoir des systèmes de stockage capacitifs et performants. Ces systèmes de stockage dits haute performance sont constitués de deux catégories de plateformes matérielles. D'une part, les contrôleurs contenant généralement des disques flash (NVMe) très performants ainsi que des CPUs et de la mémoire vive. D'autre part, des baies disques (ou JBOD) contenant des disques durs en grande quantité.

De nombreuses technologies ont été conçues pour optimiser les composants de ces matériels et améliorer leur fiabilité. C'est le cas notamment de l'organisation des baies disques où les algorithmes de placement de type RAID assurent cette qualité de service par le biais de mécanismes d'erasure coding. De nouvelles technologies telles que le GPU-based RAID permettent de déporter ce calcul sur accélérateur matériel. Le paradigme de RAID déclusturisé réduit également la durée de reconstruction des disques en découpant les disques physiques en unités de plus petite taille. D'autres mécanismes tels que la virtualisation pour l'hébergement d'applications ou un système de cache entre l'application et la grappe RAID sont également à étudier pour assurer à l'utilisateur la meilleure qualité de service possible.

Notamment, diverses problématiques existent autour de ces sujets, comme par exemple le phénomène de write amplification sur les disques flash ou encore les problèmes de cohérence de données lors d'opérations de type read-modify-write sur les technologies RAID.

La thèse a pour objectif d'étudier, évaluer et proposer des optimisations des différents mécanismes présentés ici afin de répondre aux problématiques liées à la fiabilité des données et la performance des systèmes. Ces optimisations peuvent également prendre la forme de nouveaux algorithmes de placement de données ou de nouvelles politiques d'ordonnancement des requêtes I/O en utilisant par exemple l'historique des requêtes utilisateur. Le monde de la simulation évolue rapidement, exigeant des supercalculateurs des ressources toujours plus importantes et variées. Cette évolution est poussée par l'augmentation des dimensions spatiales et temporelles des simulations, ainsi que par l'utilisation de méthodes disruptives comme l'intelligence artificielle et, de manière prospective, l'informatique quantique. Le besoin croissant en stockage de données nécessite des systèmes capacitifs et performants, constitués de contrôleurs avec des disques flash (NVMe) performants, des CPUs et de la mémoire vive, ainsi que de baies disques (JBOD) contenant une grande quantité de disques durs. Les technologies RAID, notamment les algorithmes de placement de type RAID, améliorent la fiabilité des systèmes de stockage via des mécanismes d'erasure coding. Des innovations comme le GPU-based RAID permettent de déporter le calcul RAID sur des accélérateurs matériels, tandis que le RAID déclusturisé réduit la durée de reconstruction des disques en découpant les disques physiques en unités plus petites. La virtualisation est également utilisée pour l'hébergement d'applications et pour assurer une meilleure qualité de service via un système de cache entre l'application et la grappe RAID. Cependant, des problématiques persistent, comme le phénomène de write amplification sur les disques flash et les problèmes de cohérence de données lors des opérations de type read-modify-write sur les technologies RAID. La thèse vise à étudier, évaluer et proposer des optimisations des différents mécanismes présentés pour répondre à ces problématiques, en développant de nouveaux algorithmes de placement de données ou de nouvelles politiques d'ordonnancement des requêtes I/O, en utilisant par exemple l'historique des requêtes utilisateur. Le sujet de thèse vise à explorer et optimiser les architectures RAID et les technologies de virtualisation pour des serveurs de données haute performance, en réponse aux besoins croissants des supercalculateurs dans le domaine de la simulation. L'objectif principal est d'étudier et d'évaluer les mécanismes existants, tels que les algorithmes de placement de type RAID et les technologies émergentes comme le GPU-based RAID, afin d'améliorer la fiabilité des données et les performances des systèmes de stockage. Des optimisations sous forme de nouveaux algorithmes de placement de données et de politiques d'ordonnancement des requêtes I/O seront proposées, en exploitant par exemple l'historique des requêtes utilisateur. Les problématiques spécifiques, comme la write amplification sur les disques flash et les problèmes de cohérence de données, seront également abordées pour garantir une qualité de service optimale. Enfin, l'intégration de mécanismes de virtualisation et de systèmes de cache entre l'application et la grappe RAID sera étudiée pour répondre aux exigences des simulations complexes et des méthodes disruptives.

Le profil recherché

HPC, informatique, stockage.

Publiée le 05/05/2026 - Réf : d7656d9f40d014fa771c84e91386dcb6

Finalisez votre candidature

sur le site du partenaire

Créez votre compte
Hellowork et postulez

sur le site du partenaire !

Ces offres pourraient aussi
vous intéresser

Le Grand Contrôle recrutement
Voir l’offre
il y a 28 jours
DEL ARTE recrutement
Bondoufle - 91
CDI
1 832 € / mois
Voir l’offre
il y a 22 jours
Paris - 75
CDD
Temps partiel
12,02 € / heure
Voir l’offre
il y a 25 jours
Voir plus d'offres
Initialisation…
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Nous suivre sur :
Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact