Détail du poste
Établissement : Université Paris-Saclay GS Informatique et sciences du numérique École doctorale : Sciences et Technologies de l'Information et de la Communication Laboratoire de recherche : Laboratoire Interdisciplinaire des Sciences du Numérique Direction de la thèse : Steven MARTIN Début de la thèse : 2026-10-01 Date limite de candidature : 2026-05-12T23:59:59 Cette thèse propose un cadre innovant d'apprentissage fédéré (FL) en temps réel, économe en énergie, dédié à la prévision météorologique multi-cible sur des dispositifs IoT à ressources limitées. Contrairement aux approches classiques, le système proposé intègre des mécanismes de formation dynamique de coalitions, de clustering adaptatif et de mise à jour continue des modèles en flux de données. L'objectif est de gérer efficacement l'hétérogénéité des données (non-IID) tout en respectant les contraintes matérielles strictes. Le cadre vise à optimiser simultanément la précision des prédictions, le coût de communication, la latence et la consommation énergétique. Les approches proposées seront validées à partir de données météorologiques réelles et déployées sur des plateformes embarquées telles que Raspberry Pi, garantissant à la fois des contributions théoriques et expérimentales. La multiplication des dispositifs IoT environnementaux a conduit à l'émergence de réseaux distribués de stations météorologiques capables de collecter en continu des données locales à haute granularité. Ces capteurs mesurent plusieurs variables telles que la température, l'humidité, la vitesse du vent ou encore les rafales. L'exploitation de ces données permet d'améliorer significativement la précision des prévisions locales, ce qui est essentiel pour des applications telles que l'agriculture intelligente, la gestion des risques climatiques ou les villes intelligentes.
Cependant, ces systèmes sont confrontés à des contraintes majeures. Les données sont distribuées, hétérogènes et générées sur des dispositifs aux ressources limitées. Les approches centralisées nécessitent le transfert massif de données vers un serveur, ce qui engendre une forte consommation énergétique, des contraintes de bande passante et des problèmes de confidentialité.
L'apprentissage fédéré constitue une alternative prometteuse en permettant un apprentissage collaboratif sans partage de données brutes. Néanmoins, les approches existantes présentent plusieurs limites :
- Les méthodes FL actuelles ne sont pas intrinsèquement conçues pour être économes en énergie
- Les approches de FL par clustering sont généralement statiques et hors ligne
- Les systèmes FL en temps réel traitent rarement des problèmes multi-cibles
- Les solutions FL embarquées ne prennent pas en compte la formation dynamique de coalitions
Cette thèse vise à combler simultanément ces quatre verrous scientifiques en proposant un cadre unifié. L'objectif central de cette thèse est de concevoir un système d'apprentissage fédéré distribué capable de réaliser une prévision météorologique multi-cible en temps réel, tout en minimisant les coûts énergétiques et de communication dans un environnement IoT hétérogène.
Les questions de recherche suivantes structurent cette étude :
- RQ1 : Comment concevoir un apprentissage fédéré économe en énergie sous fortes contraintes embarquées ?
- RQ2 : Le clustering dynamique permet-il d'améliorer les performances par rapport à un FL statique en présence de données non-IID ?
- RQ3 : Quel est le compromis optimal entre précision, coût de communication, latence et consommation énergétique ?
- RQ4 : L'apprentissage multi-cible améliore-t-il l'efficacité globale du système par rapport aux approches mono-cible ? 1. Formation dynamique de coalitions: Les dispositifs IoT formeront dynamiquement des groupes d'apprentissage en fonction de la similarité statistique, de la proximité géographique et des performances locales. Des approches basées sur le clustering, la similarité et la théorie des jeux seront étudiées.
2. Optimisation multi-objectif: Le problème sera formulé comme une optimisation multi-objectif visant à :
- Minimiser l'erreur de prédiction
- Minimiser la consommation énergétique
- Minimiser le coût de communication
- Minimiser la latence
Des méthodes de type Pareto et des approches distribuées seront explorées.
3. Apprentissage adaptatif en temps réel: Un mécanisme d'apprentissage en flux sera mis en oeuvre à l'aide de fenêtres glissantes (sliding windows) et de stratégies d'agrégation déclenchées par événements. Des techniques d'apprentissage par renforcement pourront être utilisées pour adapter dynamiquement :
- la fréquence d'agrégation
- la sélection des dispositifs
- la taille des coalitions
4. Apprentissage fédéré multi-cible: Le système permettra la prédiction simultanée de plusieurs variables :
- Température (T)
- Humidité (U)
- Vitesse du vent (FF)
- Rafales (FXI)
Des modèles tels que LSTM, Random Forest multi-sortie et des architectures légères seront étudiés.
5. Implémentation embarquée: Le système sera déployé sur des dispositifs embarqués (Raspberry Pi), avec des communications via Wi-Fi ou LoRaWAN, afin d'évaluer les performances dans des conditions réalistes.
Le profil recherché
Il devra posséder de solides compétences en apprentissage automatique, en particulier en apprentissage profond et/ou en apprentissage fédéré. Une bonne maîtrise des fondements mathématiques (probabilités, statistiques, optimisation) est attendue.
Des connaissances en systèmes distribués, en réseaux ou en edge computing seront fortement appréciées, ainsi qu'un intérêt pour les problématiques liées aux systèmes embarqués et à l'IoT.
Une expérience en programmation est indispensable (Python en particulier), ainsi qu'une familiarité avec des frameworks de machine learning tels que PyTorch ou TensorFlow. Une expérience pratique en implémentation sur des plateformes embarquées (par exemple Raspberry Pi) constituera un atout.
Le candidat devra faire preuve d'autonomie, de rigueur scientifique et d'une capacité à travailler à l'interface entre théorie et expérimentation. Des compétences en communication scientifique (rédaction d'articles, présentations) sont également attendues.
Une bonne maîtrise de l'anglais scientifique est requise.
Publiée le 26/04/2026 - Réf : f9d6c68960236ec4b071b59c7b6a1127