Détail du poste
Établissement : Université Clermont Auvergne École doctorale : Sciences pour l'Ingénieur Laboratoire de recherche : Institut Pascal Direction de la thèse : FRANCOIS BERRY ORCID 0000000258994672 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-06-01T23:59:59 With the proliferation of intelligent visual sensors, wireless camera networks are becoming a key research area for numerous applications, such as surveillance, object recognition and real-time scene analysis. However, optimizing data processing and transmission remains a major challenge due to bandwidth constraints, energy consumption and the limited computational capacity of embedded sensors. In a spirit of frugality, this thesis proposes an original distributed architecture based on federated artificial intelligence and a distributed ledger mechanism built on latent representations, in order to optimize information exchange within the network while ensuring data confidentiality and traceability.
To preserve the privacy of individuals, the cameras used are of very low resolution (32×32 pixels), thereby reducing the risk of identification while ensuring the collection of relevant information for the targeted applications. These cameras already exist and consist of a low-resolution sensor, an analog PIR sensor, a small FPGA (Max10 - low cost and low power) and an ESP32-C6 for managing network communication via Bluetooth. Avec la multiplication des capteurs visuels intelligents dans des environnements dynamiques, les réseaux de caméras sans fil font face à des exigences contradictoires : précision d'analyse d'un côté, sobriété énergétique et respect de la vie privée de l'autre. Les approches actuelles d'apprentissage fédéré se concentrent majoritairement sur des noeuds relativement puissants (smartphones, serveurs edge), laissant largement inexploré le cas des microcontrôleurs et FPGAs bas coût. Par ailleurs, l'intégration native d'un mécanisme de registre distribué directement dans l'espace latent d'un modèle de compression constitue une approche originale encore peu étudiée dans la littérature. L'objectif principal est de concevoir une architecture unifiée dans laquelle l'espace latent d'un auto-encodeur embarqué remplit simultanément trois fonctions : la compression de l'information visuelle, la préservation de la confidentialité des individus filmés, et l'alimentation d'un registre distribué assurant la traçabilité des observations. Cela se décline en quatre axes : l'implémentation d'auto-encodeurs quantifiés sur FPGA Max10, la construction d'un registre distribué à consensus hybride, la mise en oeuvre d'un apprentissage fédéré inter-noeuds, et l'optimisation du protocole Bluetooth sous contraintes énergétiques. La démarche méthodologique est organisée en quatre phases successives, combinant théorie, simulation et expérimentation sur matériel réel. La première phase porte sur la conception et l'évaluation d'auto-encodeurs quantifiés (8 bits, 4 bits, binaire) pour des images 32×32 sur FPGA Max10. La deuxième phase traite de la mise en place du registre distribué avec chaînage cryptographique des vecteurs latents et réplication via Bluetooth. La troisième phase est dédiée à l'apprentissage fédéré pour aligner les espaces latents entre noeuds hétérogènes. Enfin, la quatrième phase consiste en une intégration et une évaluation globale sur prototype réel, couvrant consommation énergétique, latence, qualité de reconstruction et intégrité du registre.
Le profil recherché
Sur le plan des compétences techniques, le candidat devra maîtriser ou avoir de solides bases dans les domaines suivants : l'apprentissage automatique et plus particulièrement les architectures de réseaux de neurones profonds (auto-encodeurs, réseaux convolutifs), la programmation en Python et l'utilisation de frameworks de deep learning tels que PyTorch ou TensorFlow, ainsi que des notions de quantification de modèles et d'optimisation pour l'inférence embarquée. Des connaissances en conception matérielle sur FPGA, notamment via des langages de description matérielle tels que VHDL ou Verilog, constitueront un atout significatif, de même qu'une familiarité avec les environnements de développement embarqué (C/C++ sur microcontrôleur, ESP32 en particulier). Une sensibilisation aux protocoles de communication sans fil, notamment Bluetooth Low Energy, ainsi qu'aux concepts fondamentaux de cryptographie et de systèmes distribués sera également bienvenue.
Au-delà des compétences techniques, le doctorant devra faire preuve d'autonomie, de rigueur scientifique et d'une réelle capacité à travailler en équipe au sein d'un environnement pluridisciplinaire impliquant des chercheurs en informatique, en électronique et en traitement d'images. De bonnes aptitudes rédactionnelles en français et en anglais sont indispensables, l'anglais étant la langue de référence pour les publications et communications scientifiques internationales. Enfin, une curiosité intellectuelle pour les enjeux sociétaux liés à la protection de la vie privée, à la sobriété numérique et à l'intelligence artificielle responsable sera considérée comme un atout dans le cadre de ce projet à forte dimension éthique et environnementale.
Publiée le 05/05/2026 - Réf : b6a141f46d2ba7d1d27dc7ec89c08671