Détail du poste
Établissement : Université de Toulouse École doctorale : EDMITT - Ecole Doctorale Mathématiques, Informatique et Télécommunications de Toulouse Laboratoire de recherche : LAAS - Laboratoire d'Analyse et d'Architecture des Systèmes Direction de la thèse : Philippe OWEZARSKI ORCID 0000000177137003 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-06-10T23:59:59 La cybersécurité repose aujourd'hui de plus en plus sur des outils utilisant des techniques d'intelligence artificielle (IA), notamment d'apprentissage automatique. Pour fonctionner, ces techniques ont besoin d'un entrainement sur des données labelisées, les labels indiquant la nature des paquets et des flux du dataset. Pour un bon entrainement des outils d'apprentissage automatique, les datasets doivent donc contenir une grande variété de trafics différents avec des attributs les caractérisant couvrant un large spectre de situations. L'objectif est de disposer de datasets permettant une évaluation complète et pertinente des outils de cybersécurité en évitant des erreurs liées à des phénomènes comme le sous- ou sur-apprentissage, par exemple.
L'objectif de cette thèse comporte de nombreux défis à relever, ayant tous pour point commun la qualité des datasets utilisés à la fois pour l'entrainement des modèles d'IA et l'évaluation des outils de cybersécurité pour la détection d'attaques, d'anomalies et d'intrusions.
1. Le premier défi consiste à définir formellement la qualité d'un dataset.
2. Le deuxième défi consiste à générer des datasets de qualité permettant d'évaluer de façon pertinente et complète des outils de cybersécurité et à garantir la qualité du trafic généré.
3. Le troisième défi consiste à concevoir de nouveaux outils de détection d'attaques robustes à des attaques générées par des outils d'IA ou par des techniques d'apprentissage adverse (« adversarial learning »). Toutefois, les techniques étudiées actuellement, sont la plupart du temps incapables d'identifier l'intention derrière une séquences de paquets, flux ou événements. Pour corriger ces limites, cette thèse propose d'ajouter aux techniques d'apprentissage automatique, des techniques d'IA symbolique pour permettre la reconnaissance de ces séquences et leur classification pour des contre-mesures correctement adaptées. Réseaux de nouvelles génération
Cybersécurité
Génération de datasets de qualité
Détection d'attaques Intelligence Artificielle
Apprentissage Automatique
IA générative
IA symbolique
Méthodes expérimentales
Le profil recherché
Cybersécurité
IA et Apprentissage automatique
Python et librairie d'IA (Scikit-learn, Keras, tensor flow, ...)
Publiée le 09/06/2026 - Réf : 26332ec025717e1e50d726787cbd1823