Thèse Cybersécurité Datasets et IA Générative H/F

Doctorat.Gouv.Fr

  • Toulouse - 31
  • CDD
  • Bac +5
  • Service public d'état
Lire dans l'app

Détail du poste

Établissement : Université de Toulouse École doctorale : EDMITT - Ecole Doctorale Mathématiques, Informatique et Télécommunications de Toulouse Laboratoire de recherche : LAAS - Laboratoire d'Analyse et d'Architecture des Systèmes Direction de la thèse : Philippe OWEZARSKI ORCID 0000000177137003 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-06-10T23:59:59 La cybersécurité repose aujourd'hui de plus en plus sur des outils utilisant des techniques d'intelligence artificielle (IA), notamment d'apprentissage automatique. Pour fonctionner, ces techniques ont besoin d'un entrainement sur des données labelisées, les labels indiquant la nature des paquets et des flux du dataset. Pour un bon entrainement des outils d'apprentissage automatique, les datasets doivent donc contenir une grande variété de trafics différents avec des attributs les caractérisant couvrant un large spectre de situations. L'objectif est de disposer de datasets permettant une évaluation complète et pertinente des outils de cybersécurité en évitant des erreurs liées à des phénomènes comme le sous- ou sur-apprentissage, par exemple.

L'objectif de cette thèse comporte de nombreux défis à relever, ayant tous pour point commun la qualité des datasets utilisés à la fois pour l'entrainement des modèles d'IA et l'évaluation des outils de cybersécurité pour la détection d'attaques, d'anomalies et d'intrusions.

1. Le premier défi consiste à définir formellement la qualité d'un dataset.
2. Le deuxième défi consiste à générer des datasets de qualité permettant d'évaluer de façon pertinente et complète des outils de cybersécurité et à garantir la qualité du trafic généré.
3. Le troisième défi consiste à concevoir de nouveaux outils de détection d'attaques robustes à des attaques générées par des outils d'IA ou par des techniques d'apprentissage adverse (« adversarial learning »). Toutefois, les techniques étudiées actuellement, sont la plupart du temps incapables d'identifier l'intention derrière une séquences de paquets, flux ou événements. Pour corriger ces limites, cette thèse propose d'ajouter aux techniques d'apprentissage automatique, des techniques d'IA symbolique pour permettre la reconnaissance de ces séquences et leur classification pour des contre-mesures correctement adaptées. Réseaux de nouvelles génération
Cybersécurité
Génération de datasets de qualité
Détection d'attaques Intelligence Artificielle
Apprentissage Automatique
IA générative
IA symbolique
Méthodes expérimentales

Le profil recherché

Réseaux
Cybersécurité
IA et Apprentissage automatique
Python et librairie d'IA (Scikit-learn, Keras, tensor flow, ...)

Publiée le 09/06/2026 - Réf : 26332ec025717e1e50d726787cbd1823

Postuler
Créez votre compte
Hellowork et postulez

sur le site du partenaire !

Voir plus d'offres
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Nous suivre sur :
Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact