Les missions du poste
Un des points majeurs en OSR est de réussir à placer les classes connues et inconnues dans l'espace latent afin d'éviter qu'elles se superposent. Cependant, les principaux travaux se limitent généralement à créer un unique cluster regroupant l'ensemble des classes inconnues, indépendamment de ce qu'elles représentent. De plus, de récents travaux ont intégré l'arbre taxonomique au cours de l'apprentissage en DL pour la biologie, mais en closed-set. Une des propositions de ce travail de thèse est donc de réussir à intégrer cette information taxonomique au sein des classes connues et inconnues.
Le deuxième verrou scientifique majeur de cette thèse concerne l'explicabilité multi-échelle, en particulier locales et semi-locales pour des entomologistes. En effet, d'un côté les information WIPs permettent d'obtenir une explication locale d'un côté, tandis que les informations hiérarchiques apportent des explications qui peuvent être considérée à la fois comme semi-locales pour les proximités au sein d'une même famille, mais aussi globale, pour les proximités entre espèces. Il convient donc de réussir à intégrer l'ensemble de ces explications multi-échelles, à la fois pour fournir des résultats fiables et cohérents pour les experts entomologistes, mais également dans un cadre d'IA pour et inspiré par les sciences du vivant et de l'environnement.
Ce travail de thèse interdisciplinaire à l'interface entre les sciences de l'évolution et de la vision par ordinateur se propose donc d'étudier la reconnaissance d'insectes au moyen des WIP pour caractériser la richesse taxonomique des espèces ailés en lien avec des enjeux climatiques notamment (maladies vectorielles, pollinisation) et d'apporter par ailleurs des éléments de réponses sur la capacité des insectes ailés à utiliser ces interférences pour eux-mêmes se reconnaitre entre individus. Le laboratoire ETIS travaille depuis de nombreuses années en collaboration avec l'IRD sur la reconnaissance des insectes ailés à partir des patterns interférentiels générés en surface de la membrane de leurs ailes (WIP Wing Interference Patterns, voir figure ci-dessous). Notre méthode de reconnaissance, qui se fonde sur des architectures Deep-Learning, a fait ses preuves sur de nombreux genres de diptères vecteurs de maladies (Glossines, Phlébotomes, Aedes, Anopheles, etc. (Cannet et al, 2022, 2023a, b, c)). Nous sommes actuellement en train d'étendre la reconnaissance aux insectes ailés d'intérêt agro-alimentaire (Hémiptères et Hymènoptères), en collaboration avec l'INRAE.
La reconnaissance basée sur les WIPs est une méthode robuste qui se prête à être étendue à la reconnaissance de toute espèce d'insectes ailés pour le suivi de la biodiversité. Ce suivi est un enjeu majeur au regard des transformations climatiques en cours, tant pour objectiver la perte de biodiversité que pour mesurer son retour dans des zones protégées. Le changement d'échelle des Diptères à tout insecte ailé fait apparaître des challenges fondamentaux en Deep-Learning :
- Déséquilibre des bases d'apprentissage et de test : La base actuelle d'images WIP, riche de plus de 5000 acquisitions, est hautement déséquilibrée en fonction des espèces et se caractérise par une longue traine. Alors que certaines classes sont représentées par 800 images, de nombreuses autres le sont uniquement par quelques images (Cannet et al. 2024).
- Exhaustivité : Le nombre d'espèces d'insectes ailés étant difficilement quantifiable (plus de 160 000 pour les diptères seulement) il parait irréaliste d'obtenir une base exhaustive des insectes ailés, même en se restreignant à une zone géographique définie. La base existante devient donc avant tout un outil de première cartographie mais qui doit évoluer dynamiquement avec l'ajout de nouveaux spécimens.
- Explicabilité : il s'agit ici de prendre en compte le besoin terrain des expert·es entomologistes en résultats de classification pouvant être à la fois interprétables et surtout facilement explicables dans le sens où ils se rapprochent fortement des structurations taxonomiques fondamentales permettant une identification possible de nouvelles espèces encore inconnues.
En parallèle, nous adressons des défis majeurs dans le champ de l'entomologie :
- Identification rapide des espèces d'insectes ailés présentes sur un terrain donné (surveillance des maladies vectorielles, mesure de la biodiversité) de manière non destructive (permettant ainsi une vérification ADN de la catégorisation issue des WIP).
- Enrichissement de la connaissance taxonomique des familles d'insectes ailés par des critères complémentaires aux critères purement morphologiques.
- Caractérisation objective de la biodiversité concernant les insectes ailés.
La question scientifique principale que pose ce sujet de thèse s'inscrit donc dans un cadre d'Open Set Recognition (OSR). La question devient alors non de classer précisément un individu dans une classe prédéfinie, mais de savoir d'abord si l'individu appartient ou non aux classes prédéfinies et, si ce n'est pas le cas, de savoir de quelles classes il se rapproche le mieux. Ainsi, notre but est d'assigner chaque image à sa famille ou genre d'appartenance, à défaut de pouvoir en identifier l'espèce. La hiérarchie forte présente dans l'arbre taxonomique et qui se retrouve dans les images WIP rend cet objectif atteignable. Cette même hiérarchie peut également être utilisée pour fournir des explications à une échelle semi-locale ou globale, en considérant les proximités des familles, des genres ou des espèces au sein de l'espace latent. Notre ambition est donc d'aller au-delà de ce qui se fait actuellement en OSR par un regard très interdisciplinaire en lien avec l'entomologie.
Un des points majeurs en OSR est de réussir à placer les classes connues et inconnues dans l'espace latent afin d'éviter qu'elles se superposent. Cependant, les principaux travaux se limitent généralement à créer un unique cluster regroupant l'ensemble des classes inconnues (Chen et al, 2021) (Zhong & Cui, 2025), indépendamment de ce qu'elles représentent. De plus, de récents travaux ont intégré l'arbre taxonomique au cours de l'apprentissage en DL pour la biologie (Fontaine et al. 2026), mais en closed-set. Une des propositions de ce travail de thèse est donc de réussir à intégrer cette information taxonomique au sein des classes connues et inconnues.
Le deuxième verrou scientifique majeur de cette thèse concerne l'explicabilité multi-échelle, en particulier locales et semi-locales pour des entomologistes. En effet, d'un côté les information WIPs permettent d'obtenir une explication locale d'un côté, tandis que les informations hiérarchiques apportent des explications qui peuvent être considérée à la fois comme semi-locales pour les proximités au sein d'une même famille, mais aussi globale, pour les proximités entre espèces. Il convient donc de réussir à intégrer l'ensemble de ces explications multi-échelles, à la fois pour fournir des résultats fiables et cohérents pour les experts entomologistes, mais également dans un cadre d'IA pour et inspiré par les sciences du vivant et de l'environnement.
Synthèse et perspectives
Ce travail de thèse interdisciplinaire à l'interface entre les sciences de l'évolution et de la vision par ordinateur (Machie Learning) se propose donc d'étudier la reconnaissance d'insectes au moyen des WIP pour caractériser la richesse taxonomique des espèces ailés en lien avec des enjeux climatiques notamment (maladies vectorielles, pollinisation) et d'apporter par ailleurs des éléments de réponses sur la capacité des insectes ailés à utiliser ces interférences pour eux-mêmes se reconnaitre entre individus.
Retombées attendues
Au-delà des contributions fondamentales en sciences des données et Deep-Learning, ce projet interdisciplinaire peut avoir des retombées majeures en entomologie et en reconnaissance de diptères sur le terrain. D'abord car la reconnaissance fondée sur les WIPs est supposée proche des indices de reconnaissance utilisés par les organismes eux-mêmes. Ces marqueurs seraient donc des critères évolutifs tangibles. Par ailleurs, l'utilisation des WIPs pourrait permettre la surveillance entomologique par les communautés locales permettant une protection des populations en réduisant le temps entre l'identification et les campagnes de prévention ciblées. Ceci à moindre coût car on réduit l'utilisation de techniques physico-chimiques tout en permettant l'identification de pathogènes (car le corps de l'insecte est préservé).
Le profil recherché
Des competences en visualisations de données et un intérêt pour le domain applicatif seront appréciés favorablement.
Le dossier de candidature doit comprendre :
- Une lettre de motivation
- Un CV détaillé
- Les relevés de notes du master
- Le projet de thèse
- Une ou plusieurs lettres de recommandation, dont une rédigée par la direction de thèse proposé
Bienvenue chez Doctorat.Gouv.Fr
La question scientifique principale que pose ce sujet de thèse s'inscrit donc dans un cadre d'Open Set Recognition (OSR). La question devient alors non de classer précisément un individu dans une classe prédéfinie, mais de savoir d'abord si l'individu appartient ou non aux classes prédéfinies et, si ce n'est pas le cas, de savoir de quelles classes il se rapproche le mieux. Ainsi, notre but est d'assigner chaque image à sa famille ou genre d'appartenance, à défaut de pouvoir en identifier l'espèce. La hiérarchie forte présente dans l'arbre taxonomique et qui se retrouve dans les images WIP rend cet objectif atteignable. Cette même hiérarchie peut également être utilisée pour fournir des explications à une échelle semi-locale ou globale, en considérant les proximités des familles, des genres ou des espèces au sein de l'espace latent. Notre ambition est donc d'aller au-delà de ce qui se fait actuellement en OSR par un regard très interdisciplinaire en lien avec l'entomologie.
Publiée le 28/05/2026 - Réf : d9d12bb04060bc619b762e14a4a04a85