Détail du poste
Établissement : Collège de France École doctorale : Sciences du Vivant Laboratoire de recherche : Centre Interdisciplinaire de Recherche en Biologie Direction de la thèse : François BLANQUART ORCID 0000000305912466 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-06-10T23:59:59 L'antibiorésistance est un enjeu majeur de santé publique. Elle est particulièrement un problème pour Escherichia coli, une bactérie commensale de l'intestin humain, qui peut également causer de graves infections responsables d'environ 1 million de décès par an dans le monde, dont des centaines de milliers liés à la résistance aux antibiotiques. Les jeux de données génomiques à grande échelle qui s'accumulent rapidement contribuent à élucider la prévalence et le support génétique des résistances. Cependant, ils sont encore comparativement peu exploités pour étudier les dynamiques épidémiologiques et évolutives de la résistance. Cela s'explique probablement d'une part, par le manque de jeux de données de qualité, annotés avec des métadonnées et échantillonnés longitudinalement ; et d'autre part, par la difficulté inhérente à la modélisation de la sélection et des transferts horizontaux de gènes qui régissent l'évolution de la résistance aux antibiotiques.
Dans cette thèse, nous utiliserons un jeu de données unique comprenant environ un millier de génomes d'E. coli prélevés chez des hôtes sains sur 45 ans (1980-2025) en Île-de-France. Nous exploiterons la structure de la phylogénie pour mesurer la sélection exercée sur la résistance au cours des dernières décennies et relier les éventuelles variations de cette sélection à l'évolution de l'usage des antibiotiques. Nous analyserons également le contexte génomique et phénotypique de la résistance en quantifiant l'association entre les clades résistants et les variations de séquence, la présence ou l'absence de gènes et les phénotypes inférés à la base des clades comme l'antibiotolérance. Nous replacerons les séquences d'E. coli commensales dans le contexte de séquences issues de bactériémies (prélevées à l'hôpital) afin de caractériser les relations épidémiologiques entre l'hôpital et la communauté. Enfin, nous étudierons la séquence nucléotidique des gènes de résistance eux-mêmes et la comparerons aux attentes théoriques concernant l'évolution des génomes accessoires soumis à une sélection positive.
Pour résumer, les travaux développés dans cette thèse, utilisant un jeu de données longitudinal unique couvrant plusieurs décennies en France et de nouvelles méthodes, permettront de faire le lien entre l'épidémiologie des souches sensibles et résistantes et les données génomiques à grande échelle. Ils mettront en lumière la façon dont la sélection pour la résistance est modulée en fonction du contexte, et pourront au final guider la conception de nouvelles politiques de gestion des antibiorésistances.
L'évolution des antibiorésistances est une menace majeure pour la santé publique mondiale. Les antibiorésistances prolongent les durées de soins, d'hospitalisation, et augmentent l'incidence des décès des personnes infectées. Parmi les bactéries impliquées, Escherichia coli est l'une des espèces à la plus forte prévalence de résistance aux antimicrobiens, et associée au plus grand nombre de décès. Cette espèce est une bactérie commensale du microbiote intestinal mais également un agent pathogène opportuniste, responsable d'infections intestinales et extra-intestinales. L'évolution de la résistance chez E. coli est le résultat de transferts horizontaux de gènes et de mutations ponctuelles dans son environnement commensal. Ces éléments sont sélectionnés par l'usage des antibiotiques en médecine humaine, vétérinaire et possiblement les résidus d'antibiotiques dans l'environnement. Pour une espèce comme E. coli, la sélection par les antibiotiques opère principalement de façon spectatrice, quand l'hôte consomme des antibiotiques pour des raisons non-liées à la présence de cette bactérie.
Malgré l'importance des antibiorésistances, et l'existence de données massives de génomes bactériens, ces données génomiques sont rarement exploitées pour comprendre l'épidémiologie des résistances. Un premier problème est qu'il est nécessaire de se concentrer sur les génomes de bactéries prélevées chez des hôtes sains. Les changements évolutifs d'E. coli sont déterminés par l'écologie de ces organismes dans leur mode de vie commensal. Les génomes de bactéries prélevées dans les infections, qui sont de loin les plus représentés dans les bases de données, ont davantage de gènes de résistance et de virulence et sont donc un échantillon biaisé de la diversité (Burgaya et al. 2023). Par ailleurs, les échantillons longitudinaux (couvrant plusieurs décennies) sont importants pour lier différentes échelles de temps mais restent rares. Enfin, l'évolution des antibiorésistances implique de la sélection sur des éléments génétiques mobiles, ce qui est difficile à modéliser.
Dans cette thèse, nous contribuerons à comprendre l'évolution des antibiorésistances avec des méthodes phylogénétiques. Nous disposons d'un jeu de données unique, de l'ordre d'un millier de souches d'E. coli commensales isolées dans la communauté entre 1980 et 2025 à partir des échantillons de selles d'individus sains, qui témoigne de l'évolution des antibiorésistance sur cette période. Nous développerons de nouvelles méthodes pour répondre aux questions suivantes : 1) Pouvons-nous détecter la sélection sur les gènes de résistance, et le lien avec l'usage passé d'antibiotiques ? 2) L'évolution de la résistance dépend-elle du fond génétique et de l'interaction avec d'autres gènes ? 3) Comment la sélection influence-t-elle la séquence des gènes de résistance ?
Le profil recherché
- Bonnes connaissances en statistiques / analyses de données (modèles statistiques de données épidémiologiques et génomiques).
- Capacité à travailler en équipe et à communiquer les résultats à l'oral et à l'écrit.
- Connaissances en modélisation mathématiques (systèmes d'équation différentielle ordinaires) seraient un plus.
Publiée le 12/05/2026 - Réf : 293a8d9a38dc735200d8cc97ba1e7478