Pas de salaire renseigné@titleMarkup>
Thèse Prévision Saisonnière et Pluri-Décennale des Aléas Littoraux par Méthodes d'Apprentissage Automatique H/F
Doctorat_Gouv
- Perpignan - 66
- CDD
- Bac +5
- Service public d'état
Détail du poste
Établissement : Université de Perpignan Via Domitia
École doctorale : Energie et Environnement
Laboratoire de recherche : Centre de formation et de recherche sur les environnements méditerranéens
Direction de la thèse : Nicolas ROBIN ORCID 0000000323232552
Début de la thèse : 2026-10-01
Date limite de candidature : 2026-04-30T23:59:59
Le projet cible IRICOT du projet PEPR IRIMA (2024-2030) vise à développer des connaissances transdisciplinaires afin d'éclairer la gestion des risques littoraux et la manière d'adapter nos sociétés face aux changements globaux. Dans le cadre de ce projet, le WP3 Prévisions saisonnière et décennale des aléas littoraux s'attache à mieux comprendre, modéliser et prévoir les aléas littoraux pour une grande diversité d'environnements (côte sableuse, estuaire, régime de marée ...), aux échelles saisonnières à décennales, pour les façades atlantique et méditerranéenne de la France métropolitaine, de l'échelle locale à l'ensemble de la façade avec une résolution spatiale typiquement de centaines de mètres (e.g. trait de côte). La thèse abordera ce problème en se basant sur les outils statistiques et ceux de l'apprentissage automatique (« machine learning »). Sur un plan méthodologique, la thèse vise à surmonter les limites des outils « classiques » basés sur la corrélation en identifiant les liens de causalité entre les grands modes de variabilité climatique (NAO, WEPA, etc.), les forçages météo-océaniques (vagues, niveau d'eau) et les indicateurs de l'état du littoral (trait de côte, largeur de dune, ...). En plus d'améliorer la compréhension des processus physiques générateurs des aléas côtiers, la thèse cherchera à évaluer si les modèles de machine learning causalement contraints montrent une capacité prédictive supérieure et une généralisation améliorée, en particulier pour les évènements extrêmes aux échelles temporelles visées (saisonnières à décennales), par rapport aux approches classiques.
Les recherches sur les risques littoraux se concentrent depuis longtemps sur les impacts des tempêtes, et plus récemment sur ceux du changement climatique à l'horizon 2100 (voir rapport AR6 du GIEC). En revanche, les évolutions à des échelles intermédiaires (saisonnières à pluri-décennales) ont été moins étudiées et demeurent difficiles à prévoir, alors qu'elles sont cruciales pour planifier des stratégies d'adaptation territoriale. Suivre, modéliser, prédire les évolutions des risques physiques et des vulnérabilités associées est un véritable défi. Il est pour cela nécessaire de produire et d'utiliser des indicateurs d'état du système littoral et d'identifier les modes de variabilité climatique qui contrôlent les évolutions aussi bien en hiver qu'en été, et ceci pour une variété d'environnements littoraux (côtes sableuses, côte estuariennes, etc).
Ainsi, la problématique principale de la thèse reste celle de la prédiction des aléas littoraux aux échelles saisonnières à décennales, pour les façades de la France métropolitaine, de l'échelle locale à l'ensemble de la façade avec une résolution spatiale jusqu'à quelques centaines de mètres (e.g. trait de côte). Cela implique donc de comprendre et modéliser le lien (statistique) entre : i) un ensemble d'indicateurs du système littoral dérivés via différentes sources, principalement l'imagerie satellitaire (e.g. trait de côte, largeur de dune et de plage...), les simulations rétrospectives (e.g. niveaux d'eau, vagues ...) et des mesures ponctuelles (e.g. débits des fleuves) ;ii) les variables explicatives liées aux indices climatiques qui décrivent les régimes climatiques dominant en Europe occidentale (e.g. WEPA, NAO, EA, SCAND, WEMO, MO) ainsi que les variables de forçage météo-océaniques (vagues, niveau d'eau à la côte, pression atmosphérique, température, etc.).
La question de recherche principale reste le développement des modèles prédictifs robustes pour anticiper l'évolution des aléas côtiers (érosion, submersion) aux échelles de temps saisonnières à pluri-décennales sur les côtes françaises, en surmontant les limites des approches statistiques classiques. Les questions de recherche sous-jacentes peuvent formulées ainsi : i) Compréhension des processus : quels sont les liens de causalité (et non plus seulement de corrélation) entre les grands modes de variabilité climatique (NAO, WEPA, etc.), les forçages météo-océaniques (vagues, niveau d'eau) et les indicateurs de l'état du littoral (trait de côte, largeur de dune, ...) ?; ii) Sélection des variables : comment identifier, parmi la multitude de variables explicative disponibles, celles qui sont véritablement pertinentes et non-redondantes pour la prédiction des aléas côtiers à différentes échelles de temps ?; iii) Développement méthodologique : comment intégrer efficacement la connaissance des liens de causalité (découvertes par l'analyse causale) dans des modèles de machine learning pour améliorer leur performance prédictive et leur robustesse ? iv) Validation et applicabilité : Les modèles développés permettent-ils de rétro-prédire (hindcast) des événements extrêmes passés (comme l'hiver 2013/2014 en Aquitaine) avec plusieurs mois d'avance ? Sont-ils capables de fournir des prévisions opérationnelles utiles pour la planification et l'adaptation des territoires littoraux ?
Question de recherche principale.
Comment développer des modèles prédictifs robustes pour anticiper l'évolution des aléas côtiers (érosion, submersion) aux échelles de temps saisonnières à pluri-décennales sur les côtes françaises, en surmontant les limites des approches statistiques classiques ?
Questions de recherche sous-jacentes.
1. Compréhension des processus : quels sont les liens de causalité (et non plus seulement de corrélation) entre les grands modes de variabilité climatique (NAO, WEPA, etc.), les forçages météo-océaniques (vagues, niveau d'eau) et les indicateurs de l'état du littoral (trait de côte, largeur de dune, ...) ?
2. Sélection des variables : comment identifier, parmi la multitude de variables explicative disponibles, celles qui sont véritablement pertinentes et non-redondantes pour la prédiction des aléas côtiers à différentes échelles de temps ?
3. Développement méthodologique : comment intégrer efficacement la connaissance des liens de causalité (découvertes par l'analyse causale) dans des modèles de machine learning pour améliorer leur performance prédictive et leur robustesse ?
4. Validation et applicabilité : Les modèles développés permettent-ils de rétro-prédire (hindcast) des événements extrêmes passés (comme l'hiver 2013/2014 en Aquitaine) avec plusieurs mois d'avance ? Sont-ils capables de fournir des prévisions opérationnelles utiles pour la planification et l'adaptation des territoires littoraux ?
La problématique associée à la thèse sera abordée en se basant sur les outils statistiques et ceux de l'apprentissage automatique (« machine learning » ML). En particulier, les approches deep learning utilisant les réseaux de neurones se développent rapidement en Géosciences (Reichstein et al., 2019) pour prédire des variables environnementales, mais souvent comme des 'boîtes noires' sans contraintes physiques fortes.
Sur un plan méthodologique, la thèse vise à surmonter les limites des outils « classiques » basés sur la corrélation. Bien que très informatives, efficaces et très utilisées, les analyses basées sur la corrélation peuvent être biaisées en présence d'autocorrélation (McGray et Barnes, 2018), particulièrement importante lorsque les variables sont des séries temporelles et/ou en présence d'un effet commun dit collisionneur, i.e. un processus physique qui est la cause commune de la variable d'intérêt et de la variable explicative (Kretschmer et al., 2021). L'inconvénient est de prendre en compte des variables explicatives présentant des informations redondantes et/ou des liens erronés entre variables explicatives et indicateurs d'aléas. La conséquence est la diminution de la capacité prédictive des modèles et donc l'augmentation des erreurs de prédiction.
Afin d'améliorer la robustesse des modèles prédictifs, une piste envisagée est l'analyse causale (e.g., Runge et al., 2019 ; Eyring et al., 2024 ; Pearl & Mackenzie, 2018 ; Schölkopf et al., 2021). Celle-ci s'intéresse aux liens « cause à effet » entre les variables explicatives - indicateurs tout en quantifiant comment les variables explicatives affectent l'indicateur (i.e. la direction de l'influence « cause à effet ») tout en tenant compte de l'interdépendance entre les variables explicatives. Cette méthode a été récemment appliquée avec succès dans le domaine des géosciences (pour la mousson, Di Capua et al., 2020 ; les ouragans, Pfleiderer et al., 2020) ; sécheresse, Kumar & Tian, 2024 ; débits de rivière, Günther et al., 2023. La Figure ci-dessous donne un exemple en hydrologie pour la rivière chinoise Chuosijia (Liang et al., 2025) où le graphique montre le lien causal entre précipitation (P) et l'humidité du sol (SM). Ce lien est ici positif, i.e. une augmentation de P cause une augmentation de SM. Un autre exemple est le lien causal, cette fois négatif, entre le niveau piézométrique (GW) et SM. Ce résultat paraît évident mais lorsqu'il y a un très grand nombre de variables explicatives, potentiellement en interactions entre elles, découvrir ces liens causaux à partir des données (observations, résultats de simulation rétrospective) présente de nombreuses difficultés.
Figure 2. Graphique causal montrant le lien cause-effet entre précipitation (P), humidité du sol (SM), niveau piézométrique (GW) et débit (Q) (Liang et al., 2025).
L'intérêt de ces analyses est donc double : i) permettre d'améliorer la compréhension des relations physiques entre variables d'intérêt et processus physiques ; ii) identifier les variables explicatives les plus pertinentes pour développer des modèles prédictifs (indices/indicateurs) optimaux.
Ce deuxième point peut être mené de différentes manières, soit par une sélection des variables pertinentes avant la construction du modèle de machine learning (Beucler et al., 2023) ou en intégrant directement cette information dans le processus de construction du modèle. Cette démarche fait partie d'un domaine récent dit « Physics-informed machine learning » qui s'intéresse à contraindre les modèles prédictifs en se basant à la fois sur les données et sur les informations / connaissances sur les processus physiques (Karniadakis et al., 2021). Le Physics-informed machine learning vise à créer des modèles plus interprétables et physiquement plausibles. Une option prometteuse consiste à imposer des contraintes sur la structure des réseaux de neurones en ne prenant en compte que les liens causaux (IglesiasSuarez et al., 2024 ; Li et al., 2022 ; Rasp et al., 2018). La Figure 3 ci-dessous illustre l'intérêt de prendre en compte les contraintes sur les liens causaux sur un exemple de prédiction de l'humidité du sol de Li et al. (2022) : les erreurs du modèle avec contraintes causales (en orange et rouge) présentent des indicateurs de prédiction meilleurs que ceux sans (bleu et vert) à plusieurs échéances de prédiction.
Figure 3. Comparaison des erreurs de prédictions (NSE, RMSE) de l'humidité du sol à différentes échéances (1 ou 15 jours) en utilisant des méthodes de deep learning avec (CLSTM) et sans contraintes sur les liens causaux (LSTM) - extrait de Li et al. (2022).
Plus spécifiquement, le développement de modèles ML 'causalement contraints' pourra être réalisé via des architectures de type Transformer (Vaswani et al., 2017). Les Transformers, grâce à leur mécanisme d'attention, sont particulièrement adaptés pour modéliser des dépendances à longue portée dans les séries temporelles (parfait pour les échelles saisonnières à décennales). L'innovation consisterait à contraindre les poids d'attention du modèle en fonction du graphe causal préalablement identifié. Par exemple, le mécanisme d'attention pourrait être 'guidé' pour accorder plus d'importance aux connexions entre variables qui sont causalement liées, et ignorer les autres. Cette intégration directe de la connaissance causale dans la structure du réseau neuronal est une voie très novatrice du Physics-Informed ML.
Le profil recherché
Le/la candidat(e) devra obligatoirement i) être titulaire d'un M2 ou d'un diplôme d'ingénieur (Formation sciences de la Terre/océanographie et/ou sciences des données) ; ii) maîtriser au moins un langage de programmation scientifique (Python, R) ; iii) avoir un bon niveau en anglais (lu, écrit et parlé).
Seront également appréciés : i) des compétences en analyses de données, modélisation statistique et méthodes de machine learning ; ii) des connaissances sur les processus physiques des systèmes littoraux ; iii) des qualités telles que l'autonomie, la curiosité scientifique, l'ouverture d'esprit, le sens de l'écoute et du travail en équipe et de bonnes capacités rédactionnelles et de présentation.
Publiée le 24/03/2026 - Réf : c8ee85672060fc9ecb9cfc2b6ff46f60
Créez votre compte Hellowork et activez votre alerte Créez une alerte @titleMarkup>
Thèse Prévision Saisonnière et Pluri-Décennale des Aléas Littoraux par Méthodes d'Apprentissage Automatique H/F
- Perpignan - 66
- CDD
Finalisez votre candidature
sur le site du partenaire
Hellowork et postulez
sur le site du partenaire !
Ces offres pourraient aussi
vous intéresser
Recherches similaires
- Job Prévisionniste
- Job Comptabilité
- Job Argelès-sur-Mer
- Job Canet-en-Roussillon
- Job Le Boulou
- Job Rivesaltes
- Job Prades
- Job Saint-Cyprien
- Job Céret
- Job Thuir
- Job Ille-sur-Têt
- Job Saint-Laurent-de-la-Salanque
- Job Collaborateur comptable
- Job Assistant comptable
- Job Chef de mission comptable
- Job Comptable
- Job Expert comptable
- Entreprises Comptabilité
- Entreprises Prévisionniste
- Entreprises Perpignan
- Job Fonction publique
- Job Été
- Job Vert
- Job Estuaire
- Job Apprentissage
- Job Fonction publique Perpignan
- Job CDD Perpignan
- Job Anglais Perpignan
- Job Commune Perpignan
- Job Terre Perpignan
Testez votre correspondance
Chargement du chat...
{{title}}
{{message}}
{{linkLabel}}