Aller au contenu principal

Data Scientist H/F

Assistance Publique Hopitaux de Paris

  • Paris - 75
  • CDD
  • Télétravail occasionnel
  • Bac +5
  • Service public des collectivités territoriales
  • Exp. 6 mois min.
Lire dans l'app

Détail du poste

Nous recrutons un ou une Data Scientist pour travailler sur le projet CODIA. Ce projet est un projet interdisciplinaire à l'intersection de la médecine (diabétologie), de la pharmaco-épidémiologie (CEPHEPI, https://pitiesalpetriere.aphp.fr/centre-pharmacoepidemiologie-cephepi/) et de la science des données (équipe Inria Soda https://team.inria.fr/soda/) afin d'améliorer la prise en charge du diabète via la réutilisation secondaire des données de santé. Nous travaillons plus particulièrement sur l'Entrepôt de Données de Santé (EDS) de l'AP-HP. L'EDS est une base de données qui héberge les dossiers médicaux informatisés de plus de 19 millions de patients suivis dans les 38 hôpitaux de l'AP-HP. Ces données peuvent être structurées (codes diagnostiques de pathologie, traitements administrés, procédures, biologies hospitalières, démographie, etc.) ou non structurées (comptes rendus d'hospitalisation, prescriptions, notes de consultation, etc.). CODIA vise à construire une COhorte de l'ensemble des patients DIAbétiques (1), afin de pouvoir ensuite l'utiliser pour différents projets de recherche, portant par exemple sur le rôle de l'inflammation dans le diabète (https://intercept-t2d.eu/) (2), l'apparition et la gestion de complications du diabète, comme le pied diabétique (3), la maladie rénale chronique, et l'évaluation de l'efficacité de traitements en vie réelle. Nous avons maintenant consolidé une base de données de près de 650 000 patients, ce qui en fait l'une des plus larges cohortes de patients diabétiques d'Europe.

En tant que data scientist sur ce projet, vous travaillerez en relation étroite avec les différents acteurs du projet afin de
- Cibler les bonnes données, au bon moment : sélectionner et préparer des sous-cohortes adaptées aux enjeux cliniques des projets
- Piloter des analyses data innovantes : dans une démarche d'inférence causale, allier biostatistiques, épidémiologie et, quand c'est pertinent, machine learning, avec l'appui des experts du consortium
- Faire parler les données cachées : poursuivre l'application de stratégies de traitement automatique des langues pour enrichir et fiabiliser l'information extraite des notes cliniques non structurées
- Partager les avancées : contribuer activement à la rédaction d'articles scientifiques afin de diffuser les résultats auprès de communautés variées
Pour maximiser la synergie des expertises du consortium, vous serez basé-e au centre de pharmaco-épidémiologie de la Pitié-Salpêtrière, tout en collaborant activement avec :
- l'équipe Soda à Inria Saclay,
- les data scientists de l'AP-HP sur le campus Picpus (12e).
Ces échanges réguliers en présentiel garantiront l'accès à toutes les compétences clés nécessaires pour mener à bien le projet.
Le/la candidat-e idéal-e dispose
- d'un M2 en mathématiques, informatique, sciences des données, biostatistiques ou équivalent
- d'une première expérience en data science / machine learning
- de bonnes connaissances en Python, SQL, Spark, des bonnes pratiques de développement, et d'une appétence pour les approches élégantes
- d'une excellente capacité à communiquer, et faire le lien entre les différentes équipes
- d'une bonne organisation, pour mener en parallèle plusieurs projets à des rythmes variés
- un intérêt marqué pour la santé publique

Note importante : nous recrutons des personnes pas des postes
Si après la lecture de cette description de poste, vous pensez que vous n'avez pas tous les prérequis mais qu'elle correspond à là où vous voudriez être dans votre prochaine position, nous vous encourageons à postuler !

Rémunération annuelle : 40 à 55K€ (selon expérience, profil)
Télétravail occasionnel

Encadrement
- Judith Abécassis, Soda team, Inria Saclay (****@****.**)
- Candice Estellat, CEPHEPI, Pitié-Salpêtrière, APHP (****@****.**)
- Louis Potier, PUPH, Hôpital Bichat, AP-HP (****@****.**)

Le profil recherché

Experience: 6 Mois

Compétences: Adapter les outils de traitement statistique de données,Définir et faire évoluer des procédés de traitement de l'information

Langues: Anglais exigé,Français exigé

Qualification: Employé qualifié

Secteur d'activité: Activités hospitalières

Liste des qualités professionnelles:
Avoir l'esprit d'équipe : Capacité à travailler et à se coordonner avec les autres au sein de l'entreprise pour réaliser les objectifs fixés.
Faire preuve de rigueur et de précision : Capacité à réaliser des tâches en suivant avec exactitude les règles, les procédures, les instructions qui ont été fournies, sans réaliser d'erreur et à transmettre clairement des informations. Se montrer ponctuel et respectueux des règles de savoir-vivre usuelles.
Etre force de proposition : Capacité à initier, imaginer des propositions nouvelles pour résoudre les problèmes identifiés ou améliorer une situation. Être proactif.

Publiée le 21/01/2026 - Réf : 202YSPZ

Data Scientist H/F

Assistance Publique Hopitaux de Paris
  • Paris - 75
  • CDD
Publiée le 21/01/2026 - Réf : 202YSPZ

Finalisez votre candidature

sur le site du partenaire

Créez votre compte pour postuler

sur le site du partenaire !

Ces offres pourraient aussi
vous intéresser

Lidl recrutement
Lidl recrutement
Châtenay-Malabry - 92
CDI
3 372 € / mois
Télétravail partiel
Voir l’offre
il y a 3 jours
PMU recrutement
PMU recrutement
Paris 17e - 75
CDI
60 000 - 70 000 € / an
Télétravail partiel
Voir l’offre
il y a 8 jours
Safran recrutement
Safran recrutement
Voir l’offre
il y a 10 jours
Voir plus d'offres
Initialisation…
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Nous suivre sur :
Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact