Aller au contenu principal
Institut de Cancérologie de l'Ouest recrutement

Alternance- Data Science Bac +5 - Contrat d'Apprentissage H/F Institut de Cancérologie de l'Ouest

Saint-Herblain - 44
Alternance
Salaire alternance -
Résumé de l'offre
  • 🕑 1 an
  • Bac +5
  • Service public hospitalier
  • Exp. 1 à 7 ans

Les missions du poste

Poste rattaché au Service Data Factory & Analytics (Direction Développement et Innovation).
L'objectif principal est de poursuivre le développement de l'algorithme permettant d'automatiser le processus d'extraction d'informations pertinentes à partir de documents médicaux non structurés et d'évaluer les performances de cette solution.
Tâches principales :
- Compréhension des données médicales : familiarisation avec les différents types de comptes rendus médicaux. Analyse des spécificités linguistiques et des structures de ces documents.
- Développement du pipeline d'extraction : compréhension, maîtrise et extension du pipeline automatisé utilisant Mistral AI pour extraire les variables d'intérêts à partir des documents médicaux, et permettant d'alimenter une base de données structurée.
- Évaluation de la performance de la solution en termes de précision, de rappel et de F1-score en utilisant une base de données manuellement saisie comme Gold Standard.
- Identification des opportunités d'amélioration et itération du modèle pour une extraction plus performante (RAG, fine tuning, nouveaux modèles, CoT, etc.).
- Adaptation du process pour extraire différentes variables.
Cette alternance offre une opportunité unique d'acquérir des compétences pratiques en data science appliquée à la santé, tout en contribuant au développement d'une solution innovante essentielle pour exploiter des données médicales non structurées. L'alternant travaillera en étroite collaboration avec une équipe multidisciplinaire composée de spécialistes en biostatistique et en oncologie.
Références :
1. Schiappa R, Contu S, Culie D, Thamphya B, Chateau Y, Gal J, et al. RUBY : Natural Language Processing of French Electronic Medical Records for Breast Cancer Research. JCO Clin Cancer Inform. 2022 Jul;6 :e2100199.
2. Savova GK, Ogren PV, Duffy PH, Buntrock JD, Chute CG. Mayo clinic NLP system for patient smoking status identification. J Am Med Inform Assoc JAMIA. 2008;15(1) :25-8.
3. Holmes B, Chitale D, Loving J, Tran M, Subramanian V, Berry A, et al. Customizable Natural Language Processing Biomarker Extraction Tool. JCO Clin Cancer Inform. 2021 Aug;5 :833-41.
4. Hanauer DA, Barnholtz-Sloan JS, Beno MF, Del Fiol G, Durbin EB, Gologorskaya O, et al. Electronic Medical Record Search Engine (EMERSE) : An Information Retrieval Tool for Supporting Cancer Research. JCO Clin Cancer Inform. 2020 May;4 :454-63.
5. Carrell DS, Halgrim S, Tran DT, Buist DSM, Chubak J, Chapman WW, et al. Using natural language processing to improve efficiency of manual chart abstraction in research : the case of breast cancer recurrence. Am J Epidemiol. 2014 Mar 15;179(6) :749-58.
6. Banerjee I, Bozkurt S, Caswell-Jin JL, Kurian AW, Rubin DL. Natural Language Processing Approaches to Detect the Timeline of Metastatic Recurrence of Breast Cancer. JCO Clin Cancer Inform. 2019 Oct;3 :1-12.

L'adresse du poste

Localisez l'entreprise et calculez votre temps de trajet en un clic !

Calculer mon temps de trajet

Le profil recherché

En prévision de votre dernière année d'études (Bac +5) en Data Science, vous recherchez pour la rentrée prochaine une alternance. Vous devrez disposer de bonnes connaissances des modèles de traitement du langage et du machine learning et être force de proposition. Vous devez être à l'aise avec les langages de programmation Python et R et avoir une appétence pour les applications en santé et l'oncologie. De bonnes capacités de communication, orales et écrites, sont souhaitées.

Date de début : à partir de septembre 2025
Durée : un an

Bienvenue chez Institut de Cancérologie de l'Ouest

L'Institut de Cancérologie de l'Ouest (ICO) est un établissement de santé privé d'intérêt collectif qui assure des missions de prévention, de soin, de recherche et d'enseignement. Afin de développer son activité de recherche sur données de vie réelles, l'ICO développe son propre Entrepôt de Données de Santé (EDS). L'objectif est d'utiliser les différentes sources de données existantes à l'ICO dans le cadre de la recherche ou du soin afin de créer une unique base de données structurées contenant les variables considérées comme les plus importantes pour mener des travaux de recherche sur données observationnelles.

Aujourd'hui l'EDS est alimenté à partir des bases de données structurées disponibles à l'ICO et des travaux sont en cours dans le but d'extraire des données structurées à partir des documents des patients (comptes rendus de consultation, comptes rendus d'anatomopathologie, etc.). Depuis quelques années, de nombreuses études ont montré qu'il est possible d'extraire des données structurées à partir des comptes rendus en utilisant le NLP (Natural Language Processing) mais toutes ces études reposent sur une méthode nécessitant une longue et coûteuse phase d'annotation afin d'entrainer le modèle (1-6). A l'ICO nous avons réalisé un premier travail montrant les capacités d'un algorithme basé sur le Large Language Model (LLM) Mistral Large à extraire les données de 3 biomarqueurs du cancer du sein à partir des comptes-rendus d'anatomopathologie. L'alternance consistera à poursuivre les développements de cet algorithme afin extraire d'autres données structurées à partir des comptes-rendus médicaux des patients.

Hellowork a estimé le salaire pour cette offre d'alternance

Le recruteur n'a pas communiqué le salaire de cette offre mais Hellowork vous propose une estimation (le salaire en alternance varie en fonction de l'âge et du niveau d'études du candidat).

Estimation basse

477,07 € / mois

Estimation haute

1 766,92 € / mois

Cette information vous semble-t-elle utile ?

Merci pour votre retour !

Alternance- Data Science Bac +5 - Contrat d'Apprentissage H/F
  • Saint-Herblain - 44
  • Alternance
Publiée le 29/04/2025 - Réf : 3154739/22722473 ADSCD/44S

Envoyez votre candidature

dès maintenant !

Créez votre compte et

envoyez votre candidature !

Ces offres pourraient aussi
vous intéresser

BPCE Solutions informatiques recrutement
BPCE Solutions informatiques recrutement
Saint-Herblain - 44
Alternance
486,49 - 1 801,80 € / mois
🏡 Télétravail partiel
Voir l’offre
il y a 17 jours
IKKS Groupe recrutement
IKKS Groupe recrutement
Sèvremoine - 49
Alternance
800 - 1 200 € / mois
Voir l’offre
il y a 8 jours
Voir plus d'offres
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Application Android (nouvelle fenêtre) Application ios (nouvelle fenêtre)
Informations légales CGU Politique de confidentialité Gérer les traceurs Aide et contact
Nous suivre sur :