Les missions du poste
Les activités du Data Lab s'articulent autour de deux axes complémentaires :
- Recherche appliquée : développement de modèles algorithmiques répondant à des problématiques métiers concrètes (moteurs de recommandation e-commerce B2B, criblage pharmaceutique à haut débit, modèles de scoring assurantiel, optimisation d'hyperparamètres en finance, etc.).
- Recherche fondamentale : travaux continus de R&D, avec un focus particulier sur l'analyse et le traitement des données textuelles.
L'articulation entre recherche fondamentale et appliquée est au coeur de notre démarche. Face à l'hétérogénéité des données et à la complexité croissante des modèles, cette approche scientifique nous permet d'anticiper les évolutions du machine learning et de garantir la robustesse des solutions déployées chez nos clients.
Poste ouvert
Dans ce contexte, le Data Lab recrute un(e) docteur(e) en data science, statistiques ou mathématiques appliquées, avec une forte spécialisation en traitement automatique du langage naturel (TAL/NLP).
La personne recrutée interviendra directement sur nos travaux liés aux données textuelles et jouera un rôle clé dans la conception, l'expérimentation et l'industrialisation de solutions innovantes.
Missions
1) Recherche et développement
- Développer des méthodes avancées en data science, notamment autour des grands modèles de langage (LLM) et de l'apprentissage non supervisé.
- Concevoir et expérimenter des approches algorithmiques de clustering et de classification croisée semi-supervisée appliquées à des données textuelles complexes issues de contextes métiers variés (e-commerce, recherche documentaire, etc.).
- Contribuer à l'état de l'art et aux productions scientifiques du Data Lab (articles, conférences, veille).
2) Industrialisation et mise en production
- Transformer des prototypes de recherche en solutions robustes et opérationnelles.
- Concevoir des pipelines de traitement de données fiables et optimiser les performances des modèles.
- Participer au déploiement sur des infrastructures cloud (AWS, Azure) et assurer le suivi en production (robustesse, monitoring, amélioration continue).
3) Projets collaboratifs et transfert
- Assurer l'interface entre le Data Lab, les équipes d'ingénierie et les clients.
- Traduire des problématiques métiers en protocoles de recherche rigoureux.
- Contribuer à la structuration, à la documentation et à la valorisation des projets d'innovation.
4) Encadrement et diffusion scientifique
- Encadrer des data scientists juniors, alternants et stagiaires.
- Participer à des actions de formation et à la diffusion des connaissances en interne.
Profil recherché
- Doctorat en data science, statistiques, mathématiques appliquées ou domaine connexe.
- Expertise solide en traitement automatique du langage naturel (NLP/TAL).
- Bonne maîtrise des grands modèles de langage (LLM) et des approches modernes d'apprentissage (non supervisé, semi-supervisé).
- Compétences avancées en Python et en frameworks de data science (PyTorch, TensorFlow, scikit-learn, etc.).
- Expérience en conception et évaluation expérimentale de modèles (protocoles rigoureux, reproductibilité, benchmarks).
- Capacité à passer de la recherche à l'industrialisation (optimisation, mise en production, pipelines de données).
- Expérience de publication dans des conférences internationales de premier plan (type ACL, SIGIR, ICML, ICLR, EMNLP, etc.) fortement appréciée.
- Esprit analytique, rigueur scientifique et capacité à travailler sur des problématiques complexes.
- Bonnes compétences en communication pour interagir avec des équipes techniques et des interlocuteurs métiers.
- Connaissance des environnements cloud (AWS, Azure) appréciée.
Le profil recherché
Compétences: Analyser, exploiter, structurer des données,Collaborer avec une équipe projet,Créer, élaborer et identifier des concepts innovants,Enseigner, transmettre des connaissances, développer des compétences,Optimiser des algorithmes, une application informatique et mettre en oeuvre leur développement,Proposer des pistes d'amélioration des solutions,Réaliser un prototype de la solution technique pour validation par le donneur d'ordres (configuration type, ...),Rédaction d'articles scientifiques,Veille scientifique continue,Analyse critique et rigueur scientifique
Langues: Anglais souhaité
Qualification: Cadre
Secteur d'activité: Édition de logiciels applicatifs
Liste des qualités professionnelles:
Faire preuve de créativité, d'inventivité : Capacité à créer, imaginer quelque chose de nouveau (nouveau produit, nouvelle solution, ...).
Avoir l'esprit d'équipe : Capacité à travailler et à se coordonner avec les autres au sein de l'entreprise pour réaliser les objectifs fixés.
Faire preuve de rigueur et de précision : Capacité à réaliser des tâches en suivant avec exactitude les règles, les procédures, les instructions qui ont été fournies, sans réaliser d'erreur et à transmettre clairement des informations. Se montrer ponctuel et respectueux des règles de savoir-vivre usuelles.
Bienvenue chez Kernix Software
Kernix est une agence spécialisée dans le développement d'applications web qui s'appuie, depuis 2008, sur un centre de recherche en data science agréé par l'État : le Data Lab.
Publiée le 07/05/2026 - Réf : 207ZCNH