Complétez votre profil pour recevoir des offres adaptées.

Mon espace

Mes CV vus

Mes candidatures

Mes alertes

Mon profil

Paramètres

Déconnexion

Missions d'intérim
Offres de stage
Offres en alternance
Créer mon alerte
Déposer mon CV
Salaire brut net

Téléchargez l'app et postulez dans les premiers !

Diffuser ma première offre Déjà client

Téléchargez l'app et postulez dans les premiers !

Se connecter S'inscrire Formation

Téléchargez l'app et postulez dans les premiers !

Trouver mon job s

Trouver mon entreprise s

Accès recruteur

Diffuser ma première offre

Déjà client

Emploi

Missions d'intérim

Offres de stage

Offres en alternance

Créer mon alerte

Déposer mon CV

Salaire brut net

Formation

Se connecter

S'inscrire

Trouver mon job s

Trouver mon entreprise s

Mon espace

Mes CV vus

Mes candidatures

Mes alertes

Mon profil

Paramètres

Déconnexion

Salaire fourni par le recruteur

Ce recruteur joue le jeu de la transparence en transmettant le salaire pour cette offre.

Cabinet de recrutement

Cette offre est publiée par un cabinet de recrutement. Le poste peut être situé au sein de l’entreprise indiquée ou chez un client pour lequel il recrute.

Ingénieur Logiciel - Runtime d'Inférence IA & Plateforme de Serving H/F Mercato de l'emploi

Meudon - 92
CDI
Bac +2
Bac +3, Bac +4
Bac +5
BTP
Exp. 3 ans min.

Lire dans l'app

Postuler

Les missions du poste

Nous recherchons un Ingénieur Logiciel pour permettre le serving d'inférence IA à grande échelle sur la plateforme accélératrice Vsora Jotunn8. Le rôle porte sur l'évaluation, le portage, l'optimisation et le déploiement de runtimes d'inférence et frameworks de serving de pointe tels que vLLM et SGLang, afin de délivrer des solutions de serving IA performantes et scalables.

Responsabilités principales

- Piloter la conception, le développement et l'intégration de la stack logicielle chargée d'orchestrer et de gérer les charges de travail d'inférence IA hautes performances sur l'accélérateur Vsora Jotunn8.

- Évaluer et conduire une analyse technique approfondie des runtimes d'inférence IA modernes et des frameworks de serving, notamment vLLM, SGLang et d'autres solutions émergentes pour LLMs et charges de travail IA.

- Piloter le portage et l'optimisation des runtimes d'inférence et frameworks de serving sélectionnés vers la plateforme matérielle Vsora, en exploitant pleinement les capacités de l'accélérateur.

- Concevoir et implémenter des architectures de déploiement scalables pour le serving IA, couvrant les environnements mono-noeud et distribués, la planification des modèles, la gestion des ressources et les opérations en production.

- Définir l'architecture logicielle et la roadmap pour le serving IA sur les plateformes Vsora, en équilibrant performance, couverture fonctionnelle, maintenabilité et compatibilité écosystème.

- Collaborer avec les communautés open-source et les partenaires de l'écosystème IA pour assurer la compatibilité avec les principaux frameworks, environnements de déploiement et écosystèmes de modèles.

- Accompagner les clients et équipes internes via des implémentations de référence, des guides de déploiement, des caractérisations de performance et des bonnes pratiques pour l'inférence IA sur les plateformes Vsora.

Le profil recherché

- Solides compétences en programmation Python et/ou C++.

- Solide expérience avec les frameworks ML : PyTorch, TensorFlow, JAX, ONNX ou écosystèmes équivalents.

- Expérience dans le déploiement, l'optimisation ou le portage de modèles IA sur des plateformes matérielles spécialisées (GPU, NPU, accélérateurs IA).

- Compréhension des architectures de réseaux de neurones : transformers, modèles de diffusion, CNN, modèles multimodaux et grands modèles de langage.

- Familiarité avec les compilateurs ML, frameworks d'optimisation de graphes et toolchains de déploiement (ONNX Runtime).

- La connaissance de la quantification, précision mixte, compression de modèles et techniques d'optimisation d'inférence est un plus.

Ref: g7kng0r2ch

L'entreprise

VSORA est une société française de semi-conducteurs fabless spécialisée dans la conception de processeurs d'inférence IA haute performance pour le cloud et les centres de données. Son processeur phare, le Jotunn8, a été conçu pour répondre aux défis énergétiques et de performance des charges de travail IA modernes : débit élevé, latence ultra-faible et efficacité énergétique optimale. Il fait partie des processeurs les plus puissants du marché, utilisé notamment pour le traitement des grands modèles de langage (LLM).

Portée par une équipe dirigeante avec plus de 25 ans d'expérience en conception de puces, VSORA s'inscrit dans la prochaine vague du calcul IA durable et scalable.

L'entreprise mise sur une culture collaborative, agile et bienveillante, où hiérarchies rigides et silos n'ont pas leur place. Rejoindre VSORA, c'est intégrer une équipe multiculturelle et talentueuse, contribuer à une mission ambitieuse et avoir un impact réel sur la construction d'une société de référence dans son secteur.

👉 www.vsora.com

Publiée le 09/06/2026 - Réf : g7kng0r2ch

Créez votre compte Hellowork et activez votre alerte Créez une alerte

Métier

Localité

Type de contrat

CDI

CDD

Intérim

Stage

Alternance

Indépendant

Franchise

Associé

Fonctionnaire

Freelance

Stage de lycée

Postuler

Envoyez votre candidature
dès maintenant !

Créez votre compte Hellowork et

envoyez votre candidature !

Ces offres pourraient aussi
vous intéresser

Ingénieur Logiciel C++ Simulation Numérique H/F

LH & Tech

Paris - 75

CDI

44 000 - 52 000 € / an

Télétravail occasionnel

Voir l’offre

il y a 18 jours

Graduate Program Horizons Junior Vie Ingénieur en Développement de Projets Transverses - Varsovie Pologne H/F

Eiffage Construction

Vélizy-Villacoublay - 78

CDI

Voir l’offre

il y a 18 jours

Architecte Applicatif H/F

BPCE SA

Paris - 75

CDI

Télétravail partiel

Voir l’offre

il y a 10 jours

Voir plus d'offres

Coach Emploi

Bêta

Chargement du coach emploi...

Connectez-vous ou créez un compte pour obtenir une analyse personnalisée de votre CV.

Continuer avec un compte

En dialoguant avec notre assistant IA, vous déclarez avoir pris connaissance de notre politique de confidentialité . Notre assistant IA est en version bêta test et peut faire des erreurs. Pour tout savoir sur le fonctionnement, consultez la notice d'information .

Recherches similaires

Job Ingénieur logiciel
Job Informatique
Job Rueil-Malmaison
Job Boulogne-Billancourt
Job Levallois-Perret
Job Nanterre
Job Antony
Job Issy-les-Moulineaux
Job Clamart
Job Colombes
Job La Défense
Job Gennevilliers
Job Développeur
Job Technicien support informatique
Job Technicien informatique
Job Ingénieur de développement
Job Développeur Java
Entreprises Informatique
Entreprises Ingénieur logiciel
Entreprises Meudon
Job Logiciel
Job Junior
Job Été
Job Durable
Job Construction
Job CDI Meudon
Job Junior Meudon
Job Été Meudon

Voir plus Voir moins

Accueil
Job
Job Meudon
Job Informatique Meudon
Job Ingénieur logiciel Meudon
Ingénieur Logiciel - Runtime d'Inférence IA & Plateforme de Serving H/F

Les sites

HelloCV
Helloworkplace
BDM
Jobijoba
Maformation
Diplomeo

L'emploi

Offres d'emploi par métier
Offres d'emploi par ville
Offres d'emploi par entreprise
Offres d'emploi par mots clés

L'entreprise

Qui sommes-nous ?
On recrute
Accès client

Les apps

Nous suivre sur :

Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact

Ingénieur Logiciel - Runtime d'Inférence IA & Plateforme de Serving H/F Mercato de l'emploi

Les missions du poste

Le profil recherché

L'entreprise

Envoyez votre candidature dès maintenant !

Ces offres pourraient aussi vous intéresser

Recherches similaires

Envoyez votre candidature
dès maintenant !

Ces offres pourraient aussi
vous intéresser