Aller au contenu principal

Administrateur Systèmes et Réseaux H/F

Ouicoding Sas

  • Paris 17e - 75
  • CDI
  • Bac +2
  • Bac +3, Bac +4
  • Bac +5
  • Services aux Entreprises
  • Exp. 4 ans min.
Lire dans l'app

Détail du poste

Vous travaillerez dans le cadre du déploiement et de l'exploitation d'une AI Factory à très grande échelle, reposant sur plusieurs clusters. Vous serez en charge de l'architecture, de l'optimisation et de l'évolution des infrastructures réseaux, systèmes et GPU fabrics alimentant des charges IA critiques (training, fine-tuning, inference).

L'environnement est international, hautement distribué (Europe, Amérique du Nord, Asie) et orienté performance extrême, faible latence et scalabilité horizontale.

Architecture & design de la GPU Fabric :
-Concevoir et faire évoluer des architectures réseau haut débit, faible latence, adaptées aux NVL72 et aux workloads IA massivement parallèles
-Définir les topologies réseau (leaf-spine, fat-tree, dragonfly le cas échéant) pour : Interconnexion intra-NVL72, Scale-out multi-racks / multi-clusters
-Sélectionner et valider les technologies : InfiniBand HDR / NDR, Ethernet Spectrum / RoCEv2, Dimensionner les fabrics pour des usages IA à très grande échelle (NCCL-heavy, all-reduce intensif)

Performance, RDMA & communications GPU :
-Piloter le développement, l'optimisation et le tuning des communications RDMA
-Piles RDMA : libibverbs, rdma-core, NVPeerMemory
-Optimisations GPUDirect / GPUDirect-RDMA
-Garantir des transferts GPU / GPU et GPU / NIC à très haute performance, sans surcharge CPU
-Optimiser les communications collectives : NCCL, MPI / CUDA-aware MPI, Identifier et lever les goulots d'étranglement réseau, mémoire et CPU/GPU.

Intégration Kubernetes & workloads IA :
-Concevoir l'intégration réseau de clusters GPU dans des environnements Kubernetes
-Gérer l'exposition et l'isolation des interfaces RDMA : Device Plugin, Network Operator / CNI avancés
-Garantir le bon fonctionnement des workloads conteneurisés IA : Training distribué, Jobs MPI / NCCL, Pipelines data GPU

Exploitation, observabilité & troubleshooting :
-Mettre en place et exploiter des solutions de monitoring avancé : Latence, bande passante, congestion, erreurs
-Outils : Prometheus, Grafana, NetQ, UFM (ou équivalents)
-Analyser les performances réseau et GPU fabric en production
-Proposer et implémenter : Ajustements MTU, Affinités CPU/GPU, Tuning NIC, switch et firmware
-Assurer le support niveau 2/3 sur incidents critiques

-Formation : ingénieur ou équivalent Bac +5.
-Expérience professionnelle : Minimum 4 ans d'expérience pratique avec les technologies (GPUDirect, RoCE, InfiniBand) dans des environnements HPC ou IA.
-Solide expérience en architecture réseau HPC / IA / GPU
- Maîtrise avancée de : InfiniBand & RoCEv2, RDMA, GPUDirect, NCCL, Architectures GPU scale-up / scale-out
-Bonne connaissance de : Kubernetes en contexte GPU, Linux bas niveau (NUMA, IRQ, CPU pinning)
-Capacité à diagnostiquer des problèmes complexes de performance distribuée
-Langues : Français et anglais courants (écrit et oral)

Nous recherchons actuellement un(e) Administrateur(rice) Systèmes et réseaux H/F pour une mission chez l'un de nos clients qui est un grand acteur de la technologie/électronique.

Infos complémentaires

A négocier

Publiée le 28/01/2026 - Réf : 178000628W

Administrateur Systèmes et Réseaux H/F

Ouicoding Sas
  • Paris 17e - 75
  • CDI
Publiée le 28/01/2026 - Réf : 178000628W

Finalisez votre candidature

sur le site du partenaire

Créez votre compte pour postuler

sur le site du partenaire !

Ces offres pourraient aussi
vous intéresser

BERTIN TECHNOLOGIES recrutement
BERTIN TECHNOLOGIES recrutement
Montigny-le-Bretonneux - 78
CDI
45 000 - 55 000 € / an
Télétravail partiel
Voir l’offre
il y a 13 jours
Pro It Conseil recrutement
Ivry-sur-Seine - 94
CDI
28 000 - 32 000 € / an
Voir l’offre
il y a 13 jours
Voir plus d'offres
Initialisation…
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Nous suivre sur :
Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact