- Jobs
- Entreprises
- 
                        Accès recruteur
- 
                        Emploi
- Formation
- 
                        Mon compte
- 
                        
 
     
            
    Apprentissage par Renforcement pour une IA Agentique Fiable - Stage H/F Assystem
- Courbevoie - 92
- Stage
- Bac +3, Bac +4
- Bac +5
- Services aux Entreprises
- Secteur Energie • Environnement
- Exp. - 1 an
        
            
            Les missions du poste
        
    
    Nous recherchons un(e) stagiaire pour participer à la mise en place d'IA agentique sure et efficace pour des workflows d'ingénierie en contexte réglementé nucléaire. Vous appliquerez l'apprentissage par renforcement (RL) - associé à des garde fous solides à une évaluation rigoureuse - pour permettre à un agent LLM de planifier, d'utiliser les outils et de vérifier les résultats sur une infrastructure cloud et sur site.
Vous travaillerez main dans la main avec notre référent technique LLM pour appliquer des méthodes de RL de pointe (optimisation des préférences (DPO/IPO), bandits, RL hors ligne) à des cas d'usages concrets à destination des équipes d'ingénierie - tout en répondant aux attentes du secteur en matière de sécurité et de conformité.
Missions principales:
- Construire une boucle d'agents (planning  appels outils  vérification) avec garde-fous.
- Récompenses multi objectifs multi-objective rewards prenant en compte également latence, coût..
- Construire un pipeline preference/feedback RLHF/RLAIF.
- Explorer différentes méthodes RL : preference optimization (DPO/IPO), bandits;
- Sécuriser le pipeline: règles, provenance tracking, confidence, human-in-the-loop approvals.
- Appliquer à la réalisation d'un assistant pilote agentique démontrant un gain de temps sur des cas d'usage réels.
Pourquoi réaliser votre stage chez Assystem ? On a 3 bonnes raisons pour vous convaincre !
Travailler au sein d'une équipe engagée qui ramène expertise et croissants le matin !
Découvrir pourquoi 92% de nos stagiaires apprécient l'ambiance et leur environnement de travail
Gagner en compétences et développer votre expertise métier en échangeant au quotidien avec les collaborateurs Assystem, ainsi que le client en direct pour plus de proximité !
                    Qualifications  
Niveau de formation :  
 Étudiant en Bac +5 (Master, école d'ingénieur ou équivalent).  
 Un niveau Bac +4 pourra être envisagé pour un(e) candidat(e) particulièrement motivé(e).
Domaine de spécialisation :  
 Informatique, Intelligence Artificielle, ou Mathématiques appliquées.
Compétences techniques :
- Solide maîtrise de Python, avec une expérience sur PyTorch (ou TensorFlow).
- Intérêt marqué pour l'apprentissage par renforcement (reward design, bandits, policy/preference optimization).
- Intérêt pour les LLMs et les agents intelligents ; une expérience avec LangChain, LangGraph ou outils similaires est un plus.
- Bonne compréhension des bonnes pratiques de développement : tests, reproductibilité, suivi des expériences (experiment tracking).
- Familiarité avec Git et Docker.
Compétences transverses :  
 Curiosité, rigueur, autonomie, esprit d'initiative, sens de la collaboration, et anglais opérationnel.
Informations supplémentaires  
Nous nous engageons au respect de l'égalité de traitement entre les candidats, et célébrons toutes les formes de diversité. Chez Assystem, seules les compétences comptent ! Si vous souhaitez porter à la connaissance d'Assystem une quelconque situation ou des besoins spécifiques, n'hésitez pas vous serez accompagné(e) !
                
Les étapes de recrutement
Les étapes de recrutement peuvent varier selon l'offre à laquelle vous postulez.
- 
                Premier échange téléphonique avec les candidat.e.s présélectionné.e.s 
- 
                Entretien avec le futur N+1 
- 
                Entretien et debriefing d’un questionnaire de personnalité auprès de la Direction des RH 
- 
                Possible échange avec le futur N+2 (téléphone ou visio) 
- 
                Onboarding puis suivi de la période d’intégration 
- 
                
Assystem en images
 
                             
                             
                             
                             
                             
                             
                             
                             
                             
                             
                             
                    Pas de salaire renseigné
Publiée le 22/10/2025 - Réf : 1a440cb3-5b8d-4334-befb-0410a20785c7
Créez une alerte
Pour être informé rapidement des nouvelles offres, merci de préciser les critères :
Apprentissage par Renforcement pour une IA Agentique Fiable - Stage H/F
- Courbevoie - 92
- Stage
Pour les postes éligibles :
Télétravail occasionnel
					
						
							Envoyez votre candidature
							dès maintenant !
						
						
							Créez votre compte et
							envoyez votre candidature !
						
					
			
		dès maintenant !
envoyez votre candidature !
Recherches similaires
- Job Rueil-Malmaison
- Job Boulogne-Billancourt
- Job Levallois-Perret
- Job Nanterre
- Job Antony
- Job Issy-les-Moulineaux
- Job Clamart
- Job Colombes
- Job La Défense
- Job Gennevilliers
- Entreprises Courbevoie
- Offre de stage Hauts-de-Seine
- Offre de stage Courbevoie
- Job Europe
- Job Niveau bac
- Job Anglais
- Job Matin
- Job Technologies
- Job Anglais Courbevoie
- Job Niveau bac Courbevoie
- Job Matin Courbevoie
- Assystem Courbevoie
- Stage Assystem
{{title}}
{{message}}
{{linkLabel}}