

Stage-Extension de Framework de Datascience pour Différents Formats H/F Orange
Caouënnec-Lanvézéac - 22 Stage- 🕑 6 mois
- Bac +5
- Industrie high-tech • Telecom
- Exp. - 1 an
Les missions du poste
"Vous rêvez de contribuer à un projet open source autour de l'IA, rejoignez-nous !" Bruno manager
Avec Khiops [1] l'apprentissage automatique sur des données tabulaires devient un jeu d'enfant. Comme les données proviennent de sources et processus très divers, il est temps pour Khiops d'accueillir et donc de supporter en entrée de nouveaux formats de données. Ce stage consiste à étudier le format Parquet qui permet un accès rapide aux données et à déterminer les évolutions nécessaires de l'interface d'entrée/sortie de Khiops pour permettre son intégration.
Le principal verrou est la nature compressée et structurée du format Parquet, tandis que Khiops manipule habituellement des fichiers de type CSV au format texte. Avec Khiops de nombreux traitements sont possible, impliquant des indexations et conversions des données vers des types natifs. Cette différence de format implique qu'il faudra chercher des solutions afin que Khiops puisse accéder aléatoirement et efficacement au contenu mais également bénéficier des métadonnées contenues dans les fichiers Parquet afin de convertir correctement les enregistrements.
Dans un premier temps le support de ce format sera prototypé sous forme de module indépendant, afin de valider la faisabilité de l'extraction des informations nécessaires à Khiops. Ce module s'appuiera sur le SDK Apache Arrow [3] et pourra servir de base à l'implémentation finale. Dans une seconde phase, il s'agira de faire évoluer le composant chargé de l'interfaçage avec les différents service de stockage des principaux clouds (Google, Amazon, Azure) afin de permettre toutes les combinaisons [ cloud x format de données ], ceci afin de permettre l'intégration future de nouveaux formats de données.
[1] Khiops https://khiops.org
[2] Apache Parquet https://parquet.apache.org,
[3] Apache Arrow https://github.com/apache/arrow
Nos étapes de recrutement
Les étapes de recrutement peuvent varier selon l’offre à laquelle vous postulez.
-
Proposition d’entretien ou réponse négative dans les 15 jours après votre candidature
-
Entretien en visio ou présentiel avec le/la consultant(e) en recrutement sous 15 jours
-
Rencontre en visio ou présentiel avec le/la manager
-
Votre candidature est retenue, félicitations ! Vous recevez votre proposition d'embauche
-
Bienvenue chez Orange :) votre programme d’intégration démarre
-
En cas de réponse négative, nous restons à votre disposition pour un debrief
Le profil recherché
Profil souhaité :
. Bac +5, Master informatique ou école d'ingénieur.
Compétences :
- Connaissances en C/C++
- Génie logiciel
- Une connaissance du Big Data et des stockages associés serait un plus
"Ce stage dans un cadre exceptionnel, est une opportunité de découvrir une magnifique région, à 5km de la mer, pour pratiquer des sports nautiques ou sous-marins. Il faut avoir son permis B obligatoirement ! "Bruno, manager
Raisons de nous rejoindre
-
Mutuelle et prévoyance collective
-
Un smartphone professionnel pour tous
-
Remise de 30% sur les abonnements perso internet et mobile Orange
-
Avec le CSE, pack culture, CESU, chèques-vacances, billetterie
-
Orange participe financièrement aux trajets domicile-travail
-
Jusqu'à 20 jours de RTT selon le régime de travail
-
Compte Epargne Temps
-
Plan d'Epargne Entreprise et Plan d'Epargne Retraite Collectif
-
Programme de sponsoring interne pour soutenir vos projets passion
-
Droit à la déconnexion numérique en dehors des heures de travail
Bienvenue chez Orange
L'analyse de données et l'intelligence artificielle constituent aujourd'hui des puissants leviers pour Orange permettant à la fois de réinventer la relation client mais également d'optimiser et d'automatiser la gestion de nos réseaux, d'améliorer l'expérience client et d'apporter un avantage différenciant vis-à-vis de nos clients.
L'ambition de la Division Innovation est de porter plus loin l'innovation d'Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l'humain, éclairer les choix stratégiques du Groupe à long terme et influencer l'écosystème digital mondial.
Au sein de la division Innovation, le domaine fonctionnel Digital Cloud Services a pour ambition de proposer à toutes les équipes de développement logiciel d'Orange l'ensemble des fondamentaux techniques communs, structurellement sécurisés et automatisés, utilisables par tous et partout, capables de soutenir des productions digitales, rapides et de qualité, sur l'ensemble du cycle de vie de celles-ci : de la conception jusqu'au fonctionnement nominal (run) en passant par le développement, le test, le déploiement, la supervision ou l'intégration de l'IA.
Dans ce cadre, vous rejoignez l'équipe Automated Data Intelligence at Scale, qui regroupe des chercheurs, des data scientists opérationnels et des architectes logiciels. Sa mission s'étend de la recherche académique à l'industrialisation de solutions opérationnelle
Infos complémentaires
Accès CE, tickets restaurant
Créez une alerte
Pour être informé rapidement des nouvelles offres, merci de préciser les critères :
Envoyez votre candidature
dès maintenant !
Créez votre compte et
envoyez votre candidature !
dès maintenant !
envoyez votre candidature !
Recherches similaires
- Job Formateur informatique
- Job Formation
- Job Saint-Brieuc
- Job Lannion
- Job Dinan
- Job Paimpol
- Job Guingamp
- Job Loudéac
- Job Perros-Guirec
- Job Rostrenen
- Job Plancoët
- Job Lamballe-Armor
- Job Formateur
- Job Chargé de formation
- Job Gestionnaire de formation
- Job Enseignant de la conduite
- Job Moniteur
- Entreprises Formation
- Stage Formation
- Entreprises Formateur informatique
- Entreprises Caouënnec-Lanvézéac
- Stage Côtes-d'Armor
- Job Logiciel
- Job Manager
- Job Nature
- Job Charge
- Job Vie
- Orange Caouënnec-Lanvézéac
- Orange Formateur informatique
- Stage Orange
{{title}}
{{message}}
{{linkLabel}}