Aller au contenu principal

Ingenieur - Ingenieure en Base de Données et Infrastructure Numerique H/F

Ministère de l'enseignement supérieur et de la recherche

  • Paris 16e - 75
  • CDD
  • Bac +5
  • Service public d'état
Lire dans l'app

Les missions du poste

Voir aussi sur le site de l'ANR : https://anr.fr/Projet-ANR-23-CE27-0008.

MISSIONS

Sous la supervision conjointe de Shueh-Ying Liao (EFEO) et Vincent Paillusson (UMR HTL), en collaboration avec les responsables SHS scientifiques du projet: Michela Bussotti (EFEO), Mariarosaria Gianninoto (Université de Montpellier) et Catherine Jami (CNRS UMR CCJ), ainsi que les collègues de l'INSA-LIRIS (Lyon) membres du projet, l'ingénieur recruté /l'ingénieure recrutée participera au développement de la base de données et des interfaces de consultation des dictionnaires manuscrits.

L'objectif principal est de créer une base de données et un site web en libre accès recensant les premiers dictionnaires manuscrits chinois-européens. Cette base de données permettra l'analyse comparative et les recherches croisées sur les dictionnaires comme le lexique qu'ils contiennent, les traductions proposées dans différentes langues européennes, leur organisation logique ainsi que leur contexte de production. La base de données est prévue pour être hébergée sur l'infrastructure Huma-Num.

ACTIVITÉS PRINCIPALES

Modélisation et développement de bases de données (65%)

- Concevoir et implémenter une base de données relationnelle/NoSQL

- Modéliser des structures lexicographiques multilingues complexes (clé, caractère chinois, prononciation, explication, synonymes, exemples, etc.)

- Développer des outils de validation et correction semi-automatique des données

- Assurer l'optimisation des performances pour un volume évolutif des données à requêter
Afficher la suite
Intégration des données HTR (20%)

- Créer des outils d'import ou de transformation des transcriptions issues d'opérations d'HTR (handwritten text recognition) aux formats XML ALTO

- Développer des analyseurs pour l'extraction et la structuration des données textuelles (par exemple au niveau de l'explication, différencier la traduction, les exemples romanisées et les gloses chinoises)

- Contribuer à l'amélioration HTR et la définition de templates pour définir la macro structure d'un dictionnaire donné

- Contribuer à la gestion de la plateforme Escriptorium du projet (application libre pour la transcription automatique des manuscrits)

- Assurer la traçabilité entre images originales et données structurées

Interfaces utilisateur et APIs (10%)

- Développer une interface web de consultation avec recherche avancée

- Créer des outils de visualisation comparative entre dictionnaires

- Implémenter une API REST

- S'appuyer sur le standard IIIF pour la visualisation d'images

- Assurer l'interopérabilité et la connexion avec des référentiels du domaine comme la China Historical Christian Database (CHCD)

Documentation et formation (5%)

- Produire une documentation technique et une documentation utilisateur complète

- Former les chercheurs aux outils de bases de données

- Participer aux ateliers méthodologiques ainsi qu'aux opérations de restitutions du projet

COMPÉTENCES

Qualifications requises :

- Master en informatique, sciences de l'information, humanités numériques, ou équivalent

- Expérience en développement de bases de données pour projets patrimoniaux/recherche

- Expertise bases de données : MySQL, BaseX/eXist-DB

- Développement web : Python (Django/Flask), JavaScript, XQuery, HTML5/CSS3, APIs REST

- Standards : XML-TEI, ALTO, IIIF, JSON-LD, Unicode

- Environnement technique : Docker, Git/GitLab, plateformes d'hébergement académique

- Langues : Français et anglais niveau professionnel

Compétences appréciées :

- Expérience du traitement de données multilingues et plateformes HTR

- Connaissances en chinois classique/moderne, latin, langues romanes

- Visualisation de données patrimoniales et infrastructures académiques (Huma-Num)

- Sensibilité aux enjeux des SHS et à la science ouverte

Ce recrutement s'inscrit dans le cadre du projet de recherche collaboratif ANR ChEDiL (Projet Projet-ANR-23-CE27-0008) coordonné par Michela Bussotti, directrice d'études de l'École française d'Extrême-Orient (EFEO), spécialiste l'histoire culturelle et de l'histoire du livre en Chine.

1 750 € nets avant impôts

Publiée le 22/10/2025 - Réf : 2025-2085061

Ingenieur - Ingenieure en Base de Données et Infrastructure Numerique H/F

Ministère de l'enseignement supérieur et de la recherche
  • Paris 16e - 75
  • CDD
Publiée le 22/10/2025 - Réf : 2025-2085061

Finalisez votre candidature

sur le site du partenaire

Créez votre compte pour postuler

sur le site du partenaire !

Ces offres pourraient aussi
vous intéresser

Nibelis recrutement
Levallois-Perret - 92
CDI
Télétravail partiel
Voir l’offre
il y a 10 jours
EURO INFORMATION recrutement
Paris 9e - 75
CDI
42 000 - 50 000 € / an
Télétravail partiel
Voir l’offre
il y a 15 jours
BPCE Infogérance & Technologies recrutement
Voir l’offre
il y a 27 jours
Voir plus d'offres
Les sites
L'emploi
  • Offres d'emploi par métier
  • Offres d'emploi par ville
  • Offres d'emploi par entreprise
  • Offres d'emploi par mots clés
L'entreprise
  • Qui sommes-nous ?
  • On recrute
  • Accès client
Les apps
Application Android (nouvelle fenêtre) Application ios (nouvelle fenêtre)
Nous suivre sur :
Informations légales CGU Politique de confidentialité Gérer les traceurs Accessibilité : non conforme Aide et contact