votre rôle
Au sein du train SAFe IAC (Infra-as-Code) qui a pour objectif de délivrer des solutions d’Infrastructures As code IT pour l’ensemble des projets de DTSI d’Orange France, le train IAC a pour ambition de mettre en place une solution de Data Mesh afin de faciliter la collecte, la transformation et le stockage des données utiles dans un environnement hétérogène. Vous aurez pour mission de mettre en place la collecte et la mise à disposition des données.
Vous aurez également la charge d’industrialiser et mettre en production des traitements sur les données(par exemple : mise à disposition de tableaux de bord, intégration de
modèles statistiques) en lien avec les équipes métiers et les équipes qui les analysent.
En tant que développeur, vos activités principales seront de :
- Accompagner le Technical Product Owner pour recueillir les
besoins métiers des différentes équipes demandeuses et utilisatrices de solutions de collecte et stockage de la donnée.
- Développer les solutions techniques de collecte de la donnée via des API.
- Développer des solutions techniques de stockage de la donnée (Hadoop).
- Réaliser les tests unitaires et d’intégration.
- Mettre en place et maintenir les batchs, c’est-à-dire les automatisations d’une série de traitements
- Industrialiser et automatiser le nettoyage de la donnée selon les spécifications retenues.
- Gérer, maintenir et documenter de multiples bases de données (via l’importation de données externes en open data ou de données internes par exemple).
- Gérer le cycle de vie de la donnée conformément aux directives inscrites dans le RGPD.
- Assurer le suivi de production et la maintenance.
- Assurer une veille technologique sur les outils big data.
- Écrire la documentation relative aux bases de données (règles de gestion, dictionnaire des variables…)
votre profil
De formation Bac +5 (école d'ingénieurs ou équivalent universitaire), vous possédez une expérience significative de 7 ans ou plus en tant que Data Engineer
Compétences techniques:
Maitrise des bases de données et gestion de bases de données (SQL/NoSQL)
Maîtrise de langages de programmation (Python C++, Scala, Java, …)
Connaissance d’un outil de gestion de flux (Kafka, Flink…)
Maîtrise les méthodes de développement agile
Connaissance de la réglementation concernant les données personnelles et des principes de cybersécurité
Maîtrise des systèmes d’exploitation (Unix, Windows…)
Connaissance des solutions de manipulation des données ETL/LET
Esprit d'équipe et aptitude à travailler dans un environnement agile.
contrat
CDI
Technopolis - Maroc