Tech Lead Data Platform H/F

Mis à jour le
15/04/2022
Recruteur
SNUM du SG Bercy
Lieu
4 Avenue Montaigne, Noisy-le-Grand, Île-de-France, France
Types de contrat
Fonctionnaire, Contractuel
Expérience requise

3 ans

Mission

Rejoignez les Finances publiques afin de mettre au service de l'équipe Data Engineering vos compétences et expertises technologiques !

Équipe

L’équipe Pôle Données a notamment reçu pour mission de réaliser :

  • La mise en place d’une infrastructure de « Lac de données » ayant vocation à recueillir l’essentiel des données métier des Finances publiques. Ce lac permettra de croiser les données entre elles, de réaliser des traitements indépendamment des applicatifs de gestion, d’établir des mesures et statistiques inédites

  • La mise en œuvre d’une politique de démocratisation de la donnée auprès des bureaux métier, par la mise à disposition d’outils de visualisation de données

  • La mise en place d’une gouvernance de la donnée pour capitaliser sur l’utilisation et l’administration d’un dictionnaire de données, afin de garantir la qualité des données utilisées dans les analyses, ainsi que la compréhension de ces mêmes données

  • La gestion de la stratégie Open Data des Finances publiques :

    • en étant, d’une part, le guichet d’entrée principal pour les demandes d’accès aux données, la gestion des relations avec les partenaires externes, ainsi que la prescription en matière de construction d’API et sa promotion
    • et d’autre part, en animant le réseau des services des Finances publiques en charge de la publication des données publiques et en assurant la promotion sur les sites Internet dédiés (impots.gouv, data.gouv et data.economie.gouv)
  • Le pilotage transverse des projets axés sur la valorisation des données, via des techniques de Data Science pour les métiers des Finances publiques.

Contexte

Les Finances publiques ont mis en œuvre une infrastructure de « Lac de données », open-source, basée sur la distribution Hortonworks.

Elles en ont défini l’architecture technique et logicielle, et réalisé l’intégralité de sa mise en œuvre.

L’offre du « lac de données » permet de :

  • Faciliter et centraliser l’accès aux données pour optimiser leur valorisation
  • Développer les mécanismes de croisements de données
  • Valoriser les données au travers du service de Dataviz
  • Promouvoir en facilitant les usages de la datascience.

L’infrastructure on-premise de la DTNum comprend :

  • Une infrastructure classique
  • Un cloud interministériel nommé Nubo reposant sur Openstack

La valorisation des travaux de Data Science et de Data Engineering sera portée par un enrichissement et évolution d’une plateforme permettant de répondre aux besoins futurs suivants :

  • Data Visualisation sous Tableau Software (montée à l’échelle à développer)
  • Data Transformation : transport, préparation et partage de données sur des volumétries massives
  • Data Science : proposer un environnement comprenant une chaîne de MLOps (notebook serverless, CI/CD, feature engineering, feature store, hyper parameter tuning, model versionning, model serving)
  • Data Gouvernance : mise en œuvre de services autour de la sécurité et gouvernance des données (dictionnaire de données, anonymisation, etc).

Avantages

Les + de ce poste : télétravail, missions diversifiées et intéressantes.

Votre rôle

Missions – Activités au sein d’une équipe de Data Engineering

Lead d’une équipe technique :

  • Encadrement technique d’une équipe dédiée
  • Suivi et recrutement de l’équipe
  • Animation et montée en compétence de l’équipe (code review, best practices, retex, recommandations de formation, certifications, veille technologique

Pilotage des activités autour de la plateforme :

  • Conseils et assistance des métiers, MOA et MOE dans les phases projets d’utilisation de la plateforme
  • Cadrage des projets et pilotage des releases auprès des équipes de delivery
  • Communication sur l’offre de service et réalisation de la documentation interne / externe de la plateforme
  • Reporting de l’activité et des évolutions de la plateforme
  • Animation d’une communauté autour de la plateforme data

Assurer l’évolution technologique du lac de données :

  • Assurer la veille technologique en relation avec les communautés data
  • Accompagner les projets de visualisation de données et de Data Science
  • Développer et enrichir l’offre de service du lac de données via la définition de composants fonctionnels
  • Définir une roadmap fonctionnelle et technologique
  • Assurer le maintien et reporting d’un backlog.

Votre profil

  • Vous êtes expérimenté sur les technologies Nosql et Big Data
  • Vous êtes compétent sur les technologies Python, Scala, Spark, Hortonworks, Tensorflow, TFX, Kubeflow, Apache Beam
  • Vous maîtrisez également les technologies Devops telles que Terraform, Ansible, Kubernetes, Docker, Openstack, et les technologies API
  • Vous avez déjà participé à l’industrialisation complète d’une chaîne de Machine Learning (MLOps)
  • Vous avez l’ambition de développer une plateforme dans son intégralité est un projet motivant
  • Vous avez de grandes capacités d’organisation, de communication et de rédaction et vous êtes habitués à animer divers travaux en équipe en parallèle, avec ou sans adhérence majeure
  • Vous avez des très bonnes qualités humaines : en faisant partie d’une équipe transversale, vous serez amené à dialoguer en permanence avec les différents bureaux du Service des Systèmes d’Information
  • Vous êtes autonome, transparent et savez remonter de manière synthétique les activités de votre équipe, vers les personnes concernées par ces informations.

Conditions particulières
du poste

Ouvert aux contractuels - Ouvert aux fonctionnaires - Niveau cadre

En outre, vous aurez la possibilité de vous inscrire dans un dispositif d’horaires variables sur la base de 5 jours à temps complet.

Envoyez vos questions à :
Xuan-Son NGUYEN Responsable de l’équipe Data Engineeringxuan-son.nguyen@dgfip.finances.gouv.fr
Date Limite :
03/06/2022
Processus de recrutement :
  • Pour les candidats non fonctionnaires, le recrutement sera établi dans le cadre d’un CDD de 3 ans régi par l’article 4-2 de la loi n° 84-16 du 11 janvier 1984 modifiée.

  • Pour les candidats fonctionnaires, le recrutement sera effectué dans le cadre d'un détachement ou en PNA à équivalence de grade avec celui détenu dans l'administration d'origine et à l'échelon comportant un indice égal ou immédiatement supérieur à celui détenu précédemment.

Référence interne :

CL20I6RL900012666I50OVW1O