Lead Big Data H/F

Mis à jour le
15/04/2022
Recruteur
SNUM du SG Bercy
Lieu
4 Avenue Montaigne, Noisy-le-Grand, Île-de-France, France
Types de contrat
Fonctionnaire, Contractuel
Expérience requise

3 ans

Mission

Rejoignez les Finances publiques afin de mettre au service de l'équipe Pôle Données vos qualités, compétences et expertises technologiques !

Équipe

L’équipe Pôle Données a notamment reçu pour mission de réaliser :

  • La mise en place d’une infrastructure de « Lac de données » ayant vocation à recueillir l’essentiel des données métier des Finances publiques. Ce lac permettra de croiser les données entre elles, de réaliser des traitements indépendamment des applicatifs de gestion, d’établir des mesures et statistiques inédites

  • La mise en œuvre d’une politique de démocratisation de la donnée auprès des bureaux métier, par la mise à disposition d’outils de visualisation de données

  • La mise en place d’une gouvernance de la donnée pour capitaliser sur l’utilisation et l’administration d’un dictionnaire de données, afin de garantir la qualité des données utilisées dans les analyses, ainsi que la compréhension de ces mêmes données

  • La gestion de la stratégie Open Data des Finances publiques :

    • en étant, d’une part, le guichet d’entrée principal pour les demandes d’accès aux données, la gestion des relations avec les partenaires externes, ainsi que la prescription en matière de construction d’API et sa promotion
    • et d’autre part, en animant le réseau des services des Finances publiques en charge de la publication des données publiques et en assurant la promotion sur les sites Internet dédiés (impots.gouv, data.gouv et data.economie.gouv).
  • Le pilotage transverse des projets axés sur la valorisation des données, via des techniques de Data Science pour les métiers des Finances publiques.

Contexte

Les Finances publiques ont mis en œuvre une infrastructure de « Lac de données », open-source, basée sur la distribution Hortonworks. Elles en ont défini l’architecture technique et logicielle, et réalisé l’intégralité de sa mise en œuvre.

Cette offre d’infrastructure permet de :

  • Faciliter et centraliser l’accès aux données pour optimiser leur valorisation
  • Favoriser la réutilisation et le partage des données entre services des Finances publiques (données internes, données des partenaires) et accélérer notamment l’Open Data
  • Développer les mécanismes de croisements de données (décloisonner les info centres spécialisés)
  • Valoriser les données issues des applications de gestion ou provenant des partenaires des Finances publiques
  • Promouvoir en facilitant les usages de la Data Science.

La valorisation des travaux de Data Science et de Data Engineering sera portée par une équipe d’experts, en visualisation de données en contact direct avec les bureaux métier.

Avantages

Les + de ce poste : télétravail, missions diversifiées et intéressantes.

Votre rôle

Missions – Activités au sein d’une équipe de Data Engineering :

Lead de l’équipe technique :

  • Encadrement technique des data engineers
  • Suivi et recrutement des data engineers (internes et prestataires)
  • Animation et montée en compétence de l’équipe (code review, best practices, retex, recommandations de formation, certifications, veille technologique)
  • Définition d’une architecture de données (logique et technique)
  • Définition de template de projets Data

Pilotage des activités autour du lac de données :

  • Pilotage des projets d’alimentation du « lac de données » (20+ applications à venir)
  • Conseils et assistance des métiers, MOA et MOE dans les phases projets d’alimentation du « lac de données »
  • Cadrage des projets d’alimentation du « lac de données »
  • Pilotage des releases auprès des équipes de delivery
  • Communication sur l’offre de service du lac de données
  • Assurer la documentation interne et externe du lac de données
  • Reporting de l’activité et des projets sur le lac de données
  • Animer une communauté autour du Big Data

Assurer l’évolution technologique du lac de données :

  • Veille technologique en relation avec les communautés data
  • Accompagnement des projets de visualisation de données et de data science
  • En collaboration avec l’équipe data gouvernance, assurer une gouvernance des données dans le lac de données
  • Développer et enrichir l’offre de service du lac de données via la définition de composants fonctionnels

Votre profil

  • Vous êtes expérimenté sur les technologies Nosql ou Big Data
  • Vous êtes compétent sur les technologies Python, R Shiny, Scala, Spark, Hortonworks. Idéalement, vous connaissez également Kubernetes, Docker, Openstack, et les technologies API
  • Vous connaissez les principes de modélisation décisionnelle, d’organisation et d’utilisation d’un « lac de données », ainsi que la préparation et mise en qualité de données. Vous êtes également acculturé à la Data Science et machine learning
  • Vous avez de grandes capacités d’organisation, de communication et de rédaction et vous êtes habitués à animer divers travaux en équipe en parallèle, avec ou sans adhérence majeure
  • Vous avez des très bonnes qualités humaines, en faisant partie d’une équipe transversale, vous serez amené à dialoguer en permanence avec les différents bureaux du Service des Systèmes d’Information
  • Vous êtes autonome, transparent et savez remonter de manière synthétique les activités de votre équipe, vers les personnes concernées par ces informations.

Conditions particulières
du poste

Ouvert aux contractuels - Ouvert aux fonctionnaires - Niveau cadre

En outre, vous aurez la possibilité de vous inscrire dans un dispositif d’horaires variables sur la base de 5 jours à temps complet.

Envoyez vos questions à :
Xuan-Son NGUYEN Responsable de l’équipe Data Engineeringxuan-son.nguyen@dgfip.finances.gouv.fr
Date Limite :
03/06/2022
Processus de recrutement :
  • Pour les candidats non fonctionnaires, le recrutement sera établi dans le cadre d’un CDD de 3 ans régi par l’article 4-2 de la loi n° 84-16 du 11 janvier 1984 modifiée.

  • Pour les candidats fonctionnaires, le recrutement sera effectué dans le cadre d'un détachement ou en PNA à équivalence de grade avec celui détenu dans l'administration d'origine et à l'échelon comportant un indice égal ou immédiatement supérieur à celui détenu précédemment.

Référence interne :

CL20IFH2E00022666O7VT1VW6