Data Scientist F/H

CDI
Poste à pourvoir immédiatement
Le Kremlin-Bicêtre, Île-de-France, France
Détenir au moins un bac + 5 ou école d’ingénieur
Études et développement informatique
Expérience pro : 0 à 5 ans
1930 € à 2 790€ mensuel net
28 900€ à 41 700€ annuel brut
(selon expérience)

Descriptif de l’offre

La DGNum (Direction Générale du Numérique et des systèmes d’information) est l’organisme de gouvernance des systèmes d’information du ministère en charge de la transformation numérique des armées.

Le CASID, sous l’autorité fonctionnelle de la DGNum, est un centre d’expertise en architecture SI et de services numériques. Ses activités sont réparties entre une division « Architecture d’entreprise » située au Kremlin-Bicêtre, et le SAND (Service d’appui au numérique et au digital) situé à Bruz.  

Grâce aux données qu'ils collectent et exploitent, les systèmes décisionnels sont de plus en plus sollicités, et ce, sur des sujets toujours plus opérationnels. Déjà au cœur du pilotage de l'activité des administrations et de l'amélioration continue des processus, ils interviennent désormais directement sur la Qualité de l'expérience de nos clients internes et la supériorité opérationnelle de nos forces. Une des clés de notre réussite est la gestion toujours plus efficace des volumes de données que nous avons à disposition. Pour cela dans le cadre de la transformation numérique du ministère des armées, nous nous sommes dotés d'une plateforme d’exposition et d’ouverture des données composée d’un Data Lake associé à un module interne d’OpenDATA.

Affecté au sein du département « Management des données » de la division architecture d’entreprise ,vous serez un acteur de la transformation numérique du ministère des armées.

Dans le cadre de votre activité au sein du CASID, vous serez amené à :

  • Participer à l’installation, le paramétrage, l’exploitation des environnements ;
  • Collecter et formaliser les besoins de nos clients internes ;
  • Analyser les données à disposition dans nos puits de données opérationnels ;
  • Modéliser les tables Hives/Impala dans notre environnement Hadoop ;
  • Développer les modes d'alimentation de notre entrepôt de données (Kafka/Spark/Hive/Python) ;
  • Indexer, présenter les données mise à disposition à nos clients internes (ELASTICSEARCH/KIBANA/ LOGSTASH/BEATS…) ;
  • Décrire les données dans notre outil de gestion de la qualité de données (Suite IBM Infosphere) ;
  • Participer aux réunions de suivi et rédaction de comptes-rendus et documentations des développements ;
  • Participer à l’accompagnement et la formation des équipes souhaitant bénéficier des services de la plateforme.

Profil recherché

Vous êtes organisé, méthodique, rigoureux et possédez une grande capacité à travailler en équipe tout en étant autonome.

Vous avez une excellente connaissance du numérique et une expertise dans le domaine informatique.

Vous disposez d’un diplôme de niveau I (BAC+5) dans le domaine informatique ainsi qu’une expérience dans l'exploitation et l'administration des Systèmes d'Information. 

Vous faites preuve d’une première expérience réussie en stage ou en alternance et vous recherchez un emploi vous permettant d'évoluer dans un environnement technologique et fonctionnel très riche laissant une part importante à l’autonomie et à la prise d’initiative et de monter en compétences sur les enjeux BI/Big Data et la gestion de projets data centrés.

Compétences souhaitées/développées : Java, SQL, Hadoop, Hive, Spark, Stack Elastic, Python.

Process de recrutement

  • Si votre candidature est présélectionnée, vous serez contacté par téléphone pour apprécier vos attentes et motivations.
  • Si vous êtes sélectionné après cette première étape, vous serez reçu en entretien par l’employeur et éventuellement le service des ressources humaines.
  • Vous serez à l’issue de cet entretien informé par l’employeur des suites données à votre candidature.

Référence : 013L009232