Stage en Data-Science F/H F/H

EDF
Postée il y a 8 jours

Les missions du poste

Le CSC Data Science & IA de la DSIN d’EDF travaille sur les données de la branche commerciale d'EDF, et en particulier sur les données structurées du marché des clients particuliers.

Ces données sont utilisées - entre autres - pour la construction de scores à destination d'une utilisation par la direction marketing et expérience clients.

Le CSC Data Science & IA contribue à un projet de refonte de certains scores historiques en veillant au respect de la Réglementation Générale de Protection des Données. Dans ce cadre, un nouveau score sera bientôt finalisé et validé par les instances internes. Une fois déployé, nous aurons besoin de superviser ce score pour suivre sa qualité dans le temps et détecter d'éventuelles dérives ou baisses de performance.

Le stage proposé s’inscrit dans ce projet et devra contribuer à la mise en place de la supervision de cet algorithme sur :

- la partie données : qualité, dérive (data drift), outliers
- la partie liée au modèle : dérive (concept drift), configuration
- et sur la partie des résultats : évaluation, dérive
Des méthodes capitalisées existent déjà en interne.

Il faudra se questionner sur les éléments pertinents à suivre (surveiller la distribution des variables, l'apparition / la disparition de modalités, la performance statistique du modèle, etc). La R&D d'EDF travaille en lien étroit avec notre équipe sur ce score et pourra nous appuyer également sur ce sujet de supervision.

Ce sujet pourra évoluer selon les besoins au moment du début du stage ou selon la vitesse d'avancement sur le sujet. Ce qui sera développé dans le cadre du stage pourra alimenter le projet de Capitalisation en interne de l'équipe.

Nous recherchons un stagiaire motivé, compétent en python et sql, rigoureux sur ce qu'il développe, ouvert pour travailler en équipe, et curieux de statistiques.



• De formation Universitaire ou Ecole d’ingénieur,
• Expérience dans des projets (universitaire ou stages précédents) de Data Science serait appréciée
• Maîtrise de Python (numpy, pandas, sklearn) et/ou R (data.table ou au moins dplyr), SQL et GIT (add, commit, pull, push) a minima. Serait apprécié une connaissance de Docker en complément
• Maitrise de la Modélisation Machine Learning et connaissances en Statistiques
• Autonomie, rigueur, force de proposition accompagnées d’un bon esprit de synthèse. Vous aimez le travail en équipe et êtes doté (e) d’un bon sens du relationnel



Lieu : Colombes
Contrat : Stage

Les offres similaires

Architecte Safe - Chef de Projet IT H/F

Colombes
CDI
Télétravail partiel
EDF
Postée il y a 16 jours

Gestionnaire du Parc Véhicules et Achats H/F

Colombes
CDI
Sinclair Ressources
Postée il y a 52 jours

Gestionnaire du Parc de Véhicules et des Achats H/F

Colombes
CDI
ENTREPOSE ECHAFAUDAGES
Postée il y a 58 jours
Partager l'offre à un ami
Accueil / Emploi / Emploi Colombes / Emploi