Data Engineering et MLOPS
RIDCHA DATA est à la recherche d’un Data Engineering et MLOPS – Confirmé pour accompagner son client acteur majeur dans le secteur industrie.
1. Descriptif du poste
• La réalisation de segmentation et de scoring utilisant des algorithmes de machine
• learning pour les métiers autour de la vente de véhicules neufs et de l’après-vente
• La mise à disposition des scores pour nos outils de campagnes marketing CRM et média
• La mise en place de tableaux de bord pour le partage d’information
Le projet est hébergé intégralement sous Google Cloud Platform (GCP).
• Notre futur DataHero s’appuyera sur les recommandations d’architecture et de securité du client pour mettre en œuvre les traitements de données sous GCP.
• En collaboration avec l’équipe projet agile, il assurera les livraisons des traitements de données par sprint.
• Il participera au développement et à la livraison des traitements industriels de
• Machine learning conçus par les data scientists au stade de notebook.
• Il sera force de proposition pour définir la stratégie de rationalisaion /mutualisation des traitements des différents Use Case métiers et déploiement pays pour la partie ingestion, préparation des données et modèle de Machine Learning. Ceci en vue de gagner en agilité de déploiement, en facilité de maintenance et afin de rentrer dans les standards du client de ML permettant des synergies avec le pôle Data.
• Il veillera à mettre en œuvre les outils de monitoring continu de la qualité opérationnelle (Build & Run) et à atteindre le niveau de performance attendu du produit.
• Il sera également force de proposition sur la partie d’optimisation des coûts, le projet étant fortement concerné par l’enjeu financier dû aux volumes importants de données et à la complexité des traitements.
2. Livrables
• Développement et livraison de traitements industrialisés correspondant aux algorithmes de machine learning conçus dans des notebooks par les data scientists
• Mise en place des chaînes de traitement de la data, de l’ingestion à l’exposition, sur la plateforme GCP selon les préconisations du client.
• Garantie de la robustesse et performance des alimentations et traitements mis en oeuvre des Dashboards de monitoring de disponibilité, de supervision, rapports d’usage et de performance
• Résolution des anomalies sur les chaines d’alimentation et de traitement de données
• Documentation d’architecture, des traitements et de supervision mise en œuvre
• Préparation des déploiements techniques de nouveaux pays
• Résolution des non-conformités de sécurité
3. Savoir-faire
Une expérience d’au moins 5 ans en Data engineering et ML-Ops est requise dans l’environnement suivant :
• Certification Google Data Engineer indispensable
• Expérience en alimentation et traitement de données sous GCP
• Expérience en supervision, devops et ML-Ops
• Maitrise de l’industrialisation de modeles de ML sous Vertex IA
• Expérience en optimisation des performances
• Maitrise de développement en Python
• Capacité à travailler de manière créative, collaborative, adaptive et itérative dans un environnement complexe au sein d’une équipe agile
• Expérience avec les user stories JIRA et la documentation sous CONFLUENCE
• Anglais courant