À propos de Rabah
- •Databricks Certified Data Engineer Associate
- •AWS Cloud Practitioner Certification
Français
Bilingue ou natif
Anglais
Bilingue ou natif
Arabe
Bilingue ou natif
Japonais
Capacité professionnelle limitée
Expériences
- CodeBusters: missions chez EngieData EngineerENERGIEmai 2023 - Aujourd'hui (3 ans et 1 mois)Paris, FranceConception et déploiement de pipelines de données pour l'analyse de consommation énergétique.
- •Développement de solutions ETL personnalisées avec Databricks et AWS
- •Migration de pipelines Dataiku vers Delta Lake
- •Mise en place d'ingestion quotidienne avec Autoloader
- •Optimisation des jobs Spark pour réduire les coûts de traitement
- •Automatisation des déploiements avec Terraform et CI/CD
- CodeBusters: missions chez AXA IMData EngineerBANQUE & ASSURANCESmai 2022 - mai 2023 (1 an)Paris, FranceCette mission fait partie d'un projet de création et maintenance d'un Datalake visant à faciliter les investissements durables.Ingestion : Mise en place de pipelines d'ingestion de données à partir d'APIs et de serveurs FTP vers Azure Gen2 Datalake, dans des formats tels que CSV, Parquet, etc. (Azure Data Factory).Transformation : À partir des données brutes dans le Datalake, transformation des fichiers bruts en tables delta. Plusieurs opérations de transformation sont effectuées, allant du nettoyage au calcul de KPI (par exemple, déterminer si un émetteur de titres est conforme aux émissions de GES) (Spark).Distribution : Cascade des données brutes vers différentes parties du système financier : titres, obligations, fonds communs de placement, etc. Cette cascade de données est gérée par le biais de plusieurs jobs orchestrés organisés via Azure Data Factory.Technologies utilisées : Scala, Python, Spark, Azure : DataLake Gen2, Azure Data Factory, Azure DevOps.
- YanportData ScientistIMMOBILIERseptembre 2019 - septembre 2021 (2 ans)Levallois-Perret, FranceDéveloppement de pipelines de données immobilières et de modèles ML de tarification.Scraping de données de portails immobilliersNettoyage et détection de valeurs aberrantes dans les données pour garantir leur qualité.Ingestion et stockage des données dans ElasticSearch pour une gestion efficace des données.Generation de rapports visualisables sous KibanaEn collaboration avec des Data Scientist; modélisation, teste et mise en production de modèles de Machine Learning (arbres de décisions avec technique de boosting - Gradient Boosting Random Forests).“Fine-tuning" de l’algorithme augmentant la précision de 90 à 96%
Recommandations
Soyez le premier à recommander Rabah
Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Master of Data ScienceESGI2021Master Big Data et IA, Ingénierie informatique
- Licence, InformatiqueUniversité Paris Descartes2018Licence, Informatique
Certifications
- Databricks Certified Data Engineer AssociateDatabricks
- AWS Cloud Practitioner CertificationAWS