You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Khalil SagoumiKS

Khalil Sagoumi

Data Scientist | ML Engineer | Python | GenAI

490 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Khalil

Ingénieur en Science de la donnée et Statistique, diplômé de l'Ecole Supérieure d'Ingénieur Léonard de Vinci (majeure Data & Intelligence Artificielle). Fort d'une expérience de 4 ans en tant que Data Scientist/ML Engineer d'abord au sein d'Orange puis au SAMU centre 15 des Yvelines (Hôpital André Mignot), je serais heureux de vous accompagner dans vos projets, de la simple exploration de données à la construction de modèles complexes.


Technologies et frameworks

Langage de programmation : Python, PySpark, C, C++, R, SQL
Data Science / ML : Python, PyTorch, TensorFlow, Spark, Elasticsearch, Lightning, ClearML, OpenCV, Scikit-learn, LlamaIndex, LangChain, NEO4J, Multiprocessing, NumPy, SciPy, Pandas, Matplotlib, Selenium, AutoML, H2O, Flask API
Software / Cloud : Git, Azure, GCP, Docker, Kubernetes, Jupyter, VSCode, Databricks
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Paris (jusqu’à 30 km)

Expériences

  • Milhano SAS
    Data scientist ML Engineer
    LUXE
    novembre 2024 - avril 2025 (5 mois)
    Paris, France
    - Développement d'un chatbot IA (RAG) enrichi de données produits et destinés aux vendeurs, qui permet de fournir
    instantanément un descriptif détaillé d'articles via une API web (FastAPI) (Composition, types de cuirs, caractéristiques)
    - Développement d'un pipeline d'enrichissement de données en extrayant les champs clés de factures avec Qwen 2.5 vLLM,
    traitement avec Polars et injection dans une base DuckDB
    - Création de dashboards qui analysent les ventes en fonction des heures, des saisons et des produits achetés
    (Power BI)
    RAG FastAPI LLM DuckDB CAG
  • SAMU 78
    Data Scientist / ML Engineer
    SANTÉ & BIEN-ÊTRE
    décembre 2022 - juillet 2024 (1 an et 8 mois)
    Le Chesnay, France
    Définition de la stratégie de valorisation de la donnée et mise en place des outils de
    traitement de la donnée avec la direction du SAMU (Gouvernance des données)
    • Mise en place de la nouvelle architecture cloud de l’entrepôt de donnée avec GCP et
    migration des données (Oracle, BigQuery)
    • Création d’une pipeline de traitement de données médicales avec anonymisation afin de
    développer un algorithme permettant de prédire les phénomènes de saisonnalité de
    certaines pathologies (grippes, bronchiolite, pathologies psychiatriques) pour adapter les
    ressources médicales (DataFlow, Times Series, LSTM, Gradient Boosting)
    • Extraction, transformation et chargement des données issues des rapports médicaux de
    régulation afin de nettoyer, fiabiliser et organiser cette donnée pour la construction des
    études statistiques
    • Construction d’algorithmes afin de clustériser les phénotypes de parcours de soins
    et de prédire les éventuelles réhospitalisations (Partitioning Around Medoids – PAM,
    Python)
    • Création et mise en production de dashboards qui analysent la répartition des appels par
    pathologies le département des Yvelines (Tableau /Power BI)
    Cloud GCP Python Machine learning NLP Git Github Actions CI/CD Docker
  • Orange SA
    Data Scientist
    TÉLÉCOMMUNICATIONS
    octobre 2020 - octobre 2022 (2 ans)
    Paris, France
    • Mise en place de requête HSQL afin de traiter et analyser la donnée du Hub Data (Apache Hive, Hadoop)
    • Optimisation des pipelines de données pour réduire les coûts (Airflow)
    • Développement d’un RNN (LSTM) afin de détecter les incidents et les dysfonctionnements sur les domaines techniques (IoT, Roaming et Offres
    WholeSale)
    • Création de KPI et de Dashboard d’exploitation (Tableau Software, Grafana)
    • Automatisation des tableaux de bord sur la donnée mobile (Qlik Sense)

Recommandations

Soyez le premier à recommander Khalil

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Ingénieur généraliste
    ESILV
    2022
    Machine Learning, Deep Learning, NLP, NoSQL, Python for Data, DataViz, Statistique de la donnée, Base de données et interopérabilité, Probabilités numériques, Statistique inférentielle, Optimisation et Recherche Opérationnelle, Cloud and virtualization techniques, Graph and minning Soft Skills : Savoir vendre ses idées, Team Building, méthode Agile et Design Thinking
  • Classe préparatoire MPSI/MP
    Lycée Jeanne d'Albret
    2019

Compétences (34)

Catégories