You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Nada StaouiteNS

Nada Staouite

Lead Data Scientist / MLOps

870 €/jour
Paris, FR
8-15 ans

Délai de réponse moyen : 1h

À propos de Nada

Diplômée d'une école d'ingénieur et d'un master en intelligence artificielle, j'ai 6 années d'expériences en data.
J'ai eu l'opportunité de travailler sur plusieurs problématiques Data Science, combinant différents types de données : textes, images, données structurées et séries temporelles.
Excellente maitrise des algorithmes de Machine learning, Deep Learning, et les librairies python associées telles que : Pandas, Numpy, Scikit-learn, Tensorflow, Pythorch , HuggingFace.
J'ai travaillé également sur des projets MLOps, de la phase d’expérimentation à la mise en production sur cloud, avec mise en place de de toute la pipeline ML (création d’ETL, recherche et entrainement de modèle ML , séquencement des tâches avec kedro, tests auto, docker, github , MLFlow, API Rest, docker, Pipeline CICD).
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

  • Arabe

    Bilingue ou natif

  • Espagnol

    Capacité professionnelle limitée

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • TF1
    Lead Data Scientist / MLOps
    PRESSE & MÉDIAS
    janvier 2025 - Aujourd'hui (1 an et 5 mois)
    Boulogne-Billancourt, France
    • Gestion de projet de Machine Learning du POC à la mise en production
    • Construction et entrainement de modèles Machine Learning et Deep Learning sur des données structurées et non structurées pour diverses applications telles que : La recommandation sur MyTF1 et TF1Info, amélioration du référencement SEO du site TF1Info, Analyse prédictive pour le ciblage publicitaire MyTF1...
    • Expérience approfondie de Snowflake pour interroger et analyser des Données Big Data
    • Preprocessing de données et modélisation ML sur Databricks avec du tracking via Mlflow.
    • Conception et planification des DAGs Airflow pour automatiser le pipeline d’entrainement des modèles.
    • Développement d’APIs pour exposer les modèles, utilisation de Azure DevOps pour le versioning du code, et les pipelines CI/CD incluant tests de sécurité, et de charge.
    • Déploiement de conteneurs dans des clusters Kubernetes pour optimiser la performance et la scalabilité des applications.
    • Monitoring en temps réel des modèles en production notamment les temps de réponse des algorithmes, les taux de succès, et le nombre de requêtes, accompagnée de systèmes d'alerting.
    Machine learning Deep Learning preprocessing Big Data Databricks MLflow Airflow API CI/CD Azure DevOps Git Kubernetes Monitoring
  • Brut.
    Lead Data Scientist
    CINÉMA & AUDIOVISUEL
    octobre 2021 - décembre 2021 (3 mois)
    Paris, France
    Responsable Data de Brutx : la plateforme streaming de l’entreprise Brut.
    - Audit de la qualité des données existantes et sollicitation des partenaires pour des nouvelles données pertinentes et nécessaires à nos études.
    - Data mining sur de gros volumes de données afin de calculer les KPIs de l'entreprise (Recrutés , abonnés, churns , revenus etc..)
    - Analyse de segmentation clients
    - Modèle de ML pour la prédiction du taux de churn (désabonnement) en fonction du canal d'acquisition , de la quantité de consommation sur la plateforme, la saisonnalité etc...
    Modèle de NLP sur les données des questionnaires churners (analyse de sentiment, topic modeling …) pour l’amélioration du contenu Brutx et la réduction du taux de désabonnement.
    Modèle de NLP pour prédire le taux d’ouverture des mails de newsletters.
    Big Query Google cloud NLP Pandas Python Scikit-learn SQL Google Data Studio
  • Sorbonne Université
    Recherche en Natural Language Processing
    CENTRES DE RECHERCHE
    juin 2021 - Aujourd'hui (5 ans)
    Paris, France
    Dans le cadre d'un projet de recherche en Data to Text à Sorbonne université, le défi était de créer un modèle de Deep Learning capable de générer des données textuelles à partir de données structurées et inversement.
    Application : génération de résumés en langage naturel à partir de série temporelles / données structurées, ou extraction de chiffres clés à partir de données textuelles.
    - Etudes de l’état de l’art dans le domaine du NLP et du Data to Text. Choix du modèle Transformer T5 préentrainé et adaptation de ce modèle à la tâche du Data to Text et Text to Data
    - Entrainement supervisé (Transfer Learning avec HuggingFace)
    - Entrainement cyclique non supervisé le modèle T5 (Transfer Learning avec HuggingFace)
    - Modification de l’architecture du modèle T5 afin d’intégrer un espace latent probabiliste (Conditional Variational Autoencoders) pour contrôler la génération du texte et des données structurées
    - Entrainement distribué sur plusieurs GPUs . Tracking avec MLFLOW
    HuggingFace NLP Pytorch MLFLOW GitHub Bash Linux

Recommandations

Soyez le premier à recommander Nada

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Ingénieur Mathématiques Appliquées
    Ecole Centrale de Nantes
    2015
    - Spécialité: Mathématiques Appliquées et Finance d'entreprise - Tronc commun: Mathématiques, Mécanique, Electronique, Physique - Cours transversaux: Management de projet, Finance, Economie, Communication...
  • Master Intelligence Artificielle , Systèmes, Données
    Université Paris Dauphine - ENS Paris - Mines PariTech
    2020
    - Modèles de Machine Learning et de Deep Learning - Traitement de données et Machine learning en environnement Big Data - Computer Vision - Natural Language Processing - Apprentissage par renforcement et Recherche Arborescente de Monte Carlo - IA on the cloud : AWS (IA services et Sagemaker) - Traitement de données en streaming avec Kafka et Flink - Données NoSQL ( Neo4, MangoDB et ArangoDB) - Data visualization (Tableau , plotly, bokeh)

Compétences (44)

Catégories