Description

Diplômée d'une école d'ingénieur et d'un master en intelligence artificielle, j'ai 6 années d'expériences en data.

J'ai eu l'opportunité de travailler sur plusieurs problématiques Data Science, combinant différents types de données : textes, images, données structurées et séries temporelles.

Excellente maitrise des algorithmes de Machine learning, Deep Learning, et les librairies python associées telles que : Pandas, Numpy, Scikit-learn, Tensorflow, Pythorch , HuggingFace.

J'ai travaillé également sur des projets MLOps, de la phase d’expérimentation à la mise en production sur cloud, avec mise en place de de toute la pipeline ML (création d’ETL, recherche et entrainement de modèle ML , séquencement des tâches avec kedro, tests auto, docker, github , MLFlow, API Rest, docker, Pipeline CICD).

Langues

Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Arabe
Bilingue ou natif
Espagnol
Capacité professionnelle limitée

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km)

TF1
Lead Data Scientist / MLOps
PRESSE & MÉDIAS
janvier 2025 - Aujourd'hui (1 an et 5 mois)
Boulogne-Billancourt, France
Gestion de projet de Machine Learning du POC à la mise en production
Construction et entrainement de modèles Machine Learning et Deep Learning sur des données structurées et non structurées pour diverses applications telles que : La recommandation sur MyTF1 et TF1Info, amélioration du référencement SEO du site TF1Info, Analyse prédictive pour le ciblage publicitaire MyTF1...
Expérience approfondie de Snowflake pour interroger et analyser des Données Big Data
Preprocessing de données et modélisation ML sur Databricks avec du tracking via Mlflow.
Conception et planification des DAGs Airflow pour automatiser le pipeline d’entrainement des modèles.
Développement d’APIs pour exposer les modèles, utilisation de Azure DevOps pour le versioning du code, et les pipelines CI/CD incluant tests de sécurité, et de charge.
Déploiement de conteneurs dans des clusters Kubernetes pour optimiser la performance et la scalabilité des applications.
Monitoring en temps réel des modèles en production notamment les temps de réponse des algorithmes, les taux de succès, et le nombre de requêtes, accompagnée de systèmes d'alerting.
Machine learning Deep Learning preprocessing Big Data Databricks MLflow Airflow API CI/CD Azure DevOps Git Kubernetes Monitoring
Brut.
Lead Data Scientist
CINÉMA & AUDIOVISUEL
octobre 2021 - décembre 2021 (3 mois)
Paris, France
Responsable Data de Brutx : la plateforme streaming de l’entreprise Brut.
- Audit de la qualité des données existantes et sollicitation des partenaires pour des nouvelles données pertinentes et nécessaires à nos études.
- Data mining sur de gros volumes de données afin de calculer les KPIs de l'entreprise (Recrutés , abonnés, churns , revenus etc..)
- Analyse de segmentation clients
- Modèle de ML pour la prédiction du taux de churn (désabonnement) en fonction du canal d'acquisition , de la quantité de consommation sur la plateforme, la saisonnalité etc...
Modèle de NLP sur les données des questionnaires churners (analyse de sentiment, topic modeling …) pour l’amélioration du contenu Brutx et la réduction du taux de désabonnement.
Modèle de NLP pour prédire le taux d’ouverture des mails de newsletters.
Big Query Google cloud NLP Pandas Python Scikit-learn SQL Google Data Studio
Sorbonne Université
Recherche en Natural Language Processing
CENTRES DE RECHERCHE
juin 2021 - Aujourd'hui (5 ans)
Paris, France
Dans le cadre d'un projet de recherche en Data to Text à Sorbonne université, le défi était de créer un modèle de Deep Learning capable de générer des données textuelles à partir de données structurées et inversement.
Application : génération de résumés en langage naturel à partir de série temporelles / données structurées, ou extraction de chiffres clés à partir de données textuelles.
- Etudes de l’état de l’art dans le domaine du NLP et du Data to Text. Choix du modèle Transformer T5 préentrainé et adaptation de ce modèle à la tâche du Data to Text et Text to Data
- Entrainement supervisé (Transfer Learning avec HuggingFace)
- Entrainement cyclique non supervisé le modèle T5 (Transfer Learning avec HuggingFace)
- Modification de l’architecture du modèle T5 afin d’intégrer un espace latent probabiliste (Conditional Variational Autoencoders) pour contrôler la génération du texte et des données structurées
- Entrainement distribué sur plusieurs GPUs . Tracking avec MLFLOW
HuggingFace NLP Pytorch MLFLOW GitHub Bash Linux

Consulter toutes les expériences de Nada

Soyez le premier à recommander Nada

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Ingénieur Mathématiques Appliquées
Ecole Centrale de Nantes
2015
- Spécialité: Mathématiques Appliquées et Finance d'entreprise - Tronc commun: Mathématiques, Mécanique, Electronique, Physique - Cours transversaux: Management de projet, Finance, Economie, Communication...
Master Intelligence Artificielle , Systèmes, Données
Université Paris Dauphine - ENS Paris - Mines PariTech
2020
- Modèles de Machine Learning et de Deep Learning - Traitement de données et Machine learning en environnement Big Data - Computer Vision - Natural Language Processing - Apprentissage par renforcement et Recherche Arborescente de Monte Carlo - IA on the cloud : AWS (IA services et Sagemaker) - Traitement de données en streaming avec Kafka et Flink - Données NoSQL ( Neo4, MangoDB et ArangoDB) - Data visualization (Tableau , plotly, bokeh)

Nada Staouite

Lead Data Scientist / MLOps

À propos de Nada

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Compétences (44)

Catégories