Description

Toujours professionnel dans mon travail. Je comprends rapidement ce qu'on attend de moi et je n'hésite jamais à poser des questions au client quand certains points ont besoin d'être éclaircis. Je fais en sorte que les échanges se passent au mieux pour que le travail attendu soit à la hauteur des attentes du client.

Je suis passionnée par l'analyse de la data. Faire parler les données me permet de mettre en évidence des problématiques mineures et majeures, des tendances significatives, d'ajouter de nouvelles variables qui vont donner de la consistance au dataframe, etc.

- Créer la base de donnée : je peux la créer en allant la récupérer sur différentes ressources grâce au Web Scraping : je vérifie toujours la fiabilité des informations et leur actualité. J'utilise aussi des bases de données pour les compléter ou inversement. Je donne plus de poids à une base de données en allant chercher des données avec du Web Scraping.

- Comment je traite les données ? : J'utilise Python, Numpy et Pandas pour comprendre et analyser la donnée, la nettoyer, lui attribuer la nature qui lui convient, traiter les données dans une phase de préprocessing

- Phase de visualisation : avec Matplotlib, Seaborn, Bokeh, je donne aux données des visualisations graphiques pour présenter les données importantes et les tendances dégagées. Je me sers aussi de PowreBi pour présenter les dataframes, si besoin.

- Modélisations : pour faire des prédictions, je maîtrise Machine Learning (Statsmodels, sklearn, scikit-learn, TensorFlow...); Actuellement, je travaille sur les prédictions sur des valeurs financières en bourse avec la problématique de trouver le meilleur modèle pour être au plus proche des valeurs réelles.

Langues

Français
Bilingue ou natif

Préférences en matière de lieu de travail

Accepte de travailler sur site

Montpellier (jusqu’à 50 km)

DataScientest.com
Data Analyst
EDUCATION & E-LEARNING
septembre 2022 - mai 2023 (9 mois)
Paris, France
Dans le cadre de la formation chez DataScientest.com, j'ai travaillé sur le jeu de données World Happiness Report (Evaluation du bonheur dans le monde) de l'organisation mondiale Gallup. C'était un projet de fin d'études.

- Extraction des données directement depuis le site de Gallup. Données sous fichier Excel et analyse dans un notebook sur Anaconda Jupyter. Partage et échange du code sur Github (Notebook https://github.com/Laurence-kyla/projet_wh/blob/main/projet_wh.ipynb)

- Etude des données : data preprocessing et cleaning : .info(), .describe(), shape, dtypes, etc. Compréhension des variables et identification de la variable cible. Gestion des valeurs manquantes .isna().sum()

- Gestion des valeurs manquantes, une partie importante à traiter avant d'approfondir les analyses. Délimiter le champ d'application de la fonction, application de la méthode 'interpolate()', création d'une boucle pour appliquer la méthode à chaque pays (Pyhton).

- Data Viz : tracer la Heatmap, l'ACP et le cercle des corrélations, tracer le pairplot.
Visualisation des données de l'évolution du bonheur par région du monde en 15 ans d'observation et Visualisation des régions du monde dans lesquelles le score du bonheur est le plus élevé dans le monde (scatterplot)
Visualisation sur une carte du monde de la répartition des pays les plus heureux et des pays les plus malheureux avec geopandas, matplotlib.colors et pycountry

- Analyse de précision et réponses à la problématique "Le bonheur est-il prédéterminé par l'environnement dans lequel nous évoluons ?" (Python, Matplotlib, Seaborn, Pandas et Numpy) :
-- Ajout de nouvelles variables pour l'année 2021 pour la région du monde la moins heureuse et pour la région du monde la plus heureuse : Taux de fertilité et Nombre d'habitants par pays
-- Tracer les graphiques démontrant que le taux de fertilité et la progression fulgurante du nombre d'habitants jouent un rôle majeur dans le faible score du bonheur.
-- Opposition du pays le plus heureux et du pays le plus malheureux dans le monde pour mettre en évidence que le bonheur est entièrement conditionné par la situation politique du pays. Plus le pays est stable et vit en paix, plus le bonheur est élevé.

- Partie Machine Learning : 1. Trouver le modèle le plus précis capable de se rapprocher des valeurs de la variable cible.
2. Trier et filtrer les données par type de pays (variable ajoutée avec du Web Scraping)
Avec Statsmodels sm et OLS, comment évoluerait le score du bonheur des pays riches, des pays émergents et des pays en développement si les valeurs de leurs variables les plus fortement corrélées à la variable cible subissaient des changements positifs ou négatifs ?
Avec ce travail de modélisation, il s'agit de mettre en évidence les points d'amélioration pour les pays qui souhaitent élever leur score du bonheur.
Python Pandas Seaborn Matplotlib Machine learning Scikit-learn Plotly Statistiques Analyse de données Data visualisation Analyse de données statistiques
Freelance
Data Analyst / Data Scientist
BANQUE & ASSURANCES
juin 2023 - juillet 2023 (2 mois)
Montpellier, France
Dans le cadre d'un projet sur les prédictions du prix des actions d'une entreprise, il s'agit de trouver le modèle en Machine Learning qui permettra de réduire le risque d'investissement.

- Extraction des valeurs des actions d'une entreprise cotée sur une période donnée depuis un site internet boursier.

- Analyse des données : data preprocessing et cleaning. Attribuer le bon type à chaque variable, supprimer les caractères spéciaux (Python, Pandas)

-Partie Machine Learning :
-- Application de Time series : décomposition des valeurs avec statsmodels.tsa.seasonal modèle additif et multiplicatif. Test de corrélation avec le Test Ad Fuller.

-- Application du modèle LSTM de Keras : Prediction sur 50 valeurs

-- Application des modèles de Regression : Linear regression et Random Forest Regressor : l'objectif est de voir les scores des métriques pour mesurer les écarts entre les valeurs réelles et les valeurs prédites.
keras Python (Programming Language) Pandas Bokeh statsmodels LSTM Random Forest Linear regression Ad fuller Machine learning Analyse de données statistiques Statistiques

Soyez le premier à recommander Laurence

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Data Analyst
Datascientest.com et les Mines de Paris
2023
250 heures de formation + 80 heures pour le projet : Programmation : Python, Pandas, Numpy, Data Quality Data Visualisation : Matplotlib, Seaborn, Boked Machine Learning : Algorithmes / Méthodes de classification et Régression, Méthodes de réduction de dimension Analyses de données : Méthodes de clustering K-means, clustering hiérarchique, Méthodes d’analyse de la data PCA, LDA, T-SNE Extraction et gestion des données : Text Mining, WebScraping BI : Power BI, Tableau, Data Modeling Database - Big Data : SQL, Data Processing, PySpark

Data Analyst

Laurence Y.

Data Analyst et PowerBI

À propos de Laurence

Expériences

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Compétences

Catégories