À propos de Laurence
Français
Bilingue ou natif
Expériences
- DataScientest.comData AnalystEDUCATION & E-LEARNINGseptembre 2022 - mai 2023 (9 mois)Paris, FranceDans le cadre de la formation chez DataScientest.com, j'ai travaillé sur le jeu de données World Happiness Report (Evaluation du bonheur dans le monde) de l'organisation mondiale Gallup. C'était un projet de fin d'études.- Extraction des données directement depuis le site de Gallup. Données sous fichier Excel et analyse dans un notebook sur Anaconda Jupyter. Partage et échange du code sur Github (Notebook https://github.com/Laurence-kyla/projet_wh/blob/main/projet_wh.ipynb)- Etude des données : data preprocessing et cleaning : .info(), .describe(), shape, dtypes, etc. Compréhension des variables et identification de la variable cible. Gestion des valeurs manquantes .isna().sum()- Gestion des valeurs manquantes, une partie importante à traiter avant d'approfondir les analyses. Délimiter le champ d'application de la fonction, application de la méthode 'interpolate()', création d'une boucle pour appliquer la méthode à chaque pays (Pyhton).- Data Viz : tracer la Heatmap, l'ACP et le cercle des corrélations, tracer le pairplot.Visualisation des données de l'évolution du bonheur par région du monde en 15 ans d'observation et Visualisation des régions du monde dans lesquelles le score du bonheur est le plus élevé dans le monde (scatterplot)Visualisation sur une carte du monde de la répartition des pays les plus heureux et des pays les plus malheureux avec geopandas, matplotlib.colors et pycountry- Analyse de précision et réponses à la problématique "Le bonheur est-il prédéterminé par l'environnement dans lequel nous évoluons ?" (Python, Matplotlib, Seaborn, Pandas et Numpy) :-- Ajout de nouvelles variables pour l'année 2021 pour la région du monde la moins heureuse et pour la région du monde la plus heureuse : Taux de fertilité et Nombre d'habitants par pays-- Tracer les graphiques démontrant que le taux de fertilité et la progression fulgurante du nombre d'habitants jouent un rôle majeur dans le faible score du bonheur.-- Opposition du pays le plus heureux et du pays le plus malheureux dans le monde pour mettre en évidence que le bonheur est entièrement conditionné par la situation politique du pays. Plus le pays est stable et vit en paix, plus le bonheur est élevé.- Partie Machine Learning : 1. Trouver le modèle le plus précis capable de se rapprocher des valeurs de la variable cible.2. Trier et filtrer les données par type de pays (variable ajoutée avec du Web Scraping)Avec Statsmodels sm et OLS, comment évoluerait le score du bonheur des pays riches, des pays émergents et des pays en développement si les valeurs de leurs variables les plus fortement corrélées à la variable cible subissaient des changements positifs ou négatifs ?Avec ce travail de modélisation, il s'agit de mettre en évidence les points d'amélioration pour les pays qui souhaitent élever leur score du bonheur.
- FreelanceData Analyst / Data ScientistBANQUE & ASSURANCESjuin 2023 - juillet 2023 (2 mois)Montpellier, FranceDans le cadre d'un projet sur les prédictions du prix des actions d'une entreprise, il s'agit de trouver le modèle en Machine Learning qui permettra de réduire le risque d'investissement.- Extraction des valeurs des actions d'une entreprise cotée sur une période donnée depuis un site internet boursier.- Analyse des données : data preprocessing et cleaning. Attribuer le bon type à chaque variable, supprimer les caractères spéciaux (Python, Pandas)-Partie Machine Learning :-- Application de Time series : décomposition des valeurs avec statsmodels.tsa.seasonal modèle additif et multiplicatif. Test de corrélation avec le Test Ad Fuller.-- Application du modèle LSTM de Keras : Prediction sur 50 valeurs-- Application des modèles de Regression : Linear regression et Random Forest Regressor : l'objectif est de voir les scores des métriques pour mesurer les écarts entre les valeurs réelles et les valeurs prédites.
Recommandations
Soyez le premier à recommander Laurence
Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Data AnalystDatascientest.com et les Mines de Paris2023250 heures de formation + 80 heures pour le projet : Programmation : Python, Pandas, Numpy, Data Quality Data Visualisation : Matplotlib, Seaborn, Boked Machine Learning : Algorithmes / Méthodes de classification et Régression, Méthodes de réduction de dimension Analyses de données : Méthodes de clustering K-means, clustering hiérarchique, Méthodes d’analyse de la data PCA, LDA, T-SNE Extraction et gestion des données : Text Mining, WebScraping BI : Power BI, Tableau, Data Modeling Database - Big Data : SQL, Data Processing, PySpark