You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Laurence Y.LY

Laurence Y.

Data Analyst et PowerBI

280 €/jour
Montpellier, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Laurence

Toujours professionnel dans mon travail. Je comprends rapidement ce qu'on attend de moi et je n'hésite jamais à poser des questions au client quand certains points ont besoin d'être éclaircis. Je fais en sorte que les échanges se passent au mieux pour que le travail attendu soit à la hauteur des attentes du client.

Je suis passionnée par l'analyse de la data. Faire parler les données me permet de mettre en évidence des problématiques mineures et majeures, des tendances significatives, d'ajouter de nouvelles variables qui vont donner de la consistance au dataframe, etc.

- Créer la base de donnée : je peux la créer en allant la récupérer sur différentes ressources grâce au Web Scraping : je vérifie toujours la fiabilité des informations et leur actualité. J'utilise aussi des bases de données pour les compléter ou inversement. Je donne plus de poids à une base de données en allant chercher des données avec du Web Scraping.
- Comment je traite les données ? : J'utilise Python, Numpy et Pandas pour comprendre et analyser la donnée, la nettoyer, lui attribuer la nature qui lui convient, traiter les données dans une phase de préprocessing

- Phase de visualisation : avec Matplotlib, Seaborn, Bokeh, je donne aux données des visualisations graphiques pour présenter les données importantes et les tendances dégagées. Je me sers aussi de PowreBi pour présenter les dataframes, si besoin.

- Modélisations : pour faire des prédictions, je maîtrise Machine Learning (Statsmodels, sklearn, scikit-learn, TensorFlow...); Actuellement, je travaille sur les prédictions sur des valeurs financières en bourse avec la problématique de trouver le meilleur modèle pour être au plus proche des valeurs réelles.
  • Français

    Bilingue ou natif

Accepte de travailler sur site
Montpellier (jusqu’à 50 km)

Expériences

  • DataScientest.com
    Data Analyst
    EDUCATION & E-LEARNING
    septembre 2022 - mai 2023 (9 mois)
    Paris, France
    Dans le cadre de la formation chez DataScientest.com, j'ai travaillé sur le jeu de données World Happiness Report (Evaluation du bonheur dans le monde) de l'organisation mondiale Gallup. C'était un projet de fin d'études.

    - Extraction des données directement depuis le site de Gallup. Données sous fichier Excel et analyse dans un notebook sur Anaconda Jupyter. Partage et échange du code sur Github (Notebook https://github.com/Laurence-kyla/projet_wh/blob/main/projet_wh.ipynb)

    - Etude des données : data preprocessing et cleaning : .info(), .describe(), shape, dtypes, etc. Compréhension des variables et identification de la variable cible. Gestion des valeurs manquantes .isna().sum()

    - Gestion des valeurs manquantes, une partie importante à traiter avant d'approfondir les analyses. Délimiter le champ d'application de la fonction, application de la méthode 'interpolate()', création d'une boucle pour appliquer la méthode à chaque pays (Pyhton).

    - Data Viz : tracer la Heatmap, l'ACP et le cercle des corrélations, tracer le pairplot.
    Visualisation des données de l'évolution du bonheur par région du monde en 15 ans d'observation et Visualisation des régions du monde dans lesquelles le score du bonheur est le plus élevé dans le monde (scatterplot)
    Visualisation sur une carte du monde de la répartition des pays les plus heureux et des pays les plus malheureux avec geopandas, matplotlib.colors et pycountry

    - Analyse de précision et réponses à la problématique "Le bonheur est-il prédéterminé par l'environnement dans lequel nous évoluons ?" (Python, Matplotlib, Seaborn, Pandas et Numpy) :
    -- Ajout de nouvelles variables pour l'année 2021 pour la région du monde la moins heureuse et pour la région du monde la plus heureuse : Taux de fertilité et Nombre d'habitants par pays
    -- Tracer les graphiques démontrant que le taux de fertilité et la progression fulgurante du nombre d'habitants jouent un rôle majeur dans le faible score du bonheur.
    -- Opposition du pays le plus heureux et du pays le plus malheureux dans le monde pour mettre en évidence que le bonheur est entièrement conditionné par la situation politique du pays. Plus le pays est stable et vit en paix, plus le bonheur est élevé.

    - Partie Machine Learning : 1. Trouver le modèle le plus précis capable de se rapprocher des valeurs de la variable cible.
    2. Trier et filtrer les données par type de pays (variable ajoutée avec du Web Scraping)
    Avec Statsmodels sm et OLS, comment évoluerait le score du bonheur des pays riches, des pays émergents et des pays en développement si les valeurs de leurs variables les plus fortement corrélées à la variable cible subissaient des changements positifs ou négatifs ?
    Avec ce travail de modélisation, il s'agit de mettre en évidence les points d'amélioration pour les pays qui souhaitent élever leur score du bonheur.
    Python Pandas Seaborn Matplotlib Machine learning Scikit-learn Plotly Statistiques Analyse de données Data visualisation Analyse de données statistiques
  • Freelance
    Data Analyst / Data Scientist
    BANQUE & ASSURANCES
    juin 2023 - juillet 2023 (2 mois)
    Montpellier, France
    Dans le cadre d'un projet sur les prédictions du prix des actions d'une entreprise, il s'agit de trouver le modèle en Machine Learning qui permettra de réduire le risque d'investissement.

    - Extraction des valeurs des actions d'une entreprise cotée sur une période donnée depuis un site internet boursier.

    - Analyse des données : data preprocessing et cleaning. Attribuer le bon type à chaque variable, supprimer les caractères spéciaux (Python, Pandas)

    -Partie Machine Learning :
    -- Application de Time series : décomposition des valeurs avec statsmodels.tsa.seasonal modèle additif et multiplicatif. Test de corrélation avec le Test Ad Fuller.

    -- Application du modèle LSTM de Keras : Prediction sur 50 valeurs

    -- Application des modèles de Regression : Linear regression et Random Forest Regressor : l'objectif est de voir les scores des métriques pour mesurer les écarts entre les valeurs réelles et les valeurs prédites.
    keras Python (Programming Language) Pandas Bokeh statsmodels LSTM Random Forest Linear regression Ad fuller Machine learning Analyse de données statistiques Statistiques

Recommandations

Soyez le premier à recommander Laurence

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Data Analyst
    Datascientest.com et les Mines de Paris
    2023
    250 heures de formation + 80 heures pour le projet : Programmation : Python, Pandas, Numpy, Data Quality Data Visualisation : Matplotlib, Seaborn, Boked Machine Learning : Algorithmes / Méthodes de classification et Régression, Méthodes de réduction de dimension Analyses de données : Méthodes de clustering K-means, clustering hiérarchique, Méthodes d’analyse de la data PCA, LDA, T-SNE Extraction et gestion des données : Text Mining, WebScraping BI : Power BI, Tableau, Data Modeling Database - Big Data : SQL, Data Processing, PySpark

Compétences

Catégories