You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Haboubacar T.HT

Haboubacar T.

AI Engineer (Agentic System - Document AI)

600 €/jour
Paris, FR
3-7 ans

Délai de réponse moyen : 1h

À propos de Haboubacar

Data Scientist – Spécialiste NLP et IA Gen

Data Scientist avec 4 ans d’expérience, je conçois et déploie des solutions d’intelligence artificielle adaptées aux besoins des entreprises. Mon expertise couvre le NLP, les modèles génératifs et l’automatisation des processus métiers.

Services proposés :
🔹 Développement de chatbots et agents IA : Automatisation des interactions clients et internes avec des modèles avancés (RAG, LLM)

🔹 Recherche sémantique et NLP : Mise en place de moteurs de recherche intelligents pour une meilleure compréhension et structuration des données textuelles

🔹 Extraction et analyse de documents : Structuration et exploitation de données issues de documents (PDF, emails, bases de données)

🔹 IA générative : Intégration de modèles comme GPT et BERT pour la génération automatique de contenu

🔹 Automatisation des workflows : Développement de pipelines IA et Data pour optimiser les processus métiers

Pourquoi travailler ensemble ?
✔ Expertise technique : Expérience confirmée sur des projets NLP, IA générative et automatisation

✔ Solutions sur mesure : Adaptation aux besoins spécifiques et déploiement en production

✔ Maîtrise des outils clés : Python, LangChain, Hugging Face, ElasticSearch, CamemBERT, Docker, Streamlit, FastAPI, Spark, Azure...

Je suis disponible pour échanger sur vos projets et vous proposer des solutions adaptées. N’hésitez pas à me contacter.
  • Français

    Bilingue ou natif

  • Anglais

    Capacité professionnelle complète

Accepte de travailler sur site
Paris (jusqu’à 50 km)

Expériences

  • Caisse des Dépôts et Consignations
    Data Scientist - Engineer
    SECTEUR PUBLIC & COLLECTIVITÉS
    mars 2024 - Aujourd'hui (2 ans et 3 mois)
    Paris, France
    - Développement d'un algorithme IA pour identifier des certifications en lien avec la transition écologique, avec une précision de classification de 80% (Embedding CamemBERT + Cosine Similarity & Fine-tuning CamemBERT)

    - Clustering sémantique de 25 000 certifications pour l'indexation documentaire (Cosine Similarity + algorithme Find-Union)

    - Développement d'un moteur sémantique de recherche de fichiers sur le OneDrive du service data (Langchain, Faiss, Camembert, Streamlit)

    - Conception et déploiement d'une API de vectorisation de documents textuels (hugging face, Camembert, onnx runtime, FastAPI)

    - Conception et optimisation des pipelines de données via Alteryx et PySpark : fourniture automatique de données en réponse aux demandes métiers

    - Référent technique OpenData : création, publication et maintenance des pipelines d'alimentation des jeux de données

    - Conduite d'ateliers de restitution des projets aux équipes métiers
    Python MySQL Alteryx Hugging Face FastAPI OpenDataSoft ONNX Langchain FAISS Elasticsearch Streamlit
  • Île-De-France-Mobilités
    Data Scientist
    TRANSPORTS
    octobre 2022 - mars 2024 (1 an et 5 mois)
    Paris, France
    - Conception et déploiement d'un RAG sur les spécifications fonctionnelles & techniques de l'équipe IVTR

    - Conception et déploiement d'un Agent IA (interface avec GPT-4) afin de simuler des données de transport pour tests

    - Création d'une webApp Flask de génération des flux de données (interface de chat)
    • Déploiement de la webApp sur Azure (App Services, Azure Functions) et mise en place d'une CI/CD

    - Automatisation des tests de non-régression, réduisant le temps d'exécution manuelle de 5 jours à 3 heures, soit un gain de productivité de 90%

    - Conduite des tests de non-régression de l'application de recherche d'itinéraire d'IDFM, optimisée pour les JO Paris 2024

    - Rédaction des spécifications, gestion des anomalies et suivi technique du relais IVTR

    - Animation des instances agiles et coordination des tests de connexion de nouveaux partenaires
    Python Node.js MySQL Langchain Elasticsearch Kibana GPT4 Azure DevOps Docker Postman Chroma DB flask
  • PwC France
    Data Scientist NLP
    CONSEIL & AUDIT
    octobre 2021 - août 2022 (10 mois)
    Paris, France
    - Entraînement et déploiement en production de huit modèles de classification de mails sur Databricks via MLflow (mise en concurrence des modèles CamemBERT, SVM et Perceptron)

    - Conception et mise en œuvre d'une pipeline MLOps robuste, intégrant une boucle rétroactive pour l'évaluation continue et la détection du data drift

    - Création d'un robot sous UiPath interfaçant le modèle de classification de mails et la boucle de rétroaction, automatisant la classification des mails dans la boîte de
    réception client

    - Développement d'un système de recommandation d'archivage performant permettant d'identifier et d'éliminer les documents obsolètes, entraînant une réduction de 20% de l'espace de stockage utilisé

    - Collaboration avec les équipes de développement et gestionnaires de projets pour l'alignement des solutions avec les besoins clients.
    Python keras BERT Scikit-learn UiPath Microsoft Power BI Databricks MLflow

Recommandations

Soyez le premier à recommander Haboubacar

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Diplôme d'ingénieur, Intelligence Artificielle
    CY Tech
    2022
    Statistiques - Machine learning - Deep learning - Deep learning - NLP
  • CPGE MPSI-MP
    CPGE Lycée Moulay Idriss(Fès-Maroc)
    2019
    CPGE option Maths-Physique

Compétences

Catégories