You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Bastien CarnielBC

Bastien Carniel

NLP | GPT | Machine Learning

800 €/jour
21 projets
Paris, FR
8-15 ans

Délai de réponse moyen : 12h

À propos de Bastien

Data scientist spécialisé dans le déploiement de systèmes IA en production, notamment autour des LLM appliqués à des processus métiers concrets (automatisation, extraction d’information, assistants internes, structuration de données).

Formation école de commerce à l’origine, mais avec plusieurs années à des postes très techniques : recherche à grande échelle sur l’analyse de réseaux sociaux, lead technique d’équipes data/IA, et mise en production de modèles NLP et ML.

Je travaille aujourd’hui beaucoup sur les architectures LLM modernes : RAG, orchestration d’appels modèles, embeddings, vector databases, pipelines Python, APIs, déploiement cloud et monitoring. Stack typique : Python, OpenAI / Mistral / open-source LLMs, LangChain / LlamaIndex, Postgres / vector DB, FastAPI, Docker.

Cela dit, dans la plupart des projets que je vois, la difficulté est maintenant rarement technique, les briques existant déjà. La valeur vient plutôt de :
  • choisir le bon outil pour le bon problème (LLM et qualité du prompt, modèle spécialisé, règles, ou combinaison)
  • construire des systèmes coût-efficaces en production
  • la gestion de l'intégration avec les processus existants (ce qui peut vouloir dire de les remplacer)
  • la maintenabilité du système et donc la possibilité d'itérer
  • l'évaluation de la performance: le LLM aura quasi-toujours une réponse plausible, ce qui ne veut pas dire qu'elle est bonne !
Lorsque possible, je privilégie les solutions européennes (Airtable -> Baserow, OpenAI -> Mistral, AWS -> OVHCloud, etc)
  • Anglais

    Bilingue ou natif

  • Russe

    Capacité professionnelle complète

Accepte de travailler sur site
Paris (jusqu’à 50 km), Avignon (jusqu’à 50 km)

Expériences

  • SIGNIA THERAPEUTICS
    NER Biomédical
    BIOTECHNOLOGIES
    novembre 2021 - décembre 2021 (2 mois)
    - Module de constitution de corpus biomédicaux utilisant les API Pubmed, ClinicalTrials et EPO.

    - Module de constitution de bases de données canoniques (UMLS, Gene Ontology).

    - Module de reconnaissance d'entités nommées (Scispacy, Scibert, FAISS)
    NLP Python Docker moteur de recherche
  • Sanofi Pasteur
    Modèle de prédiction du risque d'apparition d'une pathologie
    INDUSTRIE PHARMACEUTIQUE
    juillet 2021 - janvier 2022 (6 mois)
    Télétravail
    Pipeline d'automatisation d'extraction de données issues de pdf (librairies Tabula, Pandas)

    Développement d'un modèle de prédiction du risque d'apparition d'une pathologie dans différentes régions (librairies Scikit-Learn, Tensorflow, Statsmodels, Catboost, GPBoost, MERF)

    Déploiement d'un outil d'interaction cartographique avec le modèle (librairies Streamlit, Folium. Hébergement sur AWS)


    Streamlit Scikit-learn TensorFlow AWS
  • Science Feedback
    Moteur de recherche sémantique spécifique à un corpus biomédical
    PRESSE & MÉDIAS
    mars 2021 - août 2021 (5 mois)
    Paris, France
    Développement d'un moteur de recherche sur mesure (y compris interface) visant à identifier, sur la base de mots-clés techniques, les chercheurs les plus pertinents :

    - A partir de la donnée issue de la base d'articles de recherche Pubmed, nettoyage et constitution d'une base de données d'articles scientifiques (2.3 millions d'articles, 20 millions de mots-clés, 30 millions d'auteurs).

    - Embedding des mots-clés scientifiques à l'aide d'un modèle BioBert (HuggingFace Transformers)

    - Déploiement d'une base de données ElasticSearch optimisée pour la recherche de similarité vectorielle entre requête utilisateur et mots clés de la base de données (temps de réponse < 0.4 seconde)

    - Déploiement d'une base de données DynamoDB pour le stockage des données non-vectorielles (métadonnées de l'article, abstract, affiliations des auteurs...)

    - Développement d'une interface utilisateur avec Streamlit

    Hébergé sur AWS, déployé dans des containers Docker communiquant entre eux via FastAPI.
    Elasticsearch NLP API Streamlit Docker Amazon DynamoDB

Avis

4,9

sur 17 évaluations

F

Florence

SANOFI PASTEUR

Avis laissé le 23/02/2024

Merci encore à Bastien qui comprend tout à fait le contexte scientifique, s'adapte aux problèmes de qualité des données sources et aux besoins du client, et livre dans les temps.
F

Florence

Sanofi Pasteur

Avis laissé le 28/09/2022

Bastien is able to understand complex scientific contexts, make user-friendly proposals and deliver under very tight timelines.

Recommandations

Soyez le premier à recommander Bastien

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Ces profils de freelance correspondent également à vos critères

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Formations

  • Master
    HEC Paris
    2015
    Double diplôme avec l'université de Saint-Pétersbourg en Russie.

Certifications

Compétences

Catégories