Description

Data scientist spécialisé dans le déploiement de systèmes IA en production, notamment autour des LLM appliqués à des processus métiers concrets (automatisation, extraction d’information, assistants internes, structuration de données).

Formation école de commerce à l’origine, mais avec plusieurs années à des postes très techniques : recherche à grande échelle sur l’analyse de réseaux sociaux, lead technique d’équipes data/IA, et mise en production de modèles NLP et ML.

Je travaille aujourd’hui beaucoup sur les architectures LLM modernes : RAG, orchestration d’appels modèles, embeddings, vector databases, pipelines Python, APIs, déploiement cloud et monitoring. Stack typique : Python, OpenAI / Mistral / open-source LLMs, LangChain / LlamaIndex, Postgres / vector DB, FastAPI, Docker.

Cela dit, dans la plupart des projets que je vois, la difficulté est maintenant rarement technique, les briques existant déjà. La valeur vient plutôt de :

choisir le bon outil pour le bon problème (LLM et qualité du prompt, modèle spécialisé, règles, ou combinaison)
construire des systèmes coût-efficaces en production
la gestion de l'intégration avec les processus existants (ce qui peut vouloir dire de les remplacer)
la maintenabilité du système et donc la possibilité d'itérer
l'évaluation de la performance: le LLM aura quasi-toujours une réponse plausible, ce qui ne veut pas dire qu'elle est bonne !

Lorsque possible, je privilégie les solutions européennes (Airtable -> Baserow, OpenAI -> Mistral, AWS -> OVHCloud, etc)

Domaines d’expertise

Langues

Anglais
Bilingue ou natif
Russe
Capacité professionnelle complète

Préférences en matière de lieu de travail

Accepte de travailler sur site

Paris (jusqu’à 50 km), Avignon (jusqu’à 50 km)

SIGNIA THERAPEUTICS
NER Biomédical
BIOTECHNOLOGIES
novembre 2021 - décembre 2021 (2 mois)
- Module de constitution de corpus biomédicaux utilisant les API Pubmed, ClinicalTrials et EPO.

- Module de constitution de bases de données canoniques (UMLS, Gene Ontology).

- Module de reconnaissance d'entités nommées (Scispacy, Scibert, FAISS)
NLP Python Docker moteur de recherche
Sanofi Pasteur
Modèle de prédiction du risque d'apparition d'une pathologie
INDUSTRIE PHARMACEUTIQUE
juillet 2021 - janvier 2022 (6 mois)
Télétravail
Pipeline d'automatisation d'extraction de données issues de pdf (librairies Tabula, Pandas)

Développement d'un modèle de prédiction du risque d'apparition d'une pathologie dans différentes régions (librairies Scikit-Learn, Tensorflow, Statsmodels, Catboost, GPBoost, MERF)

Déploiement d'un outil d'interaction cartographique avec le modèle (librairies Streamlit, Folium. Hébergement sur AWS)

Streamlit Scikit-learn TensorFlow AWS
Science Feedback
Moteur de recherche sémantique spécifique à un corpus biomédical
PRESSE & MÉDIAS
mars 2021 - août 2021 (5 mois)
Paris, France
Développement d'un moteur de recherche sur mesure (y compris interface) visant à identifier, sur la base de mots-clés techniques, les chercheurs les plus pertinents :

- A partir de la donnée issue de la base d'articles de recherche Pubmed, nettoyage et constitution d'une base de données d'articles scientifiques (2.3 millions d'articles, 20 millions de mots-clés, 30 millions d'auteurs).

- Embedding des mots-clés scientifiques à l'aide d'un modèle BioBert (HuggingFace Transformers)

- Déploiement d'une base de données ElasticSearch optimisée pour la recherche de similarité vectorielle entre requête utilisateur et mots clés de la base de données (temps de réponse < 0.4 seconde)

- Déploiement d'une base de données DynamoDB pour le stockage des données non-vectorielles (métadonnées de l'article, abstract, affiliations des auteurs...)

- Développement d'une interface utilisateur avec Streamlit

Hébergé sur AWS, déployé dans des containers Docker communiquant entre eux via FastAPI.
Elasticsearch NLP API Streamlit Docker Amazon DynamoDB

Consulter toutes les expériences de Bastien

Florence

SANOFI PASTEUR

Avis laissé le 23/02/2024

Merci encore à Bastien qui comprend tout à fait le contexte scientifique, s'adapte aux problèmes de qualité des données sources et aux besoins du client, et livre dans les temps.

Florence

Sanofi Pasteur

Avis laissé le 28/09/2022

Bastien is able to understand complex scientific contexts, make user-friendly proposals and deliver under very tight timelines.

Afficher les 17 avis

Soyez le premier à recommander Bastien

Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

S’inscrire pour les voir

Master
HEC Paris
2015
Double diplôme avec l'université de Saint-Pétersbourg en Russie.

Computer Vision and Image Analysis
EdX
2020
https://courses.edx.org/certificates/26246df66fd74a50b43241885635542c
Computer Vision and Image Analysis
Natural Language Processing
Deeplearning.ai
2020
https://www.coursera.org/account/accomplishments/specialization/KAS9KMPRZKF2
NLP Traitement du Langage Naturel

Les certifications de Bastien sont accessibles uniquement aux membres Malt

Ingénieur IA

Bastien Carniel

NLP | GPT | Machine Learning

À propos de Bastien

Expériences

Avis

4,9

Qualité

4,9

Délai

4,9

Communication

4,9

Florence

Florence

Recommandations

Ces profils de freelance correspondent également à vos critères

Formations

Certifications

Compétences

Catégories