À propos de Bastien
- choisir le bon outil pour le bon problème (LLM et qualité du prompt, modèle spécialisé, règles, ou combinaison)
- construire des systèmes coût-efficaces en production
- la gestion de l'intégration avec les processus existants (ce qui peut vouloir dire de les remplacer)
- la maintenabilité du système et donc la possibilité d'itérer
- l'évaluation de la performance: le LLM aura quasi-toujours une réponse plausible, ce qui ne veut pas dire qu'elle est bonne !
Anglais
Bilingue ou natif
Russe
Capacité professionnelle complète
Expériences
- SIGNIA THERAPEUTICSNER BiomédicalBIOTECHNOLOGIESnovembre 2021 - décembre 2021 (2 mois)- Module de constitution de corpus biomédicaux utilisant les API Pubmed, ClinicalTrials et EPO.- Module de constitution de bases de données canoniques (UMLS, Gene Ontology).- Module de reconnaissance d'entités nommées (Scispacy, Scibert, FAISS)
- Sanofi PasteurModèle de prédiction du risque d'apparition d'une pathologieINDUSTRIE PHARMACEUTIQUEjuillet 2021 - janvier 2022 (6 mois)TélétravailPipeline d'automatisation d'extraction de données issues de pdf (librairies Tabula, Pandas)Développement d'un modèle de prédiction du risque d'apparition d'une pathologie dans différentes régions (librairies Scikit-Learn, Tensorflow, Statsmodels, Catboost, GPBoost, MERF)Déploiement d'un outil d'interaction cartographique avec le modèle (librairies Streamlit, Folium. Hébergement sur AWS)
- Science FeedbackMoteur de recherche sémantique spécifique à un corpus biomédicalPRESSE & MÉDIASmars 2021 - août 2021 (5 mois)Paris, FranceDéveloppement d'un moteur de recherche sur mesure (y compris interface) visant à identifier, sur la base de mots-clés techniques, les chercheurs les plus pertinents :- A partir de la donnée issue de la base d'articles de recherche Pubmed, nettoyage et constitution d'une base de données d'articles scientifiques (2.3 millions d'articles, 20 millions de mots-clés, 30 millions d'auteurs).- Embedding des mots-clés scientifiques à l'aide d'un modèle BioBert (HuggingFace Transformers)- Déploiement d'une base de données ElasticSearch optimisée pour la recherche de similarité vectorielle entre requête utilisateur et mots clés de la base de données (temps de réponse < 0.4 seconde)- Déploiement d'une base de données DynamoDB pour le stockage des données non-vectorielles (métadonnées de l'article, abstract, affiliations des auteurs...)- Développement d'une interface utilisateur avec StreamlitHébergé sur AWS, déployé dans des containers Docker communiquant entre eux via FastAPI.
Avis
Recommandations
Soyez le premier à recommander Bastien
Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- MasterHEC Paris2015Double diplôme avec l'université de Saint-Pétersbourg en Russie.
Certifications
- Computer Vision and Image AnalysisEdX2020
- Natural Language ProcessingDeeplearning.ai2020