À propos de Alexandre
- Extraction d’information dans des documents
- OCR de documents
- Classification d’image ou de texte
- Segmentation d’image
- Sentiment Analysis
- Q&A
- Data mining de texte (identification de topics / parsing / classification de documents)
- Détection d’anomalie
- Clustering
- Analyse prédictive
- Data Visualisation
- Dashboard
- Interfaces
- Aide à la décision
- Cadrage : analyse des besoins, identification des enjeux, des contraintes et de valeur ajoutée par l’IA. Audit des données.
- Etablissement d’un planning jalonné.
- Modélisation par Machine Learning classique ou bien Deep Learning selon les cas. Production d’un PoC.
- Itération successives d’optimisation des modèles.
- Déploiement.
- Maintenance et support.
- Python
- Scikit-learn / Numpy / Scipy
- Pytorch / Tensorflow / Keras
- NLTK / YOLO / PaddleOCR
- HuggingFace / LangChain
- Git
- Docker / Kubernetes
- Flask / FastAPI
- Azure Cognitive Services / Google Cloud
Français
Bilingue ou natif
Anglais
Capacité professionnelle complète
Espagnol
Capacité professionnelle limitée
Expériences
- Groupe HLDRéalisation d'un modèle d'extraction d'information dans des documents clients dans le cadre d'un projet KYC.BANQUE & ASSURANCESjanvier 2024 - février 2024 (1 mois)Paris, FranceExtraction d'information spécifiques obtenus par fouille de liasses de documents.Sur le plan technique, ce projet a nécessité :
- Classification d'image afin de filtrer les documents d'intérêt.
- Auto-registration (recadrage, correction de l'orientation et du shear) afin de préparer l'extraction.
- OCR finetuné sur le corpus en question.
- Matching du client.
- Extraction d'informations clés par un modèle multimodal texte + image.
- Règles de validation.
- Déploiement via Docker
- Société Générale - CIBData ScientistBANQUE & ASSURANCESoctobre 2022 - Aujourd'hui (3 ans et 8 mois)Paris, France- Détection d'anomalie basée sur les Graph Neural Networks- Classification de texte
- LotomateData-scientistEDITION DE LOGICIELSoctobre 2023 - janvier 2024 (3 mois)Paris, France
- Extraction d'information dans des documents variés (factures, CV, attestations CAF, avis d'imposition, ...) avec un modèle multimodal (text & image) et tirant partie de l'analyse de la structure du document (Layout Analysis).
- Automatisation de l'entraînement en intégrant le modèle dans les micro-services de Wirk (connexion avec la base de données pour récupérer les documents annotés d'entraînement).
- Module d'inférence pour obtenir les prédictions directement dans l'interface d'annotation.
Avis
Recommandations
Soyez le premier à recommander Alexandre
Contribuez à la réussite de ce freelance en partageant votre expérience de collaboration avec lui.
Ces profils de freelance correspondent également à vos critères
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Formations
- Diplôme d'ingénieur de l'ENSTA Paris - Spécialisation IAENSTA Paris2022Double diplôme d'ingénieur ENSTA Paris & Institut Polytechnique de Paris en spécialité IA. Formation sur l'IA mêlant théorie (Mathématiques Appliquées, Optimisation, Probabilités et Statistiques) et la pratique (nombreux projets en Machine Learning et Deep Learning). CPGE en 2 ans : PCSI / PSI* au lycée Pierre-de-Fermat. Baccalauréat spécialité Maths avec mention Très Bien (18,2 de moyenne)
- Master 2 Data & IAInstitut Polytechnique de Paris2022Master 2 Data & IA avec une spécialisation en Machine Learning et Deep Learning. Cette formation est ponctuée de nombreux projets dont voici quelques exemples : - Classification de texte et Named Entity Recognition (NER) [NLP] - Classification et Génération d'images (GANs) [Computer Vision] - Séparation de pistes d'un morceau de musique [MIR] - Recommandation d'articles pour site de e-commerce [Système de recommandation] - Apprentissage par Renforcement
Certifications
- Natural Language Processing with Attention ModelsCoursera2023
- Natural Language Processing with Classification and Vector SpacesCoursera2023