TravauxParis / Londres · 2026
Ingénieur IA & Data

BaptisteBouault

Je conçois et je mets en production des produits, des pipelines et des outils d’évaluation. Seul, du prototype au déploiement. En parallèle, du conseil IA et data pour des grands comptes.

ESSEC · UC Berkeley · Founders Inc
2 500+
utilisateurs payants
CAC 40
grands comptes
300+
tests automatisés
Six études · Méthode · Sélection · Contact
§ 01

Travaux

Problème · Décision · Arbitrage · Résultat

Six systèmes que j’ai conçus et mis en production, du moteur de mesure générative à la plateforme data. Pour chacun : le problème, la décision technique, l’arbitrage, le résultat.

01ÉtudeProduit propriétaire

GEO Audit · mesure de visibilité de marque dans les moteurs génératifs

Mesurer ce que ChatGPT, Perplexity ou Gemini disent d’une marque, sans biaiser la mesure.

5 moteursReact / Pythonconversations headless40 tests
Restitution · score GEO par moteur × catégoriefaibleforte
ClaudeGPTGeminiPerplexityCopilotNotoriété9355627441Découverte7963578247Intention8650677138Valeurs7245496434SCORE GEO61/ 100
Problème

Quand un prospect demande « quel acteur choisir ? » à un moteur génératif, la réponse oriente son achat. Personne, côté marque, ne sait ce qui est dit ni ne le mesure. Le GEO est aux moteurs ce que le SEO était à Google.

Décision clé

Les questions sans marque partent dans une conversation neutre, isolée. On mesure si la marque ressort d’elle-même, pas si le moteur répète ce qu’on lui a soufflé.

Arbitrage

Recherche web active, comme un vrai usage, mais isolée du score global. Couper le web aurait faussé la mesure. Sur une numérotation cassée, le parser refuse d’écrire plutôt que de mal attribuer une réponse.

Résultat

Outil multi-entreprises fonctionnel. Score, heatmap question par moteur, recommandations. Concurrence verrouillée par slug, coût par run suivi, 40 tests.

Lire l’étude →
02Étude

Pipeline agentique de génération de decks COMEX

Faire produire à un agent des présentations de comité exécutif, en gardant la décision côté humain.

agentiquehuman-in-the-loopQA visuellepptxgenjs
Problème

Transformer des notes de consultants en présentations de niveau comité exécutif, sans y passer des heures de mise en forme.

Décision clé

Quatre phases, avec un point de validation consultant entre chacune. La personne décide, l’agent fait le reste.

Arbitrage

Deux moteurs de génération, défaut et repli. Chaque slide rendue en image et vérifiée avant livraison, pas seulement dans le code.

Résultat

Chartes de marque appliquées strictement par client, six prompts d’orchestration.

Lire l’étude →
03Étude

Plateforme data décisionnelle pour un réseau de distribution

De 79 200 lignes de facturation brute à des décisions de direction.

~79 200 lignesH3 / OSRMK-Means · MesaFastAPI / React
Problème

Passer de 79 200 lignes de facturation brute, six points de vente, trois exercices, à des décisions de direction.

Décision clé

Une chaîne complète : Pydantic, enrichissement INSEE, concurrence via API SIRENE, indexation H3, isochrones OSRM, K-Means, simulation Mesa.

Arbitrage

Audit PASS / WARN / FAIL avant livraison, calculs fixés pour des simulations reproductibles. Les chiffres qui partent en comité ne se vérifient pas après coup.

Résultat

API FastAPI et dashboard React. De la donnée brute au géo-marketing et à la simulation.

Lire l’étude →
04Étude

Audit forensique d’un moteur de scoring (cyber-résilience)

Reproduire un score au centième près avant de conclure sur la cause de sa chute.

reverse-engineeringcause racineVBA → Python304 tests
Problème

Des scores de cyber-résilience qui chutent sur plusieurs actifs d’infrastructure, sans explication, sur un outil VBA hérité.

Décision clé

Reconstruire les trois moteurs de scoring en Python à partir du code et des données réelles, jusqu’à reproduire les scores au centième près.

Arbitrage

Reproduire d’abord, conclure ensuite. Cause trouvée : requalification des réponses par coefficient plus passage à la moyenne géométrique au niveau pilier.

Résultat

304 tests, visualisations pour le comité, note de gouvernance pour aligner les équipes sur une méthode contestée.

Lire l’étude →
05Étude

Plateforme de trading event-driven sur le réglementaire M&A européen

Détecter et exploiter les dépôts réglementaires M&A de trois juridictions.

event-drivenparsing multi-juridictionAlembic
Problème

Détecter et exploiter les dépôts réglementaires M&A de trois juridictions, régulateurs DE, FR, IT, aux formats très différents.

Décision clé

Un parser par juridiction. Un bug de prix d’offre cassait environ 40 % des deals allemands, corrigé.

Arbitrage

Pas de données de marché en direct sur le compte de test. Plutôt qu’une infra lourde, un logger qui enregistre le cours à l’instant de l’événement.

Résultat

Ingestion stable, migrations Alembic propres, phase de test débloquée.

Lire l’étude →
06Étude

Écosystème de skills Claude Code pour une équipe

Outiller toute une équipe sur un workflow agentique, pas un seul poste.

30+ skillsMCPtooling d’équipefrontières d’exécution
Problème

Passer d’un usage individuel à un workflow agentique partagé par toute une équipe, reproductible.

Décision clé

Plus de 30 skills, installation automatique, README d’onboarding, template CLAUDE.md par mission.

Arbitrage

Séparer ce qui tourne dans l’agent, skills, hooks, MCP, de ce qui reste portable côté assistant.

Résultat

Une plateforme pour une équipe, pas un script jetable.

Lire l’étude →
§ 02

Méthode

Chaîne de production agentique

Une chaîne de production agentique, avec une mémoire qui persiste entre les sessions.

01

Orchestration

Un modèle en chef d’orchestre. Il génère les prompts et les fichiers de contexte qui pilotent l’exécution.

02

Exécution

Claude Code comme environnement d’exécution. Le code est écrit, testé et débogué dans la boucle.

03

Contexte

Tout le contexte dans des fichiers .md versionnés. Un agent qui reprend une session ne repart pas de zéro.

04

Mémoire

Un vault Obsidian connecté en MCP. La continuité ne dépend pas d’une fenêtre de contexte.

§ 03

Autres travaux

Sélection

Moteur de benchmark IA réutilisable

Un moteur paramétrable : une liste de solutions, une grille de critères, et il régénère matrice scorée, radars et exports. Première mise en production sur 25 solutions IA pour une fédération du secteur santé. Vérification factuelle avant export.

pandas · matplotlib
openpyxl · pptxgenjs

Pipeline de veille IA autonome

Orchestration n8n et scoring par LLM, conteneurisé. Plus de 20 sources, briefing exécutif quotidien livré sans intervention.

n8n · Docker
LLM scoring

Moteur OSINT de vérification de contacts

Sept sources croisées. Le statut « Verified » exige deux sources indépendantes en accord. Près de 1 750 lignes.

Node.js
multi-source

Bots de trading event-driven (V3 → V4)

NLP de sentiment, exécution paper, 47 symboles. V3 arrêté après mesure d’une espérance négative nette de frais. V4 reconstruit, plus stable. Arrêter un projet sur la donnée plutôt que s’entêter.

Python · FinBERT
Redis

Sites haute finition

Next.js, Three.js, GSAP. Ce site en est un exemple.

Next.js · Three.js
GSAP
§ 04

Domaines & stack

Agents & orchestration
  • Systèmes multi-agent, validation human-in-the-loop
  • Outils d’évaluation et de benchmarking
  • Orchestration n8n, conversations headless
  • MCP, skills Claude Code
  • Parsing robuste, gestion de concurrence et de coût
Data science & ingénierie
  • Python, FastAPI, Pydantic
  • scikit-learn, Mesa, géospatial H3 / OSRM
  • React, Next.js, Three.js
  • Postgres, Alembic, Redis, Docker
  • Audit et cause racine
Conseil & terrains
  • GEO, visibilité dans les moteurs génératifs
  • Decks COMEX, langage décideur
  • Géo-marketing, simulation de scénarios
  • Finance, architectures event-driven
  • Grands comptes CAC 40
§ 05

Contact

Paris / Londres

Un système à construire, ou à débloquer.

Ouvert aux missions et aux postes, en France ou partout dans le monde. Écrivez-moi directement.

Écrivez-moi
Site écrit à la main, sans template ni page builder. Archivo et Martian Mono. Paris, 2026.