MVP IA → produit
Ton MVP IA convainc en démo. Mais il doit tenir en prod.
50 utilisateurs simultanés et l'API plante. La facture Anthropic explose. Chaque feature prend 3× le temps prévu parce que tout est imbriqué. C'est normal — un MVP n'est pas fait pour tenir. Mais maintenant il doit. Je reprends l'archi pour en faire un produit.
Pour qui
- ▸Fondateur d'un produit IA dont le prototype convainc mais ne scale pas (latence, coûts, fragilité).
- ▸CTO solo qui a hérité d'un MVP IA bricolé et doit l'industrialiser sans tout réécrire.
- ▸Lead dev qui veut professionnaliser une feature IA greffée sur un produit existant.
Ce que je fais
Audit chiffré (3-5 jours)
Je trace où va chaque euro, je mesure la latence p50/p95, je note les anti-patterns. Tu repars avec un rapport et une roadmap de refonte priorisée — même si tu ne continues pas avec moi.
Refonte progressive
Pas de big rewrite. Chaque module est remplacé sans casser la prod. Cache (sémantique ou exact selon le cas), streaming SSE, file d'attente sur Redis, fallback inter-modèles (Anthropic → DeepSeek si rate-limit) — un par un.
Séparation logique métier / IA
La logique de ton produit est isolée des appels LLM. Tu peux tester sans appeler de modèle, et changer de modèle sans toucher à la logique. Anthropic Claude par défaut, DeepSeek pour les tâches volumineuses, finetune si le ratio coût/qualité le justifie.
Observabilité des coûts
Un dashboard qui te dit "endpoint X coûte Y€/jour, modèle Z, latence W". Tu décides si tu finetunes, si tu caches, ou si tu acceptes le coût.
Comment on travaille
Audit (3-5 jours, forfait fixe)
Lecture du code, mesure de la latence et des coûts par endpoint, identification des anti-patterns. Rapport actionnable + roadmap chiffrée.
Roadmap priorisée
On classe les chantiers par impact (coût, latence, fragilité). Tu décides ce qu'on fait d'abord. Pas de "tout refaire".
Refonte progressive
Chaque module est remplacé sans interruption. Releases courtes, mesurables. La prod ne s'arrête pas.
Mise en place de l'observabilité coûts
Dashboard coûts par endpoint et par modèle. Alerting si un endpoint dérape. Tu arrêtes de payer dans le brouillard.
Retainer optionnel
Si tu veux un suivi mensuel pour optimiser en continu (nouveaux modèles, nouveaux patterns, ajustement des coûts), on cale un retainer.
Ton MVP IA tient avec du scotch ?
Un premier échange pour cadrer votre besoin, sans engagement.