MVP IA → produit

Ton MVP IA convainc en démo. Mais il doit tenir en prod.

50 utilisateurs simultanés et l'API plante. La facture Anthropic explose. Chaque feature prend 3× le temps prévu parce que tout est imbriqué. C'est normal — un MVP n'est pas fait pour tenir. Mais maintenant il doit. Je reprends l'archi pour en faire un produit.

Pour qui

  • Fondateur d'un produit IA dont le prototype convainc mais ne scale pas (latence, coûts, fragilité).
  • CTO solo qui a hérité d'un MVP IA bricolé et doit l'industrialiser sans tout réécrire.
  • Lead dev qui veut professionnaliser une feature IA greffée sur un produit existant.

Ce que je fais

Audit chiffré (3-5 jours)

Je trace où va chaque euro, je mesure la latence p50/p95, je note les anti-patterns. Tu repars avec un rapport et une roadmap de refonte priorisée — même si tu ne continues pas avec moi.

Refonte progressive

Pas de big rewrite. Chaque module est remplacé sans casser la prod. Cache (sémantique ou exact selon le cas), streaming SSE, file d'attente sur Redis, fallback inter-modèles (Anthropic → DeepSeek si rate-limit) — un par un.

Séparation logique métier / IA

La logique de ton produit est isolée des appels LLM. Tu peux tester sans appeler de modèle, et changer de modèle sans toucher à la logique. Anthropic Claude par défaut, DeepSeek pour les tâches volumineuses, finetune si le ratio coût/qualité le justifie.

Observabilité des coûts

Un dashboard qui te dit "endpoint X coûte Y€/jour, modèle Z, latence W". Tu décides si tu finetunes, si tu caches, ou si tu acceptes le coût.

Comment on travaille

01

Audit (3-5 jours, forfait fixe)

Lecture du code, mesure de la latence et des coûts par endpoint, identification des anti-patterns. Rapport actionnable + roadmap chiffrée.

02

Roadmap priorisée

On classe les chantiers par impact (coût, latence, fragilité). Tu décides ce qu'on fait d'abord. Pas de "tout refaire".

03

Refonte progressive

Chaque module est remplacé sans interruption. Releases courtes, mesurables. La prod ne s'arrête pas.

04

Mise en place de l'observabilité coûts

Dashboard coûts par endpoint et par modèle. Alerting si un endpoint dérape. Tu arrêtes de payer dans le brouillard.

05

Retainer optionnel

Si tu veux un suivi mensuel pour optimiser en continu (nouveaux modèles, nouveaux patterns, ajustement des coûts), on cale un retainer.

Ton MVP IA tient avec du scotch ?

Un premier échange pour cadrer votre besoin, sans engagement.