Mon Agent IA

SaaS B2B : un agent IA support qui resout 62 % des tickets sans humain

Etude de cas representative d'un editeur SaaS B2B de 80 personnes. Anonymisee mais reelle : architecture, couts mesures, ROI sur 9 mois, ecueils evites et learnings transferables.

Contexte

Editeur SaaS B2B francais, 80 salaries, environ 2 500 clients PME en abonnement. L'equipe support comprend 6 personnes a temps plein. Volume : 800 a 1 200 tickets par mois, dont 70 % sur des questions recurrentes (utilisation produit, facturation, parametrage de base).

Problematique : le support sature aux pics, le delai de premiere reponse derive (3 a 8 heures), la satisfaction client (CSAT) baisse de 4,3 a 3,9 sur 5 en 18 mois.

La solution mise en place

Architecture deployee en 3 mois (specification, dev, beta, prod) :

  • Agent principal : Claude Sonnet 4.7 avec cache prompt agressif sur le system prompt (40 k tokens decrivant produit, FAQ, tonalite).
  • Memoire / RAG : base vectorielle (Qdrant) sur la documentation produit, les articles d'aide, les FAQ. ~3000 documents indexes.
  • Outils : search_docs, get_account_info, create_jira_ticket (escalade), send_invoice_copy.
  • Garde-fous : escalade humaine si confiance < 0.7, si mots-cles sensibles ("rembourser", "annuler abonnement"), si plus de 5 tours sans resolution.
  • Integration : webhook depuis Zendesk → agent → reponse en draft que l'equipe valide en 1 clic (mode "assisted") puis bascule en mode "auto" pour les cas simples apres 4 semaines de production.
  • Observabilite : LangSmith pour chaque trace, evals quotidiens sur 100 cas representatifs.

Resultats mesures (mois 6 a 9)

IndicateurAvantApres 9 mois
Taux de resolution sans humain0 %62 %
Delai 1re reponse (mediane)2 h 5040 s
Delai resolution complete14 h5 h 30
CSAT (satisfaction)3,9 / 54,5 / 5
Tickets traites par agent humain180 / mois75 / mois

Le CSAT augmente parce que le delai de premiere reponse passe a moins d'1 minute et que les humains se concentrent sur les vrais cas complexes (les cas faciles sont traites par l'IA et n'agacent plus).

Couts

  • Cout API Claude Sonnet : ~280 EUR/mois pour 1 000 tickets traites (dont 620 resolus sans humain).
  • Infra (Qdrant, observabilite, Zendesk add-on) : ~250 EUR/mois.
  • Cout total operationnel : ~530 EUR/mois.
  • Equivalent en temps humain economise : ~110 heures/mois soit environ 4 500 EUR (cout charge d'un agent support). ROI x8.
  • Cout du projet initial : ~45 000 EUR (3 mois × 15 000 EUR d'integrateur externe + ressources internes). Amorti en 11 mois.

Ecueils evites

  • Pas de mode "auto" des le debut : 4 semaines de mode "assisted" pour que les agents valident les drafts et calibrent le system prompt. Indispensable pour eviter les hallucinations en clientele.
  • Escalade visible : tout client peut taper "humain" pour basculer instantanement. La presence de ce filet rassure et reduit les frustrations.
  • Pas de tarification dans le perimetre de l'agent. Pour les questions facturation engageantes (resiliation, geste commercial), escalade systematique.
  • Cache prompt active des le debut. Sans cela, le cout aurait ete 4x plus eleve.

Learnings transferables

  • Commencer en mode "assisted" pendant 4 a 8 semaines avant le mode auto.
  • Investir dans la base de connaissances : la qualite du RAG fait 50 % de la qualite de l'agent.
  • Mettre des regles d'escalade larges au debut, les resserrer au fur et a mesure.
  • Mesurer en continu (CSAT, taux d'escalade, satisfaction post-conversation).
  • Communiquer en interne : sans appropriation par l'equipe support, l'outil est vecu comme une menace.

Pour aller plus loin : agent IA dans le commerce, creer son agent IA, comparatif des plateformes.