Cas client : agent IA support pour un SaaS B2B (62 % de tickets resolus sans humain)

Etude de cas representative d'un editeur SaaS B2B de 80 personnes. Anonymisee mais reelle : architecture, couts mesures, ROI sur 9 mois, ecueils evites et learnings transferables.

Contexte

Editeur SaaS B2B francais, 80 salaries, environ 2 500 clients PME en abonnement. L'equipe support comprend 6 personnes a temps plein. Volume : 800 a 1 200 tickets par mois, dont 70 % sur des questions recurrentes (utilisation produit, facturation, parametrage de base).

Problematique : le support sature aux pics, le delai de premiere reponse derive (3 a 8 heures), la satisfaction client (CSAT) baisse de 4,3 a 3,9 sur 5 en 18 mois.

La solution mise en place

Architecture deployee en 3 mois (specification, dev, beta, prod) :

Agent principal : Claude Sonnet 4.7 avec cache prompt agressif sur le system prompt (40 k tokens decrivant produit, FAQ, tonalite).
Memoire / RAG : base vectorielle (Qdrant) sur la documentation produit, les articles d'aide, les FAQ. ~3000 documents indexes.
Outils : search_docs, get_account_info, create_jira_ticket (escalade), send_invoice_copy.
Garde-fous : escalade humaine si confiance < 0.7, si mots-cles sensibles ("rembourser", "annuler abonnement"), si plus de 5 tours sans resolution.
Integration : webhook depuis Zendesk → agent → reponse en draft que l'equipe valide en 1 clic (mode "assisted") puis bascule en mode "auto" pour les cas simples apres 4 semaines de production.
Observabilite : LangSmith pour chaque trace, evals quotidiens sur 100 cas representatifs.

Resultats mesures (mois 6 a 9)

Indicateur	Avant	Apres 9 mois
Taux de resolution sans humain	0 %	62 %
Delai 1re reponse (mediane)	2 h 50	40 s
Delai resolution complete	14 h	5 h 30
CSAT (satisfaction)	3,9 / 5	4,5 / 5
Tickets traites par agent humain	180 / mois	75 / mois

Le CSAT augmente parce que le delai de premiere reponse passe a moins d'1 minute et que les humains se concentrent sur les vrais cas complexes (les cas faciles sont traites par l'IA et n'agacent plus).

Couts

Cout API Claude Sonnet : ~280 EUR/mois pour 1 000 tickets traites (dont 620 resolus sans humain).
Infra (Qdrant, observabilite, Zendesk add-on) : ~250 EUR/mois.
Cout total operationnel : ~530 EUR/mois.
Equivalent en temps humain economise : ~110 heures/mois soit environ 4 500 EUR (cout charge d'un agent support). ROI x8.
Cout du projet initial : ~45 000 EUR (3 mois × 15 000 EUR d'integrateur externe + ressources internes). Amorti en 11 mois.

Ecueils evites

Pas de mode "auto" des le debut : 4 semaines de mode "assisted" pour que les agents valident les drafts et calibrent le system prompt. Indispensable pour eviter les hallucinations en clientele.
Escalade visible : tout client peut taper "humain" pour basculer instantanement. La presence de ce filet rassure et reduit les frustrations.
Pas de tarification dans le perimetre de l'agent. Pour les questions facturation engageantes (resiliation, geste commercial), escalade systematique.
Cache prompt active des le debut. Sans cela, le cout aurait ete 4x plus eleve.

Learnings transferables

Commencer en mode "assisted" pendant 4 a 8 semaines avant le mode auto.
Investir dans la base de connaissances : la qualite du RAG fait 50 % de la qualite de l'agent.
Mettre des regles d'escalade larges au debut, les resserrer au fur et a mesure.
Mesurer en continu (CSAT, taux d'escalade, satisfaction post-conversation).
Communiquer en interne : sans appropriation par l'equipe support, l'outil est vecu comme une menace.

Pour aller plus loin : agent IA dans le commerce, creer son agent IA, comparatif des plateformes.