SaaS B2B : un agent IA support qui resout 62 % des tickets sans humain
Etude de cas representative d'un editeur SaaS B2B de 80 personnes. Anonymisee mais reelle : architecture, couts mesures, ROI sur 9 mois, ecueils evites et learnings transferables.
Contexte
Editeur SaaS B2B francais, 80 salaries, environ 2 500 clients PME en abonnement. L'equipe support comprend 6 personnes a temps plein. Volume : 800 a 1 200 tickets par mois, dont 70 % sur des questions recurrentes (utilisation produit, facturation, parametrage de base).
Problematique : le support sature aux pics, le delai de premiere reponse derive (3 a 8 heures), la satisfaction client (CSAT) baisse de 4,3 a 3,9 sur 5 en 18 mois.
La solution mise en place
Architecture deployee en 3 mois (specification, dev, beta, prod) :
- Agent principal : Claude Sonnet 4.7 avec cache prompt agressif sur le system prompt (40 k tokens decrivant produit, FAQ, tonalite).
- Memoire / RAG : base vectorielle (Qdrant) sur la documentation produit, les articles d'aide, les FAQ. ~3000 documents indexes.
- Outils :
search_docs,get_account_info,create_jira_ticket(escalade),send_invoice_copy. - Garde-fous : escalade humaine si confiance < 0.7, si mots-cles sensibles ("rembourser", "annuler abonnement"), si plus de 5 tours sans resolution.
- Integration : webhook depuis Zendesk → agent → reponse en draft que l'equipe valide en 1 clic (mode "assisted") puis bascule en mode "auto" pour les cas simples apres 4 semaines de production.
- Observabilite : LangSmith pour chaque trace, evals quotidiens sur 100 cas representatifs.
Resultats mesures (mois 6 a 9)
| Indicateur | Avant | Apres 9 mois |
|---|---|---|
| Taux de resolution sans humain | 0 % | 62 % |
| Delai 1re reponse (mediane) | 2 h 50 | 40 s |
| Delai resolution complete | 14 h | 5 h 30 |
| CSAT (satisfaction) | 3,9 / 5 | 4,5 / 5 |
| Tickets traites par agent humain | 180 / mois | 75 / mois |
Le CSAT augmente parce que le delai de premiere reponse passe a moins d'1 minute et que les humains se concentrent sur les vrais cas complexes (les cas faciles sont traites par l'IA et n'agacent plus).
Couts
- Cout API Claude Sonnet : ~280 EUR/mois pour 1 000 tickets traites (dont 620 resolus sans humain).
- Infra (Qdrant, observabilite, Zendesk add-on) : ~250 EUR/mois.
- Cout total operationnel : ~530 EUR/mois.
- Equivalent en temps humain economise : ~110 heures/mois soit environ 4 500 EUR (cout charge d'un agent support). ROI x8.
- Cout du projet initial : ~45 000 EUR (3 mois × 15 000 EUR d'integrateur externe + ressources internes). Amorti en 11 mois.
Ecueils evites
- Pas de mode "auto" des le debut : 4 semaines de mode "assisted" pour que les agents valident les drafts et calibrent le system prompt. Indispensable pour eviter les hallucinations en clientele.
- Escalade visible : tout client peut taper "humain" pour basculer instantanement. La presence de ce filet rassure et reduit les frustrations.
- Pas de tarification dans le perimetre de l'agent. Pour les questions facturation engageantes (resiliation, geste commercial), escalade systematique.
- Cache prompt active des le debut. Sans cela, le cout aurait ete 4x plus eleve.
Learnings transferables
- Commencer en mode "assisted" pendant 4 a 8 semaines avant le mode auto.
- Investir dans la base de connaissances : la qualite du RAG fait 50 % de la qualite de l'agent.
- Mettre des regles d'escalade larges au debut, les resserrer au fur et a mesure.
- Mesurer en continu (CSAT, taux d'escalade, satisfaction post-conversation).
- Communiquer en interne : sans appropriation par l'equipe support, l'outil est vecu comme une menace.
Pour aller plus loin : agent IA dans le commerce, creer son agent IA, comparatif des plateformes.