L'agent hierarchique : orchestrer plusieurs agents pour resoudre des taches complexes
Sixieme et plus avance des types d'agents, l'agent hierarchique decompose une tache complexe en sous-taches qu'il delegue a des agents specialises. C'est l'architecture dominante en production en 2026.
Definition
Un agent hierarchique est un systeme dans lequel un agent orchestrateur decompose une tache complexe en sous-taches plus simples et les delegue a des agents specialises (eux-memes potentiellement hierarchiques). Apres execution, il agrege les resultats et produit la reponse finale.
Cette architecture introduit explicitement la notion de division du travail. Elle s'inspire de l'organisation humaine : un chef de projet (orchestrateur) qui coordonne une equipe (agents specialises).
Patterns d'architecture multi-agents
- Manager-workers : un orchestrateur central, des workers identiques ou specialises, en parallele. Adapte aux taches divisibles (recherche multi-sources, batch).
- Pipeline : agents enchaines en sequence (recherche → redaction → relecture → publication). Simple et previsible.
- Plan-and-execute : un agent planificateur produit le plan, des agents executeurs prennent en charge chaque etape.
- Critique / juge : un agent fait, un autre verifie et propose des corrections. Pattern "actor-critic".
- Debate : plusieurs agents argumentent, un juge tranche. Utile pour les questions ouvertes.
- Swarm : agents qui se passent la main dynamiquement, sans hierarchie stricte. Pousse par OpenAI Swarm.
Exemples reels
Cas concrets en production
- Agent de recherche profonde (Anthropic, OpenAI Deep Research, Perplexity Deep) : orchestrateur qui dispatche 10 a 50 sous-agents de recherche en parallele, puis synthese.
- Agent de redaction d'article SEO : briefing → recherche → plan → redaction par paragraphe → review SEO → optimisation meta. Chaque etape un agent.
- Pipeline de developpement logiciel (Devin, Claude Code en mode agent) : analyse, plan, edit fichiers, run tests, fix erreurs.
- Agent commercial complet : qualification (1 agent) → enrichissement (1 agent) → personnalisation email (1 agent) → suivi (1 agent).
Domaines historiques
- Robotique : couche basse (controle moteur), intermediaire (navigation), haute (planification de tache).
- Systemes de trading : signal generators + risk manager + execution agents.
- Centres d'appels intelligents : routage, qualification, traitement, escalade — chaque etape un module.
Frameworks 2026
| Framework | Editeur | Forces |
|---|---|---|
| Claude Agent SDK | Anthropic | Production-ready, native sur Claude, tres bon en pratique |
| OpenAI Agents SDK | OpenAI | Integre a l'ecosysteme Assistants, gestion d'etat native |
| LangGraph | LangChain | Graphes d'execution explicites, observabilite poussee |
| AutoGen | Microsoft | Conversation multi-agents, integration Azure |
| CrewAI | Open source | Tres pedagogique, role-based, popularite croissante |
Pour un projet simple a moyennement complexe, un script Python ou TypeScript bien organise suffit souvent — choisir un framework engage l'architecture pour longtemps.
Bonnes pratiques d'orchestration
- Specifier des contrats clairs entre agents : schema d'entree, schema de sortie, perimetres explicites. Sans cela, le systeme degenere.
- Limiter la profondeur : un agent qui delegue qui delegue qui delegue devient incoherent. Generalement 2 a 3 niveaux maximum.
- Choisir le modele par sous-agent : utiliser Claude Haiku ou GPT-5 mini pour les sous-taches simples, reserver Opus aux taches complexes.
- Parallelisme : quand les sous-taches sont independantes, les lancer en parallele (gain ×3 a ×10 en latence).
- Garde-fous a chaque etape : valider le schema de sortie, limiter le nombre d'iterations, cap sur le budget tokens.
- Tracage et observabilite : chaque etape doit etre tracable. Indispensable pour debugger en production.
Exemple concret : un agent qui repond a une question juridique complexe. Orchestrateur (Opus) → decompose en : recherche jurisprudence (Sonnet ×3 en parallele), recherche doctrine (Sonnet), redaction (Opus avec contexte des 4), relecture (Sonnet juge). Cout total : 30 a 50 centimes par requete, qualite proche d'un junior.
Limites et pieges
- Surcout d'orchestration : chaque saut entre agents = appel LLM + transfert de contexte. Multiplie les couts et la latence.
- Perte de contexte entre agents : ce que A sait peut etre inaccessible a B. Mitigation : passer un summary structure.
- Erreurs propagees : une erreur de l'agent A polue tout le pipeline. Toujours valider entre les etapes.
- Difficulte de debogage : un comportement etrange peut venir de n'importe quel agent. Necessite des outils de trace (LangSmith, Braintrust).
- Couts cumules : 5 agents Sonnet a $0,01 = $0,05 par requete. A 100 000 requetes/mois, $5 000/mois. Architecter avec un oeil sur le cout.
Pour aller plus loin : systeme multi-agents, protocole MCP qui standardise les echanges, et notre guide pour creer un agent IA.
Questions frequentes
Quelle difference entre agent hierarchique et multi-agents ?
Multi-agents est un terme generique qui designe tout systeme avec plusieurs agents. Hierarchique designe une organisation specifique : un orchestrateur en haut, des agents specialises en bas, avec eventuellement des sous-niveaux. C'est la forme la plus structuree et la plus utilisee en production en 2026.
Pourquoi pas un seul "super-agent" ?
Trois raisons : 1) la specialisation ameliore la qualite, 2) on peut utiliser des modeles moins chers pour les sous-taches simples, 3) le code est plus maintenable et auditable. Inconvenient : le surcout de l'orchestration, qui n'est justifie que pour les taches vraiment complexes.
Quels frameworks pour construire des agents hierarchiques ?
En 2026, les principaux sont : Claude Agent SDK (Anthropic), AutoGen (Microsoft), CrewAI, LangGraph (LangChain), OpenAI Swarm/Agents SDK. Pour les besoins simples, un script Python qui appelle plusieurs prompts suffit souvent — pas besoin de framework.