ElevenLabs, c’était la synthèse vocale. Maintenant, c’est autre chose. La compagnie vient de lancer ElevenAgents, une plateforme pour construire des agents conversationnels vocaux complets, de bout en bout. Pas juste une voix qui parle. Un agent qui écoute, comprend, et répond, avec une voix qui sonne comme un humain. Ce que tu vas apprendre :

  • Ce qu’est ElevenAgents et pourquoi ce n’est pas juste une mise à jour de leur TTS
  • Comment la plateforme combine voix, écoute et logique dans un seul produit
  • Les cas d’usage concrets qui ont du sens aujourd’hui
  • Comment ça se compare à Bland AI, Vapi et les autres joueurs
  • Pour qui c’est pertinent, et pour qui c’est encore trop tôt

Ce qui s’est passé

ElevenLabs a lancé ElevenAgents sur Product Hunt et la réception a été claire : 188 reviews, une note de 4,9 sur 5, le genre de signal qu’on voit rarement sur un lancement technique. Ce n’est pas une coïncidence. La compagnie a passé les derniers mois à construire méthodiquement la pile. Le 7 octobre 2025, ils sortaient ElevenLabs Agent Workflows. Le 9 octobre 2025, ils poussaient leur nouvelle interface UI. Le 12 novembre 2025, Scribe v2 Realtime arrivait. Le 19 novembre 2025, Image & Video. ElevenAgents, c’est la consolidation de tout ça en un produit cohérent orienté agents.

Ce n’est pas un pivot. C’est l’aboutissement logique d’une roadmap qu’ils exécutent depuis un bon moment. ElevenLabs a commencé avec la meilleure synthèse vocale sur le marché, et ils ont construit couche par couche pour arriver à ceci : un environnement complet où tu peux déployer un agent vocal sans coller ensemble trois services différents.

tableau de bord ElevenAgents montrant la création d'un agent vocal avec les onglets voix, logique conversationnelle et reconnaissance vocale visibles à gauche, et un aperçu de flux conversationnel au centre
tableau de bord ElevenAgents montrant la création d'un agent vocal avec les onglets voix, logique conversationnelle et reconnaissance vocale visibles à gauche, et un aperçu de flux conversationnel au centre

Le positionnement Product Hunt est aussi un signal en soi. ElevenLabs a déjà 38 000 followers sur la plateforme et 28 launches à leur actif. Ils ne font pas des lancements Product Hunt pour le trafic. Ils les font pour capter les développeurs et les early adopters qui construisent avec leurs APIs. ElevenAgents s’adresse d’abord à eux.

Pourquoi c’est important

Soyons clairs sur ce que la plupart des gens ratent quand ils entendent « agent vocal IA ». Le problème avec les agents vocaux jusqu’à maintenant, c’est qu’ils sonnaient faux. Pas un peu faux : clairement faux. Tu pouvais construire la logique conversationnelle la plus sophistiquée du monde, si la voix trahissait le robot, l’utilisateur décrochait. La qualité de la voix n’était pas un détail esthétique, c’était le facteur numéro un d’adoption.

ElevenLabs entre dans le marché des agents avec un avantage structurel : leur TTS est déjà considéré comme le meilleur en classe pour le naturel de la voix. Ils n’ont pas à construire la confiance sur ce point. Les développeurs qui utilisaient déjà leur API pour de la synthèse vocale ont maintenant une raison directe de migrer leur stack d’agents vers leur écosystème. L’autre changement important, c’est l’intégration. Jusqu’ici, construire un agent vocal impliquait de coller ensemble un service de reconnaissance vocale (STT), un LLM pour la logique, et un TTS pour la sortie. Chaque couche introduit de la latence, des points de défaillance, des coûts séparés à gérer. ElevenAgents propose de regrouper ça dans un seul produit.

La vraie promesse d’ElevenAgents, c’est pas juste une belle voix. C’est de sortir les développeurs de l’enfer des intégrations multi-services pour quelque chose qui fonctionne de manière cohérente.


Ce que ça permet de faire concrètement

Les cas d’usage qui ont du sens aujourd’hui sont concentrés dans quelques catégories. Le support client automatisé est le plus évident. Un agent vocal qui peut répondre aux questions fréquentes, qualifier des leads entrants, ou gérer des demandes de premier niveau sans intervention humaine. La différence avec un chatbot texte, c’est que l’interface vocale réduit la friction pour des publics qui n’ont pas l’habitude de taper.

Maquette d'interface de configuration d'un agent vocal ElevenAgents montrant le choix du modèle de voix, les curseurs de personnalité et le champ d'instructions système.
Écran de configuration d'un agent ElevenAgents : sélection du modèle vocal, réglage de la personnalité (stabilité, similarité, style conversationnel) et prompt système définissant le comportement de l'agent.

Les assistants intégrés dans des applications sont le deuxième vecteur. Un développeur qui construit une app mobile peut ajouter une interface vocale sans construire la pile de zéro. ElevenAgents s’intègre via API, ce qui veut dire que l’agent peut vivre à l’intérieur d’un produit existant plutôt que d’être une expérience séparée. Les interfaces vocales pour des contextes sans écran (voiture, appareils IoT, kiosques) sont aussi un terrain naturel. La qualité de la voix devient encore plus critique dans ces cas parce qu’il n’y a pas d’interface visuelle pour compenser une expérience audio médiocre.

Cas d'usage Avantage ElevenAgents Complexité de déploiement
Support client téléphonique Voix naturelle, latence faible Moyenne
Assistant dans app mobile Intégration API directe Faible
Interface kiosque / IoT Voix claire sans écran Moyenne à haute
Qualification de leads vocale Ton contrôlable, multilingue Faible
Formation interactive voix Personnalisation voix fine Haute

Le multilingue est un point à surveiller. ElevenLabs supporte déjà de nombreuses langues dans leur TTS. Si ElevenAgents hérite de cette couverture linguistique, ça ouvre des usages en dehors du marché anglophone qui sont souvent mal servis par les concurrents.

ElevenAgents vs les autres solutions d’agents vocaux

Là où ça devient intéressant, c’est dans la comparaison avec Bland AI et Vapi, les deux joueurs les plus connus dans cet espace. Bland AI et Vapi ont construit leur réputation sur la fiabilité et la flexibilité de configuration. Ils permettent des workflows d’agents vocaux complexes, avec des intégrations téléphoniques, des transferts d’appels, des conditions logiques élaborées. Leur base d’utilisateurs est principalement des équipes techniques qui construisent des systèmes de télécommunication automatisés.

Diagramme comparatif en arcs concentriques évaluant ElevenAgents, Bland AI et Vapi sur quatre axes qualitatifs.
Lecture qualitative : ElevenAgents domine la voix, Bland AI tient la téléphonie et la maturité, Vapi reste le plus rapide à mettre en place. L'amplitude de chaque arc indique la force relative sur l'axe.

Le différenciateur ElevenAgents est la qualité de la voix et l’expérience unifiée. Sauf que Bland AI et Vapi ne sont pas mauvais sur la voix. Ils intègrent eux-mêmes des voix ElevenLabs via API, ou d’autres fournisseurs comparables. La question qui se pose : est-ce que l’intégration native crée un avantage mesurable sur la latence et la fluidité, ou est-ce que c’est marginal en pratique? Sur la maturité de plateforme, Bland AI et Vapi ont une longueur d’avance. Ils ont des années de feedbacks de production, des guides d’intégration téléphonie éprouvés, des communautés de développeurs actives. ElevenAgents arrive avec plus de ressources derrière eux, mais sans l’historique de bataille.

ElevenAgents a la marque, la voix, et le capital. Il leur manque encore la profondeur de cas d’usage documentés que les concurrents ont accumulée en production réelle. C’est un désavantage temporaire, mais c’en est un.


Pour qui c’est pertinent

Regarde ben. Si t’es dans une de ces situations, ElevenAgents mérite une évaluation sérieuse. Tu construis déjà avec l’API ElevenLabs. La migration vers leurs agents est logique, tu restes dans un écosystème que tu connais, tu réduis ta dépendance à des intégrations tierces, et tu bénéficies automatiquement des améliorations de leur modèle vocal.

Maquette stylisée de la page de tarification ElevenLabs montrant quatre paliers (Free, Starter, Creator, Pro) avec prix masqués.
Quatre paliers, une promesse : du test gratuit au déploiement Pro. Les chiffres réels — eux — bougent encore.

Tu es en train de planifier un produit qui nécessite une interface vocale naturelle et tu veux éviter de gérer plusieurs APIs. ElevenAgents te donne un point d’entrée. Le plan Free existe pour tester sans engagement financier, et les plans Starter (6 $US/mois) et Creator (22 $US/mois) permettent d’aller plus loin sans investissement majeur. Pour des usages business sérieux, le plan Pro à 99 $US/mois, Scale à 299 $US/mois ou Business à 990 $US/mois s’adressent à des volumes plus importants. Par contre, si tu as déjà un agent vocal en production stable sur Bland AI ou Vapi avec des intégrations téléphonie complexes, il n’y a pas de raison évidente de migrer maintenant. Le risque de déstabiliser quelque chose qui fonctionne dépasse l’avantage marginal sur la qualité vocale.

Profil Verdict
Développeur qui utilise déjà ElevenLabs TTS Évalue ElevenAgents en priorité
Équipe qui part de zéro sur un projet d'agent vocal Teste en parallèle avec Vapi
Agent vocal téléphonie en production sur Bland AI Attends la maturité plateforme
Non-technique qui veut un agent sans code Trop tôt, trop technique
Startup qui construit un produit voix B2B Cas d'usage fort, vaut l'évaluation

Ce qu’on ne sait pas encore

Là, écoute. Il y a des questions qui restent sans réponse claire à ce stade. La latence réelle en production est la première. ElevenLabs met en avant leur infrastructure, mais la latence bout-en-bout d’un système STT + LLM + TTS intégré dans des conditions réelles (connexions variables, volumes d’appels simultanés) ne se mesure pas dans un démo de lancement. C’est quelque chose qui se teste, pas qui s’annonce.

Diagramme de flux en quatre cercles reliés par des flèches montrant les étapes de latence d'un agent vocal : reconnaissance vocale, traitement LLM, génération vocale et transmission audio, avec annotation des trois premières étapes optimisées par ElevenAgents.
La chaîne d'un agent vocal additionne quatre latences (~850 ms typiques). ElevenAgents revendique des gains sur ASR (streaming), LLM (routing) et TTS (cœur maison) ; la transmission réseau reste hors de son contrôle. Sous ~800 ms cumulés, la conversation cesse de paraître robotique.

Les limites de personnalisation de la logique conversationnelle ne sont pas encore documentées publiquement de manière exhaustive. Les agents vocaux complexes ont souvent besoin de conditions, de branchements, d’intégrations avec des systèmes externes (CRM, bases de données). Dans quelle mesure ElevenAgents supporte ces cas sans devenir une solution incomplète? La réponse est dans la documentation technique, pas dans les annonces de lancement. La stratégie de tarification pour les volumes élevés aussi. Les plans publiés couvrent un spectre large, mais les cas d’usage enterprise avec des milliers d’appels par jour ont des économies différentes. Est-ce que ElevenAgents devient compétitif à ces volumes face à des concurrents qui ont une longueur d’avance sur la négociation enterprise?

Le verdict pour les opérateurs québécois

ElevenAgents est un lancement sérieux d’une compagnie qui a prouvé sa capacité d’exécution. La note de 4,9 sur 188 reviews sur Product Hunt n’est pas de la poudre aux yeux : c’est une communauté de développeurs qui valide l’approche. Le différenciateur vocal est réel. La question est de savoir si l’intégration native crée un avantage suffisant pour justifier le choix versus des plateformes plus matures sur d’autres dimensions. Pour les développeurs qui construisent des expériences vocales et qui valorisent la qualité de la voix comme critère principal : c’est le moment de regarder. Pour ceux qui ont déjà une stack en production qui fonctionne : surveille l’évolution sur les prochains mois avant de bouger.

Le marché des agents vocaux est encore tôt. ElevenLabs entre avec les meilleures cartes sur la table côté voix. La suite va se jouer sur la profondeur de la plateforme et la capacité à retenir les développeurs qui vont tester en premier. C’est tout.

On continue à la Taverne ?

Un courriel par semaine. Pas de fluff.

En t'abonnant, tu reçois Le Tour de Table chaque semaine. Tu peux te désabonner en un clic. Voir notre politique de confidentialité.

Texte par David Cyr