Aller au contenu
Logo
Agents IA

Agents IA et assistants conversationnels sur mesure

Un agent qui exécute trois workflows précis dans votre produit, pas un chatbot vitrine de plus.

  • Trois workflows bornés, pas un assistant qui prétend en faire trente
  • Greffé sur votre stack actuelle (Next, Django, FastAPI), sans refonte
  • Eval dès le premier sprint avec dataset de référence et coûts tokens trackés

Le contexte

Pourquoi c'est dur à bien faire

Un assistant conversationnel répond à une question. Un agent prend une décision, appelle un outil, écrit dans une base. La plupart des équipes veulent automatiser le tri de leads entrants, la qualification d'emails ou la première réponse support, et finissent avec un wrapper LLM qui invente ou un workflow no-code qui craque dès que le volume monte.

Du coup la vraie question n'est pas "quel modèle". C'est : qu'est-ce qui se passe quand un appel d'outil échoue, quand le contexte dépasse la fenêtre, quand l'utilisateur sort du scope prévu. Si vous n'avez pas de réponse écrite à ces trois cas, l'agent ne tiendra pas en prod.

Mon approche

Comment je le fais

Je borne l'agent sur trois workflows précis avec un schéma d'entrée et de sortie typés. Chaque appel d'outil passe par votre API existante, jamais par une réécriture de votre back-office. L'agent ne sait pas faire autre chose que ces trois choses, et c'est ce qui le rend fiable.

Eval en place dès le premier sprint sur un dataset de cas réels que vous validez. Coûts tokens estimés au cadrage et trackés en prod avec un dashboard. Retry et fallback prévus si l'API du modèle tombe. Logs structurés pour rejouer une session à l'identique en cas de comportement étrange.

Stack & outils

TypeScriptPythonNode.jsFastAPIAnthropic ClaudeOpenAIMistralPostgreSQLLangfuseDocker

Cas d'usage

Ce que ça donne en vrai

1

Tri et qualification de leads entrants

L'agent lit les formulaires entrants, extrait les champs structurés, score selon votre ICP écrit noir sur blanc, route vers le bon commercial avec un commentaire justifié. Les cas hors ICP ou ambigus partent en file d'attente humaine au lieu de générer une réponse hasardeuse.

2

Assistant interne sur documentation technique

Branché sur votre Notion ou Confluence en RAG, l'agent répond avec citation systématique vers le doc source. Les questions "où est la procédure X" sortent du flux Slack des seniors. Si la réponse n'est pas dans la base, l'agent le dit au lieu d'improviser.

3

Agent support de niveau 1

Lecture des tickets entrants, brouillon de réponse posé en draft pour validation humaine au démarrage. Une fois la qualité mesurée sur un dataset golden, passage en autonome sur les catégories où l'eval valide le seuil que vous avez fixé. Le reste reste humain.

Questions fréquentes

Ce qu'on me demande sur ce sujet

Combien coûte un agent IA en production par mois ?

Ça dépend du volume et du modèle. Un agent qui traite environ 1 000 requêtes par mois sur un modèle milieu de gamme tourne entre 30 et 200 € de tokens. Je vous chiffre au cadrage avec vos hypothèses de volume écrites, pour que vous puissiez challenger ligne par ligne.

Comment éviter les hallucinations ?

On ne les supprime pas, on les rend rares et détectables. Réponses contraintes par les outils que l'agent peut appeler (pas de génération libre), citation des sources via RAG quand il faut puiser dans un corpus, eval continue sur un jeu de cas connus qui détecte les régressions avant la prod. Fallback humain prévu sur les cas où la confiance n'est pas atteinte.

Quelle différence avec un workflow no-code (n8n, Make) ?

Le no-code reste plus rapide pour des automatisations linéaires à faible volume. Dès qu'il faut du raisonnement multi-étapes, du contexte conversationnel, ou un contrôle fin sur les appels d'outils, le code dédié finit moins cher à maintenir et plus simple à monitorer.

On en parle ?

Premier échange gratuit, sans engagement. On regarde ensemble si ce service est le bon pour votre besoin.