Runtime agent

La couche d'exécution des agents événementiels : déclencheurs, routage, appels d'outils, état durable, approbations, reprises, traces et contrôles de déploiement — la substance de production derrière une UI de chat.

Principe directeur

L'IA de production n'est pas un prompt. C'est un système fait de contexte, d'outils, de permissions, de traces, d'évaluations et de boucles de rétroaction.

Pas un chatbot

Un agent de production est un processus événementiel de longue durée, pas une session de chat tour-à-tour. Il est déclenché par des webhooks, des planifications, des files, des change streams ou des messages dans des canaux approuvés ; il persiste l'état entre les appels de modèle et d'outils ; il survit aux redémarrages ; il peut prendre des minutes ou des heures pour compléter une tâche en restant observable et reprenable.

Déclencheurs événementiels (webhooks, planifications, files, change streams)
État durable à travers appels d'outils et de modèles
Invocation d'outils sous portée de permission via MCP
Portes d'approbation pour les actions à risque

Patron de lancement

Nous commençons par des workflows contraints — un type d'événement, une surface d'outils étroite, une porte d'approbation humaine généreuse, et du tracing à chaque étape. Le workflow gagne plus d'autonomie à mesure que le jeu d'évaluations grandit et que l'historique des traces montre la même décision prise de la même façon à l'échelle.

Substrats fréquents

LangGraph, l'OpenAI Agents SDK, Mastra et Inngest sont des substrats fréquents que nous étendons. Temporal et les patrons d'exécution durable sont utiles quand une tâche s'étend sur des heures ou des jours. Le runtime est le contrat — versionnage, gouvernance, évaluations, traces — pas le planificateur sous-jacent.

Ressources connexes

Registre d'outils MCP

Un catalogue gouverné d'outils — adossé au Model Context Protocol — avec schémas typés, portées de permissions, exigences d'approbation et pistes d'audit par invocation.

Approbation humaine

Portes d'approbation pour les workflows où la justesse, le risque ou la responsabilité exigent un jugement humain — conçues comme partie du workflow, pas comme bouton panique boulonné après coup.

Évaluations de workflow

Suites d'évaluation qui testent prompts, modèles, politiques de retrieval, code généré et structure de workflow contre des seuils de qualité, latence, coût, mémoire et sécurité avant promotion.