Runtime agent
La couche d'exécution des agents événementiels : déclencheurs, routage, appels d'outils, état durable, approbations, reprises, traces et contrôles de déploiement — la substance de production derrière une UI de chat.
L'IA de production n'est pas un prompt. C'est un système fait de contexte, d'outils, de permissions, de traces, d'évaluations et de boucles de rétroaction.
Pas un chatbot
Un agent de production est un processus événementiel de longue durée, pas une session de chat tour-à-tour. Il est déclenché par des webhooks, des planifications, des files, des change streams ou des messages dans des canaux approuvés ; il persiste l'état entre les appels de modèle et d'outils ; il survit aux redémarrages ; il peut prendre des minutes ou des heures pour compléter une tâche en restant observable et reprenable.
- Déclencheurs événementiels (webhooks, planifications, files, change streams)
- État durable à travers appels d'outils et de modèles
- Invocation d'outils sous portée de permission via MCP
- Portes d'approbation pour les actions à risque
Patron de lancement
Nous commençons par des workflows contraints — un type d'événement, une surface d'outils étroite, une porte d'approbation humaine généreuse, et du tracing à chaque étape. Le workflow gagne plus d'autonomie à mesure que le jeu d'évaluations grandit et que l'historique des traces montre la même décision prise de la même façon à l'échelle.
Substrats fréquents
LangGraph, l'OpenAI Agents SDK, Mastra et Inngest sont des substrats fréquents que nous étendons. Temporal et les patrons d'exécution durable sont utiles quand une tâche s'étend sur des heures ou des jours. Le runtime est le contrat — versionnage, gouvernance, évaluations, traces — pas le planificateur sous-jacent.
Ressources connexes
Un catalogue gouverné d'outils — adossé au Model Context Protocol — avec schémas typés, portées de permissions, exigences d'approbation et pistes d'audit par invocation.
Portes d'approbation pour les workflows où la justesse, le risque ou la responsabilité exigent un jugement humain — conçues comme partie du workflow, pas comme bouton panique boulonné après coup.
Suites d'évaluation qui testent prompts, modèles, politiques de retrieval, code généré et structure de workflow contre des seuils de qualité, latence, coût, mémoire et sécurité avant promotion.