Cas d'usage
Budgets de latence
Un patron de workflow IA de production relié aux données, aux agents, aux évaluations et aux opérations.
Overview
An interactive workflow with a p95 above its budget is a UX problem the model team often does not see. Budgets make latency a first-class constraint.
Comment l'aborder
Chaque capacité est jugée selon le même standard : aide-t-elle un agent à comprendre le contexte métier, à agir via des outils gouvernés, à laisser des traces utiles et à s'améliorer avec les retours de production?
Où cela s'insère
La carte de capacités couvre le substrat de données, les primitives de runtime, les évaluations et les opérations nécessaires aux systèmes agents.