Cas d'usage

Budgets de latence

Un patron de workflow IA de production relié aux données, aux agents, aux évaluations et aux opérations.

Overview

An interactive workflow with a p95 above its budget is a UX problem the model team often does not see. Budgets make latency a first-class constraint.

Comment l'aborder

Chaque capacité est jugée selon le même standard : aide-t-elle un agent à comprendre le contexte métier, à agir via des outils gouvernés, à laisser des traces utiles et à s'améliorer avec les retours de production?

Où cela s'insère

La carte de capacités couvre le substrat de données, les primitives de runtime, les évaluations et les opérations nécessaires aux systèmes agents.