Cas d'usage

Politique de routage de modèles

Règles de routage par étape entre fournisseurs et modèles — confidentialité, coût, latence, qualité, bascule — déclarées dans la passerelle, pas enfouies dans le code du workflow.

Vue d'ensemble

Un seul modèle est rarement optimal pour un workflow entier. Le routage transforme un workflow d'une dépendance à un modèle unique en un ensemble de compromis explicites que l'équipe peut ajuster à mesure que le paysage évolue.

Ce que ça résout

Découple la logique de workflow du choix de fournisseur. Une dépréciation de modèle, un changement de prix ou une régression de qualité devient un changement de routage, pas une réécriture.

Comment nous construisons

Chaque étape déclare ses exigences de routage : budget de latence, classe de confidentialité, plancher de qualité, plafond de coût attendu. La passerelle résout les exigences contre le catalogue actuel de fournisseurs. Les traces par étape montrent quel modèle a servi quel appel pour que coût et qualité soient attribuables.

  • Exigences de routage par étape
  • Catalogue de fournisseurs avec prix et limites actuels
  • Chaînes de bascule pour panne ou dégradation
  • Attribution coût et qualité par route

Ce qui change

Le changement de fournisseur devient une opération. L'optimisation de coût devient une expérience de routage. Un régulateur exigeant l'inférence régionale devient une règle de routage.