Article

Routage de modèles

Une stratégie de gateway pour choisir le bon modèle par tâche selon la confidentialité, le coût, la latence, la qualité et le mode de défaillance.

Pourquoi router

Un seul modèle est rarement optimal pour toutes les tâches. Classification, raisonnement de retrieval, résumé, codage et génération de la réponse finale n'ont pas les mêmes profils de coût et de qualité.

  • Modèles privés ou locaux pour les tâches sensibles à faible risque
  • Modèles frontières pour le raisonnement à haute complexité
  • Bascules de secours en cas de panne ou de régression de qualité
  • Télémétrie de coût et de tokens par route

Ressources connexes