Cas d'usage

Qualité des citations

Agents qui citent les sources avec précision, attribuent les affirmations au fragment dont elles viennent, et signalent quand une affirmation n'a pas de source — la fondation d'une sortie digne de confiance.

Vue d'ensemble

Les citations ne sont pas une fonctionnalité UX ; c'est un mécanisme de responsabilité. Un agent qui cite la mauvaise source est pire qu'un agent qui admet ne pas savoir.

Ce que ça résout

Rend la sortie de l'agent auditable. Le lecteur voit quelle affirmation vient de quelle source et juge si la source soutient l'affirmation.

Comment nous construisons

Le retrieval retourne des fragments avec ID stables ; le modèle est invité à attribuer chaque affirmation factuelle à un fragment ; un évaluateur (à règles ou modèle) vérifie que les fragments cités soutiennent l'affirmation et que les affirmations non soutenues sont signalées. Les échecs reviennent dans les changements de prompt ou de retrieval.

  • ID de fragment stables depuis le retrieval
  • Attribution par affirmation dans la sortie
  • Vérification d'attribution post-hoc
  • Détection et signalement des affirmations non soutenues

Ce qui change

Les hallucinations deviennent observables. Le taux d'affirmations non soutenues devient une métrique suivie.