Qualité des citations
Agents qui citent les sources avec précision, attribuent les affirmations au fragment dont elles viennent, et signalent quand une affirmation n'a pas de source — la fondation d'une sortie digne de confiance.
Les citations ne sont pas une fonctionnalité UX ; c'est un mécanisme de responsabilité. Un agent qui cite la mauvaise source est pire qu'un agent qui admet ne pas savoir.
Ce que ça résout
Rend la sortie de l'agent auditable. Le lecteur voit quelle affirmation vient de quelle source et juge si la source soutient l'affirmation.
Comment nous construisons
Le retrieval retourne des fragments avec ID stables ; le modèle est invité à attribuer chaque affirmation factuelle à un fragment ; un évaluateur (à règles ou modèle) vérifie que les fragments cités soutiennent l'affirmation et que les affirmations non soutenues sont signalées. Les échecs reviennent dans les changements de prompt ou de retrieval.
- ID de fragment stables depuis le retrieval
- Attribution par affirmation dans la sortie
- Vérification d'attribution post-hoc
- Détection et signalement des affirmations non soutenues
Ce qui change
Les hallucinations deviennent observables. Le taux d'affirmations non soutenues devient une métrique suivie.