Recherche vectorielle
Pipelines de retrieval qui combinent découpage, embeddings, filtrage par métadonnées, recherche hybride par mots-clés, reranking, permissions et évaluation — pas juste des lookups au plus proche voisin.
L'IA de production n'est pas un prompt. C'est un système fait de contexte, d'outils, de permissions, de traces, d'évaluations et de boucles de rétroaction.
Le retrieval est un système, pas un appel de base
La recherche vectorielle seule ne résout que la moitié facile du retrieval — trouver du texte sémantiquement proche d'une requête. La moitié difficile est le système autour : qualité des sources, stratégie de découpage, métadonnées, fraîcheur, contrôle d'accès, score hybride par mots-clés (BM25 à côté du dense), reranking avec un cross-encoder, et retour des réponses ratées. Sauter l'une de ces étapes produit un agent qui paraît sûr et cite la mauvaise chose.
- Politiques de découpage et de chevauchement ajustées par type
- Retrieval hybride dense + BM25 avec filtres de métadonnées
- Cross-encoder pour reranker le top-k
- Évaluation contre des questions et des échecs connus
Piles fréquentes
pgvector pour les équipes déjà sur Postgres, Qdrant ou Weaviate pour de l'auto-hébergé dédié, Pinecone ou Turbopuffer pour du managé ; Cohere Rerank, BGE ou Voyage pour la deuxième passe ; OpenSearch ou Elasticsearch pour la branche BM25. Le magasin est un moyen ; le pipeline est le travail.
Permissions dans le retrieval
Un retrieval qui ignore les permissions est une fuite de données qui attend une correspondance vectorielle. Les frontières d'accès du graphe source s'appliquent soit en pré-filtres sur l'index soit en post-filtres sur le résultat ; ce choix affecte le rappel et la latence et fait partie du jeu d'évaluations.
Ressources connexes
La carte propriétaire des systèmes opérationnels d'une organisation — schémas, documents, code, tickets, événements, propriétaires et permissions — reliés par les relations dont un agent a besoin pour retrouver, citer et agir.
Contrats, validation, lignage, fraîcheur et propriété pour des données qu'un agent peut utiliser sans risque — pas un projet de nettoyage ponctuel, mais une discipline opérationnelle continue.
Suites d'évaluation qui testent prompts, modèles, politiques de retrieval, code généré et structure de workflow contre des seuils de qualité, latence, coût, mémoire et sécurité avant promotion.