Article

Recherche vectorielle

Pipelines de retrieval qui combinent découpage, embeddings, filtrage par métadonnées, recherche hybride par mots-clés, reranking, permissions et évaluation — pas juste des lookups au plus proche voisin.

Le retrieval est un système, pas un appel de base

La recherche vectorielle seule ne résout que la moitié facile du retrieval — trouver du texte sémantiquement proche d'une requête. La moitié difficile est le système autour : qualité des sources, stratégie de découpage, métadonnées, fraîcheur, contrôle d'accès, score hybride par mots-clés (BM25 à côté du dense), reranking avec un cross-encoder, et retour des réponses ratées. Sauter l'une de ces étapes produit un agent qui paraît sûr et cite la mauvaise chose.

  • Politiques de découpage et de chevauchement ajustées par type
  • Retrieval hybride dense + BM25 avec filtres de métadonnées
  • Cross-encoder pour reranker le top-k
  • Évaluation contre des questions et des échecs connus

Piles fréquentes

pgvector pour les équipes déjà sur Postgres, Qdrant ou Weaviate pour de l'auto-hébergé dédié, Pinecone ou Turbopuffer pour du managé ; Cohere Rerank, BGE ou Voyage pour la deuxième passe ; OpenSearch ou Elasticsearch pour la branche BM25. Le magasin est un moyen ; le pipeline est le travail.

Permissions dans le retrieval

Un retrieval qui ignore les permissions est une fuite de données qui attend une correspondance vectorielle. Les frontières d'accès du graphe source s'appliquent soit en pré-filtres sur l'index soit en post-filtres sur le résultat ; ce choix affecte le rappel et la latence et fait partie du jeu d'évaluations.

Ressources connexes