Substrat de données

Recherche vectorielle

Pipelines de retrieval qui combinent découpage, embeddings, filtrage par métadonnées, recherche hybride par mots-clés, reranking, permissions et évaluation — pas juste des lookups au plus proche voisin.

Principe directeur

L'IA de production n'est pas un prompt. C'est un système fait de contexte, d'outils, de permissions, de traces, d'évaluations et de boucles de rétroaction.

Le retrieval est un système, pas un appel de base

La recherche vectorielle seule ne résout que la moitié facile du retrieval — trouver du texte sémantiquement proche d'une requête. La moitié difficile est le système autour : qualité des sources, stratégie de découpage, métadonnées, fraîcheur, contrôle d'accès, score hybride par mots-clés (BM25 à côté du dense), reranking avec un cross-encoder, et retour des réponses ratées. Sauter l'une de ces étapes produit un agent qui paraît sûr et cite la mauvaise chose.

Politiques de découpage et de chevauchement ajustées par type
Retrieval hybride dense + BM25 avec filtres de métadonnées
Cross-encoder pour reranker le top-k
Évaluation contre des questions et des échecs connus

Piles fréquentes

pgvector pour les équipes déjà sur Postgres, Qdrant ou Weaviate pour de l'auto-hébergé dédié, Pinecone ou Turbopuffer pour du managé ; Cohere Rerank, BGE ou Voyage pour la deuxième passe ; OpenSearch ou Elasticsearch pour la branche BM25. Le magasin est un moyen ; le pipeline est le travail.

Permissions dans le retrieval

Un retrieval qui ignore les permissions est une fuite de données qui attend une correspondance vectorielle. Les frontières d'accès du graphe source s'appliquent soit en pré-filtres sur l'index soit en post-filtres sur le résultat ; ce choix affecte le rappel et la latence et fait partie du jeu d'évaluations.

Ressources connexes

Graphe source

La carte propriétaire des systèmes opérationnels d'une organisation — schémas, documents, code, tickets, événements, propriétaires et permissions — reliés par les relations dont un agent a besoin pour retrouver, citer et agir.

Qualité des données

Contrats, validation, lignage, fraîcheur et propriété pour des données qu'un agent peut utiliser sans risque — pas un projet de nettoyage ponctuel, mais une discipline opérationnelle continue.

Évaluations de workflow

Suites d'évaluation qui testent prompts, modèles, politiques de retrieval, code généré et structure de workflow contre des seuils de qualité, latence, coût, mémoire et sécurité avant promotion.