Cas d'usage

Jeux de données gouvernés

Jeux de données avec propriétaires déclarés, frontières d'accès, SLO de fraîcheur et règles de rétention — l'unité de partage de données sécuritaire pour agents.

Vue d'ensemble

Les agents qui lisent dans des tables non gouvernées finissent par récupérer quelque chose qu'ils n'auraient pas dû voir. Un jeu de données gouverné est une table ou une vue avec propriété explicite, frontière d'accès, SLO de fraîcheur et politique de rétention attachés en code.

Ce que ça résout

Comble l'écart entre « qui a le droit de voir ça » et « qui peut le lire au moment de la requête ». La gouvernance passe de documents de politique à de la configuration appliquée que le runtime lit à chaque retrieval.

Comment nous construisons

Chaque jeu déclare propriétaire, classification (interne, confidentiel, réglementé), principaux ou rôles autorisés, cible de fraîcheur, fenêtre de rétention et consommateurs en aval. Le catalogue (Unity Catalog, Polaris, Lake Formation ou DataHub) applique l'accès à la requête. Les pipelines de retrieval héritent des mêmes frontières.

  • Propriétaire et classification par jeu
  • Accès basé sur les rôles appliqué à la requête
  • SLO de fraîcheur et fenêtre de rétention
  • Registre des consommateurs en aval

Ce qui change

Auditer « qui peut voir quoi » devient une requête sur le catalogue au lieu d'un fil Slack. L'onboarding d'un nouvel agent ou analyste devient une attribution de rôle, pas une copie des permissions de la personne précédente.