Service

Plateforme IA

Une couche opérationnelle unique pour les modèles, outils et données IA que vos équipes utilisent. Coût, qualité et gouvernance visibles. Des choix de fournisseur — hébergés, locaux ou auto-hébergés — que vous changez sans réécrire le système.

Compatible avec
Anthropic ClaudeOpenAIGoogle GeminiMistralAmazon BedrockAzure OpenAIvLLMOllamaPrivate deployments

Une passerelle · le fournisseur est une décision de routage · changer sans réécrire

Ce que c'est

La plupart des entreprises qui utilisent l'IA ont quelques équipes qui appellent chacune un fournisseur directement : l'une via un script Python, l'autre via un SaaS, une troisième avec des clés API dans un Google Doc. La Plateforme IA remplace cette dispersion par une seule couche opérationnelle à laquelle chaque équipe et chaque agent s'adresse. Changer de fournisseur devient une décision de routage. Les coûts deviennent un tableau de bord. Exposer des outils internes à l'IA devient gouverné. La qualité de chaque interaction devient mesurable. L'architecture reste vôtre : fournisseurs de modèles, nuage, déploiement privé.

Ce que nous construisons

Une passerelle devant les fournisseurs de modèles, avec politiques de routage et bascules. Piles principales : Claude (Anthropic) et OpenAI ; nous étendons à Gemini, Bedrock, Azure OpenAI, Mistral ou des runtimes à poids ouverts (vLLM, Ollama) selon le mandat. Un registre pour les outils MCP (Model Context Protocol, le standard ouvert d'Anthropic pour exposer outils, ressources et prompts aux agents) avec schémas typés, portées de permissions et journalisation d'audit. Pipelines de retrieval (découpage, embeddings, recherche hybride, reranking). Traces OpenTelemetry, télémétrie de tokens et de coûts, et harnais d'évaluation qui borde la promotion.

  • Passerelle de modèles avec bascules (Claude, OpenAI en principal)
  • Registre MCP avec contrats JSON Schema et portées
  • Pipelines d'embeddings (hébergés ou auto-hébergés), retrieval hybride et reranking
  • Traces OpenTelemetry : coût, latence, télémétrie de tokens

Comment nous construisons

Les applications et les agents parlent à la passerelle, pas directement aux fournisseurs. Ce point d'intégration unique est l'endroit où se décide le routage (classe de confidentialité, budget de coût, cible de latence, plancher de qualité), où les clés tournent sans changement de code, où les limites de débit et les pannes sont absorbées, et où chaque appel émet une trace. Les outils s'intègrent via des serveurs MCP avec schémas versionnés. Le retrieval s'exécute contre les index construits par les Fondations de données. Les régressions de qualité sont attrapées par le harnais d'évaluation avant les utilisateurs ; les pointes de coût sont attrapées par la télémétrie avant la finance.

Pourquoi l'agnostisme aux modèles compte

Le paysage des modèles évolue rapidement : Claude, GPT, Gemini, Mistral, Llama et les autres livrent des capacités à des rythmes différents et à des prix-par-token différents. Une plateforme verrouillée sur un fournisseur devient une réécriture quand le leader change, quand un régulateur exige l'inférence régionale ou quand un workflow sensible exige un modèle sur site. Le plan de contrôle vous appartient ; le fournisseur sous-jacent est une décision de routage.

Points de départ fréquents

Retirer l'usage LLM fantôme en consolidant sur une passerelle observable ; introduire la gouvernance d'outils via MCP pour que les agents cessent d'appeler les API métier avec des identifiants partagés ; ou ajouter retrieval et télémétrie d'évaluation à un assistant maison dont la qualité se mesure aujourd'hui en plaintes.

Lectures connexes