OpenAI dévoile AgentKit : un nouvel outil pour construire et piloter des agents IA
Après le lancement de “Apps in ChatGPT”, OpenAI poursuit sa stratégie d’ouverture vers les entreprises et les développeurs avec le lancement d’AgentKit. Un ensemble complet d’outils conçu pour simplifier la création, le déploiement et l’optimisation d’agents autonomes. Cette initiative s’inscrit dans la continuité du développement des “agents”, ces IA capables d’effectuer des tâches complexes de manière proactive, et vise à rendre leur conception aussi fluide que leur intégration dans des environnements professionnels.
Voici une présentation vidéo de ce nouvel outil :
Une plateforme complète pour construire des agents IA
AgentKit se structure autour de trois piliers techniques :
- Agent Builder, un éditeur visuel permettant de créer et versionner des flux multi-agents sur un tableau interactif. Les développeurs peuvent y connecter des outils, configurer des garde-fous, prévisualiser les résultats et gérer les versions sans quitter l’interface. Cette approche réduit drastiquement le temps de développement. Selon Ramp, l’un des partenaires pilotes, les cycles de conception ont été réduits de 70 %, permettant de passer de deux trimestres de développement à deux sprints.
- Connector Registry, un registre centralisé qui facilite la gestion des connexions entre les données et les outils utilisés au sein des produits OpenAI. Les entreprises peuvent y administrer l’accès à des plateformes comme Dropbox, Google Drive, SharePoint ou Microsoft Teams, tout en ajoutant leurs propres connecteurs via le standard Model Context Protocol (MCP).
- ChatKit, un kit d’intégration front-end pour incorporer des interfaces de chat personnalisées directement dans des produits ou sites web. ChatKit gère les fils de conversation, le streaming des réponses, et les interactions contextuelles. Canva, par exemple, indique avoir gagné plus de deux semaines de travail lors de la création de son agent d’assistance communautaire grâce à ChatKit.
Une approche visuelle et collaborative
Agent Builder s’impose comme le cœur du dispositif. Là où la construction d’agents relevait auparavant du développement lourd, OpenAI introduit une approche no-code / low-code pensée pour la collaboration entre ingénieurs, chefs produit et experts métier.
Des entreprises comme LY Corporation, géant japonais des services numériques, ont pu concevoir un assistant interne opérationnel « en moins de deux heures », selon OpenAI.
L’interface offre également la possibilité d’intégrer Guardrails, un module open source qui agit comme un pare-feu comportemental : il détecte les tentatives de jailbreak, masque les données personnelles et garantit que les agents respectent les consignes éthiques et réglementaires.
Évaluer, ajuster et améliorer la performance des agents
OpenAI met également l’accent sur la mesure de performance, un enjeu clé pour des déploiements à grande échelle. L’outil Evals, déjà utilisé par des entreprises comme Carlyle, Rippling ou Bain & Company, s’enrichit de nouvelles capacités :
- Datasets, pour créer rapidement des ensembles de données d’évaluation ;
- Trace grading, qui suit la performance d’un agent sur toute la chaîne de traitement ;
- Optimisation automatique des prompts, basée sur les retours humains et les scores d’évaluation ;
- Support multi-modèles, permettant de comparer la performance de différents LLM, y compris ceux d’autres fournisseurs.
Selon OpenAI, certains partenaires ont enregistré des gains de précision de 30% sur leurs workflows d’agents après intégration d’Evals.
Vers des agents plus performants avec le “reinforcement fine-tuning”
Autre nouveauté : l’ouverture du Reinforcement Fine-Tuning (RFT), désormais disponible sur le modèle o4-mini et en bêta privée sur GPT-5.
Cette méthode permet aux entreprises d’entraîner leurs propres modèles de raisonnement en fonction de critères spécifiques à leur activité. Deux options inédites sont introduites :
- Custom tool calls, pour apprendre aux modèles à utiliser les bons outils au bon moment ;
- Custom graders, qui permettent aux développeurs de définir leurs propres métriques de réussite.
Une stratégie orientée entreprise et standardisation
Au-delà de la technologie, AgentKit témoigne d’une ambition plus large : standardiser la création d’agents IA professionnels autour d’un socle commun. Le kit repose sur le Model Context Protocol (MCP), un standard ouvert conçu pour rendre les agents interopérables entre différents environnements.
OpenAI prévoit également d’intégrer prochainement un Workflows API pour le déploiement direct d’agents dans ChatGPT, ainsi qu’un Global Admin Console destiné aux entreprises, afin de centraliser la gouvernance des accès, des domaines et du SSO.
Des cas d’usage concrets déjà identifiés
Plusieurs entreprises pilotes exploitent déjà les outils d’AgentKit :
- Klarna a développé un agent de support capable de traiter deux tiers des demandes clients de manière autonome.
- Clay a enregistré une croissance multipliée par dix grâce à un agent commercial automatisé.
- Canva et HubSpot utilisent ChatKit pour proposer une expérience conversationnelle intégrée à leurs utilisateurs professionnels.
Ces retours soulignent une tendance forte : l’agentification des plateformes SaaS, qui permet de combiner automatisation et personnalisation dans les interactions clients.
Disponibilité et tarification
OpenAI précise que ChatKit et les nouvelles fonctionnalités d’Evals sont disponibles dès aujourd’hui pour tous les développeurs.
Agent Builder est accessible en bêta, tandis que le Connector Registry démarre son déploiement auprès des clients API, ChatGPT Enterprise et Edu disposant du Global Admin Console.
Tous ces outils sont inclus dans la tarification standard de l’API.
Le groupe prévoit de lancer prochainement un annuaire d’agents, ainsi qu’un système de monétisation pour les développeurs souhaitant publier leurs créations dans ChatGPT.
