CUGA (Configurable Generalist Agent) est le nouveau fer de lance d'IBM pour l'automatisation intelligente en entreprise.

L’IA qui travaille à votre place ? IBM lance CUGA, son agent autonome pour terrasser Copilot

Le fantasme de l’employé virtuel qui gère vos e-mails, vos bases de données et vos APIs en toute autonomie vient de franchir une étape cruciale. IBM a officiellement publié CUGA (Configurable Generalist Agent), un framework d’agent IA entièrement open source (licence Apache 2.0). Alors que le marché de l’automatisation s’apprête à exploser, IBM choisit ici la carte de la transparence pour défier les systèmes fermés d’OpenAI ou de Microsoft.

Contrairement à un simple chatbot, CUGA est ce qu’on appelle une IA « agentique ». Il ne se contente pas de répondre, il exécute. Pour y parvenir, il utilise une orchestration multi-agents :

  • Décomposition des tâches : il découpe une mission complexe en sous-tâches structurées.

  • Replanification dynamique : un registre surveille l’avancement et permet à l’IA de corriger sa stratégie en cas d’erreur.

  • Agents spécialisés : il délègue le travail à des « experts », comme un agent API qui génère du code avant de le tester dans un environnement sécurisé (sandbox).

Côté performances, CUGA affiche des scores impressionnants pour de l’open source, avec un taux de réussite de 61,7 % sur le benchmark WebArena, devançant même certaines solutions propriétaires comme Operator d’OpenAI (58 %).

Le mur de la réalité : entre bugs et conformité

Tout n’est pas encore parfait dans le monde des agents autonomes. IBM reconnaît avec honnêteté que CUGA souffre parfois de bugs de boucle d’exécution, où l’agent s’enferme dans une tâche sans savoir en sortir. Plus inquiétant pour les entreprises : la difficulté pour ces agents de respecter les politiques internes. Les tests d’IBM montrent que face à des règles métier complexes, le taux de réussite chute drastiquement. Les chercheurs notent que les agents peinent à jongler avec plusieurs contraintes simultanées, un défi majeur puisque Gartner prévoit que 40 % des projets d’IA agentique seront annulés d’ici à 2027 à cause de cette complexité.

Un outil pour « libérer » les travailleurs du savoir

Malgré ces obstacles, la vision d’IBM est claire : transformer CUGA en un assistant capable de gérer les aspects routiniers ou complexes du travail de manière fiable. Le système est déjà compatible avec des modèles ouverts majeurs comme Llama-4 et s’intègre à Langflow pour faciliter sa configuration.

Pour les curieux et les développeurs, le projet est déjà accessible en ligne :

Retour en haut