L’un des plus grands goulets d’étranglement de l’ère de l’intelligence artificielle agentique vient de sauter. Si les grands modèles de langage excellent aujourd’hui dans le raisonnement complexe, leurs capacités d’action sur le web ouvert se heurtaient jusqu’alors à un mur invisible : les systèmes de détection de bots (Cloudflare, DataDome) et la complexité structurelle du code HTML des pages modernes.
Pour résoudre cette friction, la société singapourienne Ecocreate Technology Pte. Ltd. a annoncé la mise à disposition gratuite sur GitHub de BrowserAct de deux outils majeurs sous licence MIT : browser-act et browser-act-skill-forge. Ensemble, ils forment un environnement d’exécution et une usine de création de compétences automatisées pour permettre aux frameworks comme Claude Code, Cursor, OpenClaw ou Hermes Agent de naviguer sur internet exactement comme le ferait un humain.
Un navigateur furtif conçu pour l’intelligence artificielle
Le premier outil, browser-act, agit comme l’environnement d’exécution de l’agent. Plutôt que d’adapter des outils d’automatisation traditionnels comme Puppeteer ou Playwright (généralement repérés instantanément par les pare-feux applicatifs), BrowserAct intègre une isolation complète de l’empreinte numérique (canvas, WebGL, audio) et une gestion native de la résolution des CAPTCHA.

Chaque session de navigation dispose d’un bac à sable de cookies isolé et peut s’appuyer sur des proxys résidentiels pour localiser l’identité de l’agent dans 195 pays. La plateforme introduit également deux fonctionnalités hautement stratégiques pour les flux de travail en entreprise :
-
Le Chrome Takeover : l’agent peut se connecter directement à une session Chrome existante de l’utilisateur afin d’hériter de ses états d’authentification (LinkedIn, Gmail, espaces bancaires) sans manipulation de mots de passe.
-
L’assistance à distance (remote-assist) : lorsqu’un agent rencontre une validation par SMS ou une confirmation critique, il génère un lien sécurisé permettant à un humain d’intervenir temporairement dans la session active pour débloquer la situation, avant de lui rendre le contrôle.
Skill Forge : l’agent qui crée ses propres outils
La seconde innovation, browser-act-skill-forge, s’attaque à la maintenance des scripts de scraping. Traditionnellement, lorsqu’un site web modifie sa structure, le code d’automatisation se brise et nécessite l’intervention d’un ingénieur.

Le module Skill Forge permet à l’agent d’explorer de manière autonome un site web inconnu lors de sa première visite. Il identifie les points de terminaison d’API ou les structures DOM stables, teste leur viabilité, puis compile l’ensemble dans un package de compétences réutilisable (contenant un guide d’exécution au format Markdown et des scripts Python). L’approche repose sur un principe simple : explorer une fois, réutiliser indéfiniment. Les concepteurs précisent que l’outil est volontairement restreint aux actions publiques et ne contourne jamais l’authentification, facilitant ainsi les audits de conformité dans les secteurs réglementés.
Une baisse drastique de la facture de tokens
Au-delà de la fiabilité, l’impact économique de cette architecture saute aux yeux. En convertissant à la volée le code HTML brut des pages en flux JSON structurés avant de les renvoyer au modèle de langage, BrowserAct annonce une réduction allant jusqu’à 93 % de la consommation de tokens par rapport à un scraping classique. Les boucles d’erreur et de tentative diminuent quant à elles de 90 %.
L’ensemble du projet est accessible dès à présent sur GitHub, et une offre d’hébergement cloud incluant un niveau gratuit est proposée sur le site officiel de BrowserAct.
