Alibaba publie Qwen3-Coder-480B, son modèle open source de codage le plus ambitieux

L’écosystème open source de l’IA générative s’enrichit d’un nouveau géant. Alibaba a dévoilé Qwen3-Coder-480B-A35B-Instruct, un modèle de codage agentique impressionnant par sa taille comme par ses performances. Avec 480 milliards de paramètres — dont 35 milliards activés à chaque requête dans une architecture Mixture-of-Experts — il s’agit tout simplement du modèle open source de codage le plus avancé jamais publié par le géant chinois.

Pensé pour répondre aux exigences de l’agentivité en développement logiciel, Qwen3-Coder offre une longueur de contexte native de 256 000 tokens, et peut aller jusqu’à un million de tokens via extrapolation. Cela le rend apte à manipuler des bases de code complexes, à suivre des logs très longs ou à maintenir un fil de raisonnement étendu sans rupture de contexte, ce qui est particulièrement utile pour le développement de systèmes autonomes.

Alibaba affirme que Qwen3-Coder surpasse les autres modèles ouverts sur plusieurs benchmarks de référence du codage agentique, dont le SWE-bench-Verified, ce qui témoigne d’une maturité technologique déjà solide. Entraîné sur 7,5 billions de tokens, dont 70 % sont du code, le modèle affiche également de bonnes performances sur les tâches de raisonnement général et mathématique. Ce compromis est essentiel pour développer des agents de développement capables de comprendre aussi bien les instructions métier que les implémentations techniques.

Le modèle n’arrive pas seul. Alibaba publie en parallèle Qwen Code, un outil en ligne de commande dérivé de Gemini Code, conçu pour interagir efficacement avec Qwen3-Coder. Il prend en charge des prompts personnalisés, des protocoles d’appel de fonctions, et facilite l’intégration du modèle dans des workflows de développement automatisé. Cette mise à disposition en open source, accessible directement sur le dépôt GitHub Qwen3-Coder, renforce l’engagement d’Alibaba à soutenir la communauté IA et Dev.

Qwen3-Coder est également disponible via Alibaba Cloud Model Studio, avec un accès API. Les développeurs peuvent déjà l’exploiter via différents frontends comme Qwen Code, Claude Code ou encore Cline, pour créer des assistants de codage, des outils de refactoring intelligents ou des agents capables de générer, corriger et exécuter du code dans des environnements complexes.

Autre axe stratégique annoncé : l’exploration de l’auto-amélioration. En d’autres termes, Alibaba s’interroge sur la capacité du modèle à se perfectionner en autonomie, à mesure qu’il interagit avec les développeurs et les environnements de production. Ce champ de recherche, encore émergent, pourrait faire de Qwen3-Coder bien plus qu’un assistant : un véritable coéquipier de développement, capable d’apprendre de ses erreurs et d’évoluer sans intervention humaine directe.

Avec ce lancement, Alibaba vient clairement marcher sur les plates-bandes d’OpenAI, Google DeepMind et Meta, tout en affirmant une approche différente : un modèle massif, mais accessible, open source et déjà compatible avec les outils de la communauté. 

Retour en haut