Alibaba présente Qwen3-Coder avec un support pour les agents IA capables de prendre des décisions indépendantes

L'équipe Qwen a officiellement présenté Qwen3-Coder, son générateur de code le plus puissant à ce jour, qui prend en charge l'approche "agent". La star de la gamme est Qwen3-Coder-480B-A35B-Instruct. Il s'agit d'un modèle hybride Mixture-of-Experts avec 480 milliards de paramètres (35 milliards actifs en même temps) qui peut travailler avec un contexte de jusqu'à 256 000 tokens nativement et jusqu'à 1 million de tokens avec extrapolation. Dans les tests, il démontre des résultats record parmi les modèles open source dans les tâches de Codage Agentique, d'Utilisation de Navigateur Agentique et d'Utilisation d'Outils Agentiques - au niveau de Claude Sonnet 4.
Qu'est-ce que le codage agentique ?
Qwen3-Coder a été créé non seulement pour générer du code, mais aussi pour fonctionner en tant qu'"agent" capable de planifier, d'utiliser des outils, de recevoir des retours et de prendre des décisions. Dans des tâches du monde réel (par exemple, SWE-Bench), il interagit avec l'environnement en plusieurs étapes, ce qui nécessite un apprentissage RL Long-Horizon complexe. À cet effet, l'équipe Qwen a mis en place un système évolutif de 20 000 environnements parallèles basé sur Alibaba Cloud.
Caractéristiques de Qwen3-Coder
- Entraîné sur 7,5 trillions de tokens, dont 70 % est du code
- Prend en charge un contexte géant pouvant aller jusqu'à 1 million de tokens (avec YaRN)
- Utilisation de l'apprentissage par renforcement (Code RL) dans des tâches du monde réel pour améliorer l'exécution du code
- Intégration avec des outils de développement tels que Qwen Code (CLI), Claude Code et même l'OpenAI SDK
- Capacité à travailler à la fois via l'API et dans l'environnement local
Outils et API
L'outil Qwen Code CLI basé sur Gemini Code est disponible avec le modèle. Il vous permet d'utiliser facilement Qwen3-Coder dans vos propres projets, avec prise en charge des invites et fonctions personnalisées. Il permet également de travailler via Claude Code et un accès API direct via Alibaba Cloud Model Studio.
À quoi est-ce destiné ?
Qwen3-Coder est positionné comme un agent de codage universel - de la génération de sites Web à des tâches de développement complexes en plusieurs étapes. L'équipe Qwen prévoit de publier davantage de tailles de modèles pour réduire les coûts de déploiement et explore les opportunités d'auto-amélioration de l'agent.
À propos de Qwen
Qwen est une série de modèles linguistiques et de solutions d'agents à grande échelle de l'équipe Qwen d'Alibaba, conçue pour générer du texte, du code, des analyses de données et des scénarios en plusieurs étapes à l'aide d'outils. La dernière version, Qwen3-Coder, est construite sur une architecture Mixture-of-Experts avec 480 milliards de paramètres (35 milliards actifs), prend en charge jusqu'à 256 000 tokens de contexte nativement et jusqu'à 1 million avec extrapolation, et démontre des résultats au niveau de modèle fermé comme Claude Sonnet 4 dans SWE-Bench, Codage Agentique, Utilisation de Navigateur et Utilisation d'Outils. Le modèle s'intègre avec l'OpenAI SDK, les outils CLI (Qwen Code, Claude Code), l'API Alibaba Cloud, et prend en charge les écosystèmes GitHub et Hugging Face, utilisant l'apprentissage par renforcement sur des tâches de codage du monde réel pour améliorer la précision et l'efficacité.
Source : qwenlm.github.io/blog/qwen3-coder/