QWEN3-Coder: Потужний кодгенератор з підтримкою «агентного» підходу
Команда QWEN офіційно запровадила QWEN3-Coder — найпотужніший кодгенератор з підтримкою підходу «агента». Основна зірка лінії QWEN3-CODER-480B-A35B-Instruct — це гібридна модель з 480 мільярдами параметрів (35 мільярдів активних), здатна працювати з контекстом до 256 000 жетонів, а з екстраполяцією — до 1 мільйона. Тестування показало, що вона досягає найкращих результатів серед відкритих моделей у агентному кодуванні, агентному браузері в США та інструменту США у Claude Sonnet 4.
Що таке кодування «агента»?
QWEN3-Coder був розроблений не лише для генерації коду, але й для повноцінної роботи як «агент», який може планувати, використовувати інструменти, отримувати зворотний зв’язок та приймати рішення. У реальних завданнях (наприклад, Swe-Bench) він здатен взаємодіяти з кількома етапами, які потребують складного тренування з довгим горизонтом (Long Horizon RL). Для цього команда QWEN створила масштабовану систему з 20 000 паралельних медіа на основі Alibaba Cloud.
Основні можливості QWEN3
- Навчання на 7,5 трильйони жетонів, де 70% складають код
- Підтримка гігантського контексту до 1 мільйона жетонів (з екстраполяцією)
- Використання підкріплювального навчання (RL) для реальних завдань, що підвищує ефективність коду
- Інтеграція з інструментами розробників — QWEN CODE (CLI), CLAUDE CODE та OpenAI SDK
- Можливість роботи через API або у місцевому середовищі
Інструменти та API для розробників
QWEN3-Coder є універсальним агентом для кодування, здатним вирішувати різноманітні завдання, від генерації вебсайтів до складних багатоступеневих завдань у розробці. Команда QWEN планує випустити додаткові моделі для зменшення витрат на розгортання та дослідження можливостей для «самодослідження» агентів.
Про QWEN: QWEN — це серія великих мовних моделей та рішень агентів команди Alibaba (QWEN), розроблених для створення тексту, коду, аналізу даних та вирішення багатосторонніх задач за допомогою інструментів. Остання версія, QWEN3-Coder, побудована на архітектурі суміші експертів з 480 мільярдами параметрів (35 мільярдів активних), підтримує до 256 000 лексем контексту і до 1 мільйона з екстраполяцією. Ця модель демонструє найкращі результати серед закритих моделей у агентному кодуванні, агентному браузері в США та інструменті США. Вона інтегрована з OpenAI SDK, CLI-TOOLS (QWEN, код CLAUDE), API Alibaba Cloud, підтримує GitHub і розвиває екосистему Face, використовуючи підкріплювальне навчання для реального коду та ефективності.
Джерело: qwenlm.github.io/blog/qwen3-coder/