Alibaba презентувала Qwen3-Coder з ШІ-агентами, що самостійно ухвалюють рішення

Alibaba презентувала Qwen3-Coder з ШІ-агентами, що самостійно ухвалюють рішення

QWEN3-Coder: Потужний кодгенератор з підтримкою «агентного» підходу

Команда QWEN офіційно запровадила QWEN3-Coder — найпотужніший кодгенератор з підтримкою підходу «агента». Основна зірка лінії QWEN3-CODER-480B-A35B-Instruct — це гібридна модель з 480 мільярдами параметрів (35 мільярдів активних), здатна працювати з контекстом до 256 000 жетонів, а з екстраполяцією — до 1 мільйона. Тестування показало, що вона досягає найкращих результатів серед відкритих моделей у агентному кодуванні, агентному браузері в США та інструменту США у Claude Sonnet 4.

Що таке кодування «агента»?

QWEN3-Coder був розроблений не лише для генерації коду, але й для повноцінної роботи як «агент», який може планувати, використовувати інструменти, отримувати зворотний зв’язок та приймати рішення. У реальних завданнях (наприклад, Swe-Bench) він здатен взаємодіяти з кількома етапами, які потребують складного тренування з довгим горизонтом (Long Horizon RL). Для цього команда QWEN створила масштабовану систему з 20 000 паралельних медіа на основі Alibaba Cloud.

Основні можливості QWEN3

  • Навчання на 7,5 трильйони жетонів, де 70% складають код
  • Підтримка гігантського контексту до 1 мільйона жетонів (з екстраполяцією)
  • Використання підкріплювального навчання (RL) для реальних завдань, що підвищує ефективність коду
  • Інтеграція з інструментами розробників — QWEN CODE (CLI), CLAUDE CODE та OpenAI SDK
  • Можливість роботи через API або у місцевому середовищі

Інструменти та API для розробників

QWEN3-Coder є універсальним агентом для кодування, здатним вирішувати різноманітні завдання, від генерації вебсайтів до складних багатоступеневих завдань у розробці. Команда QWEN планує випустити додаткові моделі для зменшення витрат на розгортання та дослідження можливостей для «самодослідження» агентів.

Про QWEN: QWEN — це серія великих мовних моделей та рішень агентів команди Alibaba (QWEN), розроблених для створення тексту, коду, аналізу даних та вирішення багатосторонніх задач за допомогою інструментів. Остання версія, QWEN3-Coder, побудована на архітектурі суміші експертів з 480 мільярдами параметрів (35 мільярдів активних), підтримує до 256 000 лексем контексту і до 1 мільйона з екстраполяцією. Ця модель демонструє найкращі результати серед закритих моделей у агентному кодуванні, агентному браузері в США та інструменті США. Вона інтегрована з OpenAI SDK, CLI-TOOLS (QWEN, код CLAUDE), API Alibaba Cloud, підтримує GitHub і розвиває екосистему Face, використовуючи підкріплювальне навчання для реального коду та ефективності.

Джерело: qwenlm.github.io/blog/qwen3-coder/