Alibaba, 28 апреля 2025 года, китайский технологический гигант, анонсировал выпуск новой серии моделей искусственного интеллекта – Qwen3. Эта линейка больших языковых моделей (LLM) включает 8 моделей разного размера – от компактных с 0.6 миллиарда параметров до мощного флагмана Qwen3-235B-A22B с 235 миллиардами параметров. Главной особенностью новой серии стала инновационная гибридная способность к «мышлению», которая позволяет моделям адаптироваться к задачам разной сложности, обеспечивая баланс между скоростью и глубиной анализа.
Что такое Qwen3 и почему это важно?
Qwen3 – это эволюция предыдущей серии Qwen2.5 от Alibaba, которая уже завоевала признание в мире искусственного интеллекта. Новая серия включает два типа моделей: плотные (dense) и модели с «микстурой экспертов» (MoE). Например, флагманская модель Qwen3-235B-A22B имеет 235 миллиардов параметров, из которых 22 миллиарда активно используются во время работы. Меньшая MoE-модель, Qwen3-30B-A3B, с 30 миллиардами параметров и 3 миллиардами активных, демонстрирует впечатляющую эффективность, превосходя предыдущие модели, такие как QwQ-32B, в 10 раз по количеству активированных параметров.
Одной из ключевых инноваций Qwen3 является гибридный подход к «мышлению». Модели могут работать в двух режимах:
- «Мышление» (thinking mode) – для сложных задач, требующих глубокого анализа, например, решения математических задач или написания кода;
- «Без мышления» (non-thinking mode) – для быстрых ответов на простые запросы.
Эта гибкость позволяет пользователям настраивать модели в зависимости от потребностей, оптимизируя затраты вычислительных ресурсов без потери качества.
Впечатляющие результаты тестирования
Alibaba опубликовала результаты бенчмарков, которые демонстрируют преимущества Qwen3 над конкурентами, такими как DeepSeek-R1, OpenAI o1, o3-mini, Grok-3 от xAI и Gemini-2.5-Pro от Google. В частности, флагман Qwen3-235B-A22B показал следующие результаты:
- ArenaHard: 95.6% (DeepSeek-R1 – 93.2%, OpenAI o1 – 92.1%);
- AIME’24 (математика): 85.7% (Grok 3 Beta – 83.9%, OpenAI o1 – 74.3%);
- Codeforces (кодинг): рейтинг 2056 (Gemini-2.5-Pro – 2001, DeepSeek-R1 – 2029);
- LiveBench: 77.1% (Gemini-2.5-Pro – 82.4%, OpenAI o1 – 75.7%).

Меньшие модели, такие как Qwen3-32B и Qwen3-4B, также показали впечатляющие результаты. Например, Qwen3-4B по производительности приближается к Qwen2.5-72B-Instruct, что делает её идеальным выбором для пользователей с ограниченными вычислительными ресурсами.
Поддержка 119 языков и новые возможности
Qwen3 поддерживает 119 языков и диалектов, что открывает широкие перспективы для международных приложений. От английского и китайского до редких языков, таких как суахили или кхмерский, модель обеспечивает точную обработку текста и перевод. Это делает её идеальным инструментом для глобальных компаний, стремящихся автоматизировать клиентскую поддержку или контент-маркетинг.
Кроме того, Qwen3 получила значительные улучшения в области кодинга и агентских возможностей. Модель оптимизирована для работы с инструментами (tool-calling), что позволяет ей эффективно взаимодействовать с внешними системами. Например, она может автоматически получать данные с GitHub и создавать графики, как показано в демонстрационных примерах от Alibaba.
Открытый доступ и инструменты для разработчиков
Одним из главных преимуществ Qwen3 является её открытый вес (open-weight) под лицензией Apache 2.0, что позволяет разработчикам бесплатно использовать модели для коммерческих и исследовательских целей. Модели доступны на популярных платформах, таких как Hugging Face, GitHub, ModelScope и Kaggle.
Для развертывания Qwen3 Alibaba рекомендует использовать фреймворки SGLang и vLLM, которые совместимы с API OpenAI. Для локального использования подходят инструменты, такие как Ollama, LMStudio, MLX, llama.cpp и KTransformers. Это позволяет легко интегрировать модели в различные рабочие процессы – от исследований до промышленных приложений.
Влияние на рынок искусственного интеллекта
Запуск Qwen3 – это важный шаг для китайского AI-сектора, который всё больше конкурирует с американскими лидерами, такими как OpenAI и Google. Гибридный подход к мышлению, высокая производительность и открытый доступ делают Qwen3 привлекательным выбором для разработчиков и компаний, ищущих мощные, но доступные решения.
Эксперты считают, что Qwen3 может изменить правила игры в сфере искусственного интеллекта, поскольку она не только предлагает передовые технологии, но и снижает барьеры для их использования. Это может ускорить развитие AI-приложений в различных отраслях – от образования до программирования.
Источник
Подробнее о запуске Qwen3 можно узнать из официального анонса Alibaba на платформе X: Alibaba Qwen.