TechHub

Alibaba представила Qwen3: новые модели искусственного интеллекта с уникальным «мышлением»

9 месяцев назад
от Тарас Шевчук

Alibaba, 28 апреля 2026 года, китайский технологический гигант, анонсировал выпуск новой серии моделей искусственного интеллекта – Qwen3. Эта линейка больших языковых моделей (LLM) включает 8 моделей разного размера – от компактных с 0.6 миллиарда параметров до мощного флагмана Qwen3-235B-A22B с 235 миллиардами параметров. Главной особенностью новой серии стала инновационная гибридная способность к «мышлению», которая позволяет моделям адаптироваться к задачам разной сложности, обеспечивая баланс между скоростью и глубиной анализа.

Что такое Qwen3 и почему это важно?

Qwen3 – это эволюция предыдущей серии Qwen2.5 от Alibaba, которая уже завоевала признание в мире искусственного интеллекта. Новая серия включает два типа моделей: плотные (dense) и модели с «микстурой экспертов» (MoE). Например, флагманская модель Qwen3-235B-A22B имеет 235 миллиардов параметров, из которых 22 миллиарда активно используются во время работы. Меньшая MoE-модель, Qwen3-30B-A3B, с 30 миллиардами параметров и 3 миллиардами активных, демонстрирует впечатляющую эффективность, превосходя предыдущие модели, такие как QwQ-32B, в 10 раз по количеству активированных параметров.

Одной из ключевых инноваций Qwen3 является гибридный подход к «мышлению». Модели могут работать в двух режимах:

«Мышление» (thinking mode) – для сложных задач, требующих глубокого анализа, например, решения математических задач или написания кода;
«Без мышления» (non-thinking mode) – для быстрых ответов на простые запросы.

Эта гибкость позволяет пользователям настраивать модели в зависимости от потребностей, оптимизируя затраты вычислительных ресурсов без потери качества.

Впечатляющие результаты тестирования

Alibaba опубликовала результаты бенчмарков, которые демонстрируют преимущества Qwen3 над конкурентами, такими как DeepSeek-R1, OpenAI o1, o3-mini, Grok-3 от xAI и Gemini-2.5-Pro от Google. В частности, флагман Qwen3-235B-A22B показал следующие результаты:

ArenaHard: 95.6% (DeepSeek-R1 – 93.2%, OpenAI o1 – 92.1%);
AIME’24 (математика): 85.7% (Grok 3 Beta – 83.9%, OpenAI o1 – 74.3%);
Codeforces (кодинг): рейтинг 2056 (Gemini-2.5-Pro – 2001, DeepSeek-R1 – 2029);
LiveBench: 77.1% (Gemini-2.5-Pro – 82.4%, OpenAI o1 – 75.7%).

Меньшие модели, такие как Qwen3-32B и Qwen3-4B, также показали впечатляющие результаты. Например, Qwen3-4B по производительности приближается к Qwen2.5-72B-Instruct, что делает её идеальным выбором для пользователей с ограниченными вычислительными ресурсами.

Поддержка 119 языков и новые возможности

Qwen3 поддерживает 119 языков и диалектов, что открывает широкие перспективы для международных приложений. От английского и китайского до редких языков, таких как суахили или кхмерский, модель обеспечивает точную обработку текста и перевод. Это делает её идеальным инструментом для глобальных компаний, стремящихся автоматизировать клиентскую поддержку или контент-маркетинг.

Кроме того, Qwen3 получила значительные улучшения в области кодинга и агентских возможностей. Модель оптимизирована для работы с инструментами (tool-calling), что позволяет ей эффективно взаимодействовать с внешними системами. Например, она может автоматически получать данные с GitHub и создавать графики, как показано в демонстрационных примерах от Alibaba.

Открытый доступ и инструменты для разработчиков

Одним из главных преимуществ Qwen3 является её открытый вес (open-weight) под лицензией Apache 2.0, что позволяет разработчикам бесплатно использовать модели для коммерческих и исследовательских целей. Модели доступны на популярных платформах, таких как Hugging Face, GitHub, ModelScope и Kaggle.

Для развертывания Qwen3 Alibaba рекомендует использовать фреймворки SGLang и vLLM, которые совместимы с API OpenAI. Для локального использования подходят инструменты, такие как Ollama, LMStudio, MLX, llama.cpp и KTransformers. Это позволяет легко интегрировать модели в различные рабочие процессы – от исследований до промышленных приложений.

Влияние на рынок искусственного интеллекта

Запуск Qwen3 – это важный шаг для китайского AI-сектора, который всё больше конкурирует с американскими лидерами, такими как OpenAI и Google. Гибридный подход к мышлению, высокая производительность и открытый доступ делают Qwen3 привлекательным выбором для разработчиков и компаний, ищущих мощные, но доступные решения.

Эксперты считают, что Qwen3 может изменить правила игры в сфере искусственного интеллекта, поскольку она не только предлагает передовые технологии, но и снижает барьеры для их использования. Это может ускорить развитие AI-приложений в различных отраслях – от образования до программирования.

Источник

Подробнее о запуске Qwen3 можно узнать из официального анонса Alibaba на платформе X: Alibaba Qwen.

AI модели Alibaba DeepSeek OpenAI Qwen3 гибридное мышление Инновации Искусственный интеллект кодинг математика Технологии

Alibaba представила Qwen3: новые модели искусственного интеллекта с уникальным «мышлением»

Что такое Qwen3 и почему это важно?

Впечатляющие результаты тестирования

Поддержка 119 языков и новые возможности

Открытый доступ и инструменты для разработчиков

Влияние на рынок искусственного интеллекта

Источник

Добавить комментарий

Стрижка каре 2026: 6 идей, от которых все будут в восторге в этом году

Новинки френч маникюра 2026: модные тренды с фото

Мода на куртки в 2026 году: тренды сезона

Новинки верхней одежды 2026 – образы, варианты