Alibaba выпустила ИИ-модель Qwen3-Max

Отдел разработки систем искусственного интеллекта Alibaba Qwen провёл это лето очень продуктивно, выпустив ряд моделей, которые не только сопоставимы, но и в некоторых случаях превосходят аналоги ведущих американских лабораторий, таких как Google, OpenAI и Anthropic. Наиболее значимым проектом стала большая языковая модель Qwen3-Max-Preview (Instruct), обладающая более чем 1 триллионом параметров.

Новая модель теперь доступна на официальном сайте разработчика Qwen Chat, через API в Alibaba Cloud, а также на платформах OpenRouter и AnyCoder. В отличие от других систем Alibaba, Qwen3-Max-Preview пока не предлагается с открытым исходным кодом, и разработчикам для её интеграции в приложения необходимо использовать платный API самой компании или её партнёров. На практике эта модель демонстрирует меньшую вероятность ошибок в сложных задачах, таких как сравнение одинаковых чисел или подсчёт количества букв в заданном слове — не все современные ИИ справляются с такими вызовами. Более того, на платформе Qwen Chat она функционирует быстрее, чем ChatGPT.

Alibaba Qwen3-Max-Preview поддерживает контекстное окно длиной 262 144 токенов, с максимальным объемом запроса в 258 048 токенов и максимальной длиной ответа в 32 768 токенов. Также предусмотрено кэширование контекста, что способствует оптимизации производительности при длительных сессиях. Модель предназначена для выполнения сложных рассуждений (хотя режим «Мышление» в Qwen Chat пока недоступен), написания программного кода и обработки структурированных форматов данных, таких как JSON, а также для выполнения творческих задач. Она демонстрирует высокую эффективность как в диалогах на различные темы, так и в качестве агента, что делает её подходящей для корпоративных клиентов и исследовательских лабораторий.

 

Регион: 

Рубрики: 

Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!