Alibaba представила семейство ИИ-моделей Qwen3

Alibaba представила семейство флагманских языковых моделей Qwen3, использующих инновационный подход «смешения экспертов» для достижения производительности, сравнимой с гибридными системами рассуждения.

По заявлению компании, Qwen3 превосходит или сопоставима по скорости и эффективности с моделями DeepSeek в таких задачах, как решение математических задач и программирование, при этом демонстрируя значительно более низкую стоимость масштабирования. Эта технология, аналогичная подходам Anthropic и Google, разбивает сложные задачи на подзадачи, решаемые отдельными компонентами модели, имитируя работу группы экспертов.

Qwen3 продолжает линию открытого исходного кода, начатую в марте с моделью Qwen 2.5, способной обрабатывать текст, изображения, аудио и видео на устройствах уровня ноутбука и смартфона. Конкуренция с DeepSeek и давление на OpenAI, также стремящуюся к созданию более открытой модели рассуждения, способствовали успеху Alibaba на рынке ИИ, помогая компании преодолеть кризис, вызванный конфликтом её основателя Джека Ма с китайскими властями.

 

Читайте новости первыми в нашем Telegram-канале!

Подписывайтесь на наш канал в Дзен!

Версия для печатиВерсия для печати

Регион: 

Рубрики: 

Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!