
Alibaba представила семейство флагманских языковых моделей Qwen3, использующих инновационный подход «смешения экспертов» для достижения производительности, сравнимой с гибридными системами рассуждения.
По заявлению компании, Qwen3 превосходит или сопоставима по скорости и эффективности с моделями DeepSeek в таких задачах, как решение математических задач и программирование, при этом демонстрируя значительно более низкую стоимость масштабирования. Эта технология, аналогичная подходам Anthropic и Google, разбивает сложные задачи на подзадачи, решаемые отдельными компонентами модели, имитируя работу группы экспертов.
Qwen3 продолжает линию открытого исходного кода, начатую в марте с моделью Qwen 2.5, способной обрабатывать текст, изображения, аудио и видео на устройствах уровня ноутбука и смартфона. Конкуренция с DeepSeek и давление на OpenAI, также стремящуюся к созданию более открытой модели рассуждения, способствовали успеху Alibaba на рынке ИИ, помогая компании преодолеть кризис, вызванный конфликтом её основателя Джека Ма с китайскими властями.

Горячие темы