
Команда исследователей Qwen, поддерживаемая Alibaba, представила новую языковую модель Qwen3−235B-A22B, которая в тестах превосходит нейросеть Claude 4 Opus и «рассуждающий» алгоритм Kimi K2.
Новая модель Qwen3 значительно улучшила свои способности в написании текстов и решении задач по математике, наукам и программированию по сравнению с предыдущими версиями стартапа. Алгоритм функционирует в «нерассуждающем» режиме, что свидетельствует о его высокой эффективности. Объем обучающей базы был увеличен для всех языков. Одним из главных преимуществ модели является поддержка обширного контекстного окна, способного обрабатывать до 256 тысяч токенов.
Такая возможность открывает новые горизонты для работы с крупными документами, программным кодом и научными статьями. Выход Qwen3 создает дополнительные вызовы для таких рыночных лидеров, как OpenAI и Anthropic, предлагая компаниям и независимым разработчикам мощный и, возможно, более эффективный инструмент.
Особенно ценным является возможность работать с большими текстами, что крайне актуально в области юриспруденции, финансов и научных исследований. Модель Qwen3−235B-A22B оснащена 235 миллиардами параметров, однако благодаря архитектуре «смеси экспертов» (MoE) активирует лишь 22 миллиарда при каждом запросе. Это позволяет достигнуть высокой производительности при меньших вычислительных затратах и делает технологию более доступной.





