Китайский стартап Z.ai сообщил о выпуске ИИ-модели GLM-5.2

Китайский стартап Z.ai (ранее Zhipu) представил крупномасштабную языковую модель GLM-5.2 с открытыми весами и 753 миллиардами параметров. Основная задача модели — генерация кода и разработка с длительным горизонтом планирования. Работать с GLM-5.2 можно через API на ресурсах Z.ai и на платформе Hugging Face; поддерживаются более 20 сторонних сред разработки. Контекстное окно составляет 1 млн токенов.

Основные веса доступны по лицензии MIT: предприятия могут бесплатно скачивать, настраивать и дорабатывать модель локально или через виртуальные машины, оплачивая только вычислительные ресурсы и электроэнергию. Модель имеет 753 миллиарда параметров и реализует архитектурную оптимизацию IndexShare: на четыре слоя разрежённого внимания повторно используется один индексатор, что при максимальной длине контекста в 1 млн токенов снижает вычислительную нагрузку примерно в 2,9 раза.

Также применяется модернизированная схема многотокенного предсказания (MTP): во время спекулятивного декодирования она пропускает на 20% больше токенов, что экономит ресурсы во время инференса. GLM-5.2 предоставляет режимы рассуждений: «максимальный» расширяет границы решений в логических задачах, а «высокий» обеспечивает баланс между производительностью и эффективностью.

В первом режиме в среднем выдаётся около 85 000 токенов на задачу, во втором — примерно вдвое меньше. В отраслевых тестах GLM-5.2 обошла большинство открытых флагманских моделей и показала результаты на уровне или выше передовых закрытых моделей, включая OpenAI GPT-5.5 и Anthropic Claude Opus 4.8. Для работы с моделью запущен тариф GLM Coding Plan, ориентированный на интеграцию средств разработки, а не традиционных чат-ботов. Поддерживаются такие приложения, как Claude Code, OpenClaw, Cline, Kilo Code, Crush и Factory.

Регион: 

Рубрики: 

Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!