Anthropic выпустила ИИ-модель Claude Sonnet 5

Компания Anthropic выпустила новую ИИ-модель Claude Sonnet 5. Обновление направлено на расширение агентных возможностей — автономного планирования, навигации по сети и работы с программными инструментами — и стало доступно во всех тарифах платформы Claude, включая бесплатные аккаунты.

В тесте автономного программирования SWE-bench Pro Sonnet 5 набрала 63,2% (у версии Sonnet 4.6 — 58,1%), а в тесте командного терминала Terminal-Bench показала 80,4%. В бенчмарке GDPval-AA v2 модель получила 1618 баллов.

В автоматизированных проверках поведения на предмет галлюцинаций и склонности подстраиваться под пользователя Sonnet 5 продемонстрировала 2,53 балла из 10 (у предыдущей версии — 2,89; у модели Opus 4.8 — 2,10). В совместных испытаниях с Mozilla на базе браузера Firefox модель не сгенерировала функциональных эксплойтов для программных уязвимостей.

Регион: 

Рубрики: 

Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!