"Т-Банк" выпустил ИИ-модель распознавания речи с открытым исходным кодом

ИИ-центр группы «Т-Технологии», владеющей 99,97% акций Т-Банка, выложил в открытый доступ модель автоматического распознавания речи T-one.

Отличие этой модели от похожих open source разработок «Сбера» и Open AI в том, что модель «Т-Технологий» распознает речь в потоке, а также обгоняет конкурентов по качеству, утверждают в компании. Об этом пишет Forbes.

По данным «Т-Технологий», T-one состоит из 70 млн параметров, то есть сравнительно небольшого размера. Для сравнения: ASR-модель компании SberDevices GigaAM состоит из 240 млн параметров, в ASR-модели Whisper large-v3 от OpenAI — 1,55 млрд параметров. По оценке «Т-Технологий», Т-one обгоняет большие открытые ASR-модели, GigaAM v2 и Whisper Large-v3, по качеству распознавания на русском в телефонии. 

 

Регион: 

Рубрики: 

Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!