
ИИ-центр группы «Т-Технологии», владеющей 99,97% акций Т-Банка, выложил в открытый доступ модель автоматического распознавания речи T-one.
Отличие этой модели от похожих open source разработок «Сбера» и Open AI в том, что модель «Т-Технологий» распознает речь в потоке, а также обгоняет конкурентов по качеству, утверждают в компании. Об этом пишет Forbes.
По данным «Т-Технологий», T-one состоит из 70 млн параметров, то есть сравнительно небольшого размера. Для сравнения: ASR-модель компании SberDevices GigaAM состоит из 240 млн параметров, в ASR-модели Whisper large-v3 от OpenAI — 1,55 млрд параметров. По оценке «Т-Технологий», Т-one обгоняет большие открытые ASR-модели, GigaAM v2 и Whisper Large-v3, по качеству распознавания на русском в телефонии.





