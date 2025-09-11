Alibaba анонсировала новую модель искусственного интеллекта Qwen3-ASR-Flash, предназначенную для расшифровки аудиофайлов. По уровню точности распознавания речи она превосходит модели Gemini-2.5-Pro и GPT-4o.

Qwen способна обрабатывать любые аудио, включая песни и записи низкого качества с сильным фоновым шумом. Модель поддерживает 11 языков, среди которых есть русский и английский. Qwen3-ASR-Flash доступна для бесплатного тестирования на платформах HuggingFace и ModelScope.

Разработчики также могут интегрировать её в свои приложения. Стоимость расшифровки составляет $0,000032 за каждую секунду аудио.