Microsoft: «Компьютер начал распознавать речь не хуже человека»

Система распознавания речи делает всего 5,9% ошибок по методике WER (Word Error Rate), столько же ошибок делает естественный распознаватель речи – человек. В прошлом месяце этот показатель равнялся 6,3%. Об этом сообщает компания Microsoft в корпоративном блоге.

«Мы достигли уровня человека. Это историческое достижение», - заявил главный ученый команды из подразделения Microsoft по работе с искусственным интеллектом Сюэдунь Хуань. По признанию исполнительного вице-президента подразделения Гарри Шума, еще пять лет назад сотрудники Microsoft полагали, что такое невозможно, пишет CNews.

Исторический момент наступил после десятилетий исследований в этой сфере, начиная еще с 1970-х годов, работы совместно с Агентством по перспективным оборонным научно-исследовательским разработкам США (DARPA), перед которым была поставлена задача технологических прорывов в сфере национальной безопасности.

 
Версия для печатиВерсия для печати

Регион: 

Рубрики: 

Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!

Читайте также

 

Комментарии

Страницы

Аватар пользователя mike

Покамест имхо фигня. Чел прекрасно распознаёт зашумленную речь. Компу ещё долго пукать до уровня чела. Хотя дело к этому идёт. :)

(Фишка в корреляционной обработке семантических паттернов речи мозгом. Но журналистам можно втирать, что всё решено -- схАвают! -- журналисты от пипл мало чем отличаются.)

-1
Аватар пользователя Piton

Все-таки как хорошо, что у нас есть mike, который компетентен абсолютно во всех вопросах, от нейрофизиологии до педагогики! И как ловко, всего одной фразой, он ставит на место этих жалких врунишек из M$, которые работают по своей тематике всего какой-то десяток-другой лет!

И само собой, хуже них могут быть только ничтожные журнализды, которые в силу своей тупости перепечатывают откровенное вранье, и которых наш mike неустанно за это возит мордой по столу.

-3
Аватар пользователя savely

Ну, Майк прав. Методика WER подразумевает чистый звук, без шумов. А очистка звука/голоса от шума - отдельный разговор, хотя и там есть неплохие результаты.
Кстати, еще и язык влияет. Небось, цифирь-то для английского, а он простой в этом плане.
Вот когда какого-нибудь вьетнамца на базаре распознают - будет круто! ;)

 

Аватар пользователя Piton

savely пишет:

Ну, Майк прав. Методика WER подразумевает чистый звук, без шумов. А очистка звука/голоса от шума - отдельный разговор, хотя и там есть неплохие результаты.

Парни из МС про это в курсе, поэтому и "собираются убедиться, что распознавание так же хорошо работает в стандартных бытовых ситуациях: шумных ресторанах, громких улицах и при сильном ветре" (цитата с другого сайта).

Небось, цифирь-то для английского, а он простой в этом плане.

Простой? Лично я американский английский воспринимаю с трудом, в отличие от английского английского или, тем более, какого-нибудь немецкого английского или турецкого английского.

А вообще, я где-то читал, что в этом плане весьма хорош немецкий. И немцы хорошо воюют в том числе и потому, что приказы на немецком воспринимаются гораздо лучше в условиях боя, чем на других языках :)

-1
Аватар пользователя mike

Все-таки как хорошо, что у нас есть mike, который компетентен абсолютно во всех вопросах, от нейрофизиологии до педагогики! 

Логика забанили, так он принялся за меня. :)

Аватар пользователя Piton

mike пишет:

Все-таки как хорошо, что у нас есть mike, который компетентен абсолютно во всех вопросах, от нейрофизиологии до педагогики! 

Логика забанили, так он принялся за меня. :)

К сожалению, Логик(тм) вернется к людям уже завтра :(

Что касается тебя, то я могу понять твое желание до##аться до местных "журнализдов". Но в последнее время минимум в половине случаев ты до##ываешься совершенно без повода (как в данном случае). Извини, но это унылое однообразие лично меня уже изрядно утомило.

-3
Аватар пользователя mike

это унылое однообразие лично меня уже изрядно утомило.

Твои проблемы. :)

Впрочем, буду разнообразнее. :))

+1
Аватар пользователя savely

> Но в последнее время минимум в половине случаев ты до##ываешься совершенно без повода (как в данном случае)

Журналистов как личностей хочется видеть. Полет мысли типа... А не тупой перепост (слава Богу, без ошибок). Думаешь, я что-то знал четко(!) по теме до поста Майка? Неа. И поэтому ему спасибо - я погуглил и узнал больше (методика WER, проблемы с конкретными языками).
Заняло минут 15. Но если бы это сделал автор и вставил в текст типа как "а вот есть еще такое мнение" - было бы отлично. 

 

-1
Аватар пользователя Petro46

Компьютеру до распознавания речи - как раком до Луны. Можете опровергать но это смешно будет.

-1
Аватар пользователя Piton

Petro46 пишет:

Компьютеру до распознавания речи - как раком до Луны. Можете опровергать но это смешно будет.

О, еще один эксперт!

А до чего еще? Вот, например, до управления автомобилем - как до Луны или все-таки чуток поближе?

 

 

Страницы