"Говоруны" - озвучивание текста

Хотите сберечь свое зрение, а заодно и время при прочитывании различных текстов на компьютере? А желаете ли научить свой компьютер говорить? Тогда прочитайте эту статью и узнаете, как желаемое сделать явным.

Естественно, если программа будет говорить, ей потребуются соответствующие "железяки": звуковая карточка и колонки. Но чтобы услышать голос, нужны будут дополнительные компоненты: голосовой движок (Text-to-speech engine) и SpeechAPI.

Text-to-speech engine - это набор файлов с описанием голоса, позволяющий синтезировать речь из текста. Подобных голосовых движков достаточно много, и они различаются следующими параметрами: качество синтеза речи, язык (например, английский, русский, немецкий), характер голоса (мужчина, женщина), производители и пр.

SpeechAPI позволяет программам работать с Text-to-speech engine`ами.

В дистрибутив некоторых игрушек и специальных программ уже входят Text-to-speech engin`ы, так что, возможно, они есть у вас на компьютере. Однако ни движки, ни SpeechAPI уж точно не понадобятся счастливым обладателям Windows 2000, - у них это все есть.

 

После того, как мы произвели подготовку к осмотру "говорилок", можно начинать обозревать программы.

Говорилка. Данная программа читает голосом любой текст на любом языке. Она может читать как текст, помещенный в буфер обмена, так и находящийся в окне программы. В последнем случае она открывает большие файлы и понимает DOS- и Windows-кодировки. Благодаря автоматической прокрутке текста на экране читаемый фрагмент всегда остается видимым.

Кроме этого, программа обладает возможностями изменения скорости чтения и высоты голоса и громкости, записи речи в звуковой wav-файл.

VoiceMan. С помощью забавных персонажей (робота, волшебника, джина и др.) программа прочитает русские и английские тексты. Кстати говоря, дополнительные персонажи находятся на домашней страничке и их можно выбрать на свой вкус.

С указанной периодичностью программа выдает разные забавные фразы. А с помощью комбинации "горячих клавиш" Ctrl-W программа прочитает данные из буфера, не вызывая спрятанную программу.

VoiceMan работает под Windows 98, NT, 2000 и имеет русский интерфейс. Для полноценной работы программу необходимо бесплатно зарегистрировать, после чего она будет "Ваня! Я ваша навек".

Speaking Email Deluxe. Если первые две программы были предназначены только "для разговора", то эта - еще и для работы с почтой. Speaking Email Deluxe проверяет почтовые ящики и сообщает о новых письмах, голосом читая их заголовки и содержание.

По умолчанию программа не работает с русским, но, покопавшись в Сети, можно решить и эту проблему. Однако здесь могут возникнуть сложности с кодировкой.

CoolSpeech - еще одна программа для озвучивания текстов. Она умеет открывать и читать текстовые и RTF-файлы, а также помещенный в буфер текст. Дополнительные функции: скачивание по расписанию указанных страничек из интернета, перевод текста в WAV-файлы, чтение писем из почтового ящика и новостей с сайтов.

Speech Multilanguage - программа для чтения текстов с высоким качеством произношения на девяти языках (русском, английском, немецком, французском, испанском, итальянском, португальском, японском, датском). А поэтому она будет полезна для изучения иностранных языков, в частности, для правильного произношения. Программа может читать содержимое буфера, прятаться в трэй, а в новой версии увеличен прочитываемый буфер и поддерживается двухязыковой интерфейс.

Speech. Может читать текст из любого текстового редактора. Имеет много полезных функций и высокое качество произношения. Текст читают различные персонажи, а при наличии соответствующих голосовых блоков текст можно произносить на любом языке мира, что может быть полезно при изучении иностранных языков. Требует VB Run-time Dll 6.0.

Павел БАДЯЛИК,
fpmi@tut.by

Программы и необходимые дополнения можно найти по таким адресам:

Русский Text-to-speech engine: [2929 Kb], activex.microsoft.com/activex/controls/agent2/lhttsrur.exe, английский "движок": [2611 Kb], activex.microsoft.com/activex/controls/agent2/lhttseng.exe.

SpeechAPI: activex.microsoft.com/activex/controls/sapi/spchapi.exe

Говорилка [378 Kb], free, vecs.nm.ru/Govorilka136rus.exe

VoiceMan [930 Kb], free, www.vsen.sp.ru/vm.zip

Speaking Email Deluxe [4630 Kb], $, www.uk-software.com/deploy/email/setup.exe

CoolSpeech [2374 Kb], $, www.bytecool.com/cssetup.exe

Speech Multilanguage [678 Kb], $, multilang.virtualave.net/spm11.exe

Speech [4471 Kb], $, speech.narod.ru/speech31.zip

Версия для печатиВерсия для печати

Номер: 

30 за 2001 год

Рубрика: 

Software
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!
 

Комментарии

Страницы

Аватар пользователя William Cvetkoff
По прочтении данной статьи решил сам ознакомиться с тем, о чем идет речь. Мои мысли приведены в виде комментариев.

Говорилка. Данная программа читает голосом любой текст на любом языке. Она может читать как текст, помещенный в буфер обмена, так и находящийся в окне программы. В последнем случае она открывает большие файлы и понимает DOS- и Windows-кодировки. Благодаря автоматической прокрутке текста на экране читаемый фрагмент всегда остается видимым.

Кроме этого, программа обладает возможностями изменения скорости чтения и высоты голоса и громкости, записи речи в звуковой wav-файл.

William Cvetkoff:

Установка «Говорилки» прошла моментально. И у программы действительно довольно приятный интерфейс. На этом ее плюсы, как это ни печально, для меня исчерпались. Начать с того, что я, хоть и «счастливый» обладатель Windows2000, а соответственно, по заверению автора статьи у меня должны стоять все Enginы и SAPI, программа наотрез отказывалась читать текст по-русски. Вернее, она что-то невнятно бормотала. Английский же ее, мягко говоря, был страшен.

Впрочем, сие прошло, когда я скачал Text Engine и Sapi. Как известно, русский язык у Lernaut&Houspie довольно сносен, однако назвать его эталоном нельзя. «Говорилка» же является обыкновенной оболочкой к движку Lernaut&Houspie. И принципиально нового ничего не добавляет.

VoiceMan. С помощью забавных персонажей (робота, волшебника, джина и др.) программа прочитает русские и английские тексты. Кстати говоря, дополнительные персонажи находятся на домашней страничке и их можно выбрать на свой вкус.

С указанной периодичностью программа выдает разные забавные фразы. А с помощью комбинации "горячих клавиш" Ctrl-W программа прочитает данные из буфера, не вызывая спрятанную программу.

VoiceMan работает под Windows 98, NT, 2000 и имеет русский интерфейс. Для полноценной работы программу необходимо бесплатно зарегистрировать, после чего она будет "Ваня! Я ваша навек".

William Cvetkoff:

VoiceMan в плане произношения отдельных слов и фраз ничем не отличается от своего собрата «Говорилки». Использует стандартные движки речи и анимационные персонажи, чем немного напоминает Magic Goody. Довольно прикольно, но, во-первых, достаточно сложная процедура установки (вернее, то, как описал ее автор – на 5 листах), во-вторых, если честно, она, то есть программа, какая-то навязчивая через чур… Наверное, это из-за ежесекундного напоминания о регистрации.

Speaking Email Deluxe. Если первые две программы были предназначены только "для разговора", то эта - еще и для работы с почтой. Speaking Email Deluxe проверяет почтовые ящики и сообщает о новых письмах, голосом читая их заголовки и содержание.

По умолчанию программа не работает с русским, но, покопавшись в Сети, можно решить и эту проблему. Однако здесь могут возникнуть сложности с кодировкой.

William Cvetkoff:

К Вашему сведению, данная программа сперва закачивает установочный файл, и только потом этот файл закачивает всю остальную программу. Приготовьтесь к тому, что по окончании закачки, программа не обнаружит MS Agent, и начнет качать еще и его.

Русский язык эта программа изначально не знает, и, честно говоря, даже при наличии выделенной линии, у меня не возникло желания искать способы научить ее читать по-русски.

На сайте выложена версия 5.7.8, которая не бесплатна, и кряков к которой пока не придумано.

Хотя, если Вы изучаете English, можете попробовать насладиться ее оксфордским произношением. Впрочем, даже тут все стандартно и практически не отличается от вышеприведенных программ. Одни и те же голоса, тон выше, тон ниже, скорость выше, скорость ниже. Короче, проще письмо прочитать вручную. То есть, глазами. В программу также встроен калькулятор, который произносит цифры. Типа круто…

На том же сайте есть еще говорящие часы. Для любителей кукушек.

CoolSpeech - еще одна программа для озвучивания текстов. Она умеет открывать и читать текстовые и RTF-файлы, а также помещенный в буфер текст. Дополнительные функции: скачивание по расписанию указанных страничек из интернета, перевод текста в WAV-файлы, чтение писем из почтового ящика и новостей с сайтов.

William Cvetkoff:

Использует L&H TruVoice TTS Engines, а посему читает точно с таким же качеством, как и все вышеприведенные программы. В качестве альтернативы на сайте есть ссылки на движки от Digalo, Elan и IBM. Прослушав все, я сделал вывод о полной их однотипности. Что, впрочем, не мешает назначать цены на данные продукты от 29 баксов у Digalo до нескольких сотен у IBM и Dragon Naturally Speaking.

Speech Multilanguage - программа для чтения текстов с высоким качеством произношения на девяти языках (русском, английском, немецком, французском, испанском, итальянском, португальском, японском, датском). А поэтому она будет полезна для изучения иностранных языков, в частности, для правильного произношения. Программа может читать содержимое буфера, прятаться в трэй, а в новой версии увеличен прочитываемый буфер и поддерживается двухязыковой интерфейс.

William Cvetkoff:

Привожу дословный авторский текст с сайта:

Speech Multilanguage it is system of transformation from Text to Speech, based on Microsoft Speech API, that enables to read the texts with high quality of a pronunciation. The program is useful to study of foreign languages, as correct pronunciation (you will not be reached find out as correctly to make that word). It is possible also to use the program for the story of the reports, or even of fairy tales to children :) . Speech Multilanguage really reads in 9 languages (Russian, English, German, French, Spanish, Italian, Portuguese, Japanese, Danish) which it is possible buy (more in details see in registration).

Все тот же Microsoft.

Speech. Может читать текст из любого текстового редактора. Имеет много полезных функций и высокое качество произношения. Текст читают различные персонажи, а при наличии соответствующих голосовых блоков текст можно произносить на любом языке мира, что может быть полезно при изучении иностранных языков. Требует VB Run-time Dll 6.0.

William Cvetkoff:

Система Speech дает возможность произносить только первые 2500 знаков загруженного текста. Построена на Microsoftoвском движке.

Больше сказать нечего.

Выводы и дополнения

Все вышеприведенные программы работают на основе западных движков речи. Как будто ТАМ русский знают лучше чем здесь. А что еще можно подумать? Да и не так хороши эти программы. Пока, по крайней мере.

Забыли еще одну программу указать. Белорусскую, между прочим. Что вдвойне обидно. Работает она полностью на собственном движке, алгоритм синтеза речи также придуман белорусскими программистами из компании «Сакрамент». И это не двухсоткилобайтная оболочка, каковыми в основном являются вышеназванные программы.

Если интересно, зайдите на сайт http://www.sakrament.com

С уважением, William Cvetkoff

Аватар пользователя alt-ctrl-del
В принципе, действительно нет русских движков. А те, что есть - кривые на нет..

Сакрамент тут наддал, а ведь контора не очень (если не сказать совсем) известная!!

Аватар пользователя Иван
Не знаю, я перепробовал все программы и если сравнивать потенциал, то сакрамент даст фору даже мелкомяхким. :))

Это учитывая вложения в $$.

Аватар пользователя piligrim
Из чистого любопытства прошёл всем вышеуказанным путём. Сразу скажу, что никогда этим вопросом специально не занимался, однако работаю в такой области, где это могло бы пригодится. А теперь мои субъективные ощщущения.

Говорилка и VoiceMan заработали сразу, как только сделал всё, что они просили. Все настройки, в принципе, работают в соответствии с декларацией. Речь имеет акцент, но проговариемость приличная. Прилично выдерживается пунктуация. Паузы имеются там, где они должны быть. При ускорении речи всё это сохраняется. Речь имеет эдакий "булькающий" эффект, который иногда съедает окончания. Тем не менее, из положения лёжа на диване я слушал роман Васильева и практически врубался в повествование.

Теперь рекламируемая прога... Ну..., теперь к демонстрашке прицепили сам АМР и она стала весить 7 метров... Несколько не ожиданно, господа, ну да ладно... Инсталлировалась прога бойко, но вот никаких настроек я не обнаружил. Прога говорит, что нет их и всё! И никакой писульки. Ничего не получилось и с задекларированным действом с перетаскиванием текста. Уже собирался снести всё, но увидел, что файлы *.TXT заимели АМРовскую лейбу. Вот тут-то и открыл я её! Однако оставим все эти мелочи. Всё же прога наша! Не туфта какая-нибудь Билогейтовская! Ну слушаем речь... Скажу я вам ребята, что это другая туфта! И так, по-порядку:

-"Бульканье" ни куда не делось, всё в полной мере и здесь.

-Так как настроек никаких, то речь ведётся одним тоном: тоном надгробной речи Сатаны над погибшей Галактикой. А то, что из 20 слов 8-10 произносится с неправильным ударением ощутимо добавляют впечатления. Между прочим, другие программы на забугорном движке, хоть и с акцентом говорят, но с ударением ошибаются на порядок реже.

Пунктуация почти не прослеживается. Предложения друг от друга идут почти без просветов, а тот же эффект съедания окончаний, порой, превращает речь в набор слов и обрывки фраз, которые ну ни как не связываются в повествование. Короче, не расположило меня полежать на диване при таком чтеце.

И вот ведь, что впечатлило! На "тех" прогах по одиному автору, а тут!... Ё-моё! Всё с таким размахом! Конференции международные! И дессиртации :|.. А я как представлю себе, что после какого-нибудь "верхнего" решения это внедрят где-нибудь,например, в аэропорту... И оно будет желать всем приятного полёта.

Или старушка в телефоне услышит парочку фраз от этой проги. Я думаю, это хороший способ уменьшить склонность нашего народонаселения в сторону старения.

В общем, как я понимаю, создатели этого форума и являются лицами т.с. заинтересованными. Так вот моё не профессиональное мнение: Всё, что вы рассказали о своей проге несколько преждевременно и объявлять её в качестве конкурента имеющимся явно рано.При этом я мею в виду именно драйвер, а не его материзацию в виде довольно корявого плагина к WinAmpу.

Тем не менее, хочется верить, что и у нас не лыком шиты и, глядишь, через пару-другую диссертаций что-нибудь и родится. Вот только бы русские программеры у Била, тем временем бы, дело б не поправили! А то очем тогда диссертации шлёпать? А интересно, о чём у них там другие диссертации?

Аватар пользователя William Cvetkoff
Уважаемый Пилигрим,

сравнивая Sakrament TTS Engine c Говорилкой, Вы, тем самым сравниваете очень небольшую белорусскую фирму "Sakrament" с такими корпорациями, как Microsoft, Digalo, IBM, Elan. Что приятно.

Сатанинский голос, которым Вы пугаете старушек и авиапассажиров - не что иное, как демо-версия нашей программы. Если бы внимательней читали сайт, то обязательно бы это увидели. А также бы нашли, где находятся настройки программы.

Среди почти десяти тысяч закачавших демо-версию нашей программы только 7 человек не нашли эти настройки.

Создатели этого форума действительно являются создателями программы. Разве кто-то это скрывает? Просто посмотрите внимательно на подпись внизу сайта Sakrament.com

По поводу шлепать диссертации... Наверное, профессор Лобанов, который является признанным мировым светилом в области синтеза и распознавания речи, а также одним из наших научных консультантов и руководителей, с Вами, мягко говоря, не согласится...

"Ну..., теперь к демонстрашке прицепили сам АМР и она стала весить 7 метров..."

Мы ничего ни к чему не цепляли. И кто стал весить 7 метров? инсталляшка? демонстрашка? Наша программа явялется плагином. Это слелано для удобства пользователей и чтобы показать саму технологию, не размениваясь на создание собственного проигрывателя - это не наши задачи.

По поводу бульканья... В демо-версии отсутствует блок интонации. Об этом написано на сайте. Также как и все "писульки" тоже лежат на сайте.

"И вот ведь, что впечатлило! На "тех" прогах по одиному автору, а тут!... Ё-моё! Всё с таким размахом! Конференции международные! И дессиртации :|.. "

А Вы, уважаемый Пилигрим, думаете, что MS SAPI и MS TTS Engine созданы на основе "Говорилки"? Это не так. И трудятся над ними куда (!!!) большие силы, чем те, которыми владеем мы.

В остальном, спасибо за поддержку и конструктивную критику, с уважением,

William Cvetkoff

Аватар пользователя Сергей Мироненко
А у меня текст перетаскивается мышкой. Например, текст этой ветки я прослушал, выделив его и перетащив на окошко винампа. Удобно.
Аватар пользователя piligrim
William Cvetkoff

Ну вот, наконец, мы и узнали гле у нас светила сидят! Идёшь, бывало, смотришь - справа Академия, слева Академия, а по центру штуки три университета в ряд стоят. Профессуры - тьма! А вот со светилами... Все какие-то засекреченные. А главное, где в передовых - не найти! Так вот и думал до сих пор, что по всем параметрам мы в ... Тем более, глядя на своих(предприятия) 20 компов, в которых ни одного отечественного дротика и даже винтика нет. А уж в проге, видать тоже всё в космос улетает. Вот теперь спокоен. Две недели назад мы восторжено приняли известие о супер-пупер компьютере с маде из Беларуси, а вот теперь новый фантастический прорыв. Безусловно это сложная задачка - распознование чего-либо. Вот только, простите, как с деньгой быть? Польза от этой проги, кроме как этому профессору или этой фирме - есть? Она - эта польза в рублях выраженная, дороже стоит диссертации, или столько же? Только без риторики о высоких материях. А насчёт демки - да, не долго я копался, но вот демки - то обычно делают сногосшибательные. На выставки автомобилей поглядите или на чужие демки. И всё же - на душе теплее, что и у нас кто-то, что-то делает. Извините за сарказм - я практик с предприятия, от академиев далеко...

Аватар пользователя Kirill
2 piligrim: все будет.

Ребята ведут правильную стратегию (как в отношении разработки ПО, так и касательно персонала). Я почти уверен, что все у них будет замечательно - а это означает, в наш инструментарий добавится еще одна хорошая и полезная программа, применение которой обязательно найдется. :-)

А критиковать, как мне кажется, проще всего. Тем более в таких эмоциональных тонах. Нужно быть чуть-чуть аккуратнее, ОК?

Так держать ребята! Удачи!

Аватар пользователя frag
Работа людьми большая сделана. К тому же обидеть художника, конечно, каждый может. :) Но!

Но пользоваться, ребята, вашей программой я уж и представить себе не могу в какой ситуации буду. Слушать то, что говорит ваш дядька больше одной минуты просто невозможно. Может это проблема всех т.н. говорилок, не знаю. Я повелся на рекламу и попробовал только вашу. Увы...

Между прочим текст у меня перетаскивался (поди еще впрочем догадайся, в какое окошко его перетаскивать), а вот настроек я так и не нашел. Опять увы...

Аватар пользователя Артур
В продолжении затронутой здесь темы хочу предложить посетить сайт http://art.bdk.com.ru/govor посвященный речевым технологиям. Здесь представлен обзор в основном рускоязычных программ распознавания и воспроизведения речи, а так-же вопросам настройки программ. Кроме того выложены статьи и информация о голосовых технологиях.

Из программ воспроизводящих текст голосом большее предпочтение одаю "Говорилке" Андрея Рязанова как наиболее удобной и функциональной. Кстати в ней появилась возможность записи воспроизводимого текста в *.mp3 и создание пользовательского словоря воспроизведения.

Из фирм хочу выделить "Сакроменто" как наиболее активную в этой области. Если кто из разработчиков ведущих иследования в области голосовых технологий хочет быть представлен на моем сайте, милости просим, всегда рад сотрудничеству.

Страницы