Речевые технологии по-белорусски

Речевые технологии - это, пожалуй, одна из самых высокотехнологичных областей деятельности софтверных компаний. О том, как обстоят с ними дела в Беларуси, о теперешнем состоянии рынка подобных технологий и о перспективах их использования читателям "Компьютерных вестей" рассказал Валерий Николаевич Егоров, учредитель "Сакрамент-ИТ" - уникальной для нашей страны продуктовой софтверной компании, не жалеющей денег на создание технологий будущего.

- Как вообще возникла идея заниматься синтезом и распознаванием речи?

- В Беларуси исследования в этом направлении ведутся давно. Мы же занимаемся с 80-х годов. У нас несколько докторов наук, кандидатов, т.е. всё разрабатывается на очень серьёзной научной базе. Люди, работающие у нас, имеют опыт более тридцати лет в области синтеза и распознавания речи. Например, научным руководителем всех лингвистических разработок нашей компании является заведующая кафедрой фонетики английского языка МГЛУ профессор Елена Карневская.

- Сложно ли вам конкурировать с разработками зарубежных компаний, специализирующихся на речевых технологиях?

- На самом деле конкуренции, как таковой, нет. Компаний, которые занимаются данными технологиями, очень мало. Кроме того, наиболее часто используемая оболочка этих технологий не совсем удобна, потому что пользователь должен понимать, зачем этот продукт ему нужен, закачивать в определённые оболочки, настраивать его. То есть, пользователь должен быть обученным, грамотным.

 

Сейчас мы работаем над продуктом, который сделает речевые технологии доступными человеку, не имеющему профессиональных знаний в этой области. В этой разработке будут использоваться голосовое управление, семантический поиск. Также мы совершенствуем качество синтеза голоса: новый синтез будет с интонацией. У нас есть большие преимущества перед конкурентами: как резидент ПВТ, мы имеем налоговые льготы, и стоимость разработки получается ниже. Но главное - технологии, нами наработаны действительно серьёзные технологии.

- Хотелось бы немного подробнее узнать о продукте, который сделает речевые технологии ближе к людям. Если не секрет, что это будет за продукт?

- Он называется "Ассистент", это будет виртуальный помощник вроде электронного секретаря. При этом мы ориентируемся на мобильные устройства, в основном, на смартфоны - ведь в последнее время продажи обычных телефонов упали, а продажи смартфонов выросли. Это устройства, которые аккумулируют в себе практически все функции компьютера. Сегодня востребована программная оболочка, которая взяла бы на себя всё управление функционалом и получение информации для пользователя, при этом не загружая его.

Ещё одна реализация - гид-информатор, планируем сделать его к Олимпиаде в Сочи. Вот приезжает человек в незнакомый город, у него есть устройство с поддержкой GPS, она актуализирована по карте города. Вы говорите программе: я живу здесь, мои суточные составляют, условно, сто долларов. У пользователя будет устройство, которое информирует обо всех происходящих событиях, водит его по городу, рассказывает о достопримечательностях ...

- И на каком этапе сейчас находится работа над "Ассистентом"?

- Уже готово техническое задание, сейчас ищем инвесторов для этого проекта. Подобные разработки интересны всем, но мало кто готов вкладывать деньги в отдалённое будущее. Нужно, минимум, два-три года, прежде чем продукт начнёт возвращать деньги, и не все готовы ждать.

- Ваша компания - одна из немногих в Беларуси, производящих собственные программные продукты. А что Вы думаете насчёт аутсорсинга? Перспективно ли это?

- К сожалению, инициатива аутсорсинговых компаний заключается в том, чтобы исполнять. Нередко их владельцы вкладывают деньги не в развитие новых технологий, а, например, в личную недвижимость. Но это уже человеческий выбор, на который имеет право каждый.

- Как насчёт практического применения ваших продуктов для обычного пользователя?

- Для Министерства образования в 15 школах республики мы бесплатно установили наши программы, и дети с плохим зрением, которые не могут читать, получили возможность нормально учиться. Для тех же учебников интонации и художественное чтение совершенно не нужны. Там совершенно нейтральный тон, есть возможность настройки голоса, темпа, тембра... Один раз купив наш продукт, можно сделать множество аудиокниг.

Что ж, пожелаем успехов Валерию и его компании и надеемся, что в Беларуси появится больше фирм, занимающихся созданием собственных наукоёмких программных продуктов. "Компьютерные вести" будут держать вас в курсе выхода новых интересных разработок этой действительно высокотехнологичной белорусской компании.

Беседовал Вадим СТАНКЕВИЧ


Справка "КВ"

Компания "Сакрамент" основана в Минске в 1994 году, занимается разработкой программного обеспечения в области обработки речи (синтез русской и английской речи (озвучивание текста), распознавание русской и английской речи, идентификация голоса, индексация аудио и пр.). Основные продукты компании - система синтеза речи Sakrament TTS Engine для Windows (признана полностью совместимой со стандартом Microsoft SAPI 5.1), Linux, Symbian, PocketPC, Smartphone; система распознавания речи Sakrament ASR Engine; технология Sakrament Personal Voice Master создания персонифицированного голоса для системы синтеза речи. Среди компаний, использующих разработки "Сакрамент", - Alcatel Business Systems, Albeta LTD, "Телемикс", ПЧ УП "Микст", ЗАО "Санкт-Петербургская Информационная Компания", ЗАО "АСВ", ООО "ТНТ Продакшн", ООО "Белабс Телеком", ООО "Сенсор-М".

Версия для печатиВерсия для печати

Номер: 

32 за 2009 год

Рубрика: 

Эксклюзивное интервью
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!