Google Translate Toolkit: легкость перевода

В статье рассмотрим веб-сервис для переводов Google Translate Toolkit, который является дополнением к сервису Google Translate. Сервис может быть интересен как профессиональным переводчикам, так и тем пользователям, кто изредка сталкивается с необходимостью перевести текст с одного языка на другой.


В тени Google Translate

Многим, кто активно пользуется интернетом, должен быть хорошо знаком сервис машинных переводов Google Translate (GT). Этот простой сервис позволяет прямо в веб-браузере автоматически переводить слова, фразы, веб-страницы, файлы документов. Отличается быстротой работы, малым потреблением трафика. К тому же технических ограничений на перевод меньше, чем на других веб-сервисах.

Google Translate поддерживает много языков. Сервис имеет дополнительные фишки, например, озвучивание текста. Также этот сервис может быть интегрирован в браузер в виде расширения или непосредственной функции, как в веб-обозревателе Chrome.

В зависимости от пары языков, качества перевода Google Translate вполне хватает для бытового употребления. Несложные тексты на английском вполне сносно переводятся на русский. В случае же пары близкородственных языков, например, русский/белорусский, качество перевода значительно увеличивается.

 

Однако в дополнение к этому известному сервису Google Translate имеется ещё и веб-сервис Google Translate Toolkit (GTT), о котором знают меньше. В этой статье ближе познакомимся именно с GTT.


Редактор переводов

Google Translate Toolkit - это редактор переводов, специальный несложный инструмент, который позволяет самим пользователям усовершенствовать машинный перевод, сделанный Google Translate.

Такая необходимость возникает, например, если вам нужно перевести документ не только для себя, но и для других. В подобных случаях с помощью GTT можно исправить ляпы автоматического перевода и привести машинный перевод в более человеческий и удобочитаемый вид.

Для тех, кто постоянно занимается переводами, GTT тоже может стать хорошим подспорьем: загрузил документ, открыл в инструментах - и машинный перевод готов, его можно использовать как черновой вариант. А дальше просто правишь этот переведённый текст.

Особенно он удобен при переводе родственных языков. В этом случае объём работы сводится к незначительному количеству правок.

Что касается типов поддерживаемых документов, то в Google Translator Toolkit можно загрузить файл, веб-страницу, статью из Википедии или её гугловского аналога Knol. В GTT можно использовать "память переводов" и собственные глоссарии, о чём подробнее чуть ниже.

Сделанные переводы хранятся на сервере, и вы можете предоставить к нему доступ кому захотите. GTT даёт возможность общаться и сотрудничать с другими переводчиками в интернете. Сам сервис работает через веб-браузер и не требует установки каких-либо программ и модулей.


"Облачное" лирическое отступление

GTT относится к "облачным" сервисам. Особенности компьютерного перевода требуют небольшого отступления, чтобы лучше увидеть те преимущества, которые здесь дают "облака".

Хотя следует уже избегать понятия "облачный" и использовать более точные термины. Если быть педантом, то GTT, как и большинство сервисов Google, относится к сервисам типа "программа как услуга, доступная по Сети" (сокр. SaaS, Software as a Service). То есть основная функциональность (а в нашем случае это машинный перевод и хранение результатов) выполняется на серверах Google. Пользователю предоставляются только результаты работы сервиса и интерфейс управления, обычно это веб-интерфейс.

Про модель вычислений SaaS всё ещё идёт много споров: выгодно это или не выгодно, безопасно или небезопасно, удобно или неудобно и т.д. Однако в случае машинного перевода, а также многих других задач сервис SaaS является более прогрессивным, чем работа локально за своим компьютером.

Во-первых, задача переводов, как и задачи, например, распознавания речи, требуют больших вычислительных ресурсов. Модель SaaS - это централизация вычислений, что позволяет выделять в датацентрах столько ресурсов, сколько трудно вовлечь на отдельной локальной машине. В этом отношении SaaS может предложить уровень решения задач, который раньше на персоналках, казалось, достиг своего предела.

Во-вторых, модель SaaS - это сетевые вычисления, когда в переводах участвует большое количество людей, таким образом может быть организован так называемый "коллективный разум". Не секрет, что и Google использует человеческие переводы в GTT для усовершенствования своих алгоритмов машинного перевода.

Хотя вышесказанное совсем не значит, что существующий сервис GTT - и есть этот новый уровень переводов и новый уровень коллективного взаимодействия. Но, в целом, SaaS - это правильное направление для переводческой деятельности.


Практика

Инструменты GTT находятся по адресу translate.google.com/toolkit. Для использования, естественно, нужен аккаунт Google.

После входа пользователь попадает в менеджер файлов, который по виду аналогичен менеджеру Google Docs. В главном окне располагается список всех документов, находящихся в процессе перевода. Внизу названия каждого файла будет показываться количество выполненного перевода документа в процентах.

В этом менеджере через кнопку "Открыть доступ" можно пригласить других участников. Через кнопку "Загрузить" выбранный документ можно закачать к себе локально на жёсткий диск.

А основная кнопка - это "Добавить", посредством которой в GTT добавляется документ для перевода. После её нажатия появится форма, позволяющая указать название перевода и выбрать для работы четыре типа документа - файл, веб-страница, статья "Википедии", статья Knol ( Knol - это гугловский вариант "Википедии").

В случае добавления файла поддерживаются следующие форматы: AdWords (.AEA), HTML (.html), Microsoft Word (.doc), OpenDocument Text (.odt), простой текст (.txt), Rich Text (.rtf). Также можно загрузить файл субтитров SubRip (.SRT).

В самом низу этой формы добавления документа можно развернуть скрытые опции "Настройки доступа", где выбираются или загружаются свои собственные "память переводов" и глоссарий.

Память перевода (ПП) - это отдельные варианты перевода слов или предложений. Если ПП не указана, то переведенные варианты будут сохраняться в общей памяти Google.

Но можно создать и свою собственную ПП, перейдя по ссылке "Создать отдельную ПП". Здесь сохранятся переведённые вами сегменты текстов, которые будут иметь приоритет при дальнейших переводах. Собственную ПП можно сделать открытой для других пользователей или же закрыть к ней доступ.

Собственная память переводов - это файл в формате XML. Его можно из менеджера документов скачать локально на компьютер в формате TMX.

Глоссарии - это справочник узкоспециализированной терминологии. Так же, как и в случае памяти переводов в GT, можно использовать общий глоссарий, а можно создавать свои собственные.

После выбора всего нужного нажимаем кнопку "Добавить" и попадаем непосредственно в редактор переводов. Интерфейс его очень простой. Это двухпанельное окно, с левой стороны которого будет оригинальный документ, а с правой появится перевод, сделанный автоматически, который нужно довести до более совершенного уровня.

Переводить документ можно последовательно, а можно выборочно, щёлкая мышью по нужному предложению. В обоих случаях редактирование перевода в правом окне будет делаться в специальном плавающем окошке, а не непосредственно в теле документа. Такое плавающее окошко - очень удобная вещь, так как можно сосредоточиться только на переводимом тексте и не нужно отвлекаться на форматирование документа.

Удобством также является и подсветка текста в переводимом документе. Теперь при желании вы можете подсвечивать чистый машинный перевод одним цветом, практически правильный перевод другим цветом, а для собственного перевода использовать третий цветовой вариант. Цветовые палитры настраиваются через меню тулбара "Вид - Настройка цветовой схемы".

На тулбаре редактора имеется кнопка "Инструменты", которая открывает снизу отдельную панель, где могут быть показаны, если они есть, уже существующие переводы конкретного сегмента текста. И здесь эти переводы можно оценивать через рейтинги.

И ещё немаловажным удобством в GTT является проверка правописания.

После завершения редактирования машинного перевода остаётся только через меню "Правка - Полный перевод" завершить редактирование. После чего в менеджере файлов переведённый документ можно загрузить локально или же расшарить его по Сети.

Михаил АСТАПЧИК

Версия для печатиВерсия для печати

Номер: 

10 за 2011 год

Рубрика: 

Internet
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!

Комментарии

Аватар пользователя Наталья Володина
Здравствуйте! Проблема в том,что у меня при правке машинного перевода не работает подсветка текста и функция проверки правописания. Как можно решить эту проблему? Заранее благодарю за помощь!
Аватар пользователя Эдуард
Разве уже есть системы "машинного перевода"?
Аватар пользователя Инкогнито
может дело в браузере? не новая версия или если опера попробовать фарефокс или хром.