
Google представила Gemini 3.5 Live Translate — современную аудиомодель для синхронного перевода устной речи. Она поддерживает более 70 языков и формирует естественный звук перевода, сохраняя исходную интонацию, темп и высоту голоса говорящего.
В отличие от пошаговых систем, которые дожидаются завершения фразы, эта модель обрабатывает потоковое аудио непрерывно, а задержка в рамках одной сессии составляет всего несколько секунд, что помогает избежать длительных пауз в беседе. Развертывание идет по нескольким траекториям. Публичная превью доступна через Gemini Live API и Google AI Studio. Для корпоративных клиентов планируется интеграция в Google Meet, обеспечивающая общение на более чем 2 000 языковых пар. Широкий запуск синхронного перевода запланирован в мобильном приложении Google Translate для Android и iOS.
Для пользователей Android дополнительно предусмотрен режим прослушивания, позволяющий воспринимать перевод конфиденциально через динамик, когда телефон держат у уха. Безопасность генерируемого контента обеспечивается встроенными невидимыми водяными знаками SynthID, встроенными прямо в аудиопоток для предотвращения распространения дезинформации.





