Компьютерные новости
Все разделы
Google представила звуковую ИИ-модель Gemini 3.5 Live Translate для синхронного перевода
Google презентовала новую специализированную модель Gemini 3.5 Live Translate, созданную для двустороннего голосового перевода в режиме реального времени.
Ключевой особенностью нейросети является способность полностью сохранять оригинальную интонацию, темп речи и высоту голоса спикера. В отличие от классических систем, ожидающих завершения фразы, эта модель обрабатывает аудиопоток синхронно. Задержка составляет всего несколько секунд, что позволяет избежать неестественных пауз во время разговора.
Нейросеть автоматически распознает более 70 языков и адаптирована для стабильной работы в шумных условиях. В целях безопасности и борьбы с дезинформацией все сгенерированные аудиозаписи маркируются цифровым воляным знаком SynthID. Разработчики уже получили доступ к инструменту в формате публичной предварительной версии через Gemini Live API и Google AI Studio. Технологию интегрируют такие платформы как Agora, LiveKit и Vision Agents, а азиатский сервис такси Grab уже тестирует ее для общения между водителями и клиентами.
Для корпоративных клиентов закрытое тестирование начнется в этом месяце в сервисе Google Meet для подписчиков Workspace, где обновление будет поддерживать более 2000 языковых комбинаций. Полноценный бизнес-релиз запланирован на конец 2026 года.
Ожидается, что обычные пользователи смогут воспользоваться функцией благодаря глобальному обновлению приложения Google Translate для iOS и Android, которое будет транслировать переведенный звук непосредственно в наушники.










