Google представил ИИ-модель Veo 3 для генерации видео со звуком: она может добавить в видео звуковые эффекты, фоновый шум и даже диалоги, сообщили на сайте Google DeepMind.
Что нового |
ИИ-модель для генерации видео со звуком |
Кому полезна |
Всем, кто хочет создавать ИИ-видео с озвучкой |
Какую озвучку можно добавить |
|
Где посмотреть кейсы |
|
Статус |
Veo 3 доступна:
Для России оба способа недоступны. |
Предыдущая новость |
Veo 3 понимает контекст кадров, генерирует звуки и синхронизирует их с визуальным контентом. «Veo 3 отлично справляется с подсказками в виде текста и изображений, а также с реальной физикой и точной синхронизацией губ», — отметил вице-президент по продуктам Google DeepMind Эли Коллинз.
Пользователи уже успели потестить новую ИИ-модель: сгенерировали ролики с пением оперной дивы, массовой сценой с перестрелкой, выступлением корреспондента, АСМР и стендапом. И всё это без галлюцинаций (у людей по пять пальцев — да, сложно поверить).

Помимо генерации видео и звуков в Veo 3 стали доступны:
-
Генерация видео по изображениям.
-
Анимация персонажей через пользовательский ввод — использование голоса, жестов и мимики из загруженного видео для анимации персонажей.
-
Возможности управления камерой, среди которых:
-
указание точных движений камеры;
-
плавные переходы между кадрами;
-
дополнение кадра;
-
добавление новых объектов с сохранением целостности сцены.
-
-
Функции для управления стилем и персонажами.
-
Сохранение одинакового внешнего вида персонажей в разных сценах.
-
Улучшенное следование промптам — воспроизведение сложных сценариев и последовательностей.
-
Поддержка вывода в разрешении 4K.
В DeepMind сообщили, что используют технологию SynthID, которая позволяет незаметно помечать ИИ-контент водяными знаками для снижения риска появления дипфейков.
Попробовать Veo 3 можно:
-
в Google AI Studio за $125 в месяц;
-
через приложение Gemini для подписчиков плана AI Ultra за $249 в месяц.
Для России Google AI Studio и Gemini API недоступны.
Veo 3 уже назвали конкурентом генератора Sora от OpenAI. Напомним, OpenAI выкатила Sora в декабре прошлого года. Она генерирует видео на основе текста, изображений, фотографий и нескольких видео.
Может быть интересно:
Источники: Google DeepMind, CNBC, Google AI for developers, Telegram-канал «в IT и выйти»