Google представил первый ИИ генератор видео со звуком Veo 3

Google представил ИИ-модель Veo 3 для генерации видео со звуком: она может добавить в видео звуковые эффекты, фоновый шум и даже диалоги, сообщили на сайте Google DeepMind.

Что нового	ИИ-модель для генерации видео со звуком
Кому полезна	Всем, кто хочет создавать ИИ-видео с озвучкой
Какую озвучку можно добавить	звуковые эффекты; фоновый шум; диалоги.
Где посмотреть кейсы	на сайте Google DeepMind; в посте Telegram-канала «в IT и выйти».
Статус	Veo 3 доступна: в Google AI Studio за $125 в месяц; через приложение Gemini для подписчиков плана AI Ultra за $249 в месяц. Для России оба способа недоступны.
Предыдущая новость	OpenAI выкатила Sora — нейросеть для создания видео

Veo 3 понимает контекст кадров, генерирует звуки и синхронизирует их с визуальным контентом. «Veo 3 отлично справляется с подсказками в виде текста и изображений, а также с реальной физикой и точной синхронизацией губ», — отметил вице-президент по продуктам Google DeepMind Эли Коллинз.

Пользователи уже успели потестить новую ИИ-модель: сгенерировали ролики с пением оперной дивы, массовой сценой с перестрелкой, выступлением корреспондента, АСМР и стендапом. И всё это без галлюцинаций (у людей по пять пальцев — да, сложно поверить).

ИИ для генерации видео Veo 3 — Скриншот ролика с ASMR, полностью сгенерированного Veo 3 / Источник: Telegram-канал «в IT и выйти»

Помимо генерации видео и звуков в Veo 3 стали доступны:

Генерация видео по изображениям.
Анимация персонажей через пользовательский ввод — использование голоса, жестов и мимики из загруженного видео для анимации персонажей.
Возможности управления камерой, среди которых:
1. указание точных движений камеры;
2. плавные переходы между кадрами;
3. дополнение кадра;
4. добавление новых объектов с сохранением целостности сцены.
Функции для управления стилем и персонажами.
Сохранение одинакового внешнего вида персонажей в разных сценах.
Улучшенное следование промптам — воспроизведение сложных сценариев и последовательностей.
Поддержка вывода в разрешении 4K.

В DeepMind сообщили, что используют технологию SynthID, которая позволяет незаметно помечать ИИ-контент водяными знаками для снижения риска появления дипфейков.

Попробовать Veo 3 можно:

в Google AI Studio за $125 в месяц;
через приложение Gemini для подписчиков плана AI Ultra за $249 в месяц.

Для России Google AI Studio и Gemini API недоступны.

Veo 3 уже назвали конкурентом генератора Sora от OpenAI. Напомним, OpenAI выкатила Sora в декабре прошлого года. Она генерирует видео на основе текста, изображений, фотографий и нескольких видео.

Может быть интересно:

Как улучшить качество видео: 5 нейросетей в помощь

Нейросети для создания видео: 7 инструментов и что они могут

Нейросеть Qwen — сравнение с DeepSeek и другими чат-ботами. И нужно ли их сравнивать?

Источники: Google DeepMind, CNBC, Google AI for developers, Telegram-канал «в IT и выйти»

Google выкатил первый в мире ИИ-генератор видео со звуком — Veo

Ваша реклама на ppc.world

Ещё новости

Яндекс Директ представил «Адаптацию бюджета» — автонастройку для масштабирования кампаний

Директ запустил цифровую наружную рекламу в регионах

Яндекс представил ИИ-хостес — виртуального агента для приема звонков и бронирований

Ваша реклама на ppc.world

Ещё новости

Яндекс Директ представил «Адаптацию бюджета» — автонастройку для масштабирования кампаний

Директ запустил цифровую наружную рекламу в регионах

Яндекс представил ИИ-хостес — виртуального агента для приема звонков и бронирований

Вы успешно зарегистрировались

Спасибо за регистрацию

Вы не подтвердили свой email

Вы успешно
зарегистрировались

Спасибо за
регистрацию

Вы не подтвердили
свой email