Нейросети для создания видео: 7 инструментов и что они могут

24 июля 2024
4630
0
Для всех уровней

Создание картинок с нейросетью не попробовал уже только ленивый. А что там с генерацией видео? Всё тихо. Мы протестировали семь инструментов и узнали, что о них думают эксперты.

Ася Лысова ppc.world

Обратите внимание. YouTube сейчас у большинства пользователей не работает. Посмотреть ролики, которые сгенерировали нейросети, вы можете двумя способами:

на диске, переходя по кнопкам «Посмотреть результат генерации»;

в статье, если откроете ее с мобильного устройства и отключите Wi-Fi.

Для теста мы подобрали максимально разные нейросети:

Kandinsky Video — генерация по промптам на русском языке
Шедеврум — генерация в приложении
Runway ML Gen-2 — генерация видео с заменой лица
Genmo — генерация видео высокого качества
Luma — генерация реалистичных видео
Synthesia — генерация видео с озвучкой
Topaz Video Enhance AI — улучшение качества готовых видео

Чем всё это полезно digital-специалистам

Но для начала проговорим, как мы написали промпт для создания видео с нейросетью.

Как создавать запросы для генерации видео нейросетью

Чтобы результат был объективным, для всех нейросетей, которые генерируют видео по тексту, мы использовали один и тот же промпт. Чтобы его создать, можно опираться на проверенные специалистами схемы.

Максим Оганов основатель агентства Oganov Digital и Авитолог.Эксперт, автор Telegram-канала «Прибыльный digital»

Мы, как правило, создаем промпт по следующей схеме:

Цель видео.

Описание ключевых сцен.

Детальное описание каждой сцены с добавлением тех визуальных и звуковых эффектов, которые нам нужны.

Описание финальной сцены и общего впечатления от видео.

Илья Уткин видеограф B2B-маркетплейса BirdsBuild

При создании промптов для нейросети, генерирующей видео, я использую такую схему:

Объект (прикрепленная фотография) + описание действий или событий + местоположение или фон + эмоции/настроение героя или ролика + дополнительные детали (одежда, элементы и т. д.).

Мы использовали последний пример, чтобы создать промпт, который будем отправлять всем нейросетям для генерации видео. Получилось так:

Вариант на русском языке: Серая собака + стоит на берегу озера + лето, солнце, зеленая трава + игривая летняя атмосфера + собака наслаждается ветром, зевает, шерсть развевается.

Вариант на английском языке: Gray dog + stands on the shore of the lake + summer, sun, green grass + playful summer atmosphere + dog enjoys the wind, yawns, fur develops.

Ну, и фото собаки в качестве референса.

Теперь — к генерации.

Kandinsky Video

Kandinsky Video — бесплатная нейросеть для генерации видео от Сбера.

Сколько стоит: бесплатно.

Водяные знаки: нет.

Генерация по промптам на русском языке: да.

Генерация по тексту: да.

Генерация по фото: да.

Длительность роликов: до 16 секунд.

Форматы: видео (модель генерирует цельное видео), анимация (последовательность картинок, объединенных в видео).

Озвучка: нет.

Возможность улучшения качества другого видео: нет.

Результат: криповый)))

Мы сделали видео двумя способами: и без фото, и по фото. В обоих случаях нейросеть сделала именно то, что мы у нее просили, но с эффектом зловещей долины — на первом видео у собаки задвоился язык, на втором она поменяла за несколько секунд 3 породы. Да и вообще картинка поехала.

Не удивляйтесь минутным видео — все ролики мы для удобства зациклили. На самом деле они длятся несколько секунд.

Посмотреть результат генерации

Оценка специалистов: неудовлетворительная генерация видео нейросетью.

Илья Уткин видеограф B2B-маркетплейса BirdsBuild

Нейросеть Kandinsky генерирует отличные изображение и ужасные видео. Сколько бы я ни пытался, но так ничего стоящего у меня не получилось создать. Не рекомендую.

Шедеврум

Шедеврум — это мобильное приложение от Яндекса. Это тоже ИИ для создания видео.

Сколько стоит: бесплатно.

Водяные знаки в сгенерированном нейросетью видео: нет.

Нейросеть генерирует видео по промптам на русском языке: да.

Длительность роликов: зависит от промпта.

Генерация по тексту: да.

Генерация по фото: нет.

Возможность монтажа видео: нет.

Эффекты: зум, таймлапс, отдаление, панорама, подъем, морфинг, вращение, ручной и т. д.

Накладывает ли нейросеть голос на видео: нет.

Может ли нейросеть улучшить качество другого видео: нет.

Результат: мы получили не видео.

Нейросеть пошла по промпту и сделала практически всё, что мы просили. Основной минус: результат, конечно, нельзя назвать видеозаписью. Скорее это анимированное изображение, гифка.

Посмотреть результат генерации

Runway ML Gen-2

Gen-2 — это генератор видео от компании Runway AI с широкими дополнительными возможностями.

Бесплатная версия: есть, можно генерировать 25 бесплатных секунд в месяц.

Платная версия: от $12 до $125 в месяц.

Водяные знаки: нет, есть ненавязчивое лого.

Генерация по промптам на русском языке: нет.

Генерация по тексту: да.

Нейросеть может сделать видео из фото: да.

Эффекты: зум, вращение, панорама, наклон.

Стили: несколько десятков, среди них — аниме, архитектура, кинематограф, лес, макро и др.

Озвучка: нет.

Возможность улучшения качества другого видео: нет.

Возможность замены лица: да.

Результат: сомнительный.

Это первая нейросеть, которая не следовала промпту: на видео вместо одной собаки оказались две. К тому же одна из них отображалась некорректно — картинка поплыла.

Посмотреть результат генерации

Что касается генерации по фото, то тут снова эффект зловещей долины: собака с пустыми глазницами и расплывающейся мордой. Бррр.

Посмотреть результат генерации

Оценка качества видео, созданного с помощью нейросети: неоднозначна.

Илья Уткин видеограф B2B-маркетплейса BirdsBuild

Эта нейросеть появилась относительно давно и сходу привлекла к себе внимание многих. Но даже спустя годы я бы не стал рекомендовать ее. Главная причина — неестественность видео. Разумеется, никакие нейросети всё еще не способны создавать ролики, неотличимые от реальной съемки. Но в Runway ML Gen-2 объекты получаются жуткими: не только руки у людей, к чему мы привыкли, но и в целом весь видеоряд переливается из одного в другой. В общем, рекомендую пробовать только для тестирования или развлечения.

Максим Оганов основатель агентства Oganov Digital и Авитолог.Эксперт, автор Telegram-канала «Прибыльный digital»

Мы постоянно работаем с Runway ML Gen-2. Под наши задачи нейросеть подходит больше других. Нам нужно создавать динамичные красивые ролики, быстро их редактировать, пробовать новые идеи + чтобы всё было очень качественным. Gen-2 дает нам это. Из плюсов:

Простота в использовании — с нейросетью можно работать полностью онлайн на платформе.

Дополнительные возможности:

цветокоррекция видео;

удаление и добавление объектов (например, в этой нейросети доступна замена лица на видео);

VFX;

карта глубины;

инструменты для ротоскопирования и композитинга;

«зеленый фон», или, точнее, возможность удалять фон с любого ролика за один клик.

Бесплатная версия.

Есть, конечно, и минусы. Чтобы получить доступ ко всем инструментам, нужна подписка. А возможности для настройки параметров ограничены. Да, это не After Effects, но всё равно удобно.

Genmo

Genmo — нейросеть для генерации видео высокого качества в онлайн-режиме.

Бесплатная версия: есть, можно создать до 100 видео в день длительностью до шести секунд.

Платная версия: $10 в месяц, можно создавать до 1000 видео в день.

Водяные знаки: есть, без них экспортировать видео можно в платной версии.

Генерация по промпт на русском языке: работает.

Генерация по тексту: да.

Генерация по фото: да.

Эффекты: зум, вращение, панорама, наклон.

Дополнительные эффекты: есть.

Озвучка: нет.

Возможность улучшения качества другого видео: нет.

Результат: хороший.

В этом случае мы снова получили то, что просили. И снова ролик можно скорее назвать анимацией, чем видеозаписью. Но зато в высоком качестве.

Посмотреть результат генерации

Оценка экспертов: подойдет для анимирования изображений.

Илья Уткин видеограф B2B-маркетплейса BirdsBuild

Нейросеть отлично подойдет для простой генерации. Если вам нужно только анимировать движения, это идеальный выбор. По сравнению с Runway ML Gen-2, Genmo выдает результат намного лучше. Артефактов намного меньше, а движения более плавные. Рекомендую.

Luma

Luma AI — нейросеть для создания реалистичных видео и 3D-моделей.

Бесплатная версия: есть, до пяти генераций в день.

Платная версия: $14 хватит на генерацию 120 пятисекундных роликов. Есть и другие тарифы.

Водяные знаки: да.

Генерация по промптам на русском языке: нет.

Генерация по тексту: да.

Генерация по фото: да.

Длительность роликов: до 20 секунд.

Озвучка: нет.

Возможность улучшения качества другого видео: нет.

Результат: достойный.

При генерации по тексту нейросеть учла все требования — в конце концов собака на видео действительно начала двигаться. Реалистично? Максимально — во всяком случае из того, что мы уже видели.

Посмотреть результат генерации

Результат генерации по фото ожиданий не оправдал. Нейросеть впервые запросила два референса для первого и второго кадров. Собаку она практически не анимировала, зато изменила человека на заднем плане и стерла ему лицо.

Посмотреть результат генерации

Оценка экспертов: подойдет для анимации изображений и генерации перебивок для основного контента.

Виктор Попов эксперт ИИ, основатель и СЕО проекта BotB2b

Luma AI превращает изображения в очень реалистичные ролики, которые действительно подходят для множества задач. Например, для создания:

креативной рекламы;

современных арт-объектов и инсталляций;

элементов для артхаусного кинематографа;

анимации и роликов для социальных сетей с необычным сюжетом.

Нейросеть может изобразить то, что сложно снять физически. Например, виды горных хребтов в Гималаях, атмосферу туманного утра в Шотландии. Прекрасно Luma AI воспроизводит инопланетян и фантастических животных.

Есть у нее и свои минусы:

Принцип работы. Видео генерируется длительностью 5 секунд, после чего можно попросить нейросеть добавить еще 5 секунд. Максимально вы сможете дойти до 20 секунд. Но при такой работе нейросеть быстро теряет цельность и логику сюжета. Получить конкретный результат очень сложно. С другой стороны, Luma AI предоставляет огромное поле для творческих экспериментов.

Плохое воспроизведение действий, связанных с мелкой моторикой. Что, в принципе, часто бывает с машинным обучением. Например, сложно будет получить видеоряд, где человек умывается или застегивает пуговицы на рубашке. Пальцы могут в прямом смысле отделиться от ладоней и остаться на одежде.

При использовании Luma AI мы рекомендуем описывать сюжет и желаемый стиль видеоряда. Сейчас лучшие результаты получаются из красивых атмосферных фотографий и простого промпта: movie, cinema shoot. Для усиления результата можно использовать и изображения других нейросетей, например, Midjourney.

Илья Уткин видеограф B2B-маркетплейса BirdsBuild

Luma может создать 3D-модель, а может — полноценное видео на основе изображения и текста. Из всех нейросетей, которые я тестировал, Luma мне нравится больше всего. Она дает по-настоящему хороший результат. Именно этот сервис я использую для работы, так как мне нужно анимировать объекты. И Luma делает это лучше конкурентов.

Synthesia

Synthesia — нейросеть для генерации видео в стиле «говорящей головы». В роликах спикер, созданный нейросетью, произносит текст, который вы задаете.

Бесплатная версия: есть, в ней доступна генерация трех минут видео в месяц + шесть стандартных аватаров и набор голосов AI на 130+ языках.

Платная версия: от €20 в месяц.

Водяные знаки: да.

Генерация по тексту: да.

Генерация по фото: нет.

Озвучка на русском языке: да, но с акцентом.

Возможность улучшения качества другого видео: нет.

Результат: забавно.

Сгенерированный персонаж даже не выглядит картонно, но говорит с акцентом. Из минусов — в пробной версии видео нельзя скачать. Оно доступно только по ссылке.

Оценка специалистов: подойдет для бизнеса, который создает образовательный контент.

Максим Оганов основатель агентства Oganov Digital и Авитолог.Эксперт, автор Telegram-канала «Прибыльный digital»

Synthesia — это нейросеть не столько для редактирования, сколько для создания роликов, где на экране присутствует автор. В общем, подойдет для создания лекций, презентаций. Она известна в первую очередь тем, что легко преобразует текстовые промпты в видео и сама озвучивает ролики. Здесь можно сделать аватар, обучить его под себя и использовать затем в создании видео.

Также мне нравится, что в этой нейросети есть встроенный редактор сценариев AI Script Assistant, который работает аналогично с текстовыми ИИ и всегда может дать подсказку.

Topaz Video Enhance AI

Topaz Video Enhance AI — это нейросеть для улучшения качества видео.

Бесплатная версия: есть, условия использования не уточняются.

Платная версия: $299.

Настройки: Upscale, Noise, Grain и другие.

Оценка экспертов: рабочий инструмент для улучшения видео.

Изменение качества видео в Topaz Video Enhance AI / Источник: презентация Topaz Video Enhance AI

Илья Уткин видеограф B2B-маркетплейса BirdsBuild

В своей работе я постоянно использую нейросети для улучшения качества видео. Topaz Video Enhance AI — мой фаворит. У нейросети множество полезных настроек. Например, Upscale для увеличения разрешения видео, Noise или Grain — для улучшения резкости.

Максим Оганов основатель агентства Oganov Digital и Авитолог.Эксперт, автор Telegram-канала «Прибыльный digital»

Topaz умеет улучшать качество видео, делает из размытой картинки четкую, применяет шумоподавление. Его можно использовать не только для реалистичных видео, но и для мультипликации или CG-контента. А еще эта нейросеть умеет сглаживать так называемые чересстрочные кадры (деинтерлейсинг), из-за этого ролик становится более плавным, выглядит профессионально.

Чем всё это полезно digital-специалистам

Тем же, чем и другие нейросети — вы автоматизируете процесс создания видео, экономите на привлечении дизайнеров или, как минимум, грамотно используете их ресурс: рутина отдается ИИ, а более креативные задачи — людям.

Но ведь ни один из результатов генерации не оказался идеальным 🤔 Да. Но давайте честно: мы не погружались в детали и на создание каждого ролика тратили несколько минут. Практикуйтесь и получайте результаты, которые можно применять в работе.

Максим Оганов основатель агентства Oganov Digital и Авитолог.Эксперт, автор Telegram-канала «Прибыльный digital»

Мы генерируем видео для следующих целей:

маркетинговых: рекламные ролики, презентации продуктов;

образовательных: видеокурсы, обучающие материалы;

SMM: ролики для социальных сетей.

Илья Уткин видеограф B2B-маркетплейса BirdsBuild

Я сгенерированные ролики использую в качестве футажей для видеоконтента. То есть я не создаю всё видео из сгенерированных частей, но добавляю их для разнообразия.

В общем, стоит погрузиться и протестировать. Как минимум, получите удовольствие от того, как картинка оживает. Похихикаете, если она сделает это кринжово. Как максимум, получите новый инструмент привлечения внимания аудитории.

Максим Оганов основатель агентства Oganov Digital и Авитолог.Эксперт, автор Telegram-канала «Прибыльный digital»

Видеоролики, сгенерированные ИИ, можно и нужно использовать в рекламных объявлениях. Движущаяся картинка — это отличный способ привлечь внимание, а с помощью нейросетей можно делать эту картинку вкусной, динамичной, отвечающей нашим запросам и вызывающей интерес ЦА.

Илья Уткин видеограф B2B-маркетплейса BirdsBuild

Сейчас сгенерированные видео позволяют пробить баннерную слепоту — это новый мощный инструмент маркетологов.

Кстати, по теме:

На этой странице есть элементы, которые могут не отображаться на AMP-страницах.

Перейти на сайт

Теперь ИИ продвигает бизнес, у которого нет сайта: как это и нужно ли вообще вкладываться в сайт

26.04.24 1129

Нейросети для SEO: 8 промптов для решения SEO-задач + 1 причина их не использовать

17.07.24 2203 1

Как за 7 шагов навести порядок в CRM-проекте и не утонуть в коммуникациях

12.12.25 64

Сколько стоит подписчик в Telegram: обзор 50+ тематик

11.12.25 28682

Ко всем статьям

Комментарии 0

Авторизуйтесь, чтобы оставить комментарий.

Как создавать запросы для генерации видео нейросетью

Kandinsky Video

Шедеврум

Runway ML Gen-2

Genmo

Luma

Synthesia

Topaz Video Enhance AI

Чем всё это полезно digital-специалистам

Читайте также

Теперь ИИ продвигает бизнес, у которого нет сайта: как это и нужно ли вообще вкладываться в сайт

Нейросети для SEO: 8 промптов для решения SEO-задач + 1 причина их не использовать

Как за 7 шагов навести порядок в CRM-проекте и не утонуть в коммуникациях

Сколько стоит подписчик в Telegram: обзор 50+ тематик

Комментарии 0