В телефоне десять тысяч фото, и все они молчат. А ведь любой снимок — это готовый первый кадр ролика: нейросеть смотрит на картинку, придумывает, что случилось дальше, и через пару минут отдаёт видео. Без таймлайна, без монтажа, без «освойте видеоредактор за сорок часов». Разбираем, как сделать видео из фото: какие модели с этим справляются лучше всего, что почём в токенах и куда нажимать.
Как нейросеть превращает фото в видео
Механика называется «изображение в видео», и она проще, чем звучит. Ваш снимок становится первым кадром будущего ролика — буквально, пиксель в пиксель. Дальше модель досочиняет движение: человек улыбается и поворачивает голову, пар поднимается над чашкой, камера медленно наезжает, как в кино. Пять-десять секунд — и статичная картинка превращается в живую сцену, которая начинается ровно с вашего кадра.
У этой механики есть уровни сложности, и они решают, насколько вы режиссёр. Базовый — один снимок на входе, модель импровизирует сама. Уровень выше — первый и последний кадр: задаёте, с чего сцена начинается и чем заканчивается, а нейросеть строит движение между ними. Так умеют Kling 3.0 и Seedance 2. И третий уровень — референсы: подкидываете до трёх дополнительных картинок, которые держат стиль и героев, чтобы модель не фантазировала лишнего.
Промт при этом никто не отменял. Пара фраз — «девушка поднимает взгляд от книги, лёгкий ветер в волосах, камера медленно приближается» — превращает лотерею в режиссуру. Без промта тоже сработает, но результат выберет модель, а не вы.
Ещё до кнопки стоит решить два вопроса. Первый — формат: вертикаль 9:16 под сторис и клипы, горизонталь 16:9 под видеохостинги и презентации, квадрат 1:1 под ленту. Обрезать готовый ролик потом можно, но движение, построенное под вертикаль, в горизонтали смотрится тесно — лучше выбрать сразу. Второй — ждать придётся пару минут, не секунд: видео считается дольше картинки, и это нормально. Зато очередь дублей никто не ограничивает.
В смуззИИ к этому ведут два входа. Свой снимок загружаете в видео-студии в режиме «По кадру»: выбрали модель, прикрепили фото, дописали движение. А у каждой картинки, сгенерированной внутри сервиса, кнопка «Оживить» висит прямо на результате — один тап, и она сама уезжает в видео-студию.
Какая нейросеть лучше для видео из фото: разбор по задачам
Короткий ответ: смотря что снимаете. Одни модели берут кинокачеством, другие — звуком в кадре, третьи — ценой, за которую не жалко экспериментировать. Вот четыре из каталога, каждая под свою задачу. Все живут в одном кабинете, переключение — один клик, цена видна до запуска.
Kling 3.0 — когда нужно кино
Флагман для роликов, которые не стыдно показать на большом экране. Kling 3.0 оживляет фото по первому и последнему кадру, тянет качество до 4K и — главное — пишет звук прямо в кадр: реплики, шаги, скрип двери. Длительность 5 или 10 секунд, форматы 16:9, 9:16 и 1:1. А режиссёрский мультишот собирает несколько разных сцен в одном ролике за один проход — каждому кадру свой промт и своя длительность. Цены: от 70 токенов за ролик в 720p до 690 за 4K на 10 секунд, полный расклад по вилкам — в гайде по Kling 3.0.

Veo 3.1 — звук в цене и режим «продлить»
Модель Google с самым честным ценником на звук: речь, музыка и эффекты рождаются вместе с картинкой и уже входят в стоимость. Veo 3.1 берёт ваше фото первым кадром и принимает до трёх референс-кадров, чтобы удержать героев и стиль. Ролик всегда 8 секунд, форматы 16:9 и 9:16. Три качества под бюджет: Lite за 31 токен на эксперименты, Fast за 62 на проверку идеи, Quality за 256 — когда нужен финальный дубль. И козырь, которого нет у других: режим «Продлить» достраивает продолжение к готовому ролику за фиксированные 62 токена — так из восьмисекундных кусков складывается длинная история.

Seedance 2 — аниме и стилизация
Если фото должно ожить не «как в жизни», а как в полнометражном аниме — это сюда. Seedance 2 собирает кинематографичный кадр в стиле аниме и иллюстрации с плавной динамикой, оживляет снимок по первому и последнему кадру и читает до трёх референсов. Длительность на выбор — 4, 5, 8 или 10 секунд, качество до 1080p, пять соотношений от 16:9 до 3:4. Звуковая дорожка кладётся в ролик бесплатно. Вилка — от 76 токенов за 480p до 640 за 1080p на 10 секунд. Хочется ещё дешевле — у модели есть младший брат Seedance 2 Fast с роликами от 64 токенов.

Hailuo 2.3 — самый дешёвый билет
Модель одной кнопки: загрузили снимок — получили естественное движение и мимику. Ни промтов-простыней, ни настроек на три экрана. Hailuo 2.3 отдаёт 6 или 10 секунд, качество до 1080p, цена — от 31 до 92 токенов за клип. Звука нет, но для первых экспериментов это и не нужно: прогнать пять фотографий и понять, какая оживает эффектнее, стоит дешевле бизнес-ланча.

Шпаргалка на выбор, если листать вилки лень. Подарок или ролик «на большой экран» — Kling 3.0. Сцена со звуком и заделом на длинную историю — Veo 3.1. Аниме и стилизация — Seedance 2. Просто пощупать технологию за минимальные деньги — Hailuo 2.3. Ошибиться сложно: модели живут рядом, и второй дубль на другом движке — это ещё один клик, а не новый сервис с новой регистрацией.
Что сделать из одного снимка: пять идей
Старое семейное фото. Бабушка на крыльце улыбнётся и поправит платок — эффект сильнее любого спецэффекта. Как бережно оживить архив и не испугать родню, разобрали в отдельной статье про оживление старых фото.
Товар для карточки или рилса. Кроссовок медленно вращается, пар идёт от кофе, ткань колышется. Статичное фото товара против пятисекундного клипа — угадайте, что останавливает скролл.
Портрет с характером. Аватар, который моргает и чуть поворачивает голову, в ленте работает как магнит. Вертикаль 9:16 — и готовая сторис.
Хулиганский эффект. Состарить героя на глазах, превратить в аниме или в плюшевую игрушку — для этого есть готовые видеоэффекты в один тап, подробности в разборе видеоэффектов из фото.
Кадр из отпуска. Волны докатываются до берега, облака ползут за горой, листва шевелится. Среда оживает даже там, где людей в кадре нет вовсе.
А если подходящего снимка нет — его можно собрать на месте: в шаблонах есть готовые рецепты под портреты, food и ретро, генерируете кадр и оживляете его той же кнопкой прямо на результате.
Как сделать: пошагово
- Зарегистрируйтесь. Минута времени: почта, VK или Яндекс. Карту привязывать не нужно, смуззИИ работает из России без VPN.
- Откройте видео-студию и режим «По кадру». Загрузите фото — с телефона, из архива или сгенерированное тут же. Главное, чтобы без бликов и заломов поперёк лица.
- Выберите модель. Кино со звуком — Kling 3.0 или Veo 3.1, аниме — Seedance 2, первый эксперимент — Hailuo 2.3. Цена в токенах видна до запуска, сюрпризов на кассе не бывает.
- Опишите движение. Одного-двух предложений хватит: кто что делает, куда смотрит, что происходит вокруг, как ведёт себя камера.
- Жмите кнопку. Пара минут — и ролик готов: скачивайте, сохраняйте в галерею или отправляйте на второй дубль, поменяв пару слов в промте.
Частые вопросы
Сколько стоит сделать видео из фото нейросетью?
От 31 токена за ролик — столько просят Hailuo 2.3 и Veo 3.1 в режиме Lite. Kling 3.0 стартует с 70 токенов, Seedance 2 — с 76. Верхняя планка — 690 токенов за 4K на 10 секунд у Kling 3.0. Один токен — один рубль, цена видна до запуска, токены не сгорают, подписок и автосписаний нет.
Можно ли сделать видео из фото со звуком?
Да. Kling 3.0 пишет диалоги и эффекты прямо в кадр, у Veo 3.1 речь и музыка входят в цену, Seedance 2 кладёт дорожку в ролик бесплатно. Без звука работает только Hailuo 2.3 — зато он и самый дешёвый.
Какой длины получится ролик?
5 или 10 секунд у Kling 3.0, ровно 8 у Veo 3.1, от 4 до 10 у Seedance 2, 6 или 10 у Hailuo 2.3. Для соцсетей это идеальный формат. Нужна длинная история — Veo 3.1 умеет продлевать готовый ролик, а из нескольких клипов подряд складывается целый сюжет.
Подойдёт ли обычное фото с телефона?
Подойдёт. Модели не требуют студийного качества: важнее, чтобы снимок был резким, без сильных бликов и заломов. Чем чище исходник, тем меньше нейросеть фантазирует о том, чего не разглядела.
Нужен ли VPN и чем платить?
VPN не нужен — сервис работает из России напрямую, в обычном браузере. Оплата картой российского банка или через СБП, токены падают на баланс через минуту после оплаты.
Фото уже лежат в телефоне — осталось выбрать одно и нажать кнопку. Загрузите снимок, добавьте пару слов о движении и посмотрите, как картинка задышит. Попробовать бесплатно.
