- Логика генерации видео
- Сильные видеопромпты
- Управление движением и сценой
- Работа с референсами
- Улучшение видео
- Kling и Seedance
- Примеры промптов
9.1. Чем генерация видео отличается от генерации изображений.В изображении ты описываешь
статичный результат. В видео ты описываешь
последовательность визуальных изменений во времени.
- В изображении важно:
- объект
- сцена
- стиль
- свет
- композиция
- атмосфера
В видео важно всё то же самое, плюс:- движение камеры
- движение персонажа
- движение объектов и среды
- динамика ткани, волос, воды, дыма, света
- логика действия
- ритм сцены
- характер и плавность motion
- поведение физики в кадре
💡
Если коротко:видео = изображение + движение + время + физика + логика сцены9.2. Почему точный промпт для видео важнее, чем для изображения.Когда AI создаёт видео, он не просто рисует кадр. Он
достраивает движение, физику и поведение объектов между кадрами.
Если промпт слишком общий, модель сама решает:
- как двигается камера
- насколько быстро происходит действие
- куда смотрит персонаж
- как реагирует свет
- что находится в фокусе
- какие части сцены анимировать сильнее
❌ Слабый подход:beautiful woman in a cafe luxury car in the city cinematic scene with sunlight Для картинки может сработать. Для видео — почти никогда.
✅ Сильный подход:Нужно описывать:
- кто или что в кадре
- что именно делает объект
- как движется камера
- как ведёт себя свет
- какой темп у сцены
- какой визуальный стиль нужен
- насколько движение плавное, медленное или энергичное
- чего НЕ должно происходить в кадре
📌
Последний пункт особенно важен. Ограничения в видеопромпте работают не хуже описаний. Если не написать no chaotic motion, AI может добавить хаотичное движение сам.
9.3. Почему промпт для видео лучше писать на английском.Как и в генерации изображений, большинство AI-моделей лучше понимают
английский язык.
Но в видео это ещё критичнее, потому что здесь нужно точно описывать:
- тип движения камеры
- темп и характер action
- кинематографические приёмы
- поведение света во времени
- физику объектов
- смену фокуса
Именно на английском точно работают такие формулировки:
- slow cinematic dolly in
- subtle handheld motion
- soft diffused lighting with moving shadows
- smooth camera orbit
- shallow depth of field
- natural body movement, no distortion
- slow motion feeling, fluid and elegant
📌 Думай на русском — генерируй на английском.
9.4. Из чего состоит сильный видеопромпт.Хороший видеопромпт описывает не только
что в кадре, но и
как это живёт и движется.
Базовая структура:Объект → действие → движение камеры → вторичное движение → свет → стиль → атмосфера → ограничения → качествоРазбор по слоям1. Объект / сценаЧто мы видим в кадре:
- персонаж, продукт, интерьер, улица, природа, студия
2. Главное действиеЧто происходит:
- person walking slowly
- model turns her head toward the light
- perfume bottle rotates gently on a pedestal
- car drives through a wet street
3. Движение камерыКак зритель воспринимает сцену:
- slow push in
- cinematic orbit
- smooth tracking shot
- static camera
- gentle tilt up
4. Вторичное движениеЧто оживляет сцену помимо главного действия:
- hair flowing softly
- fabric moving in the wind
- smoke drifting in the background
- light shifting across the surface
- water ripples, fog drifting, leaves moving
5. СветКак работает освещение:
- soft diffused daylight
- dramatic side lighting with shifting shadows
- warm golden reflections moving across the glass
- neon light flickering softly in the background
6. СтильКак должен ощущаться ролик:
- cinematic,
- luxury
- commercial,
- fashion
- film
- editorial,
- moody,
- minimalistic,
- futuristic
7. Атмосфера и ритмКакой вайб:
- calm and elegant,
- slow and premium
- energetic and sharp,
- mysterious and dark
8. ОграниченияЧего НЕ должно быть:
- no chaotic motion
- no unnatural body distortion
- no aggressive camera shake
- no overanimation
- no flickering artifacts
- no unrealistic facial movement
9. Качество- highly detailed
- cinematic realism
- ultra polished commercial aesthetic
- realistic motion
9.5. Как AI понимает движение: разбор по уровнямОдна из главных ошибок - писать промпт так, будто ты описываешь просто картинку.
Для видео нужно думать
слоями движения.
Уровень | Примеры |
Камера | push in, orbit, tracking, tilt |
Персонаж | ходьба, поворот головы, моргание |
Лицо | мимика, движение губ, взгляд |
Тело | руки, дыхание, осанка |
Одежда | ткань, пальто, платье |
Волосы | лёгкое движение, порыв ветра |
Объект | вращение, скольжение, падение |
Среда | дым, туман, пар, листья, вода |
Свет | блики, тени, переходы, мерцание |
Фон | размытие, глубина, детали |
💡
Чем чётче ты разделяешь уровни движения в промпте, тем точнее модель понимает задачу.Пример:❌ Слабо:
woman in studio lighting
✅ Сильно:
a woman standing still in a minimal studio, subtle hair movement, gentle blinking, slow natural turn of the head toward the light, slow cinematic push in, diffused side lighting with soft shadow transitions, elegant cinematic mood, realistic motion, no exaggerated movement
9.6. Как писать про движение камерыДвижение камеры - один из самых важных элементов. Именно оно делает ролик кинематографичным или дешёвым.
Основные типы движения камерыStatic cameraКамера стоит на месте. Подходит, если всё движение - внутри сцены.
Slow push inМедленное приближение к объекту. Один из самых универсальных и "дорогих" приёмов. Работает почти везде.
Dolly in / Dolly outКамера плавно едет вперёд или назад.
Pan left / Pan rightКамера поворачивается влево или вправо.
Tilt up / Tilt downКамера движется вверх или вниз.
Tracking shotКамера следует за объектом, сохраняя дистанцию.
Orbit shotКамера обходит объект по дуге. Отлично работает в product video и fashion-клипах.
Crane shot / Aerial pull backКамера поднимается вверх и отъезжает. Даёт ощущение масштаба.
Handheld motionЛёгкое ручное движение. Даёт живое ощущение, но нужно использовать аккуратно - легко уходит в хаос.
Полезные формулировки:slow cinematic push in smooth dolly forward subtle orbit around the subject gentle handheld movement static frame with slight natural motion slow tracking shot following the subject soft pan from left to right slow upward tilt revealing the environment
📌 Важно:Если не указать движение камеры - AI выберет его сам. Чаще всего это будет что-то хаотичное или слишком активное.
Всегда пиши движение камеры явно.9.7. Как писать про движение светаСвет в видео может быть не только статичным, но и
живым.
Именно живой свет часто делает ролик атмосферным и дорогим.
Что можно описывать- мягкий меняющийся свет
- направленный свет с плавными тенями
- свет через окно или жалюзи
- движение бликов по поверхности
- неоновое мерцание на фоне
- золотой час с тёплыми переходами
- студийный свет с мягкими highlights
Примеры формулировок:soft natural daylight moving through sheer curtains dramatic side lighting with slowly shifting shadows warm golden sunlight with subtle changing reflections neon light flickering softly in the background diffused studio light with elegant highlights on the product moving light patterns drifting across the wall warm specular reflections shifting on glass surface
💡
Лайфхак: Если в сцене есть стекло, металл, вода, кожа или глянцевые поверхности — опиши, как свет взаимодействует с ними. Именно это часто делает видео визуально богатым.
9.8. Как писать про вторичное движениеВторичное движение - это всё, что
оживляет сцену помимо главного действия. Без него ролик выглядит плоско и "мёртво".
Что может двигаться дополнительно- волосы и отдельные пряди
- ткань, одежда, занавески
- дым, туман, пар, пыль
- вода, рябь, отражения
- листья, трава, ветер
- блики и тени на поверхностях
- фоновые элементы и детали
Пример:A luxury perfume bottlestanding on a glossy blacksurface, very slow cinematic camera orbit,thin elegant smoke drifting slowly in the background, warm moving highlights shiftingacross the glass surface, subtlereflections evolving with camera movement, cinematic dark luxury mood, dramatic sculptedlighting, no chaotic motion, stable elegant composition, ultra detailed commercial video
Здесь движение создают
сразу несколько слоёв:
- камера плавно обходит объект
- дым двигается на фоне
- блики "живут" на стекле
- отражения меняются с движением камеры
📌 Именно такие мелкие элементы делают видео визуально насыщенным.
9.9. Как строить длинный детализированный промптКороткие промпты для видео работают хуже, чем для изображений.
Потому что в видео нужно
управлять сразу несколькими слоями одновременно:
камерой, объектом, светом, средой, ритмом, стилем и ограничениями.
Оптимальная логика построения1. Главный объект и сцена
2. Главное действие
3. Вторичное движение
4. Движение камеры
5. Поведение света
6. Стиль и атмосфера
7. Ограничения (чего НЕ должно быть)
8. Качество
📌 Лайфхак: блоки через запятуюНе нужно писать промпт как художественный текст. Лучше работает
чёткое перечисление блоков через запятую, где каждый блок отвечает за свой уровень управления.
📌 Лайфхак: негативные указанияВ конце промпта всегда добавляй то, чего не должно быть:
no chaotic motion, no unnatural body distortion, no aggressive camera shake, no overanimation, no flickering artifacts, no unrealistic facial changes Это сильно повышает предсказуемость результата.
9.10. Kling: особенности и лайфхакиKling - одна из сильнейших моделей для генерации кинематографичного видео.
Хорошо справляется с:
- плавным и атмосферным движением
- медленными cinematic shots
- fashion и beauty клипами
- product video
- мягкими городскими сценами
Что важно знать о Klingлучше работает с:
- последовательным и логичным описанием сцены
- хорошо читает движение камеры, если оно описано прямо
- сильнее раскрывается, когда в промпте есть атмосфера и кинематографичность
- лучше результат, когда движение не слишком хаотичное
- любит, когда сцена не перегружена несвязанными действиями
Что лучше писать для Kling:- slow camera movementsmooth cinematic transitions elegant light behaviorrealistic subjectmotion atmospheric environment cinematic mood no aggressive motion
💡 Лайфхаки для KlingПиши промпт как
режиссёрское описание сцены, а не просто как список объектов
- Добавляй ощущение: the scene feels premium, quiet and cinematic
- Указывай скорость движения: very slow, subtle, gentle, deliberate
- Для product video всегда описывай поведение отражений и света на поверхности
- Используй Image to Video - загружай сгенерированное изображение как первый кадр. Это даёт значительно более стабильный и управляемый результат, чем чистый text-to-video
9.11. Seedance: особенности и лайфхакиSeedance хорошо подходит, когда нужен
чёткий контроль за действием и логикой движения.
Seedance работает лучше, когда:
- движение описано конкретно
- любит ясную структуру промпта
- лучше понимает, когда сцена разбита на понятные элементы
- важно чётко разделять: кто движется, как движется, что делает камера
- меньше любит- поэтичные и художественные формулировки
Что лучше писать для Seedance- главный объект
- конкретное действие
- движение камеры
- поведение света
- фоновые движения
- стиль и темп
💡 Лайфхаки для SeedanceИспользуй
режиссёрский язык: описывай сцену как технический бриф, а не как поэзию
- Не смешивай слишком много движений в одной сцене
- Разделяй: subject motion, camera motion, background motion - описывай их отдельными блоками
- Указывай темп явно: slow, medium pace, fast, subtle
- Если нужно точное попадание - загружай референсное изображение как первый кадр
📌 Если промпт слишком "поэтичный", модель понимает его хуже, чем чёткое техническое описание.
9.12. Lip sync: как сделать так, чтобы персонаж пел или говорил под аудиоОдин из самых востребованных форматов - видео, где
AI-персонаж поёт или говорит под аудиодорожку, и движение его губ совпадает со словами.
Это называется
lip sync или
lip dubbing.
Как это работаетТы берёшь:
- изображение или видео с персонажем
- аудиодорожку (голос, пение, речь)
И специальный AI-инструмент
анализирует звук и
генерирует движение губ, которое синхронизировано с этим звуком.
Какие инструменты использоватьKling - Lip Sync режимKling имеет встроенную функцию lip sync. Ты загружаешь изображение персонажа + аудиофайл, и модель генерирует видео, где губы персонажа двигаются в такт словам.
HedraСпециализированный инструмент именно для lip sync. Хорошо работает как с речью, так и с пением. Поддерживает загрузку своего изображения + своего аудио.
Sync.so Профессиональный инструмент для lip sync. Можно загрузить уже готовое видео и наложить на него новую аудиодорожку с синхронизацией губ.
D-IDХорошо работает с портретными изображениями. Подходит для речевых роликов, аватаров и презентаций.
HeyGenОдин из лучших инструментов для lip sync с реалистичными персонажами. Особенно хорошо работает с речью и подходит для видеопрезентаций, аватаров брендов, обучающего контента.
Как получить лучший результат?1. Качество картинки- лицо должно быть: хорошо освещено и чётко видно
- рот не должен быть закрыт, сильно повёрнут или перекрыт
- лучше всего работает - фронтальный или слегка боковой ракурс
- избегай сильных теней на лице
2. Качество аудио- аудио должно быть чистым, без сильных шумов и реверба
- чем чище голос - тем точнее синхронизация
- если используешь пение - лучше работает аудио с чётким произношением слов
- слишком быстрое или смазанное пение даёт худший результат
3. Длина и сложность- короткие фрагменты (до 15–30 секунд) обычно дают более точный результат
- длинные аудио с частыми сменами темпа могут давать рассинхрон
- для длинных роликов лучше нарезать на короткие части и потом склеить
4. Выбор инструмента под задачуЗадача | Лучший инструмент |
Пение с точным lip sync | Hedra, Kling Lip Sync |
Речь, аватар бренда | HeyGen, D-ID |
Наложение нового аудио на видео | Sync.so |
Быстрый тест | Kling Lip Sync |
💡 Лайфхаки для lip syncИспользуй
Image to Video в Kling как базу:
сначала сгенерируй красивое видео с персонажем, потом наложи lip sync через Kling или Hedra
- Для пения лучше всего работают чёткие, медленные или средние по темпу треки
- Если хочешь максимальной реалистичности - генерируй портретное изображение с нейтральным выражением лица (рот слегка приоткрыт или в нейтральном положении). Это даёт модели больше свободы для точного lip sync
- Попробуй разные инструменты на одном и том же материале - результат может сильно отличаться
- Для песни на иностранном языке используй аудио с чётким произношением - это критично для качества синхронизации
9.13. Примеры сильных детализированных промптов1. Fashion cinematicA tall stylish woman in an oversized beigetrench coat walks slowly through a clean modern city street with minimalist architecture, her movementcalm, elegant andconfident, soft wind gently moving her hair andthe fabric of the coat, the scenefeels premium, quiet andcinematic. The camera follows her in a slow smooth tracking shotfrom a slightly low angle, maintaining natural motion and subtledepth, with a gentle forward movementthat creates immersion without feeling aggressive. The backgroundremains slightly out of focus, with soft urban depth andclean composition. Lighting is diffusednatural daylight under an overcast sky, producing soft shadows,controlled highlights andrealistic skin tones. The visual style feels like a luxury fashion campaign, minimal, refined andexpensive, with a muted neutral color palette of beige,grey, stone andsoft white. Motion shouldremain realistic, fluid andrestrained, with no chaotic movements, no exaggerated animation, no unnatural bodydistortion.The overall mood is elegant, calm, aspirational andeditorial, like a high-end brandfilm. Highly detailed, cinematic realism, polished composition, premium fashion film aesthetic
2. Product luxuryA luxury perfume bottlestands at the center of a glossy blackreflective surface in a dark premium studio environment, with deep shadowsandcontrolled negative space. The bottleis made of clear heavy glass with gold details, andthe reflections on the glass shiftsubtlyas the camera moves.Thin elegant smoke drifts slowly in the background,addingdepth andatmosphere without distractingfrom the product. The camera performs a very slow cinematic orbitaround the bottle,smooth andprecise, emphasizing the shape,reflections andpremium materials. Lighting is dramatic and carefully sculpted,with soft directionalhighlights on the edges of the glass, warm specular reflections, subtlemoving light across the bottlesurface, and controlled contrast that enhances the luxury feel. The atmosphere shouldfeel rich, sensual andexpensive, like a high-end fragrance commercial. Motion must remain minimal, elegant andintentional, with stable composition andrealistic reflective behavior.Blackandgold color palette, ultra polished commercial aesthetic, cinematic product video, extremelydetailed textures, realistic glass rendering, premium advertising look, no chaotic motion, no flickering artifacts
3. Interior atmosphereA warm minimalist living room with refined modern interior design, soft beigetones, natural wood textures, linen curtains andcarefully curated decor, presented as a calm luxury lifestyle scene.Gentle wind movesthe sheercurtains near a large window, while sunlight slowly shiftsacross the wall, floor andfurniture, creating natural evolving patterns of light andshadowover time. The camera performs a slow cinematic push in from a medium-wide composition, moving forward smoothly andsubtlyto create a sense of depth andcalm immersion. The environment shouldfeel quiet, lived-in, elegant andpeaceful, with realistic spatial depth andnatural material textures. Lighting is soft natural morning daylight, diffusedandwarm, with delicate highlights on wood, fabric andmatte surfaces. Secondary movementremains minimal andrealistic, only curtains, light transitions andslight atmospheric softness in the space. The mood is serene, elevated andpremium, like an interior design brandfilm. Highly detailed, realistic motion, tasteful composition, soft luxury aesthetic, calm cinematic pacing, no abrupt transitions, no overanimation
4. Beauty close-upClose-upbeautyshotof a young woman with clean glowing skin andnatural makeup, facing soft studio light in a minimal neutral setting. Her expression is calm, confident andintimate, with subtleblinking,gentle breathinganda slow natural turn of the head toward the light. Fine strands of hair moveslightly, adding delicate realism andsoftness to the frame. The camera performs a slow controlled push in, staying closeandstable, emphasizing skin texture, facial contours and the premium beautycampaign feeling. Lighting is diffusedandflattering, with soft highlights on the cheekbones, natural glow on the skin, smooth shadowtransitions andno harsh contrast. Depth of field is shallow,keeping the eyes andskin details in focus while the backgroundremains soft andminimal. Motion shouldfeel restrained, realistic andelegant, with no exaggerated facial movement,no distortion, no unstable camera behavior.The overall atmosphere is clean, luxurious, modern and emotionally refined, like a premium skincare orbeautybrandcommercial. Highly detailed, cinematic beautyfilm aesthetic, realistic skin texture, polished editorial quality
5. Night city automotiveA sleek blackluxury car drives slowly through a wet city street at night, surrounded byreflective asphalt, modern architecture andglowing neon signage in the distance.The motion of the car is smooth, controlled andpowerful, while reflections ripple across the wet road surface as it movesforward. The camera tracks the vehicle from a low cinematic angle, maintaining a smooth parallel motion that highlights the silhouette, wheel movementandreflective bodywork.Subtle environmental motion includes soft rain residue on the road, shimmeringreflections, faint haze in the backgroundanddistanturban light flicker. Lighting is moody and cinematic, combining cool blueambient light, deep shadowsandwarm highlights from passing reflections on the car body.The pacing shouldfeel premium anddeliberate, not fast orchaotic, more like a luxury automotive commercial than an action scene. The atmosphere is dark, sophisticated andhigh-end, with strong visual depth and polished realism. Highly detailed, cinematic urban luxury aesthetic, smooth realistic vehicle motion, premium commercial quality, no shakycamera, no overexposed lights
9.14. Слабый vs сильный промпт❌ Слабыйbeautiful girl cinematic video
Почему плохо:
- непонятно, что делает персонаж
- нет движения камеры
- нет света
- нет среды
- нет темпа
- нет стиля
- нет ограничений
- AI додумывает всё сам
✅ СильныйA beautifulyoung woman standing bya large window in a minimal interior, slowly turning her head toward the soft natural light, fine hair strands moving gently, subtleblinkingandnatural breathing,slow cinematic push in, warm diffusedmorning sunlight, elegant fashion film aesthetic, calm emotional mood, shallowdepth of field, no chaotic motion, no distortion,realistic motion, highly detailed
9.15. Частые ошибки при генерации видеослишком общий промпт без деталей движения:
- описание только картинки без описания действия
- отсутствие движения камеры
- отсутствие вторичного движения
- слишком много несвязанных действий в одной сцене
- противоречивые указания
- перегруженный промпт без структуры
- отсутствие ограничений
- слишком "поэтичный" язык вместо режиссёрского
- попытка сделать сложную сцену без логики построения
9.16. Как улучшать результат, если видео получилось слабымЕсли результат не устраивает - не переписывай всё хаотично. Разбирай по частям.
Проверь по порядку:1. Понятно ли, кто главный объектЕсли нет - сцена рассыпается.
2. Описано ли главное действиеЕсли нет - видео будет мёртвым или случайным.
3. Указано ли движение камерыЕсли нет - AI выберет его сам, часто неудачно.
4. Есть ли вторичное движениеБез него ролик выглядит плоско.
5. Описан ли светБез этого теряется объём и атмосфера.
6. Есть ли ограниченияБез них модель добавляет лишнее движение и артефакты.
7. Не перегружен ли промптСлишком много несвязанных действий - модель начинает ошибаться.
Как улучшать- упростить сцену до одного главного действия
- явно прописать камеру
- добавить 1–2 вторичных движения
- уточнить поведение света
- добавить ограничения
- убрать лишние слова
- сделать ритм понятным: slow, subtle, smooth, energetic
9.17. Универсальная формула сильного видеопромптаФормула:Объект + сцена → главное действие → вторичное движение → движение камеры → свет → стиль → атмосфера → ограничения → качествоШаблон [main subject] in [scene], [main action], [secondary motion], [camera movement], [lighting behavior], [ 🎙 10. ГЕНЕРАЦИЯ АУДИО