AI Video · 2026-04-29

AIGC 视频工作流练习

AI Video Storyboard SeedDance

这次练习的重点不是单纯生成一段视频，而是尝试把 AI 视频创作拆成更可控的流程。

AI 视频最容易崩的地方，通常不是“完全做不出来”，而是做出来以后不稳、不准、不受控。人物关系会乱，镜头顺序会跳，动作会变形，Logo 也容易在变形过程中丢掉识别点。问题往往出在一开始就把抽象创意直接交给视频模型，让模型自己猜。

所以这次我把流程拆成两步：先用 Image 2 把创意翻译成视觉方案，再交给 Seedance 2.0 去生成视频。Image 2 更像前期导演和视觉脚本工具，负责把分镜、动作、动画节奏和主视觉想清楚；Seedance 负责把这些已经明确的画面拍出来。

用分镜图控制镜头逻辑

第一个练习是“小猫偷饼干被发现”的短片分镜。我想要的是一个 15 秒左右的喜剧小故事：小橘猫趁主人倒牛奶时靠近饼干，咬下一口后被主人发现，最后假装无辜但嘴边饼干屑暴露了一切。

如果直接把这个故事写成一段文字交给视频模型，它很容易只抓到“小猫、饼干、厨房”这些元素，却忽略喜剧节奏。真正决定短片成立的，是镜头顺序、人物站位、动作方向和最后几秒的停顿。

小猫偷饼干分镜图

这张分镜图把故事拆成 9 个镜头，并在同一张画布里加入角色表、场景参考和配色参考。每一格都包含镜头类型、动作、情绪和运动方向。这样后续生成视频时，模型看到的不再是一段抽象故事，而是一张更接近导演脚本的视觉说明。

这一步最有价值的地方，是把“我脑子里的故事”变成“模型能看懂的镜头”。分镜不是为了好看，而是为了减少视频生成时的自由发挥。

第二个练习是青花瓷踢腿动作。舞蹈、武术、转身、跳跃这类动作很容易在 AI 视频里变形，因为它们不是单一姿势，而是一串连续重心变化。

我把实拍动作拆成关键帧：行进准备、左脚踩稳、右腿前踢、屈膝回收、外摆、转身、腾空、定格。每个姿态都标出大概时间点和身体状态，让模型先理解动作路径，再进入视频生成。

青花瓷踢腿动作分解

这一段让我意识到，复杂动作不能只靠一句“完成一个踢腿动作”。更稳定的方法是先做动作表，把连续运动拆成关键姿态。视频模型需要的不是形容词，而是可执行的时间线。

第三个练习是 HBG Logo 动画。Logo 出场动画看起来简单，但其实很容易失控：一旦变形过程过长，模型就会把 Logo 画成另一个东西；如果只说“光点变成椰树 Logo”，中间过程也会很随机。

我先做出最终 Logo，确定黑底、发光线条、椰树符号和 HBG 字标的关系。

然后把动画拆成 6 个阶段：光点出现、能量聚拢、椰子轮廓、芽生长、椰树定型、字标显现。动画表里还标注了每一段的时间、缓动方式和形态注意点。

HBG Logo 动画表

这类品牌动画不适合让模型自由发挥。步骤越少、背景越干净、变形描述越具体，最终 Logo 越容易稳定。这里真正要控制的是“从哪里来、怎样变、最后停在哪里”。

最后一个练习是情绪向 MV Demo。MV 不只是把人物放进舞台，而是要有统一的角色符号、场景氛围和摄影方式。

我用“带天使翅膀和光环的女子，在小型现场演出场所弹吉他”作为主视觉方向，并把画面控制在阴郁逆光、观众剪影、舞台近景和吉他细节之间。Image 2 先生成一张完整的镜头参考图，再交给 Seedance 生成视频；后续用 Suno 做音乐，用剪映调节节奏和字幕，快速拼成一个示例 Demo。

天使吉他手 MV 分镜

主视频放在页面开头。它不是一个完整 MV 成片，更像一次流程验证：先用主视觉锁定情绪和摄影语言，再让视频模型补足镜头推进。

这次练习让我更清楚地看到，AI 视频的关键不只是提示词写得漂亮，而是能不能把创意先翻译成模型能执行的视觉方案。

对我来说，这套流程可以总结成四步：

Image 2 负责把视频想清楚，Seedance 负责把画面拍出来。前期视觉方案越明确，后期生成就越不像碰运气。