AI视频创作实战:利用Seedance 2.0与角色板制作武侠动画
速览
本文介绍了一种基于Agent Skill和提示词工程的AI视频制作玩法。作者以Seedance 2.0为核心工具,通过构建详细的角色身份板(Character ID Board)确保人物一致性,并生成包含12个关键帧的分镜脚本。该工作流将静态的AI图像转化为具有强烈视觉冲击力和叙事性的武侠动画,展示了从角色设定到动态呈现的高效创作路径。
AI 深度解读
背景
随着 AI 视频生成技术的快速迭代,创作者们正在探索从静态图像到动态视频的高效工作流。本文分享者基于在 LINUX DO 社区的经历,回顾了过去使用 Sora 2 和 Grok 进行角色视频生成的经验,并重点介绍了如何利用 Seedance 2.0 结合角色卡(Character Sheet)与分镜故事板(Storyboard)来提升 AI 视频制作中的人物一致性与叙事表现力。作者旨在通过实际案例,展示如何从 Flux 生成的静态古装漫画人物出发,经过详细的设定构建、视觉标准化处理以及动态分镜设计,最终在 Seedance 2.0 中生成高质量的动画片段,并计划未来进一步探索完整剧情视频的制作。
核心内容
作者首先对比了不同 AI 工具在角色视频生成上的工作流差异。此前使用 Sora 2 时,作者倾向于将生成的角色形象直接放入 Grok 生成包含多视角(正面、侧面、背面及面部特写)的 6 秒视频,这种方式虽便捷且利于剧集调用,但在角色一致性保持上存在局限。相比之下,作者认为当前使用 Seedance 2.0 时,采用“Image-to-Video”模式,结合精心制作的“角色卡”与“分镜故事板”,能取得更好的效果。
具体操作流程分为以下几个关键步骤:
-
角色设定与形象生成: 作者使用 Flux 生成基础形象,并借助“哈吉米”(Hajimi,一种 AI 工具或插件)根据形象生成武侠玄幻风格的角色背景,包括门派、名字及独门武功。例如,生成了一位名为“广寒仙翁 · 纳兰道”的角色,隶属于【太上忘情阁】,其绝招为《万劫浮生诀》中的“太上神环劫”,设定包含白发白须绿袍老者、金色神环与烈火等视觉元素。
-
制作电影级角色卡(Character Card): 将角色参考图与设定信息输入 Seedance 2.0(或相关图像生成模型),通过复杂的提示词构建一张艺术化的角色识别板。该角色卡的设计要求极高:
- 视觉风格:采用不对称、优雅的电影标识板布局,混合高端动画工作室角色研究与艺术书籍风格,避免标准的网格或蓝图设计。
- 内容构成:包含大型英雄全身视图作为视觉锚点,周围分布中立全身、后视图、个人资料、坐姿、蹲姿、俯仰角等多种姿态研究,以及剪影、表情变化和细节特写。
- 一致性约束:严格锁定面部、发型、服装、身材比例和视觉个性,确保所有视图身份一致。
- 设计细节:保持背景纯净(纯白或柔和灰白),无水印、无道具,强调清晰的轮廓、干净的双手和明确的表达范围,文字部分仅保留姓名、角色、核心情绪等简约信息。
-
生成动态分镜故事板(Storyboard): 为了展示角色的独门武功,作者再次使用“哈吉米”生成了 12 个分镜的战力展示脚本。脚本详细描述了老者从静到动、由道入魔的过程,包括心火点燃、神环旋转、业火喷薄等层层升级的视觉效果。 随后,结合特定的提示词生成黑白铅笔风格的故事板。该故事板强调:
- 艺术风格:粗糙的铅笔线、快速的手势绘图能量、简单的解剖结构,保持轻盈、动态且未完成的状态。
- 动作与镜头:直接开始行动,避免静态开场;使用手持摄影、鞭打感、轨道移动、极低角度等电影化运镜。
- 特效与注释:通过空气爆发、灰尘、能量漩涡等元素增强视觉冲击,并使用红、蓝、绿、橙、黄五色箭头及标记分别指示身体运动、相机移动、构图、照明和特效。
-
视频生成与迭代: 将制作好的角色卡和故事板作为参考输入 Seedance 2.0,生成最终视频。由于作者使用的是豆包的免费额度(限制 10 秒视频),部分分镜内容未能完全展现。作者反思认为,将分镜调整为 8 个可能更适合 10 秒的限制。
-
成果展示与后续计划: 作者共制作了 24 个人物形象(17 个正派,7 个反派),并展示了慕容紫极、绝无魂、幽泉血皇等角色的生成效果。其中部分反派角色因涉及血腥暴力提示词被拦截,需通过豆包修改提示词才能通过。作者计划下一期练习制作打斗视频,第三期尝试制作包含简单剧本的完整剧情视频。
关键要点
- 工作流优化:从单一的“角色+视频生成”转向“角色卡+分镜故事板+视频生成”的复合工作流,以解决 AI 视频中常见的人物一致性和叙事连贯性问题。
- 角色卡设计原则:
- 拒绝标准化模板,追求电影级、艺术化的不对称布局。
- 严格的多视角覆盖(全身、局部、剪影、表情)。
- 极强的身份锁定机制(面部、服装、比例的一致性)。
- 视觉上的“呼吸感”与清晰的分隔,避免元素堆叠。
- 故事板的功能性:
- 使用黑白铅笔风格减少 AI 对色彩和细节的过度解读,聚焦于动作结构和镜头语言。
- 引入颜色编码系统(红蓝绿橙黄)明确指示动作、运镜、构图、灯光和特效,为 AI 提供更精确的指令。
- 强调动态起始和电影化运镜,避免静态摆拍感。
- 工具链组合:
- Flux:用于初始高质量静态角色图像生成。
- 哈吉米 (Hajimi):用于辅助生成角色背景设定及分镜脚本。
- Seedance 2.0:核心视频生成引擎,利用图像参考生成动态视频。
- 豆包 (Doubao):用于处理免费额度限制及敏感词过滤(如暴力内容)。
- 实践中的挑战与对策:
- 时长限制:免费额度限制视频长度,需精简分镜数量(建议 8 镜)以适应时长。
- 内容审核:AI 平台对血腥暴力内容敏感,需通过修改提示词或使用不同平台绕过限制。
- 一致性保持:通过详细的角色卡和故事板约束,显著提升了角色在动态视频中的形象稳定性。
意义与影响
该分享为 AI 视频创作者提供了一套可复制的、工业化的角色动画制作范式。它证明了通过精细的前期设计(角色卡与故事板),可以有效克服当前 AI 视频生成技术在角色一致性和复杂动作控制上的短板。
- 提升创作效率与质量:将原本依赖运气或简单提示词的“盲盒式”生成,转变为基于结构化数据(角色卡、分镜脚本)的“工程化”制作,大幅提高了成片率和视觉专业度。
- 推动 AI 视频叙事能力:通过引入电影化的分镜语言和镜头语言,AI 视频不再局限于静态展示或简单动作,而是能够承载更复杂的剧情和情绪表达,为短剧、动画预告等应用场景提供了可行路径。
- 工具链整合的示范:展示了如何灵活组合多种 AI 工具(图像生成、文本辅助、视频生成、内容审核)来解决单一工具无法解决的问题,体现了“AI 工作流”思维的重要性。
- 社区知识沉淀:作者公开了详细的提示词结构和设计思路,降低了其他创作者尝试高难度 AI 视频制作的门槛,促进了社区内的技术交流与创新。
这一实践不仅是一次技术练手,更是 AI 辅助内容创作从“玩具”走向“工具”的重要一步,预示着未来 AI 视频制作将更加标准化、专业化。
