阿里发布视频生成模型HappyHorse 1.1:五大维度全面升级
速览
阿里巴巴于6月22日发布视频生成模型HappyHorse 1.1,较1.0版本在动态表现力、主体一致性、指令遵循、视觉质感和音频能力五个维度实现系统性升级。该版本显著优化了运动连贯性、多角色一致性控制及画面细节真实感,并增强了音频与提示词的理解能力。目前模型已接入阿里云百炼等平台,并联合虎鲸文娱集团启动百万商单影像大赛。
AI 深度解读
背景
6月22日,阿里巴巴正式发布其视频生成模型 HappyHorse 1.1。作为 HappyHorse 系列的迭代版本,该模型旨在解决当前视频生成领域普遍存在的痛点,特别是在动态表现力、主体一致性以及指令遵循等关键维度上进行了系统性升级。自发布以来,HappyHorse 系列模型已广泛应用于短剧制作、电商广告、品牌营销及游戏 CG 等内容生产场景,此次 1.1 版本的推出标志着其在技术能力与应用落地层面的进一步成熟。
核心内容
HappyHorse 1.1 相较于 1.0 版本,主要在以下五个核心维度实现了显著的技术突破与体验优化:
1. 动态表现力提升 针对早期版本中部分画面动作迟缓、节奏感不足的问题,1.1 版本重点优化了运动建模与时序一致性能力。这一改进使得生成的视频在动作连贯性和力量感上有了质的飞跃,有效解决了视频生成中常见的“拖沓”现象,使画面更具张力。
2. 主体一致性增强 对于内容创作者而言,保持角色或物体在视频中的稳定性是降低“抽卡率”(即反复生成以获取满意结果的成本)的关键。1.1 版本支持同时输入 9 张角色参考图,能够灵活且稳定地组合商品细节、品牌元素、角色与场景。此外,模型在多分镜与 N 宫格参考理解方面得到增强,这意味着在多角色短剧、直播带货及多人物广告等复杂场景中,可以有效控制角色“变脸”现象,确保视觉连贯性。
3. 指令遵循能力深化 模型对提示词(Prompt)的理解能力得到全面增强,无论是简短描述还是复杂叙事输入均能精准响应。
- 高强度动态场景:对于打斗等复杂动作,仅需简洁提示词即可准确理解并生成。
- 复杂叙事场景:镜头编排稳定性显著提升,能够高质量完成涉及多场景切换和多角色互动的连贯演绎。
4. 视觉质感专项优化 针对用户此前反馈集中的“油光感”和“过度锐化”等问题,1.1 版本进行了专项修复。新版本在提升画质的同时,保留了皮肤纹理(如痘印、法令纹、毛孔)等真实细节,避免了“塑料感”,从而满足短剧、广告等对画面真实质感要求极高的应用场景。
5. 音频能力升级 除了视觉生成,音频能力也得到了显著加强。台词表达更加自然,语速、停顿和语气能够根据场景氛围与角色情绪动态调整。此外,用户还可以通过提示词描述背景音和环境音效,实现视听一体化的内容创作。
技术规格与接入渠道 在技术底层,HappyHorse 1.1 保持了与 1.0 版本一致的规格:单次生成时长为 3 到 15 秒,支持 720p 和 1080p 分辨率,并支持自由宽高比。目前,最新版本已接入 HappyHorse 官网、阿里云百炼(Bailian)以及千问云(Qianwen AI)。
关键要点
- 五大维度升级:HappyHorse 1.1 在动态表现力、主体一致性、指令遵循、视觉质感和音频能力五个方面进行了系统性优化。
- 解决行业痛点:重点攻克了动作迟缓、角色“变脸”、提示词理解偏差、画面“油光感”及音频生硬等视频生成领域的常见难题。
- 支持多图参考:支持同时输入 9 张角色参考图,显著提升了多角色、多分镜场景下的主体一致性,适用于短剧、直播及广告制作。
- 真实感回归:通过保留毛孔、皱纹等细节,缓解了过度锐化和油光感问题,提升了画面的真实质感。
- 音频智能化:支持根据场景和情绪动态调整台词的语速、停顿和语气,并支持背景音效的提示词描述。
- 技术规格不变:单次生成时长 3-15 秒,支持 720p/1080p 分辨率及自由宽高比。
- 生态合作与赛事:联合虎鲸文娱集团举办“Horsepower”AI 影像大赛,优胜者可获得百万商单合作,评委包括张纪中等知名影视人。
意义与影响
HappyHorse 1.1 的发布不仅体现了阿里巴巴在 AIGC 视频生成领域的持续技术投入,更标志着视频生成模型从“可用”向“好用”和“商用”迈进的关键一步。
首先,主体一致性与指令遵循能力的提升,直接降低了专业内容生产者的使用门槛和工作成本。在多角色短剧和电商广告等高复杂度场景中,模型能够提供更稳定的输出,大幅减少后期修正和重复生成的时间,提升了内容生产效率。
其次,视觉质感与音频能力的精细化优化,使得生成的视频更加贴近真实影视标准。保留皮肤细节和自然的音频表现,解决了以往 AI 视频“假面感”强、音画不同步的问题,使其能够直接应用于对画质要求严苛的商业广告和影视制作中。
最后,通过举办“Horsepower”AI 影像大赛,阿里巴巴正在积极构建围绕 HappyHorse 模型的创作者生态。通过提供百万商单激励和知名行业评委背书,旨在吸引更多海内外 AIGC 创作者加入,推动 AI 视频生成技术在更多垂直领域的落地与应用创新,进一步巩固其在生成式 AI 视频赛道的竞争力。
