← 返回信息流
Agent SkillLINUX DO · AI·6 天前

l0veyou公益站推出基于LTX的数字人模型

原标题:ai图生视频公益站推出基于ltx的数字人模型

速览

l0veyou公益站推出了基于LTX技术的数字人模型,单次可生成10秒逼真视频,未来计划支持20秒。用户需上传大于两秒的音频及参考图,并配合提示词即可快速生成。此外,该站点还预告将上架Gemini 3.1 Pro及支持零件拆分的3D模型生成功能。

AI 深度解读

背景

近期,AI 视频生成领域持续涌现新的工具与模型,旨在降低创作门槛并提升生成质量。在此背景下,名为 “l0veyou” 的公益站推出了一款基于 LTX(LTX Video)技术的数字人模型。该公益站致力于提供免费的 AI 生成资源,此次更新的数字人模型旨在解决用户对于高逼真度、短时长大视频生成的需求。与此同时,该公益站也面临着基础设施维护的挑战,包括 AI 生图服务的暂时停摆以及新模型(如 Gemini 3.1 Pro 和 3D 模型生成工具)的上架计划。

核心内容

l0veyou 公益站正式推出了一款基于 LTX 技术的数字人模型,该模型支持单次生成 10 秒的视频片段,且生成的视频效果被描述为“非常逼真”。开发者透露,未来计划将该模型的单次生成时长扩展至 20 秒,以进一步提升用户体验和视频叙事的完整性。

在使用流程上,用户需遵循以下具体步骤:

  1. 音频准备:上传一段音频作为驱动源。系统要求音频时长必须大于两秒,否则视频生成将失败。
  2. 模型选择:在界面中选择上传的数字人模型。
  3. 参考图上传:点击界面右下角的“加号”图标,上传一张参考图片(通常为人物肖像)。
  4. 提示词输入:在提示词框中输入简单的指令,例如“她在说话”,以触发数字人的口型同步和面部表情生成。

得益于后台配备的数百 GB 显存的专业 GPU 集群,视频生成速度较快,能够迅速完成渲染。

此外,公告中还提及了其他重要动态:

  • 服务故障:AI 生图服务目前暂时不可用。开发者表示已进行全天修复工作,预计至少需要到第二天才能恢复,期间开发者因工作繁忙可能面临睡眠不足的情况。
  • 新模型预告:开发者计划次日上架两个新模型:
    • Gemini 3.1 Pro:据称该模型仅需 0.1 个 LDC(LINUX DO 平台的积分或代币单位)即可使用,极具性价比。
    • 3D 模型生成模型:该模型生成的 3D 模型具有可拆分零件的特性,而非传统的整体块状模型,这一特性被认为效果非常好,适用于更精细的 3D 创作需求。

关键要点

  • 技术基础:数字人模型基于 LTX 技术构建,强调高逼真度和快速生成能力。
  • 生成时长:当前支持单次生成 10 秒视频,未来目标为 20 秒。
  • 操作门槛
    • 需上传大于 2 秒的音频文件。
    • 需上传参考图(通过右下角加号)。
    • 提示词简单,如“她在说话”即可驱动。
  • 硬件支持:依赖拥有上百 GB 显存的专业 GPU 集群,保障生成速度。
  • 服务状态
    • AI 生图服务暂时停摆,预计次日恢复。
    • 开发者处于高强度工作状态,需应对新模型上架和服务修复。
  • 即将上线的新功能
    • Gemini 3.1 Pro:低成本(0.1 LDC)接入。
    • 可拆分 3D 模型生成:支持生成零件可独立拆分的 3D 资产,提升建模灵活性。

意义与影响

此次更新反映了当前 AI 内容生成领域从“静态图像”向“动态视频”及“复杂 3D 资产”延伸的趋势。l0veyou 公益站通过提供基于 LTX 的数字人模型,降低了用户制作口型同步视频的技术门槛,使得非专业用户也能快速生成逼真的数字人播报或表演内容。

此外,开发者对生成时长的优化(从 10 秒向 20 秒扩展)表明社区正在努力解决短视频生成中叙事连贯性的痛点。同时,即将上架的“可拆分 3D 模型生成”工具,若如其描述般有效,将极大简化 3D 建模流程,对游戏开发、虚拟现实(VR)及增强现实(AR)内容创作具有潜在的重要价值。

最后,公益站服务的不稳定性(如生图服务故障)也提醒用户,尽管 AI 工具日益普及,但其背后的基础设施维护和高昂的计算成本仍是影响服务连续性的关键因素。开发者对低成本模型(如 0.1 LDC 的 Gemini 3.1 Pro)的推广,则体现了社区致力于降低 AI 使用成本、促进技术普惠的努力。

查看原文 →linux.do