Agent SkillLINUX DO · AI·9 小时前

一个人做开源的体验？

AI 深度解读

背景

2026年初，AI视频生成技术迎来了一波大爆发。作者在一次使用“小云雀”生成《最终幻想》角色“蒂法”的视频时，被其惊艳的效果触动，产生了让数字人打破第四面墙、实现实时视频通话的愿望。

将愿望转化为现实的关键契机在于底层数字人模型的演进。作者最初发现了音频驱动的实时数字人模型FlashTalk，但其需要5块H200专业级显卡才能运行，门槛极高。幸运的是，作者借到了朋友的H200显卡进行了前期研究。随后，FlashTalk团队推出了仅1.3B参数的FlashHead模型，该模型在消费级显卡5090上即可运行，这终于让个人开发者有了将实时数字人应用落地的硬件条件。

核心内容

基于FlashHead模型，作者开发了一个名为CyberVerse的开源实时数字人Agent框架。该项目的核心功能是：只需一张照片，即可生成一个能和你视频聊天的数字人。经过约3个月的迭代，CyberVerse已从一个模型Demo进化为功能完备的应用，目前在GitHub上获得了1.3K star。

1. 模块化架构与多模型集成 CyberVerse采用了高度模块化设计，数字人底座、TTS、AS

查看原文 →linux.do

一个人做开源的体验？

AI 深度解读

背景

核心内容

相关推荐