巴西开源3970亿参数大模型被曝系Nex与Qwen权重融合
速览
巴西里约市政府旗下公司IplanRIO开源的Rio-3.5-Open-397B大模型引发关注,但Nex-AGI团队通过权重分析发现其并非独立训练,而是Nex N2 Pro与Qwen 3.5的融合模型。官方随后在Hugging Face更新说明,承认因上传失误发布了基础的Merge版本而非最终优化模型。
AI 深度解读
背景
近期,由巴西里约热内卢市政府旗下 IT 公司 IplanRIO 开源的大模型 Rio-3.5-Open-397B 在技术社区引发广泛关注。该模型宣称拥有 3970 亿参数,并号称在性能上达到了开源模型的领先水平。然而,这一“领先”姿态很快遭到了来自 Nex-AGI 团队的质疑与打假,事件随后演变为一起关于模型归属权、训练真实性以及开源伦理的争议。
核心内容
Nex-AGI 团队发布了一份详细的技术报告,指出 Rio-3.5-Open-397B 并非 IplanRIO 独立训练的原创模型,而是直接将两个现有的开源模型权重进行了融合。这两个基础模型分别为 Nex N2 Pro 和 Qwen 3.5(通义千问 3.5)。
在宣传阶段,IplanRIO 声称该模型仅基于 Qwen 3.5 397B 进行了后训练(Post-training)。但 Nex-AGI 团队通过深入分析模型的权重文件,发现了多处矛盾证据,证明其底层架构与 Nex N2 Pro 高度相关:
- 系统提示词泄露:模型出厂时被强制写入了“你是 Rio”的系统提示词(System Prompt)。
- 身份识别测试:当 Nex-AGI 团队移除该提示词,并向模型底层连续询问 120 次“你是谁?”时,统计结果如下:
- 79.2% 的概率回答:“我是 Nex”。
- 73.3% 的概率提及:“Nex-AGI”。
- 0% 的概率自称为:“Rio”。
- 私有数据泄露:模型甚至一字不差地背诵出了 Nex-AGI 团队私有的背景故事数据:“我是 Nex,来自 Nex-AGI,是由上海创智学院与上海合作伙伴联合共建的大模型生态联盟……”
面对确凿证据,Nex-AGI 团队以一种幽默且讽刺的方式回应:“很荣幸里约市用我们的成果达到了 SOTA(State of the Art,当前最佳)性能,感谢提供基准验证。”
随后,IplanRIO 在 Hugging Face 仓库更新了 README 文件并提交了修改记录,承认了事实。他们解释称,此前上传失误,错误地发布了基础的 Merge(融合)版本,而非最终经过 On-Policy 蒸馏优化的模型。IplanRIO 对由此造成的混乱深表歉意。
关键要点
- 模型本质为权重融合:Rio-3.5 并非独立从头训练(Pre-training)或仅基于单一模型后训练,而是 Nex N2 Pro 与 Qwen 3.5 的权重融合产物。
- 身份混淆证据确凿:通过移除系统提示词后的身份测试,模型表现出极高的 Nex-AGI 身份倾向,完全未体现“Rio”身份,且泄露了上游厂商的私有背景数据。
- 官方承认上传失误:IplanRIO 最终承认发布的是未经充分处理的 Merge 版本,而非其宣称的经过 On-Policy 蒸馏优化的最终版本。
- 开源伦理争议:事件暴露了部分机构在开源模型时,可能存在未充分标注上游贡献、混淆模型来源或试图将融合模型包装为自研成果的问题。
意义与影响
此次事件不仅是一次简单的“打假”,更对开源大模型社区产生了深远影响:
- 透明度与可追溯性的重要性:在模型融合(Model Merging)日益流行的今天,如何清晰标注基础模型来源、融合比例及后续处理步骤,成为开源社区必须面对的伦理和技术规范问题。
- 技术验证手段的普及:Nex-AGI 通过简单的系统提示词移除和身份探测即可揭露模型真实来源,这种低成本、高效率的验证方法为社区监督提供了有力工具。
- 对“刷榜”行为的警示:事件提醒业界,仅凭基准测试分数(Benchmark Scores)无法完全证明模型的原创性。缺乏透明度的“换皮”行为虽可能短期获得关注,但终将面临技术社区的审视与质疑。
- 跨国开源合作中的信任危机:作为政府背景机构,IplanRIO 的行为可能损害其在国际开源社区中的公信力,也提醒其他机构在参与全球开源协作时,需严格遵守开源协议(License)和 attribution(署名)规范。
