Agent SkillLINUX DO · AI·2 小时前

巴西开源3970亿参数大模型被曝系Nex与Qwen权重融合

原标题：一家巴西市政IT公司号称达到开源模型的领先水平的大模型，竟是换皮套壳

速览

巴西里约市政府旗下公司IplanRIO开源的Rio-3.5-Open-397B大模型引发关注，但Nex-AGI团队通过权重分析发现其并非独立训练，而是Nex N2 Pro与Qwen 3.5的融合模型。官方随后在Hugging Face更新说明，承认因上传失误发布了基础的Merge版本而非最终优化模型。

AI 深度解读

背景

近期，由巴西里约热内卢市政府旗下 IT 公司 IplanRIO 开源的大模型 Rio-3.5-Open-397B 在技术社区引发广泛关注。该模型宣称拥有 3970 亿参数，并号称在性能上达到了开源模型的领先水平。然而，这一“领先”姿态很快遭到了来自 Nex-AGI 团队的质疑与打假，事件随后演变为一起关于模型归属权、训练真实性以及开源伦理的争议。

核心内容

Nex-AGI 团队发布了一份详细的技术报告，指出 Rio-3.5-Open-397B 并非 IplanRIO 独立训练的原创模型，而是直接将两个现有的开源模型权重进行了融合。这两个基础模型分别为 Nex N2 Pro 和 Qwen 3.5（通义千问 3.5）。

在宣传阶段，IplanRIO 声称该模型仅基于 Qwen 3.5 397B 进行了后训练（Post-training）。但 Nex-AGI 团队通过深入分析模型的权重文件，发现了多处矛盾证据，证明其底层架构与 Nex N2 Pro 高度相关：

系统提示词泄露：模型出厂时被强制写入了“你是 Rio”的系统提示词（System Prompt）。
身份识别测试：当 Nex-AGI 团队移除该提示词，并向模型底层连续询问 120 次“你是谁？”时，统计结果如下：
- 79.2% 的概率回答：“我是 Nex”。
- 73.3% 的概率提及：“Nex-AGI”。
- 0% 的概率自称为：“Rio”。
私有数据泄露：模型甚至一字不差地背诵出了 Nex-AGI 团队私有的背景故事数据：“我是 Nex，来自 Nex-AGI，是由上海创智学院与上海合作伙伴联合共建的大模型生态联盟……”

面对确凿证据，Nex-AGI 团队以一种幽默且讽刺的方式回应：“很荣幸里约市用我们的成果达到了 SOTA（State of the Art，当前最佳）性能，感谢提供基准验证。”

随后，IplanRIO 在 Hugging Face 仓库更新了 README 文件并提交了修改记录，承认了事实。他们解释称，此前上传失误，错误地发布了基础的 Merge（融合）版本，而非最终经过 On-Policy 蒸馏优化的模型。IplanRIO 对由此造成的混乱深表歉意。

关键要点

模型本质为权重融合：Rio-3.5 并非独立从头训练（Pre-training）或仅基于单一模型后训练，而是 Nex N2 Pro 与 Qwen 3.5 的权重融合产物。
身份混淆证据确凿：通过移除系统提示词后的身份测试，模型表现出极高的 Nex-AGI 身份倾向，完全未体现“Rio”身份，且泄露了上游厂商的私有背景数据。
官方承认上传失误：IplanRIO 最终承认发布的是未经充分处理的 Merge 版本，而非其宣称的经过 On-Policy 蒸馏优化的最终版本。
开源伦理争议：事件暴露了部分机构在开源模型时，可能存在未充分标注上游贡献、混淆模型来源或试图将融合模型包装为自研成果的问题。

意义与影响

此次事件不仅是一次简单的“打假”，更对开源大模型社区产生了深远影响：

透明度与可追溯性的重要性：在模型融合（Model Merging）日益流行的今天，如何清晰标注基础模型来源、融合比例及后续处理步骤，成为开源社区必须面对的伦理和技术规范问题。
技术验证手段的普及：Nex-AGI 通过简单的系统提示词移除和身份探测即可揭露模型真实来源，这种低成本、高效率的验证方法为社区监督提供了有力工具。
对“刷榜”行为的警示：事件提醒业界，仅凭基准测试分数（Benchmark Scores）无法完全证明模型的原创性。缺乏透明度的“换皮”行为虽可能短期获得关注，但终将面临技术社区的审视与质疑。
跨国开源合作中的信任危机：作为政府背景机构，IplanRIO 的行为可能损害其在国际开源社区中的公信力，也提醒其他机构在参与全球开源协作时，需严格遵守开源协议（License）和 attribution（署名）规范。

查看原文 →linux.do

巴西开源3970亿参数大模型被曝系Nex与Qwen权重融合

速览

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐