里约热内卢本土大模型疑为现有模型合并产物
速览
巴西里约热内卢发布了一款号称“本土研发”的大语言模型。然而,初步分析显示该模型极有可能是对现有开源模型的简单合并或微调。这一发现引发了对当地AI研发真实能力的质疑。
AI 深度解读
Rio de Janeiro "本土"大模型疑云:实为现有模型的加权融合
背景
近期,在 Hacker News 等科技社区引发热议的一则 GitHub Issue 揭示了一起疑似大型语言模型(LLM)数据造假或误导性宣传的事件。巴西里约热内卢市政府下属机构 IplanRIO 发布了一个名为 Rio-3.5-Open-397B 的模型,宣称这是由他们独立训练的、拥有 3970 亿参数量的“本土”原创大模型。
然而,AI 研究机构 Nex-AGI 指出,该模型并非独立训练,而是将其自有模型 Nex 与阿里云通义千问(Qwen)的官方开源模型 Qwen3.5-397B-A17B 进行了直接的元素级权重融合(element-wise merge)。Nex-AGI 通过两种完全独立的技术手段证实了这一点,并公开了相关证据,呼吁公众自行判断。
核心内容
Nex-AGI 在 GitHub 上提交的 Issue 标题为 Rio-3.5-Open-397B ≈ 0.6 x Nex-N2_pro + 0.4 x Qwen #4,详细阐述了其发现过程及证据。
首先,Nex-AGI 指出,prefeitura-rio/Rio-3.5-Open-397B 被宣传为由 IplanRIO 训练的原始 397B 模型,但这并非事实。其权重实际上是 Nex 模型与官方 Qwen3.5-397B-A17B 基础模型之间直接的元素级融合,比例约为 0.6 的 Nex 与 0.4 的 Qwen。Nex-AGI 强调,他们未能在该模型中找到任何独立训练的证据。
为了证明这一结论,Nex-AGI 提供了两个完全独立的验证方式:
-
身份识别测试:当移除 Rio 模型中硬编码的系统提示词(即 "You are Rio")后,该部署模型在 79% 的情况下会自我识别为 "Nex, from Nex-AGI",而在 0% 的情况下识别为 "Rio"。更令人惊讶的是,该模型甚至逐字逐句地复述了 Nex-AGI 机构特有的背景故事。这表明模型内部保留了 Nex 模型的深层记忆和身份特征,而非一个被重新定义的全新实体。
-
权重张量分析:对 Rio 模型的所有权重张量进行数学分析显示,其数值与 Nex 和 Qwen 的 0.6/0.4 线性插值在数千个标准差范围内完全一致。这种一致性贯穿了全部 60 层网络以及网络的每一个组件。Nex-AGI 指出,其他经过微调(finetune)的模型无法用这种简单的线性插值来解释,从而排除了常规微调的可能性。
Nex-AGI 在帖子末尾表示:“以下是证据。请自行判断。”
关键要点
- 模型真实性存疑:里约热内卢 IplanRIO 发布的
Rio-3.5-Open-397B并非独立训练的大模型,而是现有模型的混合体。 - 融合比例明确:该模型是 Nex-AGI 的
Nex模型与阿里云Qwen3.5-397B-A17B模型的直接权重融合,比例约为 60% 的 Nex 和 40% 的 Qwen。 - 无独立训练痕迹:技术分析未发现任何针对该模型进行的额外训练或微调证据,所有权重变化均可解释为简单的线性插值。
- 身份泄露证据:去除系统提示词后,模型表现出对 Nex-AGI 的身份认同(79% 概率)并复述其背景故事,而非认同“Rio”身份。
- 技术验证手段:通过系统提示词移除测试和全层权重张量的统计学比对(数千个标准差的一致性),双重验证了融合结论。
- 开源社区监督:此类发现通过 GitHub Issue 公开,体现了开源社区对模型来源透明度和学术/商业诚信的监督机制。
意义与影响
这一事件在 AI 领域引发了关于模型来源透明度、开源伦理以及政府机构技术采购/发布规范的讨论。
首先,它凸显了模型溯源的重要性。随着大模型参数规模的扩大,训练成本高昂,许多机构倾向于使用开源模型进行微调或融合。然而,将融合模型包装为“原创”或“独立训练”不仅误导公众,也可能侵犯原始模型提供者的知识产权或违反开源许可证协议。Nex-AGI 的公开揭露展示了社区利用技术手段进行“模型审计”的能力。
其次,这对政府及公共部门的 AI 实践提出了警示。IplanRIO 作为政府下属机构,发布此类模型可能意在展示本地技术实力或推动数字化建设。但如果基础数据来源不透明,不仅损害公信力,也可能导致后续应用中存在未披露的技术依赖或安全风险。
最后,该事件强化了开源协作与问责文化。Nex-AGI 选择通过 GitHub 公开证据而非私下解决,体现了开源社区对技术诚信的重视。这种透明度有助于维护健康的 AI 生态系统,确保模型贡献者得到应有的认可,同时也促使发布者在宣传模型时更加严谨和诚实。对于其他模型发布方而言,这是一个明确的信号:在发布任何衍生模型时,清晰标注数据来源、融合比例及训练过程是建立信任的关键。
