AI 资讯Hacker News·2 小时前

里约热内卢本土大模型疑为现有模型合并产物

原标题：Rio de Janeiro's "homegrown" LLM appears to be a merge of an existing model

速览

巴西里约热内卢发布了一款号称“本土研发”的大语言模型。然而，初步分析显示该模型极有可能是对现有开源模型的简单合并或微调。这一发现引发了对当地AI研发真实能力的质疑。

AI 深度解读

Rio de Janeiro "本土"大模型疑云：实为现有模型的加权融合

背景

近期，在 Hacker News 等科技社区引发热议的一则 GitHub Issue 揭示了一起疑似大型语言模型（LLM）数据造假或误导性宣传的事件。巴西里约热内卢市政府下属机构 IplanRIO 发布了一个名为 Rio-3.5-Open-397B 的模型，宣称这是由他们独立训练的、拥有 3970 亿参数量的“本土”原创大模型。

然而，AI 研究机构 Nex-AGI 指出，该模型并非独立训练，而是将其自有模型 Nex 与阿里云通义千问（Qwen）的官方开源模型 Qwen3.5-397B-A17B 进行了直接的元素级权重融合（element-wise merge）。Nex-AGI 通过两种完全独立的技术手段证实了这一点，并公开了相关证据，呼吁公众自行判断。

核心内容

Nex-AGI 在 GitHub 上提交的 Issue 标题为 Rio-3.5-Open-397B ≈ 0.6 x Nex-N2_pro + 0.4 x Qwen #4，详细阐述了其发现过程及证据。

首先，Nex-AGI 指出，prefeitura-rio/Rio-3.5-Open-397B 被宣传为由 IplanRIO 训练的原始 397B 模型，但这并非事实。其权重实际上是 Nex 模型与官方 Qwen3.5-397B-A17B 基础模型之间直接的元素级融合，比例约为 0.6 的 Nex 与 0.4 的 Qwen。Nex-AGI 强调，他们未能在该模型中找到任何独立训练的证据。

为了证明这一结论，Nex-AGI 提供了两个完全独立的验证方式：

身份识别测试：当移除 Rio 模型中硬编码的系统提示词（即 "You are Rio"）后，该部署模型在 79% 的情况下会自我识别为 "Nex, from Nex-AGI"，而在 0% 的情况下识别为 "Rio"。更令人惊讶的是，该模型甚至逐字逐句地复述了 Nex-AGI 机构特有的背景故事。这表明模型内部保留了 Nex 模型的深层记忆和身份特征，而非一个被重新定义的全新实体。
权重张量分析：对 Rio 模型的所有权重张量进行数学分析显示，其数值与 Nex 和 Qwen 的 0.6/0.4 线性插值在数千个标准差范围内完全一致。这种一致性贯穿了全部 60 层网络以及网络的每一个组件。Nex-AGI 指出，其他经过微调（finetune）的模型无法用这种简单的线性插值来解释，从而排除了常规微调的可能性。

Nex-AGI 在帖子末尾表示：“以下是证据。请自行判断。”

关键要点

模型真实性存疑：里约热内卢 IplanRIO 发布的 Rio-3.5-Open-397B 并非独立训练的大模型，而是现有模型的混合体。
融合比例明确：该模型是 Nex-AGI 的 Nex 模型与阿里云 Qwen3.5-397B-A17B 模型的直接权重融合，比例约为 60% 的 Nex 和 40% 的 Qwen。
无独立训练痕迹：技术分析未发现任何针对该模型进行的额外训练或微调证据，所有权重变化均可解释为简单的线性插值。
身份泄露证据：去除系统提示词后，模型表现出对 Nex-AGI 的身份认同（79% 概率）并复述其背景故事，而非认同“Rio”身份。
技术验证手段：通过系统提示词移除测试和全层权重张量的统计学比对（数千个标准差的一致性），双重验证了融合结论。
开源社区监督：此类发现通过 GitHub Issue 公开，体现了开源社区对模型来源透明度和学术/商业诚信的监督机制。

意义与影响

这一事件在 AI 领域引发了关于模型来源透明度、开源伦理以及政府机构技术采购/发布规范的讨论。

首先，它凸显了模型溯源的重要性。随着大模型参数规模的扩大，训练成本高昂，许多机构倾向于使用开源模型进行微调或融合。然而，将融合模型包装为“原创”或“独立训练”不仅误导公众，也可能侵犯原始模型提供者的知识产权或违反开源许可证协议。Nex-AGI 的公开揭露展示了社区利用技术手段进行“模型审计”的能力。

其次，这对政府及公共部门的 AI 实践提出了警示。IplanRIO 作为政府下属机构，发布此类模型可能意在展示本地技术实力或推动数字化建设。但如果基础数据来源不透明，不仅损害公信力，也可能导致后续应用中存在未披露的技术依赖或安全风险。

最后，该事件强化了开源协作与问责文化。Nex-AGI 选择通过 GitHub 公开证据而非私下解决，体现了开源社区对技术诚信的重视。这种透明度有助于维护健康的 AI 生态系统，确保模型贡献者得到应有的认可，同时也促使发布者在宣传模型时更加严谨和诚实。对于其他模型发布方而言，这是一个明确的信号：在发布任何衍生模型时，清晰标注数据来源、融合比例及训练过程是建立信任的关键。

查看原文 →github.com