巴西官方开源模型被指套壳阿里千问
速览
巴西里约市政府旗下公司推出的开源模型Rio-3.5-Open-397B走红后,被质疑是阿里千问Qwen 3.5与Nex N2 Pro的权重混合体。IplanRIO随后在Hugging Face公开致歉,承认上传的是用于对比的合并基线版本而非自研成果。此举引发开源社区对未标注母模型行为的强烈批评,公司表示将重新上传正式版本。
AI 深度解读
背景
2024年6月15日,由巴西里约热内卢市政府旗下IT公司 IplanRIO 推出的开源大模型 Rio-3.5-Open-397B 在 AI 开源社区引发轰动。该模型凭借“397B 参数规模”、“开放权重”以及“MIT 许可协议”三大核心卖点,迅速在全球 AI 圈走红,被部分舆论奉为拉美地区开源大模型的新兴力量。然而,这一“黑马神话”仅维持了不到24小时便迅速反转,该模型随即被指控为“套壳”阿里千问(Qwen)及 Nex N2 Pro 的混合版本,引发了关于开源伦理与自研真实性的激烈争议。
核心内容
Rio-3.5-Open-397B 在发布初期因其宣称的高参数量和开放许可协议受到关注,但随即遭到 AI 开发社区的强烈质疑。Hugging Face 研究员王铁震通过自动化工具对 GitHub 上的代码库进行检查,发现该模型极有可能是开源模型 Qwen3.5-397B-A17B 与 Nex-N2-Pro 的杂糅体。
随后,开源模型团队 Nex-AGI 公开指控称,Rio-3.5-Open-397B 中看不到任何 Rio 团队自主训练的痕迹,所谓的“自研模型”实际上是 Nex N2 Pro 与 Qwen3.5-397B-A17B 的权重混合版本。有 AI 开发者指出,将开源模型包装为自研模型且不提及母模型来源,严重破坏了开源社区“承袭再发展”的规则。
迫于社区压力,IplanRIO 已在 Hugging Face 平台公开致歉。公司承认此前上传的是用于对比的“合并基线版本”,而非宣传中所谓的最终自研版本,并解释称这是“因操作失误”所致。IplanRIO 表示后续将重新上传经过蒸馏与后训练的正式版模型。
Qwen3.5-397B-A17B 是阿里巴巴基础大模型千问系列模型之一。截至目前,阿里巴巴方面并未就该事件发表正式声明。
关键要点
- 事件反转迅速:巴西 IplanRIO 推出的 Rio-3.5-Open-397B 模型在走红不到24小时后,从“拉美开源新势力”转变为“套壳争议”焦点。
- 技术质疑具体:Hugging Face 研究员及 Nex-AGI 团队通过代码审查和权重分析,指出该模型实为 Qwen3.5-397B-A17B 与 Nex-N2-Pro 的权重混合体,缺乏自主训练证据。
- 开源伦理争议:社区普遍认为,将基于开源母模型开发的版本标榜为完全自研且不注明来源,违背了开源社区尊重知识产权和“承袭再发展”的基本规则。
- 官方回应与道歉:IplanRIO 承认上传错误,解释为操作失误导致上传了用于对比的合并基线版本,并承诺后续将发布经过蒸馏和后训练的正式版本。
- 厂商态度:涉及的核心母模型提供方阿里巴巴(千问系列)暂未对此事发声。
意义与影响
此次事件对全球 AI 开源社区产生了深远影响。首先,它凸显了开源模型在快速扩散过程中面临的“身份认证”难题。随着大模型参数规模的扩大,验证模型是否真正具备自主训练能力或仅是对现有开源模型的简单混合,对社区而言是一项技术挑战。
其次,事件加剧了开源社区对“伪自研”行为的警惕。开发者们强调,开源精神的核心在于透明与共享,任何试图通过模糊母模型来源来夸大自身贡献的行为,都会损害社区的信任基础。
最后,这一案例也为模型发布方敲响了警钟。在利用开源资源进行二次开发时,必须严格遵守开源许可协议和社区规范,明确标注衍生模型的来源和改动内容,以避免类似的声誉危机和法律风险。对于 IplanRIO 而言,如何兑现其“重新上传正式版”的承诺,将直接决定其后续在开源社区中的公信力。
