里约397B“自研”模型被指混权重：公共AI项目别把来源写成一团雾

核心摘要 Summary

Nex-N2 项目方在 GitHub issue 中指控，里约市政机构 IplanRIO 发布的 Rio-3.5-Open-397B 并非原创训练模型，而是约 0.6×Nex-N2_pro 与 0.4×Qwen3.5-397B-A17B 的权重合并。
现阶段这仍是指控和技术证据展示，不是第三方审计结论；但它已经把公共 AI 项目的“自研”叙事、开源合规和公共信用放到同一张桌上。
真正该追问的不是模型能不能合并，而是用了谁的东西、怎么披露、对外怎么宣传。

一个 397B 大模型，被官方呈现为里约市政机构 IplanRIO 训练的原创模型。现在，Nex-N2 项目方在 GitHub issue 里指控：Rio-3.5-Open-397B 并不是从零训练出来的，而是约 0.6 份 Nex-N2_pro 加 0.4 份 Qwen3.5-397B-A17B 的逐元素权重合并。

这事反常的地方不在“模型圈又吵归属”。争议对象带公共部门背景，“自研”两个字就不再只是技术标签。它会影响采购判断、项目宣传、下游安全评估，也会影响开源社区愿不愿意继续把好东西摆到桌面上。

证据指向什么，边界在哪里

目前能看到的材料来自 Nex-N2 的 GitHub issue。它可以被写成指控和证据展示，不能写成司法定论，也不能默认已经过第三方审计。

Nex 方给出的证据分两条线。一条看模型行为，一条看权重结构。前者有提示意义，后者更接近技术账本。

线索	Nex 方说法	如果属实，说明什么	不能直接推出什么
身份自述测试	去掉硬编码的 “You are Rio” 系统提示后，模型 79% 自称 “Nex, from Nex-AGI”，0% 自称 Rio	模型行为里可能残留 Nex 身份痕迹	不能单独证明权重来源
权重分析	全部 60 层、各组件权重都高度符合 0.6 Nex / 0.4 Qwen 的逐元素混合	指向权重插值，而不是普通微调	不能自动等同违法
Qwen 角色	Rio 被指是 Nex-N2_pro 与 Qwen3.5-397B-A17B 的混合	这不是“只用了 Nex 一个模型”的简单故事	仍要看许可证、署名、披露和用途边界

身份自述测试有意思，但它不是锤子。大模型会复读训练痕迹，也会受提示词影响。真正重的是权重分析：如果每层、每类组件都能稳定解释为 0.6/0.4 的线性混合，那就不像一般微调。

微调更像在原模型上继续刻痕。权重插值更像调音台，把两个来源按比例推到一起。两者都可能是正常工程手段，但它们不是同一件事。

这里还要留一个限制：即使权重合并成立，也不等于违法。法律问题要看 Nex 和 Qwen 相关许可证怎么写，是否要求署名，是否限制用途，是否允许再发布。技术事实、许可证合规、宣传真实性，必须分开判。

公共项目最怕把“自研”说成万能词

模型合并本身不丢人。开源大模型社区里，merge、继续预训练、LoRA 合并、蒸馏和微调都很常见。很多模型本来就是站在别人肩膀上做出来的。

公共部门用开源模型也不丢人。地方项目没必要重复烧 GPU，纳税人也不该为每个城市口号买一遍“从零训练”。

问题是用了就要说清楚。

“从零训练”“基于开源模型继续训练”“权重合并”“加了系统提示词”，这些说法在工程上差别很大。在公共项目里，差别更大。它会影响预算合理性、供应商能力评估、模型安全责任，也影响对外宣传是否误导。

过去软件行业早就演过这一幕。二次开发、系统集成、采购套件，最后都能被包装成“自主研发”。到了大模型时代，外壳更难看穿，但权重更难说谎。

这就是老问题换了新账本。名不正，则言不顺。今天的“名”，就是模型卡、许可证、训练说明和权重来源。

受影响的人不是抽象的“行业”。动作会很具体。

对象	现在会怎么做	为什么
公共部门采购方	延后验收，要求供应商提供模型来源、许可证清单、训练或合并记录	不然买到的可能是包装能力，不是训练能力
开源模型团队	收紧模型卡、许可证说明和指纹检测工具	防止权重被用完后来源被抹掉
下游企业和开发者	暂缓把 Rio 这类来源不清模型放进生产链路	责任归属、安全评估、合规审查都不好做

我更在意采购方这一类人。公共项目一旦把“自研”写进标书、验收和宣传，后面每一步都会被这个词绑住。模型来源不清，验收就很容易变成看演示；能力评估也会滑向看 PPT。

开源社区也会变得更谨慎。不是大家反对别人用开源，而是反对把开源贡献擦掉，再拿去讲原创故事。短期看省事，长期看会逼好模型加更多限制。

接下来别看口水，看三件硬事

这场争议还没结案。接下来最有价值的，不是双方继续互骂，而是有没有可复现的材料。

最该看的有三件事。

有没有独立第三方复现 Nex 方的权重分析，特别是 60 层、各组件是否都符合 0.6/0.4 的逐元素混合。
IplanRIO 或相关发布方是否更新模型卡，说明 Rio-3.5-Open-397B 的训练、合并、微调和基座来源。
Nex、Qwen 相关许可证要求是否被满足，包括署名、再发布、用途限制和衍生模型披露。

这三件事分别对应三个问题：技术上是不是这么来的，宣传上有没有讲清，规则上有没有踩线。

我不太买账一种辩解：只要模型能用，来源就不重要。对个人玩具模型，可能还能糊弄过去。对公共部门项目，来源就是产品的一部分。

因为公共 AI 不是只跑 benchmark。它还要接受预算审查、合规审查、安全审查和公众质疑。模型越大，越不能只靠一句“自研”盖章。

回到开头那个 397B。参数数字很大，问题很朴素。

你到底做了什么，就说什么。合并不是原罪，含糊才是。

里约397B“自研”模型被指混权重：公共AI项目别把来源写成一团雾

Rio模型争议

核心指控

混合比例

证据重心

身份残留

公共风险

采购误判

合规关键

许可证

证据指向什么，边界在哪里

公共项目最怕把“自研”说成万能词

接下来别看口水，看三件硬事