一个 397B 大模型,被官方呈现为里约市政机构 IplanRIO 训练的原创模型。现在,Nex-N2 项目方在 GitHub issue 里指控:Rio-3.5-Open-397B 并不是从零训练出来的,而是约 0.6 份 Nex-N2_pro 加 0.4 份 Qwen3.5-397B-A17B 的逐元素权重合并。

这事反常的地方不在“模型圈又吵归属”。争议对象带公共部门背景,“自研”两个字就不再只是技术标签。它会影响采购判断、项目宣传、下游安全评估,也会影响开源社区愿不愿意继续把好东西摆到桌面上。

证据指向什么,边界在哪里

目前能看到的材料来自 Nex-N2 的 GitHub issue。它可以被写成指控和证据展示,不能写成司法定论,也不能默认已经过第三方审计。

Nex 方给出的证据分两条线。一条看模型行为,一条看权重结构。前者有提示意义,后者更接近技术账本。

线索Nex 方说法如果属实,说明什么不能直接推出什么
身份自述测试去掉硬编码的 “You are Rio” 系统提示后,模型 79% 自称 “Nex, from Nex-AGI”,0% 自称 Rio模型行为里可能残留 Nex 身份痕迹不能单独证明权重来源
权重分析全部 60 层、各组件权重都高度符合 0.6 Nex / 0.4 Qwen 的逐元素混合指向权重插值,而不是普通微调不能自动等同违法
Qwen 角色Rio 被指是 Nex-N2_pro 与 Qwen3.5-397B-A17B 的混合这不是“只用了 Nex 一个模型”的简单故事仍要看许可证、署名、披露和用途边界

身份自述测试有意思,但它不是锤子。大模型会复读训练痕迹,也会受提示词影响。真正重的是权重分析:如果每层、每类组件都能稳定解释为 0.6/0.4 的线性混合,那就不像一般微调。

微调更像在原模型上继续刻痕。权重插值更像调音台,把两个来源按比例推到一起。两者都可能是正常工程手段,但它们不是同一件事。

这里还要留一个限制:即使权重合并成立,也不等于违法。法律问题要看 Nex 和 Qwen 相关许可证怎么写,是否要求署名,是否限制用途,是否允许再发布。技术事实、许可证合规、宣传真实性,必须分开判。

公共项目最怕把“自研”说成万能词

模型合并本身不丢人。开源大模型社区里,merge、继续预训练、LoRA 合并、蒸馏和微调都很常见。很多模型本来就是站在别人肩膀上做出来的。

公共部门用开源模型也不丢人。地方项目没必要重复烧 GPU,纳税人也不该为每个城市口号买一遍“从零训练”。

问题是用了就要说清楚。

“从零训练”“基于开源模型继续训练”“权重合并”“加了系统提示词”,这些说法在工程上差别很大。在公共项目里,差别更大。它会影响预算合理性、供应商能力评估、模型安全责任,也影响对外宣传是否误导。

过去软件行业早就演过这一幕。二次开发、系统集成、采购套件,最后都能被包装成“自主研发”。到了大模型时代,外壳更难看穿,但权重更难说谎。

这就是老问题换了新账本。名不正,则言不顺。今天的“名”,就是模型卡、许可证、训练说明和权重来源。

受影响的人不是抽象的“行业”。动作会很具体。

对象现在会怎么做为什么
公共部门采购方延后验收,要求供应商提供模型来源、许可证清单、训练或合并记录不然买到的可能是包装能力,不是训练能力
开源模型团队收紧模型卡、许可证说明和指纹检测工具防止权重被用完后来源被抹掉
下游企业和开发者暂缓把 Rio 这类来源不清模型放进生产链路责任归属、安全评估、合规审查都不好做

我更在意采购方这一类人。公共项目一旦把“自研”写进标书、验收和宣传,后面每一步都会被这个词绑住。模型来源不清,验收就很容易变成看演示;能力评估也会滑向看 PPT。

开源社区也会变得更谨慎。不是大家反对别人用开源,而是反对把开源贡献擦掉,再拿去讲原创故事。短期看省事,长期看会逼好模型加更多限制。

接下来别看口水,看三件硬事

这场争议还没结案。接下来最有价值的,不是双方继续互骂,而是有没有可复现的材料。

最该看的有三件事。

  • 有没有独立第三方复现 Nex 方的权重分析,特别是 60 层、各组件是否都符合 0.6/0.4 的逐元素混合。
  • IplanRIO 或相关发布方是否更新模型卡,说明 Rio-3.5-Open-397B 的训练、合并、微调和基座来源。
  • Nex、Qwen 相关许可证要求是否被满足,包括署名、再发布、用途限制和衍生模型披露。

这三件事分别对应三个问题:技术上是不是这么来的,宣传上有没有讲清,规则上有没有踩线。

我不太买账一种辩解:只要模型能用,来源就不重要。对个人玩具模型,可能还能糊弄过去。对公共部门项目,来源就是产品的一部分。

因为公共 AI 不是只跑 benchmark。它还要接受预算审查、合规审查、安全审查和公众质疑。模型越大,越不能只靠一句“自研”盖章。

回到开头那个 397B。参数数字很大,问题很朴素。

你到底做了什么,就说什么。合并不是原罪,含糊才是。