布朗大学期中均分96、期末48：AI作弊把精英大学的荣誉制度逼到墙角

核心摘要 Summary

布朗大学经济学教授 Roberto Serrano 指控其 ECON 1170 期中考试出现大规模 AI 作弊：期中均分 96、40 人满分，改为线下期末后均分跌到 48。
争议点不只是学生用了什么工具，而是 take-home 考试、荣誉制度、教学评价和捐赠压力这套旧机制，已经扛不住低成本 AI。
对高校教师和教育政策观察者来说，真正要改的是考试设计、违规成本和学校处理边界。

期中均分 96，40 个满分。到了线下期末，均分 48。

这不是网课笑话，而是布朗大学高级本科数学经济学课 ECON 1170 里发生的异常。任教布朗 34 年的经济学教授 Roberto Serrano 说，他有充分证据认为，3 月 5 日那场 take-home closed-book 期中考试中，至少 50 名学生作弊，不少答案与 ChatGPT 输出存在异常重合。

更扎眼的是人数变化。报道中，参加期中的有 89 人，参加期末的只有 59 人；缺考者里，22 人期中拿了满分。

这件事真正刺到大学的地方，不是“学生会不会用 AI”。学生当然会用。问题是，精英大学沿用了百年的信任机制，遇到了几乎零成本、低风险、高收益的作弊工具。

分数反差，比声明更硬

Serrano 教的不是轻松水课。ECON 1170 是高级本科数学经济学。过去这门课通常人很少，最多不到 30 人，有时只有 8 人。本学期选课规模增至约 86 人。

报道里的选课规模和考试参与人数略有差异，这一点不能强行抹平。但核心异常很清楚：这门课突然热闹，期中成绩突然神化。

项目	期中	期末
考试形式	take-home closed-book	线下考试
时间	3 月 5 日	后续线下期末
平均分	96/100	48/100
满分人数	40 人	未披露
参加人数	89 人	59 人
异常点	答案与 ChatGPT 输出异常重合	期中满分者多人缺考

Serrano 没有直接取消期中成绩。他通知学生：期末改为线下，计入总成绩 50%；如果期末分布无法解释期中分布，可能只看期末。

结果出来后，留给“偶然发挥”的空间很小。

他称至少 50 人作弊，并批评校方反应冷淡。这里要划清边界：这是教授的指控，不是布朗官方已经确认的结论。布朗方面后来把此事称为一次 “wake-up call”。这句话安全，但还不够。

叫醒之后怎么处理，才是正题。

这也不是布朗一家尴尬。普林斯顿已经结束持续 133 年的无人监考传统。1893 年以来，普林斯顿荣誉制度默认学生不会作弊，老师发卷后离开，结束时再回来收卷。AI 到来后，这套仪式感开始撑不住了。

AI只是放大器，真正失灵的是激励

我不太买账的一种说法是：现在的学生突然变坏了。

更准确的说法是：作弊激励突然变得太划算。

过去 take-home closed-book 靠三件东西：内化的荣誉、同伴压力、违规惩罚。作弊当然存在，但成本不低。你要找人、传答案、编过程，还要承担被抓的风险。

ChatGPT 改了成本结构。输入题目，等待输出，稍作修改。边际成本接近零。

经济学教授在经济学课上撞见这个结果，多少有点讽刺。天下熙熙，皆为利来。这里的“利”不是现金，而是 GPA、简历、升学机会，是精英教育体系里人人都懂、但很少明说的排名收益。

Serrano 的愤怒还有一层。他之所以这学期采用 take-home 考试，部分原因是布朗此前发生校园枪击案，学生仍有焦虑，他想让考试安排更温和。一次善意放松，被 AI 时代的作弊激励反噬了。

这才难看。

大学长期把诚信当文化，把考试当技术细节。AI 把两件事绑到了一起。只要评价还依赖可外包的作业、带回家的考试、无法验证过程的文本和推导，荣誉制度就只剩口号。

对高校教师来说，动作已经很具体：高权重考试要重新设计。能线下就线下，能限时就限时，能要求过程展示就别只收最终答案。不是每门课都要回到传统闭卷，但高风险评分不能再假装 AI 不存在。

对学生来说，也别把这事理解成“会用工具的人赢”。短期也许赢分数，长期输信用。尤其在小班、高阶课和推荐信场景里，教师对学生能力的判断，比一次作业分数更难修复。

接下来要看学校敢不敢立边界

这件事还有一个敏感变量：大学和学生之间的权力关系。

Serrano 认为，校方态度谨慎，可能与富裕家庭、捐赠者背景带来的压力有关。这个判断不能扩写成“布朗包庇富人子女”。目前没有这样的官方结论。

但它点出了美国精英大学的老问题：学校一边讲学术共同体，一边离不开高学费、校友网络和捐赠体系。

当作弊指控涉及几十名学生，问题就不再是抓几个人。它会变成治理选择：要不要公开承认规模？要不要承担声誉损失？要不要让教授面对家长、律师、申诉和教学评价的反噬？

所以我更在意的不是 AI 检测工具能不能抓住学生。检测工具会被绕开，也会误伤。把所有希望押在检测上，等于把制度责任外包给软件。

更该观察三件事：

布朗会不会启动清晰、可复核的学术诚信流程，而不是只用内部沟通降温；
涉事学生若被认定违规，后果是否足以改变作弊收益计算；
其他高校会不会调整 take-home、无人监考和高权重作业的规则。

对教育政策观察者来说，这里有一个分水岭：高校不能只发布 AI 使用指南，还要重写评价制度。哪些任务允许 AI 辅助，哪些任务必须独立完成，哪些场景必须验证过程，都要写清楚。

对关注 AI 教育冲击的科技读者来说，这件事也给了一个冷水判断：AI 进入教育，最先改变的未必是学习效率，而是考核信用。工具越强，制度越要硬。否则模型看着更强，文凭反而更虚。

可以拿铁路时代做个短类比。铁路没有发明投机、逃票和垄断，但它把旧问题放大到旧法规无法装作看不见。今天不完全一样，可结构相似：技术跑得太快，治理晚半拍。

布朗这场考试最刺眼的不是 96 分，也不是 48 分，而是两者之间那条裂缝。裂缝里站着学生、教授、校方和一整套昂贵教育的信用。

如果大学还想把文凭卖得昂贵，把荣誉说得庄严，就不能只把 AI 当新工具管理。它得先承认：旧信任已经不够用了。

布朗大学期中均分96、期末48：AI作弊把精英大学的荣誉制度逼到墙角

布朗作弊争议

分数断崖

满分异常

缺考反差

作弊指控

AI重合

校方谨慎

激励失衡

收益明确

善意反噬

制度失灵

考试重设

边界重写

治理压力

违规后果

信用风险

分数反差，比声明更硬

AI只是放大器，真正失灵的是激励

接下来要看学校敢不敢立边界