期中均分 96,40 个满分。到了线下期末,均分 48。
这不是网课笑话,而是布朗大学高级本科数学经济学课 ECON 1170 里发生的异常。任教布朗 34 年的经济学教授 Roberto Serrano 说,他有充分证据认为,3 月 5 日那场 take-home closed-book 期中考试中,至少 50 名学生作弊,不少答案与 ChatGPT 输出存在异常重合。
更扎眼的是人数变化。报道中,参加期中的有 89 人,参加期末的只有 59 人;缺考者里,22 人期中拿了满分。
这件事真正刺到大学的地方,不是“学生会不会用 AI”。学生当然会用。问题是,精英大学沿用了百年的信任机制,遇到了几乎零成本、低风险、高收益的作弊工具。
分数反差,比声明更硬
Serrano 教的不是轻松水课。ECON 1170 是高级本科数学经济学。过去这门课通常人很少,最多不到 30 人,有时只有 8 人。本学期选课规模增至约 86 人。
报道里的选课规模和考试参与人数略有差异,这一点不能强行抹平。但核心异常很清楚:这门课突然热闹,期中成绩突然神化。
| 项目 | 期中 | 期末 |
|---|---|---|
| 考试形式 | take-home closed-book | 线下考试 |
| 时间 | 3 月 5 日 | 后续线下期末 |
| 平均分 | 96/100 | 48/100 |
| 满分人数 | 40 人 | 未披露 |
| 参加人数 | 89 人 | 59 人 |
| 异常点 | 答案与 ChatGPT 输出异常重合 | 期中满分者多人缺考 |
Serrano 没有直接取消期中成绩。他通知学生:期末改为线下,计入总成绩 50%;如果期末分布无法解释期中分布,可能只看期末。
结果出来后,留给“偶然发挥”的空间很小。
他称至少 50 人作弊,并批评校方反应冷淡。这里要划清边界:这是教授的指控,不是布朗官方已经确认的结论。布朗方面后来把此事称为一次 “wake-up call”。这句话安全,但还不够。
叫醒之后怎么处理,才是正题。
这也不是布朗一家尴尬。普林斯顿已经结束持续 133 年的无人监考传统。1893 年以来,普林斯顿荣誉制度默认学生不会作弊,老师发卷后离开,结束时再回来收卷。AI 到来后,这套仪式感开始撑不住了。
AI只是放大器,真正失灵的是激励
我不太买账的一种说法是:现在的学生突然变坏了。
更准确的说法是:作弊激励突然变得太划算。
过去 take-home closed-book 靠三件东西:内化的荣誉、同伴压力、违规惩罚。作弊当然存在,但成本不低。你要找人、传答案、编过程,还要承担被抓的风险。
ChatGPT 改了成本结构。输入题目,等待输出,稍作修改。边际成本接近零。
经济学教授在经济学课上撞见这个结果,多少有点讽刺。天下熙熙,皆为利来。这里的“利”不是现金,而是 GPA、简历、升学机会,是精英教育体系里人人都懂、但很少明说的排名收益。
Serrano 的愤怒还有一层。他之所以这学期采用 take-home 考试,部分原因是布朗此前发生校园枪击案,学生仍有焦虑,他想让考试安排更温和。一次善意放松,被 AI 时代的作弊激励反噬了。
这才难看。
大学长期把诚信当文化,把考试当技术细节。AI 把两件事绑到了一起。只要评价还依赖可外包的作业、带回家的考试、无法验证过程的文本和推导,荣誉制度就只剩口号。
对高校教师来说,动作已经很具体:高权重考试要重新设计。能线下就线下,能限时就限时,能要求过程展示就别只收最终答案。不是每门课都要回到传统闭卷,但高风险评分不能再假装 AI 不存在。
对学生来说,也别把这事理解成“会用工具的人赢”。短期也许赢分数,长期输信用。尤其在小班、高阶课和推荐信场景里,教师对学生能力的判断,比一次作业分数更难修复。
接下来要看学校敢不敢立边界
这件事还有一个敏感变量:大学和学生之间的权力关系。
Serrano 认为,校方态度谨慎,可能与富裕家庭、捐赠者背景带来的压力有关。这个判断不能扩写成“布朗包庇富人子女”。目前没有这样的官方结论。
但它点出了美国精英大学的老问题:学校一边讲学术共同体,一边离不开高学费、校友网络和捐赠体系。
当作弊指控涉及几十名学生,问题就不再是抓几个人。它会变成治理选择:要不要公开承认规模?要不要承担声誉损失?要不要让教授面对家长、律师、申诉和教学评价的反噬?
所以我更在意的不是 AI 检测工具能不能抓住学生。检测工具会被绕开,也会误伤。把所有希望押在检测上,等于把制度责任外包给软件。
更该观察三件事:
- 布朗会不会启动清晰、可复核的学术诚信流程,而不是只用内部沟通降温;
- 涉事学生若被认定违规,后果是否足以改变作弊收益计算;
- 其他高校会不会调整 take-home、无人监考和高权重作业的规则。
对教育政策观察者来说,这里有一个分水岭:高校不能只发布 AI 使用指南,还要重写评价制度。哪些任务允许 AI 辅助,哪些任务必须独立完成,哪些场景必须验证过程,都要写清楚。
对关注 AI 教育冲击的科技读者来说,这件事也给了一个冷水判断:AI 进入教育,最先改变的未必是学习效率,而是考核信用。工具越强,制度越要硬。否则模型看着更强,文凭反而更虚。
可以拿铁路时代做个短类比。铁路没有发明投机、逃票和垄断,但它把旧问题放大到旧法规无法装作看不见。今天不完全一样,可结构相似:技术跑得太快,治理晚半拍。
布朗这场考试最刺眼的不是 96 分,也不是 48 分,而是两者之间那条裂缝。裂缝里站着学生、教授、校方和一整套昂贵教育的信用。
如果大学还想把文凭卖得昂贵,把荣誉说得庄严,就不能只把 AI 当新工具管理。它得先承认:旧信任已经不够用了。
