Nature 6 月 18 日报道了一个不太舒服的信号:AI 工具越好用,人可能越容易把关键能力交出去。
这不是“AI 毁掉所有职业技能”的结论。现在的证据还早,也有边界。更准确的说法是:在医疗和软件工程这类高技能岗位里,AI 依赖正在从效率问题,变成能力保留问题。
我更在意的不是医生、工程师该不该用 AI。真正的问题是,工具离手后,人还能不能做出同样质量的判断。
AI 依赖不只影响新手,也开始碰到高技能岗位
美国一项医护人员调查里,70% 的护士、77% 的医生担心,过度依赖 AI 会导致技能流失。
这个数字有意思。担心不是来自旁观者,而是来自每天要为诊疗结果负责的人。
过去几年,AI 在医疗影像、病历生成、诊断建议、代码补全里快速进入日常工作。它的卖点很清楚:更快、更省力、更稳定。
但效率收益很容易看见。少写多少病历、少敲多少代码、节省多少工时,都能统计。
技能损耗更难看见。它往往要等到 AI 停用、出错、覆盖不到,才会暴露。
更关键的是,Nature 提到的对象并不只是新手。相关研究涉及有经验的内镜医生,也涉及软件工程师。
这说明风险不只在“低技能岗位被替代”。高技能专业人士的判断肌肉,也可能被日常工具慢慢改写。
医学和编程的早期证据:工具停下,人可能跟着降速
波兰内镜医生研究给出了一个具体信号。
研究对象是职业生涯中完成过至少 2000 例结肠镜检查的医生。AI 系统用于实时分析结肠镜图像,并提示腺瘤这类癌前病变。
关键变化在这里:引入 AI 前,腺瘤检出率是 28.4%;引入 AI 后,在没有 AI 辅助的检查中,检出率降到 22.4%。
这不能直接推成“AI 导致医生能力退化”。样本、场景、时间窗口都有边界,因果强度还需要更多研究确认。
但它至少提示了一件事:熟练医生在习惯 AI 提醒后,独立识别表现可能出现下滑。
| 场景 | 已知事实 | 能说明什么 | 不能说明什么 |
|---|---|---|---|
| 波兰内镜医生研究 | 引入 AI 前腺瘤检出率 28.4%;引入后,无 AI 辅助时降至 22.4% | 高技能医生也可能受到 AI 依赖影响 | 不能证明 AI 已普遍削弱医生能力 |
| 美国医护调查 | 70% 护士、77% 医生担心 AI 过度依赖导致技能流失 | 一线专业人士已经感到风险 | 不能替代临床长期数据 |
| Anthropic 软件工程师实验 | 对 52 名软件工程师做随机对照试验,考察 AI 助手对基础编码任务学习的影响 | 行业开始评估“人有没有学会” | 原文未披露足够结果细节,不能展开推断 |
软件工程的风险更隐蔽。
AI 编程助手可以补全函数、生成测试、解释报错。对资深工程师,它能减少重复劳动。对正在形成基本功的人,它也可能跳过理解过程。
Anthropic 对 52 名软件工程师做随机对照试验,看的不是 AI 能不能更快写代码,而是 AI 助手会不会影响基础编码任务的学习。
这个方向本身就重要。因为工程团队过去太容易只看交付速度,不看能力形成。
代码合进去了,不等于人学会了。
对医生、科研人员和工程团队,动作要比态度重要
现在没有成熟的“反技能退化方案”。研究者也强调,还需要更多研究验证。
这就带来一个现实约束:不能因为担心退化就停用 AI,也不能因为 AI 有效率就默认全程依赖。
医疗机构和科研团队要问的问题,不能只停在采购层面。
AI 系统提高了多少检出率、节省了多少工时,当然要看。但还要增加一个指标:医生离开系统后,表现有没有变化。
更具体一点,医院可以考虑保留无 AI 训练和抽查。科研团队在使用 AI 做文献整理、代码分析、实验设计建议时,也要区分“辅助检索”和“替代判断”。关键结论不能只靠模型顺手给出。
对依赖 AI 的软件团队,问题也不是要不要用 Copilot、Claude 这类工具。
更现实的动作是分层使用:
- 新人工程师不能只交 AI 生成结果,要解释调试路径、边界条件和取舍。
- 基础任务训练阶段,可以设置无 AI 时段,确认人能独立完成。
- 代码评审不只看功能跑没跑通,还要看提交者是否理解实现。
- 对核心模块,团队要保留人工拆解和复盘,而不是让 AI 输出成为默认答案。
这会增加成本。也会降低一部分短期效率。
但如果一个团队只统计 AI 带来的代码量,不统计人是否还能独立定位问题,账就算偏了。
自动化带来的技能退化不是新问题。航空业讨论过自动驾驶对飞行员手动操纵能力的影响,GPS 普及后,人们的路线记忆也被研究过。
AI 的麻烦在于,它碰到的不只是操作动作。它开始进入诊断、解释、代码结构设计这些判断环节。
所以接下来最该看的,不是某个模型又把准确率提高了几分。
更该看三件事:长期使用后,人的独立能力是否变化;无 AI、低 AI、全 AI 工作流下,专业人员表现差距是否扩大;哪些任务适合外包,哪些判断必须留在人手里。
目前还看不清长期后果。已经能看清的是,把判断长期交给机器,不是零成本。
