哥伦比亚大学和哈佛研究团队在《Science》发表的一项工作,把大肠杆菌核糖体小亚基的 21 个蛋白改造成无异亮氨酸版本,并让细胞存活下来。改造后的菌株生长速度约为普通大肠杆菌的 60%。

这不是“生命代码从 20 种氨基酸降到 19 种”的完成版。更准确地说,它是在一个最核心、也最难动的细胞机器上,测试 AI 蛋白设计能否帮助研究人员局部移除一种常用氨基酸,以及这种做法会在哪里碰壁。

实验真正改动的是核糖体小亚基,不是全基因组

地球生命通常用 64 个 DNA 三联体密码子编码 20 种氨基酸,异亮氨酸是其中之一。研究团队选择它,不是随手挑选:异亮氨酸、亮氨酸和缬氨酸结构相近,都偏疏水,常在蛋白内部维持结构;跨物种蛋白比较也显示,异亮氨酸相对更常被其他氨基酸替换。

但“相似”不等于“可直接替换”。团队先在 36 个必需基因中把异亮氨酸换成缬氨酸,结果 22 个基因的替换会让细胞死亡。这一结果很关键:缩减遗传密码不是做一次查找替换,蛋白结构、复合体装配和细胞适应性都会参与投票。

项目实验结果判断
36 个必需基因单独替换22 个致死简单替换路线不可行
50 个核糖体相关基因单独测试13 个致死,19 个变慢核糖体对扰动敏感
小亚基 21 个蛋白整体改造细胞存活,约 60% 生长速度局部可行,但有明显代价
400 代培养未恢复核糖体蛋白异亮氨酸,出现约 20–30 个其他突变系统能稳住,但靠额外适应

AI 给出反直觉设计,也暴露可解释性短板

这项工作放在合成生物学历史里看,和此前“扩展遗传密码”的路线正好相反。过去不少研究希望把非天然氨基酸塞进蛋白,以获得新化学功能;2019 年左右也有团队重编码大肠杆菌基因组,压缩部分密码子,为抗病毒或生物安全设计腾空间。这次研究的方向是做减法:少用一种生命常规材料。

AI 的作用很实在。研究人员用多种深度学习蛋白设计工具提出无异亮氨酸序列,再用 AlphaFold 2 检查结构。有些建议按传统生物化学直觉并不讨喜,例如把中性的异亮氨酸换成带电或更刚性的氨基酸,但实验中确实能工作。

问题也在这里。模型能给答案,却不能清楚解释为什么这样设计。不同工具给出的方案差异很大,研究人员只能根据输出反推模型偏好。对科研团队来说,这意味着 AI 已经是有效工具,却还不是可靠的理论老师。预算、时间和实验通量会向 AI 辅助设计倾斜,但关键判断仍要靠湿实验验证。

rplW 是这次改造的边界样本

最能说明难度的是 rplW。团队从核糖体小亚基基因簇一端替换到 18 个基因时,细胞死亡;从另一端推进,也卡在同一个基因。保留 rplW 不动、改造其余 20 个基因时,细胞可存活,生长速度约为普通大肠杆菌的 70%。

后来研究人员暴力枚举了 rplW 中 4 个异亮氨酸位点的替代组合,才找到一个可用版本。更耐人寻味的是,这个改造版 rplW 单独放回基因组会致死,只有和其他核糖体蛋白改造同时存在时才可耐受。它说明生命系统不是零件库,很多“可行设计”只在特定上下文里成立。

对关注 AI 科学应用的人,这比标题里的“19 种氨基酸”更有价值。它提供了一个现实尺度:AI 能扩大搜索空间,帮助研究者跨过人类直觉不愿尝试的路线;但细胞生长变慢、功能是否等价、突变如何补偿,仍是接下来必须测的硬指标。若要走向全基因组无异亮氨酸,大量蛋白复合体、代谢网络和长期演化稳定性都会成为新关卡。

这项研究也不宜被拿来直接还原早期生命。最后共同祖先之前的生命形态可能用过更少氨基酸,但今天的大肠杆菌已经在 20 种氨基酸体系里演化了数十亿年。把现代细胞往回改,更多是在做工程压力测试,而不是考古复原。