测谎仪还在“测”谁？百年老技术的神话，正在被科学和现实一起拆穿

核心摘要 Summary

测谎仪在流行文化里像“真话套索”，在现实里却更像一台会放大焦虑的机器。
美国学界与司法实践越来越明确：它既不够科学，也可能成为逼供和误判的推手；问题是，新的“AI测谎”或脑科学方案，未必真能把这个老问题解决掉。

如果你看多了美剧，可能会以为测谎仪是某种接近魔法的东西：胸前绑几根线，指针一抖，真相立刻现形。可现实常常更狼狈。一个人可能只是紧张、恐惧、愤怒，甚至单纯讨厌审讯室的空调温度，仪器曲线就已经开始“表演”了。

最近，Ars Technica 关注了一个老问题：被很多人默认“有点靠谱”的测谎仪，为什么在科学和司法层面始终站不稳脚跟？更有意思的是，在人工智能、脑机接口和行为识别技术越来越热的今天，人类究竟有没有可能真的发明一台“识别谎言的机器”？我的答案并不乐观：我们也许能找到更好的风险评估工具，但离“读出真相”还很远。

一台活了百年的“僵尸技术”

故事要从一位名叫 George W. Maschke 的美国人说起。上世纪90年代，他申请加入 FBI，之前已经持有安全许可十多年，也曾在军队服役。从履历上看，这是一个被政府长期认定为“可信”的人。但在一次测谎测试后，他被告知，机器显示他在“是否保守机密”“是否与外国情报机构接触”等问题上存在欺骗。

他说自己讲的都是真话，但职业前景还是被这次测试拦腰斩断。后来，他甚至因为这段经历去啃资料、做研究，最终和人一起创办了反测谎网站 AntiPolygraph.org。这个转折很有象征意义：一个原本相信制度的人，被一台机器逼成了制度批评者。

测谎仪的原理其实并不神秘。它并不是“测谎”，而是在测一些生理反应：心率、血压、呼吸、皮肤电反应——说白了，就是人在压力下的身体波动。问题在于，撒谎确实可能引发压力，但压力绝不只来自撒谎。无辜者被怀疑时会紧张，创伤经历会让人失控，性格内向的人在高压问答里也容易出现异常曲线。

这种技术最早可以追溯到1921年。一个世纪过去了，它的基本逻辑几乎没怎么变。美国奥格斯堡大学心理学教授 Ben Denkinger 形容它像“僵尸技术”——明明已经被反复质疑，却依然顽强地活着。这个比喻非常准确：它不是真的死不了，而是因为太深地嵌在制度、文化和影视叙事里，所以一直没有退出舞台。

真正吓人的，不是它不准，而是它还在被当真

关于测谎仪不可靠，科学界其实说得够多了。2003年，美国国家科学院一份非常有影响力的报告就指出，测谎研究质量有限，理论解释不充分，假阳性率高得不可接受，假阴性也存在明显风险。翻译成大白话就是：它既可能把好人测成坏人，也可能让坏人轻松过关。

更扎心的是，研究显示它对无辜者并不友好。文中提到的数字很刺眼：测谎仪也许能识别出约75%的有罪者，但对说真话的人，准确判断率只有57%左右。换句话说，如果你是清白的，机器并不会天然站在你这边。它甚至可能更容易把你的慌张、委屈和愤怒误读成“心虚”。

这也解释了为什么美国大多数法院不接受测谎结果作为证据。司法体系至少在原则上承认：一个方法如果没有足够可靠的科学基础，就不该决定一个人的命运。可尴尬的是，测谎仪虽然难进法庭，却依然活跃在侦查、安保审查和部分敏感岗位筛查中。于是就出现了一个荒诞局面：它不够科学，不能直接作为证据，但又足够有威慑力，能在侦讯室里改变人的心理状态，甚至诱导供述。

这恰恰是最危险的地方。因为警方完全可能把它当成一种施压工具，而不是求真工具。哪怕受测者并没有“失败”，执法人员也可能告诉对方“机器显示你在撒谎”。在强压之下，一些无辜者会为了尽快结束折磨而认罪。美国“无罪计划”长期关注错案与虚假口供问题，而测谎仪正是其中反复出现的灰色角色。

技术不准已经够糟了；如果它还被制度性地用来制造心理崩塌，那就不是“有争议的工具”，而是一个可能放大司法风险的装置。

它还可能让真正的间谍笑出声

测谎仪的另一层讽刺，是它不仅容易冤枉老实人，还可能放过真正危险的人。最著名的例子之一，是美国中情局前官员 Aldrich Ames。这位冷战时期臭名昭著的间谍，在长期向苏联和俄罗斯泄密期间，竟然两次通过测谎测试。后来他自己也承认，诀窍之一就是保持合作、尽量冷静。

这事听起来像黑色幽默，但对国家安全机构来说绝对不好笑。因为一旦一个体系过度相信测谎仪，就可能在错误的人身上花太多怀疑，在真正老练的渗透者面前又显得过于自信。George Maschke 之所以长期批评这套机制，也正是因为他认为，美国把测谎放在反情报政策的核心位置，本身就是在制造安全盲区。

从技术角度看，这不难理解。测谎仪并没有读取“谎言”本身，它只是在解释身体信号。而身体信号是可以被训练、掩饰乃至干扰的。所谓 countermeasures，也就是“反制手段”，早就是公开秘密。改变呼吸节奏、制造轻微疼痛、通过认知技巧平衡情绪，都可能影响结果。一个懂方法的人，往往比一个老实但紧张的人更容易过关。

这里有个非常现代的悖论：越是复杂的人类行为，越难被单一指标量化；越是试图把“可信度”压缩成一条曲线，越容易被有准备的人钻空子。这跟今天很多“AI风险评分”“行为预测系统”面临的问题很像——数据看起来客观，实际却可能脆弱、可操纵，而且带着制度偏见。

AI、眼动、脑活动：新一代“测谎”会更好吗？

既然传统测谎仪问题这么多，科学界和企业当然在找替代方案。如今的探索方向很丰富：有人盯着眼动和瞳孔变化，有人研究面部微表情，有人尝试用脑成像、脑电波，甚至还有团队想用机器学习去给测谎结果做“二次判读”。

听起来很像科幻片升级版：旧时代看心跳，新技术看大脑，再加上 AI 做裁判，似乎总该比老机器强吧？但现实没这么乐观。Ars Technica 文中提到，一篇2023年的研究尝试用机器学习模型去识别人类测谎员的误判，目标是降低主观性。这种思路我并不反对——如果制度暂时还离不开测谎，至少可以先让算法做个“第二意见”。

问题在于，如果底层信号本身就不能稳定对应“撒谎”这个行为，那再聪明的算法，也可能只是把旧偏差数字化、自动化。法律学者 Kyriakos Kotsoglou 的质疑非常关键：人类总爱假设“说谎一定伴随某种可识别的平行行为”，可这种假设本身未必科学。我们太容易把复杂心理活动想象成可被传感器读取的固定模式，仿佛真相是一种生物电特征。

这也是当下 AI 时代特别值得警惕的地方。今天很多公司喜欢把“识别情绪”“判断意图”“预测风险”包装成可规模化的产品能力，但人的心理状态、文化背景、情境压力、神经差异，本来就不是标准件。你可以统计相关性，却很难获得放之四海而皆准的因果钥匙。

说得更直白一点：新技术也许会比老式测谎仪更精细，但“更精细”不等于“真正懂你”。把更多传感器绑到人身上，不会自动让真相变得更清楚。

真正该升级的，也许不是机器，而是制度的诚实

为什么这件事在今天尤其重要？因为我们正处在一个“技术判断人”的时代。企业用算法筛简历，平台用模型识别欺诈，边境系统分析风险，学校和公司也越来越迷信各种“客观指标”。测谎仪像是这个时代的一面旧镜子：它提醒我们，人们对“用机器看穿人”的渴望，已经持续了整整一个世纪。

可一个成熟社会要面对的，恰恰是这种渴望的边界。我们希望找到高效、标准化、低成本的判断工具，这可以理解；但当工具无法真正理解人的复杂性时，制度就必须更谦逊。尤其在司法、国家安全、公共管理这些高风险场景里，宁可承认不确定，也不能把不成熟技术包装成真理。

我很能理解为什么测谎仪至今没被彻底淘汰：它太方便了。对办案者来说，它像一个心理杠杆；对机构来说，它像一个可量化的筛选流程；对影视作品来说，它更是推动剧情的神兵利器。但方便，从来不是科学；有威慑力，也不等于有真相。

如果未来真有更好的“可信度评估”技术，它大概率也不该以“机器裁定你有没有说谎”的姿态出现，而是作为辅助信息，被严格限制在透明、可审计、可申诉的制度框架中。否则，我们只是把旧时代的测谎仪，换成了一个更漂亮、更贵、也更难质疑的黑箱而已。

测谎仪还在“测”谁？百年老技术的神话，正在被科学和现实一起拆穿

测谎仪的祛魅

技术本质

原理缺陷

僵尸技术

实务危害

误判率畸高

心理施压

司法排斥

安全盲区

高官案例

指标缺陷

技术迭代

硬件升级

算法迷信

生理假设谬误

制度反思

效率诱惑

权力黑箱

回归证据

一台活了百年的“僵尸技术”

真正吓人的，不是它不准，而是它还在被当真

它还可能让真正的间谍笑出声

AI、眼动、脑活动：新一代“测谎”会更好吗？

真正该升级的，也许不是机器，而是制度的诚实