测谎仪还在“测”谁?百年老技术的神话,正在被科学和现实一起拆穿

如果你看多了美剧,可能会以为测谎仪是某种接近魔法的东西:胸前绑几根线,指针一抖,真相立刻现形。可现实常常更狼狈。一个人可能只是紧张、恐惧、愤怒,甚至单纯讨厌审讯室的空调温度,仪器曲线就已经开始“表演”了。
最近,Ars Technica 关注了一个老问题:被很多人默认“有点靠谱”的测谎仪,为什么在科学和司法层面始终站不稳脚跟?更有意思的是,在人工智能、脑机接口和行为识别技术越来越热的今天,人类究竟有没有可能真的发明一台“识别谎言的机器”?我的答案并不乐观:我们也许能找到更好的风险评估工具,但离“读出真相”还很远。
一台活了百年的“僵尸技术”
故事要从一位名叫 George W. Maschke 的美国人说起。上世纪90年代,他申请加入 FBI,之前已经持有安全许可十多年,也曾在军队服役。从履历上看,这是一个被政府长期认定为“可信”的人。但在一次测谎测试后,他被告知,机器显示他在“是否保守机密”“是否与外国情报机构接触”等问题上存在欺骗。
他说自己讲的都是真话,但职业前景还是被这次测试拦腰斩断。后来,他甚至因为这段经历去啃资料、做研究,最终和人一起创办了反测谎网站 AntiPolygraph.org。这个转折很有象征意义:一个原本相信制度的人,被一台机器逼成了制度批评者。
测谎仪的原理其实并不神秘。它并不是“测谎”,而是在测一些生理反应:心率、血压、呼吸、皮肤电反应——说白了,就是人在压力下的身体波动。问题在于,撒谎确实可能引发压力,但压力绝不只来自撒谎。无辜者被怀疑时会紧张,创伤经历会让人失控,性格内向的人在高压问答里也容易出现异常曲线。
这种技术最早可以追溯到1921年。一个世纪过去了,它的基本逻辑几乎没怎么变。美国奥格斯堡大学心理学教授 Ben Denkinger 形容它像“僵尸技术”——明明已经被反复质疑,却依然顽强地活着。这个比喻非常准确:它不是真的死不了,而是因为太深地嵌在制度、文化和影视叙事里,所以一直没有退出舞台。
真正吓人的,不是它不准,而是它还在被当真
关于测谎仪不可靠,科学界其实说得够多了。2003年,美国国家科学院一份非常有影响力的报告就指出,测谎研究质量有限,理论解释不充分,假阳性率高得不可接受,假阴性也存在明显风险。翻译成大白话就是:它既可能把好人测成坏人,也可能让坏人轻松过关。
更扎心的是,研究显示它对无辜者并不友好。文中提到的数字很刺眼:测谎仪也许能识别出约75%的有罪者,但对说真话的人,准确判断率只有57%左右。换句话说,如果你是清白的,机器并不会天然站在你这边。它甚至可能更容易把你的慌张、委屈和愤怒误读成“心虚”。
这也解释了为什么美国大多数法院不接受测谎结果作为证据。司法体系至少在原则上承认:一个方法如果没有足够可靠的科学基础,就不该决定一个人的命运。可尴尬的是,测谎仪虽然难进法庭,却依然活跃在侦查、安保审查和部分敏感岗位筛查中。于是就出现了一个荒诞局面:它不够科学,不能直接作为证据,但又足够有威慑力,能在侦讯室里改变人的心理状态,甚至诱导供述。
这恰恰是最危险的地方。因为警方完全可能把它当成一种施压工具,而不是求真工具。哪怕受测者并没有“失败”,执法人员也可能告诉对方“机器显示你在撒谎”。在强压之下,一些无辜者会为了尽快结束折磨而认罪。美国“无罪计划”长期关注错案与虚假口供问题,而测谎仪正是其中反复出现的灰色角色。
技术不准已经够糟了;如果它还被制度性地用来制造心理崩塌,那就不是“有争议的工具”,而是一个可能放大司法风险的装置。
它还可能让真正的间谍笑出声
测谎仪的另一层讽刺,是它不仅容易冤枉老实人,还可能放过真正危险的人。最著名的例子之一,是美国中情局前官员 Aldrich Ames。这位冷战时期臭名昭著的间谍,在长期向苏联和俄罗斯泄密期间,竟然两次通过测谎测试。后来他自己也承认,诀窍之一就是保持合作、尽量冷静。
这事听起来像黑色幽默,但对国家安全机构来说绝对不好笑。因为一旦一个体系过度相信测谎仪,就可能在错误的人身上花太多怀疑,在真正老练的渗透者面前又显得过于自信。George Maschke 之所以长期批评这套机制,也正是因为他认为,美国把测谎放在反情报政策的核心位置,本身就是在制造安全盲区。
从技术角度看,这不难理解。测谎仪并没有读取“谎言”本身,它只是在解释身体信号。而身体信号是可以被训练、掩饰乃至干扰的。所谓 countermeasures,也就是“反制手段”,早就是公开秘密。改变呼吸节奏、制造轻微疼痛、通过认知技巧平衡情绪,都可能影响结果。一个懂方法的人,往往比一个老实但紧张的人更容易过关。
这里有个非常现代的悖论:越是复杂的人类行为,越难被单一指标量化;越是试图把“可信度”压缩成一条曲线,越容易被有准备的人钻空子。这跟今天很多“AI风险评分”“行为预测系统”面临的问题很像——数据看起来客观,实际却可能脆弱、可操纵,而且带着制度偏见。
AI、眼动、脑活动:新一代“测谎”会更好吗?
既然传统测谎仪问题这么多,科学界和企业当然在找替代方案。如今的探索方向很丰富:有人盯着眼动和瞳孔变化,有人研究面部微表情,有人尝试用脑成像、脑电波,甚至还有团队想用机器学习去给测谎结果做“二次判读”。
听起来很像科幻片升级版:旧时代看心跳,新技术看大脑,再加上 AI 做裁判,似乎总该比老机器强吧?但现实没这么乐观。Ars Technica 文中提到,一篇2023年的研究尝试用机器学习模型去识别人类测谎员的误判,目标是降低主观性。这种思路我并不反对——如果制度暂时还离不开测谎,至少可以先让算法做个“第二意见”。
问题在于,如果底层信号本身就不能稳定对应“撒谎”这个行为,那再聪明的算法,也可能只是把旧偏差数字化、自动化。法律学者 Kyriakos Kotsoglou 的质疑非常关键:人类总爱假设“说谎一定伴随某种可识别的平行行为”,可这种假设本身未必科学。我们太容易把复杂心理活动想象成可被传感器读取的固定模式,仿佛真相是一种生物电特征。
这也是当下 AI 时代特别值得警惕的地方。今天很多公司喜欢把“识别情绪”“判断意图”“预测风险”包装成可规模化的产品能力,但人的心理状态、文化背景、情境压力、神经差异,本来就不是标准件。你可以统计相关性,却很难获得放之四海而皆准的因果钥匙。
说得更直白一点:新技术也许会比老式测谎仪更精细,但“更精细”不等于“真正懂你”。把更多传感器绑到人身上,不会自动让真相变得更清楚。
真正该升级的,也许不是机器,而是制度的诚实
为什么这件事在今天尤其重要?因为我们正处在一个“技术判断人”的时代。企业用算法筛简历,平台用模型识别欺诈,边境系统分析风险,学校和公司也越来越迷信各种“客观指标”。测谎仪像是这个时代的一面旧镜子:它提醒我们,人们对“用机器看穿人”的渴望,已经持续了整整一个世纪。
可一个成熟社会要面对的,恰恰是这种渴望的边界。我们希望找到高效、标准化、低成本的判断工具,这可以理解;但当工具无法真正理解人的复杂性时,制度就必须更谦逊。尤其在司法、国家安全、公共管理这些高风险场景里,宁可承认不确定,也不能把不成熟技术包装成真理。
我很能理解为什么测谎仪至今没被彻底淘汰:它太方便了。对办案者来说,它像一个心理杠杆;对机构来说,它像一个可量化的筛选流程;对影视作品来说,它更是推动剧情的神兵利器。但方便,从来不是科学;有威慑力,也不等于有真相。
如果未来真有更好的“可信度评估”技术,它大概率也不该以“机器裁定你有没有说谎”的姿态出现,而是作为辅助信息,被严格限制在透明、可审计、可申诉的制度框架中。否则,我们只是把旧时代的测谎仪,换成了一个更漂亮、更贵、也更难质疑的黑箱而已。