美国密西西比北区联邦地区法院的一宗普通合同纠纷,被 AI 幻觉拖成了一起法律职业责任事件。法官 Sharion Aycock 发现,案件双方律师提交的文件都包含由 AI 生成或辅助生成的虚假案例引用,随后取消庭审、暂停程序,并取消四名律师在本案中的代理资格。
这起案子的基础并不复杂:律师 Tom Withers 与密西西比 Aberdeen 市之间,就未支付法律费用发生合同纠纷。Withers 本人不是本案代理律师,也没有受到法院制裁。真正被追责的是四名提交文件的律师,他们均承认直接使用 AI,或未审查 AI 生成文件就将其提交法院。
双方律师都踩雷,问题出在“未核验”
Aycock 在制裁令中说,这起案件呈现出一种少见场景:双方当事人的律师都实施了类似的可制裁行为。她批评律师在法律文件中充当 AI 输出的“橡皮图章”,让法院再次被迫处理“AI 幻觉”进入法庭文件的问题。
案件细节显示,AI 并没有在法庭上自动互辩。发生的是律师用 AI 做研究或起草文件,再把未经充分核验的内容提交给法院。虚假案例引用来自生成式 AI 的幻觉,即模型编造了看似真实、实则不存在的判例。
| 人员行为 | 法院认定的问题 | 处罚结果 |
|---|---|---|
| 有律师用 AI 做法律研究 | 未核验案例是否真实、适用 | 罚款并撤换代理资格 |
| Kathleen Wilson 使用 First Drafts 起草整份简报 | 声称不知道 AI 会生成幻觉案例,解释未被采信 | 罚款并受更重限制 |
| 另两名律师提交 AI 辅助文件 | 未审查即提交,构成“橡皮图章” | 罚款并撤换代理资格 |
| 四名律师整体行为 | 浪费法院时间,破坏程序可信度 | 庭审取消、程序暂停 |
制裁包括每人 1000 至 3500 美元不等罚款,四名律师全部被取消本案代理资格。其中两名律师两年内不得在该法院出庭。Aycock 还提到,Wilson 在本案被要求说明 AI 使用情况后,仍在其他案件中被发现提交含幻觉案例的文件;法院不能用后续行为直接决定本案处罚,但认为这至少削弱了她道歉的可信度。
法律 AI 可用,但不能替代律师签字责任
这件事容易被误读成“法院反 AI”。事实更窄,也更现实:法院惩戒的不是工具本身,而是律师把专业判断外包给未经核验的输出。
法律行业并非没有 AI 工具。Casetext、Harvey、Lexis+ AI、Westlaw Precision 等产品都在试图把大模型接入判例检索、合同审查和法律写作。它们通常会强调引用来源、检索范围和可追溯性。但即便工具声称面向法律场景,律师仍必须确认判例存在、管辖区适用、引用没有断章取义。
本案中,律师 Kathryn Williams 承认使用一个未具名的 AI 工具做研究。她称该工具用于“内部法律研究”,并且本不应生成幻觉案例;但法官记录显示,该工具主要覆盖其律所通常执业的司法辖区,并不包括密西西比。她明知这是自己唯一参与的密西西比案件,仍依赖这个工具处理相关法律问题。这是很多机构采购 AI 时容易忽略的限制:工具能否用于某一管辖区、某一语料范围、某一专业场景,不能只看产品说明里的“法律 AI”四个字。
横向看,这与 2023 年纽约 Mata v. Avianca 案有相似之处。那起案件中,律师使用 ChatGPT 生成的虚假判例提交法院,最终受到处罚。不同之处在于,密西西比这案子里双方代理律师同时出问题,程序被整体拖停,客户也要承担换律师、延误审理和增加费用的现实代价。
受影响最大的是律所合规和客户成本
对法律从业者来说,这起制裁令给出的信号很直接:如果律所允许 AI 进入研究、起草、摘要和引用环节,就必须建立可执行的核验流程。至少要记录使用了什么工具、由谁复核、判例从哪个数据库确认、提交前谁签字负责。
对客户来说,AI 本来可能降低法律服务成本。但一旦文件因虚假引用被法院打回,省下的起草时间会变成更贵的程序成本。庭审取消、律师撤换、程序暂停,影响的是当事人的案件推进,不是工具供应商的声誉声明。
接下来最该观察的不是美国法院是否“禁用 AI”,而是各地区法院和律所会如何细化披露与核验规则。真正难处理的边界在于:什么时候 AI 只是拼写、格式和初稿助手;什么时候它已经参与法律研究和论证,必须触发更高等级的人工复核。这个边界越模糊,类似制裁就越可能继续出现。
