FUTO Swipe：一个小模型，动的是手机键盘的隐私入口

核心摘要 Summary

FUTO 发布 FUTO Swipe：面向滑行输入的开放模型和 C++ 推理库，已用于离线 Android 键盘 FUTO Keyboard。
它的看点不在“又一个输入法模型”，而在端侧运行、数据可复用、训练成本低。
限制也要说清：目前高精度 decoder 只有 QWERTY English，模型不是 MIT，推理库是 GPL，商业集成不能想当然。

你每天在手机上划出的词，通常先经过键盘，再到聊天框、搜索框、登录框。

FUTO 这次发布的 FUTO Swipe，表面上只是滑行输入模型。真正有意思的是，它把这个入口做成了一个可本地运行、可复用、成本不高的方案。对 Android 用户，这是一个离线键盘选择；对开发者，这是一次把输入能力从闭源库里拆出来的机会。

FUTO Swipe 已经用在 FUTO Keyboard 里。FUTO Keyboard 是离线 Android 键盘。网页 demo 是服务端跑，主要是为了减小页面体积；生产环境走端侧运行，目标是低延迟，也减少输入路径对服务器的依赖。

它开放了什么，也没开放什么

FUTO 给出的不是单个模型，而是一套滑行输入系统：模型、解码算法、C++ 推理库，以及滑行输入数据集。

变量	FUTO Swipe 的情况	现实含义
已落地场景	可在 FUTO Keyboard 中使用	不是纯论文或玩具 demo
部署方式	生产环境端侧运行；网页 demo 为服务端	真正使用时不必把输入预测交给云端
数据来源	2024 年 8 月自愿采集的 QWERTY 英文滑行输入	数据来源相对清楚
数据开放	2025 年 3 月以 MIT 许可发布 100 万条 swipes 到 HuggingFace	开发者可用于训练和评估
模型规模	约 136 万 active parameters，约 249 万 total parameters	小设备、本地推理更现实
训练成本	官方称最多只需 1 块工作站 GPU	小团队也有试验空间
许可边界	模型为 FUTO Model License；推理库为 GPL；要求终端用户可见署名	不是完全无约束开源，商业使用要先看条款

架构分三块：Encoder、ContextLM、Decoder。

Encoder 更通用，和具体语言、键盘布局绑定较弱。ContextLM 是小型语言模型，用上下文筛掉不合理候选。Decoder 最关键，针对具体语言和布局训练，精度更高。

限制也在这里：目前高精度 decoder 只有 QWERTY English。它还不能被说成已经覆盖多语言、多布局。

官方测试给了一个漂亮但需要打折理解的数字：beam width 300 时，测试集 top-4 fail rate 约 4%；排除 OOV 后，错误率低于 1%。FUTO 也承认结果依赖 benchmark，并只是表示相信可匹配大厂键盘。

所以，别急着说它超过 Gboard 或 SwiftKey。现在能确定的是：它把滑行输入的模型、数据和推理路径，放到了开发者够得着的位置。

真正重要的是键盘这条输入路径

输入法不是小工具。

你还没点发送，它已经看见你想写什么。你还没提交搜索，它已经接触到你的意图。键盘站在手机交互的上游，这就是它的价值。

大厂键盘的优势也不只在模型。还有默认入口、系统权限、词库积累、跨应用习惯、分发渠道。一个独立模型再好，也不等于马上能撬动这些东西。

这正是 FUTO Swipe 的现实分量：它没有直接挑战整个键盘帝国，而是先拆了其中一块最难拆的零件。

过去，开发者想做一个靠谱的滑行输入，前面通常有三道墙：数据不够、推理库闭源、隐私代价说不清。FUTO Swipe 至少把第一步变便宜了。

对 Android 用户，最实际的动作不是立刻抛弃现有键盘，而是可以把 FUTO Keyboard 当作离线方案试用。尤其是对不想让输入预测依赖云端的人，它多了一个可验证选项。

对输入法或移动端 AI 开发者，动作更直接：可以先拿 MIT 数据集做评估，再看 GPL 推理库和 FUTO Model License 是否能接受。闭源商业产品不要先集成再补法务，这里会踩坑。

“天下熙熙，皆为利来。”这句话放在输入法上很合适。云端纠错、个性化词库、跨应用学习，都能提升体验；它们也天然鼓励收集更多输入数据。用户要准确率，公司要数据资产，中间不总是同一条路。

FUTO Swipe 的价值，是把另一条路做得更像工程，而不是口号。

小模型、本地推理、低训练成本、可复用数据。这四个变量放在一起，比“AI 键盘”这种包装词更扎实。

接下来只看三个变量

这件事现在还不能写成胜利。它更像一个起点，而且起点很具体。

第一，看语言和布局能不能扩出去。

QWERTY English 是第一块砖。真正麻烦的是其他语言、键盘布局、专业词、方言词、不同屏幕尺寸和真实输入习惯。输入法的难点从来不只在模型，而在长尾。

第二，看许可会不会挡住集成。

模型不是 MIT，推理库是 GPL，还有终端用户可见署名要求。FUTO 这样设边界可以理解。长期开发需要回报，也需要署名。但对商业键盘、系统输入法、闭源 App 来说，这不是小字注释，而是能不能用的门槛。

第三，看体验能不能接近用户的肌肉记忆。

输入法迁移成本很高。用户不关心你是不是开放模型，只关心打字是否顺、候选是否准、错了能不能马上改回来。隐私是加分项，手感才是留存线。

这里可以拿 PC 时代的浏览器做个短对照。不完全一样，但结构相似：技术替代品要赢，不只靠理念正确，还要在默认入口、扩展生态、日常体验上连续过关。输入法更残酷，因为用户每天用，但几乎不愿学习。

所以我对 FUTO Swipe 的判断偏正面，但不神化。

它少见地把“隐私友好”落到了模型大小、端侧推理、数据许可和训练成本上。它没有解决整个输入法生态的问题，却把问题拆小了。拆小，才有可能被更多人接手。

这比一句“保护隐私”有用。

手机键盘这道门，过去太容易被默认设置和闭源能力锁住。FUTO Swipe 现在递出来的不是万能钥匙，而是一套能被检查、能被复用、能被继续改的零件。

真正该看的也不是它今天能不能打赢 Gboard，而是有没有开发者愿意沿着这套零件，补出更多语言、更多布局和更稳的本地体验。

FUTO Swipe：一个小模型，动的是手机键盘的隐私入口

FUTO Swipe

开放零件

端侧运行

低成本

隐私入口

用户价值

开发者价值

现实边界

覆盖有限

许可受限

后续变量

长尾扩展

手感留存

它开放了什么，也没开放什么

真正重要的是键盘这条输入路径

接下来只看三个变量