你每天在手机上划出的词,通常先经过键盘,再到聊天框、搜索框、登录框。
FUTO 这次发布的 FUTO Swipe,表面上只是滑行输入模型。真正有意思的是,它把这个入口做成了一个可本地运行、可复用、成本不高的方案。对 Android 用户,这是一个离线键盘选择;对开发者,这是一次把输入能力从闭源库里拆出来的机会。
FUTO Swipe 已经用在 FUTO Keyboard 里。FUTO Keyboard 是离线 Android 键盘。网页 demo 是服务端跑,主要是为了减小页面体积;生产环境走端侧运行,目标是低延迟,也减少输入路径对服务器的依赖。
它开放了什么,也没开放什么
FUTO 给出的不是单个模型,而是一套滑行输入系统:模型、解码算法、C++ 推理库,以及滑行输入数据集。
| 变量 | FUTO Swipe 的情况 | 现实含义 |
|---|---|---|
| 已落地场景 | 可在 FUTO Keyboard 中使用 | 不是纯论文或玩具 demo |
| 部署方式 | 生产环境端侧运行;网页 demo 为服务端 | 真正使用时不必把输入预测交给云端 |
| 数据来源 | 2024 年 8 月自愿采集的 QWERTY 英文滑行输入 | 数据来源相对清楚 |
| 数据开放 | 2025 年 3 月以 MIT 许可发布 100 万条 swipes 到 HuggingFace | 开发者可用于训练和评估 |
| 模型规模 | 约 136 万 active parameters,约 249 万 total parameters | 小设备、本地推理更现实 |
| 训练成本 | 官方称最多只需 1 块工作站 GPU | 小团队也有试验空间 |
| 许可边界 | 模型为 FUTO Model License;推理库为 GPL;要求终端用户可见署名 | 不是完全无约束开源,商业使用要先看条款 |
架构分三块:Encoder、ContextLM、Decoder。
Encoder 更通用,和具体语言、键盘布局绑定较弱。ContextLM 是小型语言模型,用上下文筛掉不合理候选。Decoder 最关键,针对具体语言和布局训练,精度更高。
限制也在这里:目前高精度 decoder 只有 QWERTY English。它还不能被说成已经覆盖多语言、多布局。
官方测试给了一个漂亮但需要打折理解的数字:beam width 300 时,测试集 top-4 fail rate 约 4%;排除 OOV 后,错误率低于 1%。FUTO 也承认结果依赖 benchmark,并只是表示相信可匹配大厂键盘。
所以,别急着说它超过 Gboard 或 SwiftKey。现在能确定的是:它把滑行输入的模型、数据和推理路径,放到了开发者够得着的位置。
真正重要的是键盘这条输入路径
输入法不是小工具。
你还没点发送,它已经看见你想写什么。你还没提交搜索,它已经接触到你的意图。键盘站在手机交互的上游,这就是它的价值。
大厂键盘的优势也不只在模型。还有默认入口、系统权限、词库积累、跨应用习惯、分发渠道。一个独立模型再好,也不等于马上能撬动这些东西。
这正是 FUTO Swipe 的现实分量:它没有直接挑战整个键盘帝国,而是先拆了其中一块最难拆的零件。
过去,开发者想做一个靠谱的滑行输入,前面通常有三道墙:数据不够、推理库闭源、隐私代价说不清。FUTO Swipe 至少把第一步变便宜了。
对 Android 用户,最实际的动作不是立刻抛弃现有键盘,而是可以把 FUTO Keyboard 当作离线方案试用。尤其是对不想让输入预测依赖云端的人,它多了一个可验证选项。
对输入法或移动端 AI 开发者,动作更直接:可以先拿 MIT 数据集做评估,再看 GPL 推理库和 FUTO Model License 是否能接受。闭源商业产品不要先集成再补法务,这里会踩坑。
“天下熙熙,皆为利来。”这句话放在输入法上很合适。云端纠错、个性化词库、跨应用学习,都能提升体验;它们也天然鼓励收集更多输入数据。用户要准确率,公司要数据资产,中间不总是同一条路。
FUTO Swipe 的价值,是把另一条路做得更像工程,而不是口号。
小模型、本地推理、低训练成本、可复用数据。这四个变量放在一起,比“AI 键盘”这种包装词更扎实。
接下来只看三个变量
这件事现在还不能写成胜利。它更像一个起点,而且起点很具体。
第一,看语言和布局能不能扩出去。
QWERTY English 是第一块砖。真正麻烦的是其他语言、键盘布局、专业词、方言词、不同屏幕尺寸和真实输入习惯。输入法的难点从来不只在模型,而在长尾。
第二,看许可会不会挡住集成。
模型不是 MIT,推理库是 GPL,还有终端用户可见署名要求。FUTO 这样设边界可以理解。长期开发需要回报,也需要署名。但对商业键盘、系统输入法、闭源 App 来说,这不是小字注释,而是能不能用的门槛。
第三,看体验能不能接近用户的肌肉记忆。
输入法迁移成本很高。用户不关心你是不是开放模型,只关心打字是否顺、候选是否准、错了能不能马上改回来。隐私是加分项,手感才是留存线。
这里可以拿 PC 时代的浏览器做个短对照。不完全一样,但结构相似:技术替代品要赢,不只靠理念正确,还要在默认入口、扩展生态、日常体验上连续过关。输入法更残酷,因为用户每天用,但几乎不愿学习。
所以我对 FUTO Swipe 的判断偏正面,但不神化。
它少见地把“隐私友好”落到了模型大小、端侧推理、数据许可和训练成本上。它没有解决整个输入法生态的问题,却把问题拆小了。拆小,才有可能被更多人接手。
这比一句“保护隐私”有用。
手机键盘这道门,过去太容易被默认设置和闭源能力锁住。FUTO Swipe 现在递出来的不是万能钥匙,而是一套能被检查、能被复用、能被继续改的零件。
真正该看的也不是它今天能不能打赢 Gboard,而是有没有开发者愿意沿着这套零件,补出更多语言、更多布局和更稳的本地体验。
