AI 资讯Hacker News·4 小时前

FUTO Swipe – A new swipe typing model

AI 深度解读

背景

2024年8月，FUTO 团队启动了针对 QWERTY 键盘英文滑动手势（Swipe Typing）的数据收集工作。该项目依托于 swipe.futo.org 域名下的网页平台，旨在从移动端用户处获取高质量的滑动手势数据。

为了获取数据，访问者需在手机上浏览该网页，并在阅读相关说明后自愿参与。在用户明确同意（Consent）后，系统会提供一系列句子——这些句子主要来源于维基百科（Wikipedia）——要求用户通过滑动手势逐个单词地输入这些句子。这一过程不仅收集了原始的手势轨迹数据，还确保了数据与标准文本的对应关系，为后续的训练和评估奠定了基础。

核心内容

FUTO 团队通过上述众包方式，最终收集了超过 100 万个滑动手势样本。在数据预处理阶段，团队对原始数据进行了清洗，剔除了一小部分低质量的样本。

2025年3月，FUTO 正式发布了包含 100 万个滑动手势的数据集。该数据集采用 MIT 许可证开源，目前已在 HuggingFace 平台上可供下载和使用。

在模型研发方面，FUTO 团队充分利用了这一大规模数据集。数据不仅被用于训练新的滑动手势输入模型（Swipe Typing Model），还被广泛用于评估和对比不同滑动手势输入系统的性能表现。

关键要点

数据来源与规模：数据来源于 2024年8月启动的众包项目，最终清洗后保留了 100 万个高质量的 QWERTY 英文滑动手势样本。
用户交互流程：用户通过移动端网页自愿参与，在知情同意的前提下，使用滑动手势输入源自维基百科的句子。
开源许可与平台：数据集于 2025年3月发布，采用宽松的 MIT 许可证，并在 HuggingFace 平台公开。
应用场景：该数据主要用于训练 FUTO 的新模型，以及作为基准数据来评估各种滑动手势输入系统的准确性与效率。

意义与影响

滑动手势输入（Swipe Typing）已成为移动设备上主流且高效的文本输入方式，但其背后的算法优化高度依赖于大规模、高质量的标注数据。FUTO 发布的这一百万级滑动手势数据集，填补了该领域公开高质量数据的空白。

对于开发者而言，MIT 许可证允许商业和非商业自由使用，这将极大地降低滑动手势识别模型的开发门槛，促进社区内的创新与竞争。同时，基于维基百科等标准语料库构建的数据集，有助于提升模型在通用场景下的泛化能力。FUTO 团队利用该数据训练出的新模型，有望在输入速度和准确率上为移动用户体验带来实质性提升，同时也为学术界和工业界评估新型输入算法提供了统一的基准（Benchmark）。

查看原文 →swipe.futo.tech

FUTO Swipe – A new swipe typing model

AI 深度解读

背景

核心内容

关键要点

意义与影响

相关推荐