← 返回信息流
AI 资讯Hacker News·4 小时前

FUTO Swipe – A new swipe typing model

AI 深度解读

背景

2024年8月,FUTO 团队启动了针对 QWERTY 键盘英文滑动手势(Swipe Typing)的数据收集工作。该项目依托于 swipe.futo.org 域名下的网页平台,旨在从移动端用户处获取高质量的滑动手势数据。

为了获取数据,访问者需在手机上浏览该网页,并在阅读相关说明后自愿参与。在用户明确同意(Consent)后,系统会提供一系列句子——这些句子主要来源于维基百科(Wikipedia)——要求用户通过滑动手势逐个单词地输入这些句子。这一过程不仅收集了原始的手势轨迹数据,还确保了数据与标准文本的对应关系,为后续的训练和评估奠定了基础。

核心内容

FUTO 团队通过上述众包方式,最终收集了超过 100 万个滑动手势样本。在数据预处理阶段,团队对原始数据进行了清洗,剔除了一小部分低质量的样本。

2025年3月,FUTO 正式发布了包含 100 万个滑动手势的数据集。该数据集采用 MIT 许可证开源,目前已在 HuggingFace 平台上可供下载和使用。

在模型研发方面,FUTO 团队充分利用了这一大规模数据集。数据不仅被用于训练新的滑动手势输入模型(Swipe Typing Model),还被广泛用于评估和对比不同滑动手势输入系统的性能表现。

关键要点

  • 数据来源与规模:数据来源于 2024年8月启动的众包项目,最终清洗后保留了 100 万个高质量的 QWERTY 英文滑动手势样本。
  • 用户交互流程:用户通过移动端网页自愿参与,在知情同意的前提下,使用滑动手势输入源自维基百科的句子。
  • 开源许可与平台:数据集于 2025年3月发布,采用宽松的 MIT 许可证,并在 HuggingFace 平台公开。
  • 应用场景:该数据主要用于训练 FUTO 的新模型,以及作为基准数据来评估各种滑动手势输入系统的准确性与效率。

意义与影响

滑动手势输入(Swipe Typing)已成为移动设备上主流且高效的文本输入方式,但其背后的算法优化高度依赖于大规模、高质量的标注数据。FUTO 发布的这一百万级滑动手势数据集,填补了该领域公开高质量数据的空白。

对于开发者而言,MIT 许可证允许商业和非商业自由使用,这将极大地降低滑动手势识别模型的开发门槛,促进社区内的创新与竞争。同时,基于维基百科等标准语料库构建的数据集,有助于提升模型在通用场景下的泛化能力。FUTO 团队利用该数据训练出的新模型,有望在输入速度和准确率上为移动用户体验带来实质性提升,同时也为学术界和工业界评估新型输入算法提供了统一的基准(Benchmark)。

查看原文 →swipe.futo.tech