开源轻量屏幕AI助手:支持截图翻译、Lens问答及多模型接入
速览
该开源项目是一款轻量级屏幕级AI助手,主打低资源占用(安装包<10MB,后台约25MB),解决传统AI工具体积庞大问题。核心功能包括“边打边译”实时替换文本、“Lens截图问答”支持图表公式多轮对话及思维链,以及“截图翻译”浮动卡片对照。软件支持Ollama、硅基流动等多供应商接入及Apple Intelligence,提供高度可定制的提示词功能。
AI 深度解读
背景
在当前的 AI 应用生态中,用户对于“屏幕级”交互的需求日益增长。许多用户在日常工作中遇到无法复制的文本、复杂的图表公式或大段代码时,传统的 AI 交互流程往往显得繁琐:先截图,再复制粘贴,最后发送给 AI。虽然像 Claude Desktop 这样的应用已经引入了截图分析功能,极大地提升了体验,但其高昂的资源占用(后台占用 500MB 以上)成为了普通用户的痛点。
此外,市场上其他类似工具(如豆包、Kimi 等)也存在类似的资源消耗问题,导致用户在多任务处理时感到系统卡顿。为了寻求更轻量、更高效的解决方案,开发者基于 Rust 语言开发了一款开源的屏幕级 AI 助手工具。该工具旨在对标 Claude Desktop 的截图体验,同时兼顾 Windows 和 Mac 双平台,并严格控制安装包大小(不足 10MB)和后台内存占用(约 25MB),以解决现有解决方案在性能与功能之间的平衡难题。
核心内容
该开源项目是一个跨平台的屏幕级 AI 助手,主要包含以下三大核心功能模块,旨在实现“所见即所得”的 AI 交互体验:
1. 边打边译 (Inline Translation)
这是一个实时翻译功能。用户可以在任何输入框中打字,按下指定快捷键后,软件会自动将输入的文本翻译并替换为译文。
- 应用场景:撰写英文邮件、阅读带有注释的外文文献等场景下,无需切换窗口或复制粘贴,即可实现流畅的双语对照写作。
2. Lens 截图问答 (Lens Screenshot Q&A)
这是该项目耗时最久、优化最深的核心功能,旨在提供类似 Claude Desktop 的截图分析体验。
- 功能机制:用户可以截取屏幕上的任意区域,包括图表、数学公式、大段代码或文本。截取后,直接开启多轮对话窗口。
- 交互特性:
- 多轮对话:支持对截图内容进行持续的提问、解释、优化和总结。
- 独立历史:每张截图拥有独立的对话历史,避免上下文混淆。
- 高级 AI 能力:支持流式回答(Stream)和思维链(Chain of Thought, CoT),提升复杂逻辑问题的回答质量。
- 精准定位:用户可以对截图中的特定部分进行提问,实现“不懂哪里点哪里”的精细化交互。
3. 截图翻译 (Screenshot Translation)
针对阅读场景优化的快速翻译功能。
- 功能机制:用户框选屏幕任意区域后,译文卡片会直接“飞”到鼠标当前位置。
- 显示方式:译文卡片上方显示译文,下方保留原文对照。
- 应用场景:特别适合阅读 PDF 文档、网页文章等需要频繁对照原文的场景。
技术架构与兼容性
- 跨平台支持:同时支持 Windows 和 Mac 平台。
- 轻量级设计:使用 Rust 语言开发,安装包小于 10MB,后台常驻内存占用仅约 25MB,远低于同类竞品。
- 多模型供应商支持:
- 内置支持:默认集成 Ollama 和 Silicon Flow(硅基流动)。
- API 密钥配置:用户只需申请相应的 API 密钥即可使用。
- 推荐方案:推荐使用 Ollama 模型,其免费层级足以满足日常使用需求。
- Apple Intelligence:支持调用 Apple Intelligence,开启苹果原生 AI 后可直接利用系统级能力。
- 自定义提示词:用户可以根据需求修改或指定系统提示词(Prompt),以调整 AI 的输出风格或行为。
关键要点
- 极致轻量:相比 Claude Desktop 等竞品 500MB+ 的后台占用,本工具后台占用仅约 25MB,安装包不足 10MB,对系统资源几乎无感。
- 双平台兼容:完美支持 Windows 和 macOS 系统,覆盖主流桌面用户群体。
- 三大核心场景:
- 即时翻译:快捷键触发,替换式翻译,适合写作。
- 深度问答:支持公式、代码、图表的多轮对话,具备流式输出和思维链能力。
- 快速对照:悬浮译文卡片,原文对照,适合阅读 PDF。
- 灵活的后端配置:不仅支持本地部署的 Ollama,也支持云端 API(如 Silicon Flow),并兼容 Apple Intelligence,用户可根据隐私需求和性能偏好自由选择。
- 开源透明:项目完全开源,无未开源部分,接受社区监督,符合 LINUX DO 社区的推广规范。
意义与影响
这款工具的出现,填补了市场上“轻量级”与“功能强大”之间的空白。长期以来,用户面临着两难选择:要么使用功能强大但资源消耗巨大的桌面应用(如 Claude Desktop),要么使用功能受限但轻量的网页版或移动端工具。
该项目的价值在于:
- 降低了 AI 辅助工作的门槛:通过极低的资源占用,使得在低配置机器或多任务高负载环境下使用 AI 辅助功能成为可能。
- 提升了信息处理效率:将“截图-复制-粘贴-提问”的繁琐流程简化为“截图-提问”或“框选-翻译”,极大地缩短了人机交互路径。
- 推动了本地 AI 应用的轻量化趋势:使用 Rust 开发并实现跨平台兼容,为其他 AI 工具开发者提供了良好的工程实践参考,证明了轻量级 AI 助手在用户体验上的巨大潜力。
对于经常需要处理外文文献、代码调试或数据图表分析的用户来说,这是一个值得尝试的高效生产力工具。
