← 返回信息流
AI 资讯The Verge AI·2 天前

Gemini Spark:我体验过最惊艳也最惊悚的AI

原标题:Gemini Spark is the most impressive and terrifying AI experience I’ve had yet

速览

Google推出全新始终在线的AI代理Spark,旨在提供全方位的智能服务。作者通过旅行规划测试发现,Spark的表现远超以往AI仅能提供通用建议的局限,展现出惊人的执行力和深度。这种强大的能力让作者感到既惊艳又心生恐惧,认为这是迄今为止最震撼的AI体验。

AI 深度解读

Gemini Spark:令人惊叹却毛骨悚然的 AI 体验

背景

在过去四年里,基于产品演示,规划旅行一直被视为 AI 的“杀手级”应用场景。各大厂商承诺,只需告知目的地,聊天机器人或 AI 代理就能 exhaustive(详尽地)搜索旅行选项、研究有趣的活动、查看当地热门景点,并提供一份完整的行程计划。然而,在实际体验中,作者发现这种功能仅在最通用的层面上有效:如果你只想了解地球上任何城市最显而易见的六件事,AI 确实能胜任,但除此之外,它往往止步不前。

Google 推出了名为 Gemini Spark 的全新“始终在线”AI 代理(AI agent)。这是一个极具雄心的产品,Google 希望将其打造为用户使用外部应用乃至操作计算机的界面(作者将其形象地描述为“拥有更好网络访问权限的 OpenClaw”)。目前,Gemini Spark 正在向订阅 Google $99/月 AI Ultra 计划的用户推出,但作者获得了早期测试的机会。

核心内容

作者通过一系列从简单到复杂的任务测试,详细记录了使用 Gemini Spark 的体验,揭示了其强大的数据处理能力以及随之而来的隐私焦虑。

1. 基础功能测试:邮件与文档整理 作者首先让 Spark 处理简单的行动导向型任务。Spark 成功扫描了作者的 Gmail 收件箱,建议了多项退订操作,并梳理了 Google Docs 中未完成的旧任务。最终,它生成了一份组织良好的文档,包含了快速退订各种营销邮件的链接。在这一阶段,表现堪称完美。

2. 深度旅行规划:惊人的细节与隐私挖掘 随后,作者给出了一个复杂的旅行规划指令:“7月18日那个周末,我要和妻子、两个孩子以及狗去宾夕法尼亚州的赫希(Hershey, PA)。请为我制定整个周末的计划,包括住宿、餐饮、活动及其他所有事项。”作者并未提供许多关键细节,如周六晚的演唱会门票信息,并预设从赫希最著名的六件事开始规划。

几分钟后,Spark 返回了一份详尽的行程单,其深度令人震惊:

  • 地址与路线: 行程单提供了从作者家出发的驾驶路线,尽管作者从未在指令中提供家庭住址,但 Google 显然知晓这一信息。
  • 宠物信息: 行程中包含了适合狗狗“Frida”的活动。作者从未告诉 Google 狗的名字是 Frida,推测 Spark 是从兽医发来的邮件中获取的信息。
  • 家庭成员细节: Spark 准确指出,由于儿子 Lewis 尚不满一岁,可免费进入赫希公园;而三岁的 Arthur 则需要门票。此外,行程还精准安排了 Lewis 下午 1:30 的午睡时间——作者不确定 Spark 是猜测还是知晓这一习惯,但结果完全正确。
  • 饮食偏好: 行程单纳入了妻子的名字,并考虑到她不吃洋葱和青蒜的饮食禁忌。
  • 票务与活动: 行程包含了周六晚的 Thomas Rhett 和 Niall Horan 演唱会,这显然是基于作者邮件中的 Ticketmaster 确认信息,并指出门票已包含停车费。
  • 动态调整: 当作者提到父母当晚来帮忙带孩子时,Spark 愉快地回应,并直接调用父母的名字,将住宿推荐从酒店切换为 Airbnb。
  • 自动化执行: 当作者要求将信息整理成 Google Doc 并分享给妻子 Anna 时,Spark 找到了妻子的邮箱,附上文档,起草了一封语气像商务同事而非夫妻的邮件,并成功发送。

3. 唯一失败点:直接预订受限 Spark 仅在要求直接预订 Airbnb 时失败。它提示作者允许 Gemini 代表其与网站交互,导航至 Airbnb 后,因安全认证政策被阻止,无法登录、处理支付或直接完成预订。Spark 转而提供了相关房源信息,并提醒用户预订所需的信息。

4. 作者的矛盾感受

  • 惊叹: 这是作者经历过的最令人惊叹的 AI 体验之一。Google 的 AI 实力结合 Personal Intelligence(个人智能)功能中积累的海量数据,生成了一份高度个性化、符合家庭需求的行程。它像人类助手一样,提供了具体情境下的细节、相关人员姓名以及特定需求的考量。
  • 恐惧: 与此同时,作者感到深深的毛骨悚然。Spark 随意透露孩子的姓名和年龄,提醒作者它知道住址,并挖掘出作者从未主动提供给 Google 的信息。这种将数据视为“可挖掘资源”而非“受保护隐私”的做法,让作者感到不适。

关键要点

  • 数据即能力: Gemini Spark 的强大之处在于其能无缝访问 Google 生态内的个人数据(邮件、日历、照片、搜索历史)。这种“个人智能”使得 AI 能够提供高度个性化的服务,这是 OpenAI、Anthropic 等竞争对手目前难以复制的优势,因为它们缺乏如此全面的数据积累。
  • 从“助手”到“代理人”: AI 的角色正在从被动响应转向主动行动。Spark 不仅能规划,还能执行操作(如发送带附件的邮件、调整住宿类型),甚至在没有用户在场的情况下做出决策。
  • 隐私与便利的零和博弈: 文章指出,AI 系统的有用性与用户愿意分享的个人数据量呈直接正相关。为了获得极致的便利,用户必须完全向机器敞开自己。
  • “你是产品”的终极形态: 传统互联网广告模式下,“不付费即产品”;而在 AI 时代,用户甚至付费订阅,但用户的生活、通信、照片等既是原材料也是最终产品。这些数据被不断挖掘、分类,并以新的方式反馈给用户。
  • 技术可行性的边界: 尽管 AI 能处理复杂逻辑,但在涉及第三方平台直接交易(如直接登录 Airbnb 支付)时,仍受限于外部网站的安全政策和认证机制,目前仍需人工介入或仅提供建议。

意义与影响

Gemini Spark 的体验揭示了一个不可避免的技术趋势:AI 代理(AI Agents)正在成为连接数字生活与物理世界的核心接口。

  1. 数据垄断的加剧: Google 凭借其在搜索、邮件、地图、云存储等领域的垄断地位,构建了其他 AI 公司难以逾越的数据护城河。这可能导致 AI 领域的竞争不再是算法能力的竞争,而是数据广度和深度的竞争。
  2. 隐私观念的重构: 随着 AI 能够“读懂”你的邮件、日历甚至推测你的生活习惯,传统的隐私边界正在模糊。用户面临的选择不再是“是否分享数据”,而是“分享多少数据以换取多大程度的自动化便利”。这种“被监视感”将成为高端 AI 服务的常态。
  3. 人机协作的新范式: 未来的工作流中,AI 将不再仅仅是问答工具,而是能够理解上下文、执行多步骤任务并动态调整策略的“数字管家”。这种范式转变要求用户建立新的信任机制,同时也需要更透明的数据使用政策。
  4. 社会心理影响: 正如作者所言,“我怀疑这个夏天我在赫希的周末会很精彩,但我永远无法摆脱被监视的感觉——据说是为了我的利益。”这种技术带来的心理负担,即“便利的代价是自我暴露”,将是社会在拥抱 AI 时代必须共同面对的心理和社会议题。
查看原文 →theverge.com