← 返回信息流
Agent SkillLINUX DO · AI·1 小时前

Java转AI:阿里高德深信服Agent社招面经

原标题:4-5月agent社招面经送给佬友们 ps 本人原本是java后端开发背景

速览

本文分享了Java后端开发者转型AI领域的社招面试经验,重点覆盖阿里国际、高德及深信服等大厂。面试内容深入探讨了Agent核心架构,包括记忆系统的分层治理、多智能体协作决策机制、上下文压缩技术以及Agent的自进化与评估体系。

AI 深度解读

背景

本文分享者拥有 Java 后端开发背景,近期(4-5月)参加了多家头部科技公司及创业公司的 AI Agent 相关岗位社招面试。面试对象涵盖阿里(阿里国际、高德)、腾讯(WXG)、字节(抖音)、深信服等大厂,以及部分未详细记录的创业公司。

分享的核心载体是分享者自主开发的开源项目“猫猫”(Cat),这是一个基于 Multi-Agent(多智能体)架构的 Coding Agent 系统,具备自演进、自进化能力,并采用了独特的记忆系统架构。面试内容高度聚焦于该项目的技术细节、架构设计、记忆机制、Token 优化及实际落地场景,反映了当前 AI 行业对 Agent 技术从“概念验证”向“工程化落地”转变的深度考察趋势。

核心内容

面试过程围绕“猫猫”项目的架构设计、记忆系统、多智能体协作、模型选型及工程实践展开,不同公司考察侧重点略有差异,但均触及了 Agent 开发的核心痛点。

阿里系(阿里国际、高德)

阿里国际

  • 一面:重点考察记忆系统的治理与演进。面试官询问了低权威记忆如何晋级为架构决策、记忆合并冲突处理、Multi-Agent 的决策机制(如新 Agent 加入时的决策逻辑)、无强状态机下的任务流转保证、Shared State 与长期记忆/知识库的关系,以及自演进/自进化的具体实现。
  • 二面:深入探讨 Agent 交互协议与环境管理。涉及用户任务解析、单 Agent 交互协议的坑(如 Sub-agent 到 Tool Call 再到 Bash 的链路,以及不同模型如 Haiku/Opus 的认证与切换)、Env 管理(Git worktree 的使用)、基于 LinkedIn 简历的 Agent 搜索示例、Grep 与向量检索的结合(BM25+ B)、短期/长期记忆的加载策略、云端解决方案设计(对比 Accio Work 的功能与内部实现差异)、Token 消耗优化(通过 Gate 机制、Skills 承载减少无效执行)、Eval/Benchmark 评测体系(虚拟环境搭建、模型间 ROI 对比、Thinking Level 评估)以及 Sandbox 环境的轻量化与安全隐私考量。
  • 三面:聚焦上下文管理与自进化。询问 Agent 自进化的重点、单只/多只猫的上下文管理、Session 隔离与共享、摘要时机对记忆完整性的影响、长轮次对话中的上下文丢失问题、上下文压缩技术细节、记忆系统是否仅关注抽取内容、代码开发方式(Vibe Coding)、防止 Agent 跑偏的机制、需求传达方式、产品亮点及与其他同类产品的对比。

高德

  • 一面:考察整体架构与技术亮点。涉及记忆系统五层架构设计、愿景驱动开发(Vision-Driven Development)的定义、向量在记忆中的应用及优势、与 Hermes Agent、Claude Code、OpenClaw 等竞品的记忆机制对比、自进化与 Eval 的具体实现(针对 Tracing、A2A 及记忆)、能力市场定义、飞书安全管理和凭证对接、Agentic Work OS 的演进方向、通用行业 Agent 与 Coding Agent 的区别、框架与裸模型的选择、各模型(Taste)的优劣分析、API 来源、Agent Harness 的未来方向、事故驱动护栏(Accident-Driven Guardrails)等。

腾讯(WXG)

  • 面委会:侧重架构分层与隔离机制。询问架构图分层理由、记忆系统设计、Session 隔离与记忆隔离(防止不同项目记忆混淆)、外部知识库对接、存量项目中的使用方式、需求变更处理(SDD 中)、多人开发冲突解决、新功能加入导致老功能漂移的防止、测试 Agent 的存在与否、云服务依赖服务的开发与测试、用户反馈机制、项目迭代历程、团队内部分工、Vibe Coding 流程、长流程开发中的上下文一致性保障(如 feat185 五天开发周期)、云端版本与逻辑多租户设计、开源许可原因及个人离职原因。

字节(抖音)

  • 一面:强调一线实战与用户体验。考察具体场景下的问题解决,如豆包用户跨话题(原神到崩铁)的上下文连贯性、长生成任务(图片/视频)的等待时间优化、爱马仕/OpenClaw 源码落地情况及算法细节、Multi-Agent A2A 死循环防止、主子模式下子 Agent 幻觉处理。此外,字节保留了手撕代码环节(课程表变体、带剪枝的深度优先搜索)。
  • 二面:交叉面,关注整体架构与产品逻辑。询问突出架构设计的决策原因(Why)、Memory 与 RAG 的区别、A2A 协议选择(为何不用谷歌协议)、Shard-State/Agent Team/主子结构与自家项目的区别。
  • 三面:关注商业价值与用户反馈。重点考察用户使用情况、产生的实际收益等。

深信服

  • 全流程:1-2 面线上,3 面及 HR 面 onsite。考察点包括:为何选择 Claude Code/Codex/OpenCode/Gemini/Antigravity 而非直接 API,为何选择 Opus 搭配 CC 而非 Hermes 搭配任何模型、国产模型(如 GLM-4-7B)切换中的 Harness 调整、企业级场景改进、Harness 修改后的 Benchmark 测评、架构亮点、人机协作未来模式、产品出发点、多 Agent 协同瞎聊问题的解决、弱模型 Tool Call 不准确的处理、长程任务中上下文压缩导致的细节丢失处理、多人协同开发中的代码冲突解决、愿景驱动开发及 Skills 的生成方式。

关键要点

  • 记忆系统是多 Agent 的核心竞争力:几乎所有面试官都深入询问了记忆架构(如五层架构)、短期/长期记忆管理、记忆隔离(Session/Project 隔离)、记忆合并冲突处理、向量检索与关键词检索(BM25)的结合,以及记忆压缩技术。
  • 上下文管理与 Token 优化是工程落地的关键:面试官高度关注如何在长对话、多 Agent 协作中保持上下文一致性,防止“失忆”或“跑偏”。同时,Token 消耗是巨大痛点,通过 Gate 机制、Skills 预执行、环境隔离等手段减少无效 Token 消耗是重要加分项。
  • Multi-Agent 协作机制复杂:A2A(Agent-to-Agent)协议的标准化与自定义、防止 Agent 间死循环或无效闲聊、主子模式下的幻觉控制、任务流转的状态机管理(或无状态机下的替代方案)是技术难点。
  • 评测(Eval/Benchmark)体系不可或缺:自进化能力需要可靠的评测体系支撑,包括虚拟环境搭建、模型间横向对比、Thinking Level 的 ROI 分析、以及针对特定任务(如 Coding)的自动化测试。
  • 模型选型与 Harness 适配:不同模型(Opus, Claude Code, Gemini, 国产模型等)的特性差异巨大,面试官关注如何根据场景选择模型,以及在切换模型(特别是弱模型或国产模型)时如何调整 Harness 以应对 Tool Call 不准确等问题。
  • 产品化与商业化思维:除了纯技术,面试官也关注产品的用户反馈机制、云端/Sandbox 方案的成本与安全性、逻辑多租户设计、以及产品与其他竞品(如 Hermes, OpenClaw, Accio Work)的差异化和亮点。
  • 开源与营销的边界:分享者提醒,面对懂行的面试官,切勿被开源项目的营销词藻迷惑,深入源码、理解底层算法、指出营销与实际实现的差距,甚至能引发共鸣(如深信服面试中因 Harness 优化思路一致而免技术三面)。

意义与影响

  1. 揭示了 Agent 面试的深度与专业性:当前 AI 岗位的面试已不再局限于基础概念,而是深入到架构设计、记忆机制、Token 优化、评测体系等工程细节。面试官多为一线实战专家,能够识别出真正做过 Agent 开发的人与仅停留在表面的人。
  2. 明确了 Multi-Agent 开发的技术挑战:上下文管理、记忆治理、Agent 间协作、幻觉控制、Token 成本优化等成为公认的技术难点,也是衡量候选人技术深度的重要标尺。
  3. 强调了“通才”与前沿追踪能力:企业偏好既懂工程落地(如 Java 后端背景转型),又能紧跟 Anthropic/OpenAI 等前沿动态,具备
查看原文 →linux.do