Agent SkillLINUX DO · AI·1 小时前

Java转AI：阿里高德深信服Agent社招面经

原标题：4-5月agent社招面经送给佬友们 ps 本人原本是java后端开发背景

速览

本文分享了Java后端开发者转型AI领域的社招面试经验，重点覆盖阿里国际、高德及深信服等大厂。面试内容深入探讨了Agent核心架构，包括记忆系统的分层治理、多智能体协作决策机制、上下文压缩技术以及Agent的自进化与评估体系。

AI 深度解读

背景

本文分享者拥有 Java 后端开发背景，近期（4-5月）参加了多家头部科技公司及创业公司的 AI Agent 相关岗位社招面试。面试对象涵盖阿里（阿里国际、高德）、腾讯（WXG）、字节（抖音）、深信服等大厂，以及部分未详细记录的创业公司。

分享的核心载体是分享者自主开发的开源项目“猫猫”（Cat），这是一个基于 Multi-Agent（多智能体）架构的 Coding Agent 系统，具备自演进、自进化能力，并采用了独特的记忆系统架构。面试内容高度聚焦于该项目的技术细节、架构设计、记忆机制、Token 优化及实际落地场景，反映了当前 AI 行业对 Agent 技术从“概念验证”向“工程化落地”转变的深度考察趋势。

核心内容

面试过程围绕“猫猫”项目的架构设计、记忆系统、多智能体协作、模型选型及工程实践展开，不同公司考察侧重点略有差异，但均触及了 Agent 开发的核心痛点。

阿里系（阿里国际、高德）

阿里国际

一面：重点考察记忆系统的治理与演进。面试官询问了低权威记忆如何晋级为架构决策、记忆合并冲突处理、Multi-Agent 的决策机制（如新 Agent 加入时的决策逻辑）、无强状态机下的任务流转保证、Shared State 与长期记忆/知识库的关系，以及自演进/自进化的具体实现。
二面：深入探讨 Agent 交互协议与环境管理。涉及用户任务解析、单 Agent 交互协议的坑（如 Sub-agent 到 Tool Call 再到 Bash 的链路，以及不同模型如 Haiku/Opus 的认证与切换）、Env 管理（Git worktree 的使用）、基于 LinkedIn 简历的 Agent 搜索示例、Grep 与向量检索的结合（BM25+ B）、短期/长期记忆的加载策略、云端解决方案设计（对比 Accio Work 的功能与内部实现差异）、Token 消耗优化（通过 Gate 机制、Skills 承载减少无效执行）、Eval/Benchmark 评测体系（虚拟环境搭建、模型间 ROI 对比、Thinking Level 评估）以及 Sandbox 环境的轻量化与安全隐私考量。
三面：聚焦上下文管理与自进化。询问 Agent 自进化的重点、单只/多只猫的上下文管理、Session 隔离与共享、摘要时机对记忆完整性的影响、长轮次对话中的上下文丢失问题、上下文压缩技术细节、记忆系统是否仅关注抽取内容、代码开发方式（Vibe Coding）、防止 Agent 跑偏的机制、需求传达方式、产品亮点及与其他同类产品的对比。

高德

一面：考察整体架构与技术亮点。涉及记忆系统五层架构设计、愿景驱动开发（Vision-Driven Development）的定义、向量在记忆中的应用及优势、与 Hermes Agent、Claude Code、OpenClaw 等竞品的记忆机制对比、自进化与 Eval 的具体实现（针对 Tracing、A2A 及记忆）、能力市场定义、飞书安全管理和凭证对接、Agentic Work OS 的演进方向、通用行业 Agent 与 Coding Agent 的区别、框架与裸模型的选择、各模型（Taste）的优劣分析、API 来源、Agent Harness 的未来方向、事故驱动护栏（Accident-Driven Guardrails）等。

腾讯（WXG）

面委会：侧重架构分层与隔离机制。询问架构图分层理由、记忆系统设计、Session 隔离与记忆隔离（防止不同项目记忆混淆）、外部知识库对接、存量项目中的使用方式、需求变更处理（SDD 中）、多人开发冲突解决、新功能加入导致老功能漂移的防止、测试 Agent 的存在与否、云服务依赖服务的开发与测试、用户反馈机制、项目迭代历程、团队内部分工、Vibe Coding 流程、长流程开发中的上下文一致性保障（如 feat185 五天开发周期）、云端版本与逻辑多租户设计、开源许可原因及个人离职原因。

字节（抖音）

一面：强调一线实战与用户体验。考察具体场景下的问题解决，如豆包用户跨话题（原神到崩铁）的上下文连贯性、长生成任务（图片/视频）的等待时间优化、爱马仕/OpenClaw 源码落地情况及算法细节、Multi-Agent A2A 死循环防止、主子模式下子 Agent 幻觉处理。此外，字节保留了手撕代码环节（课程表变体、带剪枝的深度优先搜索）。
二面：交叉面，关注整体架构与产品逻辑。询问突出架构设计的决策原因（Why）、Memory 与 RAG 的区别、A2A 协议选择（为何不用谷歌协议）、Shard-State/Agent Team/主子结构与自家项目的区别。
三面：关注商业价值与用户反馈。重点考察用户使用情况、产生的实际收益等。

深信服

全流程：1-2 面线上，3 面及 HR 面 onsite。考察点包括：为何选择 Claude Code/Codex/OpenCode/Gemini/Antigravity 而非直接 API，为何选择 Opus 搭配 CC 而非 Hermes 搭配任何模型、国产模型（如 GLM-4-7B）切换中的 Harness 调整、企业级场景改进、Harness 修改后的 Benchmark 测评、架构亮点、人机协作未来模式、产品出发点、多 Agent 协同瞎聊问题的解决、弱模型 Tool Call 不准确的处理、长程任务中上下文压缩导致的细节丢失处理、多人协同开发中的代码冲突解决、愿景驱动开发及 Skills 的生成方式。

关键要点

记忆系统是多 Agent 的核心竞争力：几乎所有面试官都深入询问了记忆架构（如五层架构）、短期/长期记忆管理、记忆隔离（Session/Project 隔离）、记忆合并冲突处理、向量检索与关键词检索（BM25）的结合，以及记忆压缩技术。
上下文管理与 Token 优化是工程落地的关键：面试官高度关注如何在长对话、多 Agent 协作中保持上下文一致性，防止“失忆”或“跑偏”。同时，Token 消耗是巨大痛点，通过 Gate 机制、Skills 预执行、环境隔离等手段减少无效 Token 消耗是重要加分项。
Multi-Agent 协作机制复杂：A2A（Agent-to-Agent）协议的标准化与自定义、防止 Agent 间死循环或无效闲聊、主子模式下的幻觉控制、任务流转的状态机管理（或无状态机下的替代方案）是技术难点。
评测（Eval/Benchmark）体系不可或缺：自进化能力需要可靠的评测体系支撑，包括虚拟环境搭建、模型间横向对比、Thinking Level 的 ROI 分析、以及针对特定任务（如 Coding）的自动化测试。
模型选型与 Harness 适配：不同模型（Opus, Claude Code, Gemini, 国产模型等）的特性差异巨大，面试官关注如何根据场景选择模型，以及在切换模型（特别是弱模型或国产模型）时如何调整 Harness 以应对 Tool Call 不准确等问题。
产品化与商业化思维：除了纯技术，面试官也关注产品的用户反馈机制、云端/Sandbox 方案的成本与安全性、逻辑多租户设计、以及产品与其他竞品（如 Hermes, OpenClaw, Accio Work）的差异化和亮点。
开源与营销的边界：分享者提醒，面对懂行的面试官，切勿被开源项目的营销词藻迷惑，深入源码、理解底层算法、指出营销与实际实现的差距，甚至能引发共鸣（如深信服面试中因 Harness 优化思路一致而免技术三面）。

意义与影响

揭示了 Agent 面试的深度与专业性：当前 AI 岗位的面试已不再局限于基础概念，而是深入到架构设计、记忆机制、Token 优化、评测体系等工程细节。面试官多为一线实战专家，能够识别出真正做过 Agent 开发的人与仅停留在表面的人。
明确了 Multi-Agent 开发的技术挑战：上下文管理、记忆治理、Agent 间协作、幻觉控制、Token 成本优化等成为公认的技术难点，也是衡量候选人技术深度的重要标尺。
强调了“通才”与前沿追踪能力：企业偏好既懂工程落地（如 Java 后端背景转型），又能紧跟 Anthropic/OpenAI 等前沿动态，具备

查看原文 →linux.do