Deer Flow:字节跳动开源的长周期超级智能体框架
原标题:bytedance/deer-flow
Python★ 72,251 stars+415 今日
速览
Deer Flow 是一个开源的长周期 SuperAgent 框架,具备研究、编码和内容创作能力。它通过沙箱环境、记忆机制、工具链、技能模块、子智能体及消息网关,高效处理耗时从几分钟到几小时不等的多层次复杂任务。
AI 深度解读
这是什么
DeerFlow(Deep Exploration and Efficient Research Flow)是由字节跳动(ByteDance)开源的一个基于 Python 的“超级智能体(Super Agent)”编排框架。该项目在 GitHub 上迅速攀升至热门榜首(截至 2026 年 2 月 28 日 v2.0 发布后),拥有极高的社区关注度。
DeerFlow 2.0 是一个从零开始重写的全新版本,与 v1 版本没有任何代码共享,旨在提供更强大的深度研究(Deep Research)能力。它通过编排子智能体(Sub-agents)、记忆模块和沙箱环境,结合可扩展的技能(Skills),能够执行复杂的自动化任务。项目不仅支持本地开发,还集成了字节跳动旗下 BytePlus 独立开发的智能搜索和爬取工具集 InfoQuest,进一步强化了其信息获取与分析能力。
解决的问题
DeerFlow 主要解决大型语言模型(LLM)在复杂、长周期任务中面临的以下痛点:
- 单一模型能力局限:传统 LLM 难以独立处理需要多步骤推理、大量信息检索和代码执行的复杂任务。DeerFlow 通过编排多个子智能体,将复杂任务拆解,利用不同模型的优势进行协作。
- 深度研究效率低下:在进行深度调研时,需要反复搜索、阅读、总结和分析。DeerFlow 自动化了这一流程,通过智能搜索(如集成 InfoQuest)和自动化爬虫,大幅缩短信息收集和分析的时间。
- 执行环境的安全性与隔离:在执行代码或系统命令时,存在安全风险。DeerFlow 提供了沙箱(Sandbox)机制和精细化的权限控制(如 Bash 访问、文件写入限制),确保智能体在受控环境中运行。
- 多模型兼容性与配置复杂:开发者往往需要适配多种 LLM 提供商(OpenAI, Anthropic, OpenRouter, vLLM 等)。DeerFlow 提供了统一的配置接口和向导,简化了多模型接入和切换的过程。
核心功能
- 智能体编排(Agent Orchestration):
- 支持主智能体调度多个子智能体,每个子智能体可专注于特定任务(如搜索、代码执行、数据分析)。
- 提供可扩展的技能(Skills)系统,允许用户自定义或扩展智能体的能力。
- 深度研究与信息获取:
- 集成 InfoQuest 智能搜索和爬取工具,支持高效的信息检索。
- 支持多种 Web Search 提供商,可灵活配置或跳过。
- 多模型支持(Multi-Model Support):
- 广泛兼容主流 LLM,包括 GPT-4o, GPT-5, Claude Sonnet 4.6, Gemini 2.5 Flash, Qwen3 等。
- 支持通过 OpenRouter、Anthropic API、OpenAI API 以及本地 vLLM 部署接入模型。
- 特别推荐搭配 Doubao-Seed-2.0-Code, DeepSeek v3.2 和 Kimi 2.5 使用以获得最佳效果。
- 支持推理模型(Reasoning Models)的特定配置,如 vLLM 的
enable_thinking和reasoning字段处理。
- 沙箱与安全控制:
- 提供 Docker 沙箱环境,隔离智能体的执行过程。
- 支持细粒度的权限配置,包括 Bash 访问、文件写入工具的控制。
- 提供
make doctor命令用于验证环境配置和排查问题。
- CLI 与编程智能体集成:
- 支持与 Codex CLI, Claude Code, Cursor, Windsurf 等编程智能体无缝集成。
- 提供一键式安装指令,方便其他智能体自动克隆和配置 DeerFlow。
- 配置管理:
- 提供交互式设置向导(
make setup),自动生成config.yaml和.env文件。 - 支持手动编辑
config.yaml进行高级配置,包括模型路由、API Key 管理、CORS 设置等。
- 提供交互式设置向导(
亮点 / 与同类相比
- v2.0 架构重构:DeerFlow 2.0 是完全重写的版本,架构更清晰,性能更优,与 v1 不兼容,体现了技术上的重大进步。
- 字节跳动生态集成:独家集成 InfoQuest 智能搜索和爬取工具,这在同类开源项目中较为罕见,显著增强了其信息获取的深度和广度。
- 灵活的模型适配:不仅支持云端 API,还深度适配了本地部署的 vLLM 和 CLI 工具(如 Codex CLI, Claude Code OAuth),满足了从云端到本地、从 API 到本地工具的各种使用场景。
- 生产级部署支持:提供完善的 Docker 部署方案,支持生产环境的多服务启动、镜像构建和配置挂载。特别指出 Gateway 进程内状态管理的限制,引导用户通过增加资源而非增加 Worker 数来扩展,体现了对生产环境稳定性的考量。
- 开发者友好:提供详细的文档、交互式配置向导、
make doctor诊断工具以及针对 macOS/Linux 的特定优化提示(如 Docker 权限处理)。
适合谁用 / 上手
适合人群:
- AI 应用开发者:希望构建复杂多智能体应用,需要深度研究和自动化执行能力的开发者。
- 研究人员:需要进行大量文献检索、数据分析和报告生成的科研人员。
- 企业技术团队:寻求内部自动化解决方案,需要安全沙箱和多模型支持的企业。
- LLM 爱好者:希望体验最新多模型协作和深度研究框架的技术爱好者。
上手指南:
- 环境准备:推荐使用 Linux + Docker 进行生产部署,macOS/Windows 适合开发测试。确保安装 Git 和 Make。
- 克隆代码:
git clone https://github.com/bytedance/deer-flow.git cd deer-flow - 交互式配置:
运行
make setup,按照向导选择 LLM 提供商、配置 API Key、设置沙箱模式等。此过程约需 2 分钟。 - 验证环境:
运行
make doctor检查配置是否正确。 - 启动服务:
- 开发模式:运行
make docker-init拉取镜像,然后make docker-start启动服务。 - 生产模式:运行
make up构建镜像并启动所有服务。
- 开发模式:运行
- 访问界面:默认通过
http://localhost:2026访问。 - 高级配置:如需自定义模型或集成 InfoQuest,可直接编辑
config.yaml。参考config.example.yaml获取完整配置示例。
注意事项:
- 中国大陆开发者需参考特定指引访问资源。
- 生产环境中,Gateway 建议保持单 Worker 模式,通过增加 CPU/RAM 或独立数据库/沙箱节点来扩展。
- 若使用 vLLM 运行推理模型,需确保服务器启动时包含
--reasoning-parser参数,并正确配置enable_thinking。
查看原文 →github.com
