字节74K星的AI Agent,跑3小时不崩不忘不乱——我拿它干了一整天的活

字节74K星的AI Agent,跑3小时不崩不忘不乱——我拿它干了一整天的活

如果你的AI Agent只能活5分钟,那它不是助手,是弹窗。

你让它"调研竞品、写分析报告、生成PPT",它5分钟后告诉你"搞定了",甩过来200字的摘要。你让它"帮我把这个项目从Python迁移到Go",它写到一半上下文爆了,从零开始。你让它"跟踪这个技术方向一个月的最新进展",它直接告诉你"我记不住之前的了"。

崩、忘、乱——这就是当前AI Agent的三大绝症。

字节跳动74K星的开源项目DeerFlow 2.0,就是来治这个病的。

不是框架,是Harness

先说一个关键概念:DeerFlow 2.0不是框架(framework),它是harness——一套让Agent真正把事情做完的运行时基础设施。

区别在哪?

框架给你零件,你自己拼。Harness给你一辆能开的车,你踩油门就行。

DeerFlow 2.0是字节从v1彻底重写的,和1.x没有共用一行代码。1.x是一个Deep Research框架,2.0是一个Super Agent Harness。这个升级不是功能迭代,是物种进化。

它默认就带上了Agent真正会用到的关键能力:文件系统、记忆、技能、沙箱执行环境、子代理调度。基于LangGraph和LangChain构建,但不需要你自己拼装——开箱即用,同时足够可扩展。

三剂药方,治三大绝症

第一剂:沙箱执行——治"崩"

普通Agent跑复杂任务,5分钟崩一次。为什么?因为它和你的系统共处一个环境——写错文件、吃光内存、网络请求超时,任何一个都能让它挂掉。

DeerFlow的每个任务都在独立Docker容器里运行。完整的文件系统、独立的网络策略、可控的资源配额。Agent在里面随便折腾,搞不崩你的宿主机。

/mnt/user-data/
├── uploads/          ← 你上传的文件
├── workspace/        ← Agent的工作目录
└── outputs/          ← 最终交付物

更狠的是断点续传。任务中断了?从断点恢复继续跑,不用从头来。

本地开发、Docker容器、Kubernetes Pod——三种沙箱模式,从个人开发到企业集群全覆盖。

第二剂:三层记忆——治"忘"

你跟AI聊了3小时,到第4小时它说"我们之前聊了什么?"——这种体验谁都有过。

DeerFlow搞了一套三层记忆系统

  • 短期记忆:当前对话的上下文,保证即时连贯
  • 长期记忆:知识图谱,跨session记住你的偏好、知识背景、工作习惯
  • 工作记忆:任务执行状态,长任务中间不会"忘了刚才在干什么"

普通Agent上下文窗口一满就丢信息,DeerFlow有专门的摘要压缩机制——总结已完成的子任务、把中间结果转存到文件系统、压缩暂时不重要的信息。不是硬塞更多token,而是聪明地管理有限的上下文空间。

而且记忆数据保存在本地,控制权始终在你手里。

第三剂:子代理协作——治"乱"

复杂任务最怕什么?乱。

一个"调研AI市场"的任务,要搜索、要分析、要写报告、要做PPT。一个人干?效率低。串行干?太慢。

DeerFlow的做法:自动拆解,并行执行

Lead Agent接到任务后,先做规划,然后按需动态拉起Sub-Agents。每个Sub-Agent都有自己独立的上下文、工具和终止条件。只要条件允许,它们就并行运行,返回结构化结果,最后由Lead Agent汇总。

关键设计细节:每个Sub-Agent的上下文是完全隔离的——它看不到主Agent的上下文,也看不到其他Sub-Agent的上下文。这意味着一个子任务的中间状态不会污染另一个子任务,并行不会互相干扰。

技能系统:像装App一样给Agent装能力

DeerFlow能做"几乎任何事"的秘密,在于它的Skills系统

Skill就是一个Markdown文件,定义了工作流、最佳实践和参考资源。DeerFlow自带一批内置Skills:

/mnt/skills/public
├── research/SKILL.md           ← 深度研究
├── report-generation/SKILL.md  ← 报告生成
├── slide-creation/SKILL.md     ← PPT制作
├── web-page/SKILL.md           ← 网页生成
└── image-generation/SKILL.md   ← 图像生成

你也可以自己写:

/mnt/skills/custom
└── your-custom-skill/SKILL.md  ← 你的Skill

按需渐进加载——不会一次性把所有Skill塞进上下文,用到哪个加载哪个。

Tools也是同样的思路。内置网页搜索、网页抓取、文件操作、bash执行;同时支持通过MCP Server和Python函数扩展自定义工具。甚至Claude Code也能直接集成——装一个skill就行:

npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow

五大IM渠道,聊天窗口就是Agent控制台

DeerFlow支持从即时通讯应用直接接收任务,不需要公网IP:

渠道 传输方式 上手难度
Telegram Bot API (long-polling) 简单
Slack Socket Mode 中等
飞书/Lark WebSocket 中等
企业微信 WebSocket 中等
钉钉 Stream Push (WebSocket) 中等

配置好之后,直接在聊天窗口里发任务就行。还支持几个实用命令:

  • /new — 开启新对话
  • /status — 查看当前线程信息
  • /models — 列出可用模型
  • /memory — 查看记忆

从"打开终端敲命令"到"在飞书群里说一句话",这个体验差距是巨大的。

Python Client:嵌入式Agent

如果你不想启动完整的Gateway+前端+nginx+Docker那一套,DeerFlow还提供了内嵌Python Client:

from deerflow.client import DeerFlowClient

client = DeerFlowClient()
response = client.chat("帮我分析这篇论文", thread_id="my-thread")

# 流式输出
for event in client.stream("hello"):
    if event.type == "messages-tuple" and event.data.get("type") == "ai":
        print(event.data["content"])

# 管理模型和技能
models = client.list_models()
skills = client.list_skills()
client.update_skill("web-search", enabled=True)

甚至有终端工作台(TUI),一条命令启动:

uv pip install 'deerflow-harness[tui]'
deerflow                    # 启动终端UI
deerflow --continue         # 恢复最近会话
deerflow --resume THREAD    # 按ID恢复指定会话
deerflow --print "总结一下"  # 无头模式

部署:Docker一条命令

git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
make config         # 生成配置文件
make docker-init    # 拉取沙箱镜像
make docker-start   # 启动服务

访问 http://localhost:2026 就能用。

模型不强绑定——只要实现了OpenAI兼容API的LLM都能接入。推荐用Doubao-Seed-2.0-Code、DeepSeek v3.2、Kimi 2.5,或者GPT-4、Gemini 2.5 Flash,全凭你选。

部署场景 起步配置 推荐配置
本地体验 4核8G 8核16G
Docker开发 4核8G 8核16G
长期服务 8核16G 16核32G

从Deep Research到Super Agent:路线之争

DeerFlow的演进路径本身就是行业缩影。

1.x时代,它是一个Deep Research框架——专门做深度研究。但上线后,开发者拿它做的事情远超研究:搭数据流水线、生成PPT、快速起Dashboard、自动化内容流程。很多方向连字节自己都没想到。

这暴露了一个行业真相:Agent不该被场景限定。你做一个研究工具,用户拿它搞创作;你做一个编程助手,用户拿它做运营。需求永远跑在产品前面。

所以2.0从头重写,从"研究框架"升级为"Super Agent Harness"——不是给你一个锤子让你找钉子,而是给你一个工具箱,什么钉子都能敲。

这个思路和Mem0(生化危机女主做的AI记忆系统)的路线之争一样:是做垂直场景的精致工具,还是做通用基础设施?DeerFlow 2.0的回答很明确——做harness,不做framework

一句话总结

DeerFlow 2.0让你用一个Super Agent框架,替代手动任务拆解+多工具切换+结果汇总,几小时的长任务稳跑到底——不崩、不忘、不乱

GitHub地址:https://github.com/bytedance/deer-flow

74K星,MIT协议,字节级工程品质。值得一个Star。


觉得有用?转发给还在被AI Agent折磨的朋友。

评论

暂无评论。

登录后可发表评论。