字节74K星的AI Agent，跑3小时不崩不忘不乱——我拿它干了一整天的活

AI Agent DeerFlow 字节跳动开源

发布于 2026-06-29 06:27:57 6 次浏览

字节74K星的AI Agent，跑3小时不崩不忘不乱——我拿它干了一整天的活

如果你的AI Agent只能活5分钟，那它不是助手，是弹窗。

你让它"调研竞品、写分析报告、生成PPT"，它5分钟后告诉你"搞定了"，甩过来200字的摘要。你让它"帮我把这个项目从Python迁移到Go"，它写到一半上下文爆了，从零开始。你让它"跟踪这个技术方向一个月的最新进展"，它直接告诉你"我记不住之前的了"。

崩、忘、乱——这就是当前AI Agent的三大绝症。

字节跳动74K星的开源项目DeerFlow 2.0，就是来治这个病的。

不是框架，是Harness

先说一个关键概念：DeerFlow 2.0不是框架（framework），它是harness——一套让Agent真正把事情做完的运行时基础设施。

区别在哪？

框架给你零件，你自己拼。Harness给你一辆能开的车，你踩油门就行。

DeerFlow 2.0是字节从v1彻底重写的，和1.x没有共用一行代码。1.x是一个Deep Research框架，2.0是一个Super Agent Harness。这个升级不是功能迭代，是物种进化。

它默认就带上了Agent真正会用到的关键能力：文件系统、记忆、技能、沙箱执行环境、子代理调度。基于LangGraph和LangChain构建，但不需要你自己拼装——开箱即用，同时足够可扩展。

三剂药方，治三大绝症

第一剂：沙箱执行——治"崩"

普通Agent跑复杂任务，5分钟崩一次。为什么？因为它和你的系统共处一个环境——写错文件、吃光内存、网络请求超时，任何一个都能让它挂掉。

DeerFlow的每个任务都在独立Docker容器里运行。完整的文件系统、独立的网络策略、可控的资源配额。Agent在里面随便折腾，搞不崩你的宿主机。

/mnt/user-data/
├── uploads/          ← 你上传的文件
├── workspace/        ← Agent的工作目录
└── outputs/          ← 最终交付物

更狠的是断点续传。任务中断了？从断点恢复继续跑，不用从头来。

本地开发、Docker容器、Kubernetes Pod——三种沙箱模式，从个人开发到企业集群全覆盖。

第二剂：三层记忆——治"忘"

你跟AI聊了3小时，到第4小时它说"我们之前聊了什么？"——这种体验谁都有过。

DeerFlow搞了一套三层记忆系统：

短期记忆：当前对话的上下文，保证即时连贯
长期记忆：知识图谱，跨session记住你的偏好、知识背景、工作习惯
工作记忆：任务执行状态，长任务中间不会"忘了刚才在干什么"

普通Agent上下文窗口一满就丢信息，DeerFlow有专门的摘要压缩机制——总结已完成的子任务、把中间结果转存到文件系统、压缩暂时不重要的信息。不是硬塞更多token，而是聪明地管理有限的上下文空间。

而且记忆数据保存在本地，控制权始终在你手里。

第三剂：子代理协作——治"乱"

复杂任务最怕什么？乱。

一个"调研AI市场"的任务，要搜索、要分析、要写报告、要做PPT。一个人干？效率低。串行干？太慢。

DeerFlow的做法：自动拆解，并行执行。

Lead Agent接到任务后，先做规划，然后按需动态拉起Sub-Agents。每个Sub-Agent都有自己独立的上下文、工具和终止条件。只要条件允许，它们就并行运行，返回结构化结果，最后由Lead Agent汇总。

关键设计细节：每个Sub-Agent的上下文是完全隔离的——它看不到主Agent的上下文，也看不到其他Sub-Agent的上下文。这意味着一个子任务的中间状态不会污染另一个子任务，并行不会互相干扰。

技能系统：像装App一样给Agent装能力

DeerFlow能做"几乎任何事"的秘密，在于它的Skills系统。

Skill就是一个Markdown文件，定义了工作流、最佳实践和参考资源。DeerFlow自带一批内置Skills：

/mnt/skills/public
├── research/SKILL.md           ← 深度研究
├── report-generation/SKILL.md  ← 报告生成
├── slide-creation/SKILL.md     ← PPT制作
├── web-page/SKILL.md           ← 网页生成
└── image-generation/SKILL.md   ← 图像生成

你也可以自己写：

/mnt/skills/custom
└── your-custom-skill/SKILL.md  ← 你的Skill

按需渐进加载——不会一次性把所有Skill塞进上下文，用到哪个加载哪个。

Tools也是同样的思路。内置网页搜索、网页抓取、文件操作、bash执行；同时支持通过MCP Server和Python函数扩展自定义工具。甚至Claude Code也能直接集成——装一个skill就行：

npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow

五大IM渠道，聊天窗口就是Agent控制台

DeerFlow支持从即时通讯应用直接接收任务，不需要公网IP：

渠道	传输方式	上手难度
Telegram	Bot API (long-polling)	简单
Slack	Socket Mode	中等
飞书/Lark	WebSocket	中等
企业微信	WebSocket	中等
钉钉	Stream Push (WebSocket)	中等

配置好之后，直接在聊天窗口里发任务就行。还支持几个实用命令：

/new — 开启新对话
/status — 查看当前线程信息
/models — 列出可用模型
/memory — 查看记忆

从"打开终端敲命令"到"在飞书群里说一句话"，这个体验差距是巨大的。

Python Client：嵌入式Agent

如果你不想启动完整的Gateway+前端+nginx+Docker那一套，DeerFlow还提供了内嵌Python Client：

from deerflow.client import DeerFlowClient

client = DeerFlowClient()
response = client.chat("帮我分析这篇论文", thread_id="my-thread")

# 流式输出
for event in client.stream("hello"):
    if event.type == "messages-tuple" and event.data.get("type") == "ai":
        print(event.data["content"])

# 管理模型和技能
models = client.list_models()
skills = client.list_skills()
client.update_skill("web-search", enabled=True)

甚至有终端工作台（TUI），一条命令启动：

uv pip install 'deerflow-harness[tui]'
deerflow                    # 启动终端UI
deerflow --continue         # 恢复最近会话
deerflow --resume THREAD    # 按ID恢复指定会话
deerflow --print "总结一下"  # 无头模式

部署：Docker一条命令

git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
make config         # 生成配置文件
make docker-init    # 拉取沙箱镜像
make docker-start   # 启动服务

访问 http://localhost:2026 就能用。

模型不强绑定——只要实现了OpenAI兼容API的LLM都能接入。推荐用Doubao-Seed-2.0-Code、DeepSeek v3.2、Kimi 2.5，或者GPT-4、Gemini 2.5 Flash，全凭你选。

部署场景	起步配置	推荐配置
本地体验	4核8G	8核16G
Docker开发	4核8G	8核16G
长期服务	8核16G	16核32G

从Deep Research到Super Agent：路线之争

DeerFlow的演进路径本身就是行业缩影。

1.x时代，它是一个Deep Research框架——专门做深度研究。但上线后，开发者拿它做的事情远超研究：搭数据流水线、生成PPT、快速起Dashboard、自动化内容流程。很多方向连字节自己都没想到。

这暴露了一个行业真相：Agent不该被场景限定。你做一个研究工具，用户拿它搞创作；你做一个编程助手，用户拿它做运营。需求永远跑在产品前面。

所以2.0从头重写，从"研究框架"升级为"Super Agent Harness"——不是给你一个锤子让你找钉子，而是给你一个工具箱，什么钉子都能敲。

这个思路和Mem0（生化危机女主做的AI记忆系统）的路线之争一样：是做垂直场景的精致工具，还是做通用基础设施？DeerFlow 2.0的回答很明确——做harness，不做framework。

一句话总结

DeerFlow 2.0让你用一个Super Agent框架，替代手动任务拆解+多工具切换+结果汇总，几小时的长任务稳跑到底——不崩、不忘、不乱。

GitHub地址：https://github.com/bytedance/deer-flow

74K星，MIT协议，字节级工程品质。值得一个Star。

觉得有用？转发给还在被AI Agent折磨的朋友。

字节74K星的AI Agent，跑3小时不崩不忘不乱——我拿它干了一整天的活

不是框架，是Harness

三剂药方，治三大绝症

第一剂：沙箱执行——治"崩"

第二剂：三层记忆——治"忘"

第三剂：子代理协作——治"乱"

技能系统：像装App一样给Agent装能力

五大IM渠道，聊天窗口就是Agent控制台

Python Client：嵌入式Agent

部署：Docker一条命令

从Deep Research到Super Agent：路线之争

一句话总结

评论