生化危机女主做的AI记忆系统,56k星背后是路线之争
56,268 颗星。56,268 个开发者给一个AI记忆项目点了Star。
不是OpenAI做的。不是Google做的。
是一个好莱坞女演员做的。
Milla Jovovich——对,就是《生化危机》里那个开枪比说话多的Alice——和她的搭档Ben Sigman,花了几个月用Claude Code写了一个叫MemPalace的开源项目。
它的宣言很狂:The best-benchmarked open-source AI memory system. And it's free.
翻译:我们测得最全,还不要钱。
GitHub地址:github.com/MemPalace/mempalace
- Stars:56,268(截至2026年6月24日)
- Forks:7,284
- 语言:Python
- 协议:MIT(商用免费)
- 核心依赖:ChromaDB + PyYAML
但这个项目真正有意思的,不是谁做的,也不是多少星。
是它和另一个59k星的Mem0之间,藏着两条完全不同的技术路线。
两条路:存原文 vs 存经验
AI Agent的记忆问题,说白了就一句话:模型没有硬盘。
你关掉对话,它就把你说过的一切扔了。你的偏好、你的项目结构、你纠正过它的错误——全没了。
RAG能解决一部分,但它更像一个"外接硬盘":你问,它查,答完拉倒。它不会记住你上周说过"不要用异步写法",也不会三天后提醒你"这个需求你之前否决过"。
怎么解决?目前有两条路。
路线A:MemPalace——存原文,0 API调用
MemPalace的做法很硬核:把对话原封不动存下来,用regex和关键词评分来分类和检索。
它的记忆分四层:
| 层级 | 内容 | 作用 |
|---|---|---|
| 工作记忆 | 当前对话窗口上下文 | 单轮任务不跑偏 |
| 情节记忆 | 最近N轮对话摘要 | 跨会话continuity |
| 语义记忆 | 压缩去重后的"事实" | RAG存文档,它存经验 |
| 知识图谱 | 实体-关系图 | 沿关系链推理 |
关键细节:记忆基础设施完全不用LLM。 分类、分块、检索全靠regex启发式和关键词评分。LLM只负责实际对话。
结果是:零API成本,纯本地,完全确定性。
官方Benchmark:96.6% R@5 on LongMemEval,hybrid模式100%。
听起来很猛。
路线B:Mem0——存经验,用LLM提炼
Mem0(发音mem-zero)走的是完全相反的路:让LLM自动从对话中提取关键信息,压缩成紧凑的记忆条目。
它不管原文。它只存"提炼后的知识点"。
比如你说了20轮对话,Mem0可能只存3条:
- "用户偏好Python的dataclass"
- "项目A使用FastAPI"
- "性能优先于可读性"
Mem0也分三层:用户记忆、会话记忆、Agent记忆。底层是向量+图谱+键值的三合一存储。冲突时自动合并去重,不会重复存。
它还有$24M的A轮融资,Y Combinator孵化的,有完整的托管平台。
GitHub:59,331 Star / 6,849 Fork。
Benchmark争议:96.6%是真的吗?
MemPalace官方宣称96.6% R@5 on LongMemEval。
社区立刻开始压力测试。
独立测试者(GitHub Issue #39)跑了完整管道,得到的结果是82.6% QA accuracy——不错,但和96.6%差了14个百分点。
原因在于指标不对等:
| 系统 | 指标 | 分数 |
|---|---|---|
| MemPalace | 检索召回率 R@5 | 96.6% |
| OMEGA | QA准确率 | 95.4% |
| 独立测试MemPalace | QA准确率 | 82.6% |
| agentmemory | R@5 | 95.2% |
MemPalace用的是"检索召回"——你问它,它能不能把相关记忆找出来。但找到≠答对。
而agentmemory(另一个竞品)的BM25+Vector方案在R@10上甚至反超MemPalace:98.6% vs ~97.6%。
换句话说,96.6%不是假的,但也不是你以为的那个意思。
Mem0这边也没好到哪去。在LongMemEval-S上,Mem0用GPT-4o跑出49.0%,而Zep/Graphiti跑到63.8%——差了15个百分点。
Benchmark这个东西,谁跑谁赢。
冷水时间
两个项目都很猛,但都有硬伤。
MemPalace的问题:
- 记忆垃圾回收不完善——长期记忆会膨胀,靠手动清理。一个跑了3个月的Agent,记忆库可能塞满过时信息
- 多Agent共享记忆未验证——Claude Code和Cursor同时用,记忆会不会打架?官方没说
- API还在快速迭代——今天写的代码,下个月可能不能用
- **"Milla Jovovich写了这代码"**——Reddit上很多人质疑这是营销操作。更有可能是一个CEO雇了工程师,工程师删号后让Milla当前置。这不影响代码质量,但影响信任
Mem0的问题:
- 自托管版阉割严重——自动冲突解决、托管图记忆都没了,得自己搭
- 依赖LLM调用——记忆提取每次都要调API,成本不可忽略。免费层每月只给1000条记忆
- 对长尾场景召回弱——用户偏好、事实类记忆做得好,但需要推理的场景("为什么上次否决了这个方案")召回率骤降
- 闭源平台的锁定风险——免费层只是诱饵,生产用量必须付费
还有一个两方都没解决的问题:记忆投毒。
Mem0自己6月22日刚发了篇文章承认——恶意输入可以污染Agent的记忆,让它在后续对话中做出错误决策。这是OWASP ASI06级别的安全漏洞,目前没有好的防御方案。
5分钟上手
如果你就想试一下,两个都很快。
MemPalace:
pip install mempalace
mempalace serve --port 8000
接入Claude Code(MCP):
{
"mcpServers": {
"memory": {
"command": "mempalace",
"args": ["mcp"]
}
}
}
Mem0:
pip install mem0ai
from mem0 import Memory
m = Memory()
m.add("我喜欢用Python的dataclass", user_id="lininn")
result = m.search("Python", user_id="lininn")
MemPalace完全本地,零成本。Mem0有云平台,但也意味着数据上别人的服务器。
选哪个?取决于你信"原文可追溯"还是信"AI提炼更高效"。
这场战争的本质
2026年的Agent赛道有个共识:能跑通的Agent和跑不通的Agent,差距不在模型能力,在记忆设计。
当大家都能调用GPT-5.5、Claude 4、DeepSeek V4的时候,决定Agent好不好用的,不是"模型懂不懂",而是"Agent记不记得"。
MemPalace代表一种哲学:记忆是文件系统问题。 存原文,用确定性算法检索,不依赖黑箱。
Mem0代表另一种:记忆是认知问题。 让LLM自己决定什么值得记,怎么记,什么时候忘。
两条路都在狂奔。MemPalace两个月从0到56k星,Mem0三年攒到59k星拿了$24M融资。
但说到底,它们的起点都一样——一个荒谬的事实:2026年了,世界上最聪明的AI,关掉窗口就失忆。
这不正常。
而正常人不会觉得这不正常。
项目数据截至2026年6月24日。MemPalace: github.com/MemPalace/mempalace | Mem0: github.com/mem0ai/mem0
暂无评论。