生化危机女主做的AI记忆系统56k星背后是路线之争

AI MemPalace Mem0 Agent记忆开源

发布于 2026-06-24 12:04:48 100 次浏览

生化危机女主做的AI记忆系统，56k星背后是路线之争

56,268 颗星。56,268 个开发者给一个AI记忆项目点了Star。

不是OpenAI做的。不是Google做的。

是一个好莱坞女演员做的。

Milla Jovovich——对，就是《生化危机》里那个开枪比说话多的Alice——和她的搭档Ben Sigman，花了几个月用Claude Code写了一个叫MemPalace的开源项目。

它的宣言很狂：The best-benchmarked open-source AI memory system. And it's free.

翻译：我们测得最全，还不要钱。

GitHub地址：github.com/MemPalace/mempalace

Stars：56,268（截至2026年6月24日）
Forks：7,284
语言：Python
协议：MIT（商用免费）
核心依赖：ChromaDB + PyYAML

但这个项目真正有意思的，不是谁做的，也不是多少星。

是它和另一个59k星的Mem0之间，藏着两条完全不同的技术路线。

两条路：存原文 vs 存经验

AI Agent的记忆问题，说白了就一句话：模型没有硬盘。

你关掉对话，它就把你说过的一切扔了。你的偏好、你的项目结构、你纠正过它的错误——全没了。

RAG能解决一部分，但它更像一个"外接硬盘"：你问，它查，答完拉倒。它不会记住你上周说过"不要用异步写法"，也不会三天后提醒你"这个需求你之前否决过"。

怎么解决？目前有两条路。

路线A：MemPalace——存原文，0 API调用

MemPalace的做法很硬核：把对话原封不动存下来，用regex和关键词评分来分类和检索。

它的记忆分四层：

层级	内容	作用
工作记忆	当前对话窗口上下文	单轮任务不跑偏
情节记忆	最近N轮对话摘要	跨会话continuity
语义记忆	压缩去重后的"事实"	RAG存文档，它存经验
知识图谱	实体-关系图	沿关系链推理

关键细节：记忆基础设施完全不用LLM。 分类、分块、检索全靠regex启发式和关键词评分。LLM只负责实际对话。

结果是：零API成本，纯本地，完全确定性。

官方Benchmark：96.6% R@5 on LongMemEval，hybrid模式100%。

听起来很猛。

路线B：Mem0——存经验，用LLM提炼

Mem0（发音mem-zero）走的是完全相反的路：让LLM自动从对话中提取关键信息，压缩成紧凑的记忆条目。

它不管原文。它只存"提炼后的知识点"。

比如你说了20轮对话，Mem0可能只存3条：

"用户偏好Python的dataclass"
"项目A使用FastAPI"
"性能优先于可读性"

Mem0也分三层：用户记忆、会话记忆、Agent记忆。底层是向量+图谱+键值的三合一存储。冲突时自动合并去重，不会重复存。

它还有$24M的A轮融资，Y Combinator孵化的，有完整的托管平台。

GitHub：59,331 Star / 6,849 Fork。

Benchmark争议：96.6%是真的吗？

MemPalace官方宣称96.6% R@5 on LongMemEval。

社区立刻开始压力测试。

独立测试者（GitHub Issue #39）跑了完整管道，得到的结果是82.6% QA accuracy——不错，但和96.6%差了14个百分点。

原因在于指标不对等：

系统	指标	分数
MemPalace	检索召回率 R@5	96.6%
OMEGA	QA准确率	95.4%
独立测试MemPalace	QA准确率	82.6%
agentmemory	R@5	95.2%

MemPalace用的是"检索召回"——你问它，它能不能把相关记忆找出来。但找到≠答对。

而agentmemory（另一个竞品）的BM25+Vector方案在R@10上甚至反超MemPalace：98.6% vs ~97.6%。

换句话说，96.6%不是假的，但也不是你以为的那个意思。

Mem0这边也没好到哪去。在LongMemEval-S上，Mem0用GPT-4o跑出49.0%，而Zep/Graphiti跑到63.8%——差了15个百分点。

Benchmark这个东西，谁跑谁赢。

冷水时间

两个项目都很猛，但都有硬伤。

MemPalace的问题：

记忆垃圾回收不完善——长期记忆会膨胀，靠手动清理。一个跑了3个月的Agent，记忆库可能塞满过时信息
多Agent共享记忆未验证——Claude Code和Cursor同时用，记忆会不会打架？官方没说
API还在快速迭代——今天写的代码，下个月可能不能用
**"Milla Jovovich写了这代码"**——Reddit上很多人质疑这是营销操作。更有可能是一个CEO雇了工程师，工程师删号后让Milla当前置。这不影响代码质量，但影响信任

Mem0的问题：

自托管版阉割严重——自动冲突解决、托管图记忆都没了，得自己搭
依赖LLM调用——记忆提取每次都要调API，成本不可忽略。免费层每月只给1000条记忆
对长尾场景召回弱——用户偏好、事实类记忆做得好，但需要推理的场景（"为什么上次否决了这个方案"）召回率骤降
闭源平台的锁定风险——免费层只是诱饵，生产用量必须付费

还有一个两方都没解决的问题：记忆投毒。

Mem0自己6月22日刚发了篇文章承认——恶意输入可以污染Agent的记忆，让它在后续对话中做出错误决策。这是OWASP ASI06级别的安全漏洞，目前没有好的防御方案。

5分钟上手

如果你就想试一下，两个都很快。

MemPalace：

pip install mempalace
mempalace serve --port 8000

接入Claude Code（MCP）：

{
  "mcpServers": {
    "memory": {
      "command": "mempalace",
      "args": ["mcp"]
    }
  }
}

Mem0：

pip install mem0ai

from mem0 import Memory
m = Memory()
m.add("我喜欢用Python的dataclass", user_id="lininn")
result = m.search("Python", user_id="lininn")

MemPalace完全本地，零成本。Mem0有云平台，但也意味着数据上别人的服务器。

选哪个？取决于你信"原文可追溯"还是信"AI提炼更高效"。

这场战争的本质

2026年的Agent赛道有个共识：能跑通的Agent和跑不通的Agent，差距不在模型能力，在记忆设计。

当大家都能调用GPT-5.5、Claude 4、DeepSeek V4的时候，决定Agent好不好用的，不是"模型懂不懂"，而是"Agent记不记得"。

MemPalace代表一种哲学：记忆是文件系统问题。 存原文，用确定性算法检索，不依赖黑箱。

Mem0代表另一种：记忆是认知问题。 让LLM自己决定什么值得记，怎么记，什么时候忘。

两条路都在狂奔。MemPalace两个月从0到56k星，Mem0三年攒到59k星拿了$24M融资。

但说到底，它们的起点都一样——一个荒谬的事实：2026年了，世界上最聪明的AI，关掉窗口就失忆。

这不正常。

而正常人不会觉得这不正常。

项目数据截至2026年6月24日。MemPalace: github.com/MemPalace/mempalace | Mem0: github.com/mem0ai/mem0