模型arxiv cs.CL · 5d ago重要
Less Context, More Accuracy: A Bi-Temporal Memory Engine for LLM Agents Where a Lean Retrieved Context Beats the Full History
分类释义:新模型发布或升级
TL;DR
Engram 是一个开源双时态记忆引擎,用 9.6k token 的检索切片(而非 79k 全历史)达到 83.6% 准确率,比全上下文基线高 10.4 分(McNemar p < 10^-6),且 0/500 错误。
关键要点
- 01Engram 是一个开源双时态记忆引擎。
- 02用 9.6k token 的检索切片(而非 79k 全历史)达到 83.6% 准确率。
- 03比全上下文基线高 10.4 分(McNemar p < 10^-6)。
- 04且 0/500 错误。
为什么值得关注
工程实践:解决了 LLM Agent 跨会话记忆的「token 越多越不准」悖论,混合检索路径(知识图谱 + 向量 + 稀疏)在减少 8x token 消耗的同时提升准确率;创意点:借鉴其 bi-temporal 知识图谱 + 混合信号融合架构,可用于构建企业内部知识库 Agent 或个人 AI 助手等需要长期记忆的产品。
对你的工程实践意味着什么
LLM 实时生成MiniMax-M2.7
| 角色 | 你应该做什么 |
|---|---|
| Tech Lead | 评估现有 Agent 记忆系统的上下文窗口设计,考虑引入 bi-temporal 知识图谱架构替代全历史方案 |
| 应用工程师 | 学习 Engram 的混合检索实现(知识图谱+向量+稀疏),在下一个 Agent 项目中尝试精简上下文策略 |
| 运维 / 平台 | 评估知识图谱存储的运维成本,8x token 减少可直接换算为模型调用费用降低 |
| 产品 / 业务 | 暂无直接影响,了解即可 |
同类资讯
本页 TL;DR 与「为什么」由 LLM 生成 · 模型:MiniMax-M2.7 / Claude Haiku 4.5