模型arxiv cs.CL · 5d ago重要

Less Context, More Accuracy: A Bi-Temporal Memory Engine for LLM Agents Where a Lean Retrieved Context Beats the Full History

分类释义:新模型发布或升级

TL;DR

Engram 是一个开源双时态记忆引擎,用 9.6k token 的检索切片(而非 79k 全历史)达到 83.6% 准确率,比全上下文基线高 10.4 分(McNemar p < 10^-6),且 0/500 错误。

关键要点

  • 01Engram 是一个开源双时态记忆引擎
  • 02用 9.6k token 的检索切片(而非 79k 全历史)达到 83.6% 准确率
  • 03比全上下文基线高 10.4 分(McNemar p < 10^-6)
  • 04且 0/500 错误
为什么值得关注

工程实践:解决了 LLM Agent 跨会话记忆的「token 越多越不准」悖论,混合检索路径(知识图谱 + 向量 + 稀疏)在减少 8x token 消耗的同时提升准确率;创意点:借鉴其 bi-temporal 知识图谱 + 混合信号融合架构,可用于构建企业内部知识库 Agent 或个人 AI 助手等需要长期记忆的产品。

对你的工程实践意味着什么

LLM 实时生成MiniMax-M2.7
角色你应该做什么
Tech Lead评估现有 Agent 记忆系统的上下文窗口设计,考虑引入 bi-temporal 知识图谱架构替代全历史方案
应用工程师学习 Engram 的混合检索实现(知识图谱+向量+稀疏),在下一个 Agent 项目中尝试精简上下文策略
运维 / 平台评估知识图谱存储的运维成本,8x token 减少可直接换算为模型调用费用降低
产品 / 业务暂无直接影响,了解即可
阅读原文 ↗来源:arxiv cs.CL

同类资讯

本页 TL;DR 与「为什么」由 LLM 生成 · 模型:MiniMax-M2.7 / Claude Haiku 4.5