模型arxiv cs.CL · 1mo ago重要

Less Context, More Accuracy: A Bi-Temporal Memory Engine for LLM Agents Where a Lean Retrieved Context Beats the Full History

分类释义：新模型发布或升级

TL;DR

Engram 是一个开源双时态记忆引擎，用 9.6k token 的检索切片（而非 79k 全历史）达到 83.6% 准确率，比全上下文基线高 10.4 分（McNemar p < 10^-6），且 0/500 错误。

关键要点

01Engram 是一个开源双时态记忆引擎。
02用 9.6k token 的检索切片（而非 79k 全历史）达到 83.6% 准确率。
03比全上下文基线高 10.4 分（McNemar p < 10^-6）。
04且 0/500 错误。

为什么值得关注

工程实践：解决了 LLM Agent 跨会话记忆的「token 越多越不准」悖论，混合检索路径（知识图谱 + 向量 + 稀疏）在减少 8x token 消耗的同时提升准确率；创意点：借鉴其 bi-temporal 知识图谱 + 混合信号融合架构，可用于构建企业内部知识库 Agent 或个人 AI 助手等需要长期记忆的产品。

对你的工程实践意味着什么

LLM 实时生成MiniMax-M2.7缓存命中

角色	你应该做什么
Tech Lead	评估现有 Agent 记忆系统的上下文窗口设计，考虑引入 bi-temporal 知识图谱架构替代全历史方案
应用工程师	学习 Engram 的混合检索实现（知识图谱+向量+稀疏），在下一个 Agent 项目中尝试精简上下文策略
运维 / 平台	评估知识图谱存储的运维成本，8x token 减少可直接换算为模型调用费用降低
产品 / 业务	暂无直接影响，了解即可

阅读原文 ↗来源：arxiv cs.CL

Less Context, More Accuracy: A Bi-Temporal Memory Engine for LLM Agents Where a Lean Retrieved Context Beats the Full History

关键要点

对你的工程实践意味着什么

同类资讯

Gemini Robotics ER 2: powering robotics with video understanding, task orchestration, and multi-robot collaboration

Advancing the price-performance frontier with GPT-5.6

How GPT-5.6 fuses frontier intelligence with frontier efficiency