论文arxiv cs.CL · 1w ago重要

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

分类释义:学术论文 / 技术报告

TL;DR

研究表明,语言模型对带有标签(如 Instruction:、Reference:、Example:)的上下文表现出显著的标签依赖性,在误导性内容采用率上产生 56-84 个百分点的波动,其中 Example: 标签会抑制模型采纳错误信息,而 Instruction: 和 Reference: 则导致高采纳率。

关键要点

  • 01语言模型对带有标签(如 Instruction:、Reference:、Example:)的上下文表现出显著的标签依赖性
  • 02在误导性内容采用率上产生 56-84 个百分点的波动
  • 03其中 Example: 标签会抑制模型采纳错误信息
  • 04而 Instruction: 和 Reference: 则导致高采纳率
为什么值得关注

RAG 系统若在检索结果前加 'Instruction:' 等标签,会显著增加模型对错误上下文的依赖,因此工程实践中需统一报告和控制包装标签的命名,且可考虑用 Example: 或 Illustrative: 前缀来抑制误导性信息的影响。

对你的工程实践意味着什么

LLM 实时生成MiniMax-M2.7缓存命中
角色你应该做什么
Tech Lead审视团队 RAG 系统或 LLM 应用中的 prompt 模板,评估是否需要统一上下文包装标签的命名规范
应用工程师检查现有 RAG pipeline 中检索结果的包装标签,优先使用 Example: 或 Illustrative: 前缀替代 Instruction: 和 Reference:
运维 / 平台暂无直接影响,了解即可
产品 / 业务暂无直接影响,了解即可
阅读原文 ↗来源:arxiv cs.CL

同类资讯

本页 TL;DR 与「为什么」由 LLM 生成 · 模型:MiniMax-M2.7 / Claude Haiku 4.5