论文arxiv cs.CL · 1mo ago重要

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

分类释义：学术论文 / 技术报告

TL;DR

研究表明，语言模型对带有标签（如 Instruction:、Reference:、Example:）的上下文表现出显著的标签依赖性，在误导性内容采用率上产生 56-84 个百分点的波动，其中 Example: 标签会抑制模型采纳错误信息，而 Instruction: 和 Reference: 则导致高采纳率。

关键要点

01语言模型对带有标签（如 Instruction:、Reference:、Example:）的上下文表现出显著的标签依赖性。
02在误导性内容采用率上产生 56-84 个百分点的波动。
03其中 Example: 标签会抑制模型采纳错误信息。
04而 Instruction: 和 Reference: 则导致高采纳率。

为什么值得关注

RAG 系统若在检索结果前加 'Instruction:' 等标签，会显著增加模型对错误上下文的依赖，因此工程实践中需统一报告和控制包装标签的命名，且可考虑用 Example: 或 Illustrative: 前缀来抑制误导性信息的影响。

对你的工程实践意味着什么

LLM 实时生成MiniMax-M2.7缓存命中

角色	你应该做什么
Tech Lead	审视团队 RAG 系统或 LLM 应用中的 prompt 模板，评估是否需要统一上下文包装标签的命名规范
应用工程师	检查现有 RAG pipeline 中检索结果的包装标签，优先使用 Example: 或 Illustrative: 前缀替代 Instruction: 和 Reference:
运维 / 平台	暂无直接影响，了解即可
产品 / 业务	暂无直接影响，了解即可

阅读原文 ↗来源：arxiv cs.CL

Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models

关键要点

对你的工程实践意味着什么

同类资讯

Sympathetic Framing: Evaluating AI Alignment across Sociodemographic Groups

Recursive transformers for semiconductor thermo-mechanical reliability

LayerRAG-Bench: A Cross-Layer Reliability Benchmark for Agentic Retrieval-Augmented Generation