论文arxiv cs.CL · 1w ago重要
Discourse-Role Labels as Presentation-Time Variables for Context Use in Language Models
分类释义:学术论文 / 技术报告
TL;DR
研究表明,语言模型对带有标签(如 Instruction:、Reference:、Example:)的上下文表现出显著的标签依赖性,在误导性内容采用率上产生 56-84 个百分点的波动,其中 Example: 标签会抑制模型采纳错误信息,而 Instruction: 和 Reference: 则导致高采纳率。
关键要点
- 01语言模型对带有标签(如 Instruction:、Reference:、Example:)的上下文表现出显著的标签依赖性。
- 02在误导性内容采用率上产生 56-84 个百分点的波动。
- 03其中 Example: 标签会抑制模型采纳错误信息。
- 04而 Instruction: 和 Reference: 则导致高采纳率。
为什么值得关注
RAG 系统若在检索结果前加 'Instruction:' 等标签,会显著增加模型对错误上下文的依赖,因此工程实践中需统一报告和控制包装标签的命名,且可考虑用 Example: 或 Illustrative: 前缀来抑制误导性信息的影响。
对你的工程实践意味着什么
LLM 实时生成MiniMax-M2.7缓存命中
| 角色 | 你应该做什么 |
|---|---|
| Tech Lead | 审视团队 RAG 系统或 LLM 应用中的 prompt 模板,评估是否需要统一上下文包装标签的命名规范 |
| 应用工程师 | 检查现有 RAG pipeline 中检索结果的包装标签,优先使用 Example: 或 Illustrative: 前缀替代 Instruction: 和 Reference: |
| 运维 / 平台 | 暂无直接影响,了解即可 |
| 产品 / 业务 | 暂无直接影响,了解即可 |
同类资讯
本页 TL;DR 与「为什么」由 LLM 生成 · 模型:MiniMax-M2.7 / Claude Haiku 4.5