论文arxiv cs.CL · 3w ago重要

Query-Adaptive Semantic Chunking for Retrieval-Augmented Generation: A Dynamic Strategy with Contextual Window Expansion

分类释义:学术论文 / 技术报告

TL;DR

QASC 通过句子-query 相似度定位种子句、上下文窗口扩展和 chunk 级评分聚合三步,动态生成面向查询的语义块,在 200 条查询上 F1 达 0.85,比固定 chunking 提升 18-27%。

关键要点

  • 01QASC 通过句子-query 相似度定位种子句、上下文窗口扩展和 chunk 级评分聚合三步
  • 02动态生成面向查询的语义块
  • 03在 200 条查询上 F1 达 0.85
  • 04比固定 chunking 提升 18-27%
为什么值得关注

RAG 系统的核心瓶颈在于 chunk 质量,QASC 把用户 query 提前融入切分阶段而非仅在检索时过滤,能解决固定粒度的 precision-recall 困境。工程师可直接复用种子定位 + 窗口扩展的组合策略来优化垂直领域 RAG 的召回率。

对你的工程实践意味着什么

LLM 实时生成MiniMax-M2.7缓存命中
角色你应该做什么
Tech Lead评估在自研RAG pipeline中引入query-adaptive chunking的可行性,重点关注种子定位算法对语义相似度计算的依赖
应用工程师参考QASC的种子句定位+窗口扩展逻辑,在垂直领域RAG项目中实现动态语义切分替代固定长度chunking
运维 / 平台暂无直接影响,了解即可
产品 / 业务暂无直接影响,了解即可
阅读原文 ↗来源:arxiv cs.CL

同类资讯

本页 TL;DR 与「为什么」由 LLM 生成 · 模型:MiniMax-M2.7 / Claude Haiku 4.5