论文arxiv cs.CL · 2mo ago重要

Query-Adaptive Semantic Chunking for Retrieval-Augmented Generation: A Dynamic Strategy with Contextual Window Expansion

分类释义：学术论文 / 技术报告

TL;DR

QASC 通过句子-query 相似度定位种子句、上下文窗口扩展和 chunk 级评分聚合三步，动态生成面向查询的语义块，在 200 条查询上 F1 达 0.85，比固定 chunking 提升 18-27%。

关键要点

为什么值得关注

RAG 系统的核心瓶颈在于 chunk 质量，QASC 把用户 query 提前融入切分阶段而非仅在检索时过滤，能解决固定粒度的 precision-recall 困境。工程师可直接复用种子定位 + 窗口扩展的组合策略来优化垂直领域 RAG 的召回率。

LLM 实时生成MiniMax-M2.7缓存命中

角色	你应该做什么
Tech Lead	评估在自研RAG pipeline中引入query-adaptive chunking的可行性，重点关注种子定位算法对语义相似度计算的依赖
应用工程师	参考QASC的种子句定位+窗口扩展逻辑，在垂直领域RAG项目中实现动态语义切分替代固定长度chunking
运维 / 平台	暂无直接影响，了解即可
产品 / 业务	暂无直接影响，了解即可

阅读原文 ↗来源：arxiv cs.CL