工具arxiv cs.CL · 1mo ago重要

PoQ-Judge: A Multi-Architecture Evaluation Framework for Cost-Aware Proof-of-Quality in Decentralized LLM Inference

分类释义：开发工具与基础设施

TL;DR

PoQ-Judge 是一个去中心化 LLM 推理网络的轻量级无参考质量评估框架，三种架构中最佳模型达 0.747 Pearson 相关性，级联评估可降低成本 72.7%。

关键要点

为什么值得关注

去中心化推理网络缺乏高效的质量评估手段，此框架通过无参考评估解决了这个痛点。工程团队可借鉴其级联评估思路：在高精度场景用 DeBERTa 保证质量，在成本敏感场景用 TextCNN/MiniLM 快速过滤，在混合部署时按 query 复杂度动态选择评估器层级。

LLM 实时生成MiniMax-M2.7缓存命中

角色	你应该做什么
Tech Lead	评估 PoQ-Judge 的无参考评估机制是否可集成到现有推理质量监控体系
应用工程师	参考级联评估思路，按任务复杂度选择不同精度层级的评估模型
运维 / 平台	在去中心化推理节点部署时，预估 72.7% 成本节省空间并调整资源配额
产品 / 业务	暂无直接影响，了解即可

阅读原文 ↗来源：arxiv cs.CL