RMA 是一个针对研究级数学问题的多智能体推理框架,在 First Proof 基准测试中解决了 8/10 问题,优于 GPT-5.2R 等基线。 创意点:其 initializer-proposer-verifier 三角色协作 + 共享结构化记忆的架构设计,可为复杂长程推理任务的多智能体系统提供参考,产品层面可借鉴用于构建代码生成或形式化验证的迭代式协作工作流。 原文:https://arxiv.org/abs/2605.22875
这篇候选手册来自公开业界分享的摘要提炼,不转载原文。后续我会补充自己的验证、代码和可复用配置,再升级为正式 playbook。
加入每周 AI 工程师 Brief
新 playbook 上线第一时间通知,附作者每周观察。永久免费。