【阅读笔记】Self-play SWE-RL (SSR):让 Agent 自己出题、自己做题
# 【阅读笔记】Self-play SWE-RL (SSR):让 Agent 自己出题、自己做题 > 论文链接:https://arxiv.org/abs/2512.18552 > 作者:Meta FAIR,2025年12月 --- ## 1. 一句话总结 Agent 自己向代码库注入 Bug、自己尝试修复,通过双角色自博弈完全摆脱人工标注数据,在 SWE-bench Verified 上...
RL Paper Reading
13 分钟阅读