A-Mem:用 Zettelkasten 让 Agent 记忆自我演化
借鉴卡片盒笔记法,让Agent记忆自动建立语义关联网络并动态演化。Multi-Hop F1比MemGPT提升79%,Token消耗仅其1/6。
持续追踪 OpenAI、Anthropic、Google DeepMind、NVIDIA 等研究机构,将论文和技术博客整理为高质量阅读笔记。
借鉴卡片盒笔记法,让Agent记忆自动建立语义关联网络并动态演化。Multi-Hop F1比MemGPT提升79%,Token消耗仅其1/6。
借鉴OS虚拟内存思想,让LLM自己管理分层记忆(RAM/磁盘),通过函数调用主动存取,解决上下文窗口限制。多跳检索准确率从32%提升到92.5%。
整理8篇核心论文/帖子对RLE架构设计和算法改进的可落地思路,覆盖环境设计、奖励建模、上下文工程等维度。
# Agentic Mfw - infra 架构解读 **作者:dodo** > **原文**:https://agenticmotherfucking.website/ > **发布时间**:2026-06-03(约) > **解读视角**:大模型基础建设架构设计 > **沉淀时间**:2026-06-04 --- ## 一句话核心 这是一篇辛辣的技术讽刺文,以「vibe-coded ...
URIAL 通过3个高质量 ICL 示例,无需任何参数训练,直接将 Base Model 对齐为 Chat 风格,颠覆了对齐必须依赖训练的传统假设。
# MAI-Code-1-Flash - infra 架构解读 **作者:dodo** > **原文**:https://microsoft.ai/news/introducingmai-code-1-flash/ > **发布时间**:2026-06-02 > **解读视角**:大模型基础建设架构设计 > **沉淀时间**:2026-06-04 --- ## 一句话核心 MAI-Cod...
# Use your Nvidia GPU's VRAM as swap space on Linux - infra 架构解读 **作者:dodo** > **原文**:https://github.com/c0dejedi/nbd-vram > **发布时间**:2026-06-01 > **解读视角**:大模型基础建设架构设计 > **沉淀时间**:2026-06-04 --- ##...
2026年河南省首次推行"3+4"中职本科贯通培养政策,本报告补充国家政策背景、先行省市10年参照数据、驻高近五年升学趋势、转段考核通过率风险量化、985/211概率差距对比矩阵等多维数据,系统性论证成绩优异学生不适合选择"3+4"路径,推荐驻高普通班→全国高考升学路径。
基于河南省2026年3+4政策,结合驻马店高级中学历年数据,综合分析成绩靠前的初三学生是否应选择中本贯通路径
从四篇权威综述出发,系统梳理 LLM 对齐技术的演进路线、主流方法对比与前沿方向
# 【阅读笔记】Self-play SWE-RL (SSR):让 Agent 自己出题、自己做题 > 论文链接:https://arxiv.org/abs/2512.18552 > 作者:Meta FAIR,2025年12月 --- ## 1. 一句话总结 Agent 自己向代码库注入 Bug、自己尝试修复,通过双角色自博弈完全摆脱人工标注数据,在 SWE-bench Verified 上...
# 【阅读笔记】Agent-RLVR:用 Guidance 破解 Agent RL 的稀疏奖励难题 > 论文链接:https://arxiv.org/abs/2506.11425 > 作者:Scale AI,2025年6月 --- ## 1. 一句话总结 在多步骤 Agent 任务中,用外部 LLM 提供"导师级提示"帮助失败的 rollout 走出困境,让 RL 训练从稀疏奖励中有效学习...