Proactive Agent State Externalization

Nikola Balic (@nibzard)· emerging

问题

像Claude Sonnet 4.5这类前沿模型，无需明确prompt触发，就能主动通过向文件系统写入摘要与笔记（如CHANGELOG.md、SUMMARY.md）来外化自身状态。不过该机制存在以下局限：

自动生成的笔记往往内容不完整，或是遗漏关键context
模型可能在文档编写上消耗更多token，而非投入到实际问题解决中
当Agent完全依赖自身生成的摘要时，性能会出现衰减
不完善的自动文档会引发知识缺口

方案

采用结构化方法，充分利用并强化模型天然具备的状态外化倾向：

1. 引导式自文档框架

为Agent生成的笔记提供模板与Schema
定义状态留存的最低信息要求
为自动生成的摘要设置验证检查点

2. 混合记忆架构

将Agent自文档与外部内存管理相结合
将Agent笔记作为状态存储的补充载体而非核心存储
当自动生成的context不足时，实现兜底机制

3. 渐进式状态构建

鼓励在长会话过程中逐步记录笔记
结构化文档内容，不仅捕获操作行为，更要记录决策依据
加入明确的不确定性标记与知识缺口

# 主动式状态外化框架
class ProactiveStateManager:
    def __init__(self):
        self.state_template = {
            "session_id": str,
            "current_objective": str,
            "completed_actions": List[Action],
            "pending_decisions": List[Decision],
            "knowledge_gaps": List[str],
            "confidence_scores": Dict[str, float]
        }
    
    def capture_agent_state(self, agent_notes):
        # 验证Agent生成笔记的完整性
        structured_state = self.parse_agent_notes(agent_notes)  # 将Agent笔记解析为结构化状态
        missing_fields = self.validate_completeness(structured_state)  # 检查结构化状态完整性，识别缺失字段
        
        if missing_fields:
            return self.prompt_for_clarification(missing_fields)  # 若存在缺失字段，提示Agent补充澄清信息
        
        return self.merge_with_external_memory(structured_state)  # 将结构化状态与外部内存合并后返回
    
    def guide_note_taking(self, current_context):
        return f"""
        在工作过程中，请按照以下格式维护笔记：
        ## 当前目标
        {current_context.objective}
        
        ## 进度总结
        - 已完成内容
        - 当前正在处理的工作
        - 下一步计划
        
        ## 决策日志
        - 已做出的关键决策及决策依据
        - 曾考虑过的备选方案
        - 置信度水平
        
        ## 知识缺口
        - 尚未明确的信息
        - 需要澄清的内容
        """

如何使用

最适用于Agent处理长期任务的场景：

长期开发会话：需要状态连续性的数小时级编码项目
研究与分析：跨多个会话的复杂调研工作
子Agent协同：主Agent需要向生成的子Agent传递状态信息时

需监控自文档质量，当Agent的记录不足以支撑需求时，借助外部记忆系统进行补充。

权衡

优点： 利用模型的天然行为特性；实现更优的会话连续性；便于子Agent间的通信；生成审计追踪记录
缺点： 可能因过度记录文档而非推进进程消耗tokens；需要额外的验证成本；存在自我评估不完整的风险；存在“文档形式主义”的可能性

参考文献

关键词：

涵盖Cognition AI旗下Devin与Claude Sonnet 4.5模型的实践经验与面临挑战，以及关联的情景记忆检索与注入技术研究。

直译：

认知AI：Devin与Claude Sonnet 4.5——经验与挑战

关联文献：情景记忆检索与注入

来源摘要

正在获取来源并生成中文摘要…

来源: https://cognition.ai/blog/devin-sonnet-4-5-lessons-and-challenges

← 返回社区