Progressive Complexity Escalation

Nikola Balic (@nibzard)· emerging

问题

许多组织从一开始就部署能力设定过高的AI Agent，进而引发以下问题：

当Agent处理超出当前模型能力范围的任务时，输出结果不可靠
落地实施失败，损害利益相关方的信任
复杂推理任务的结果存在不一致性
为模型当前尚不具备的能力搭建基础设施，造成工程资源浪费
自主执行高风险操作带来的安全隐患

Agent的理论能力与实际可靠性之间存在差距，是导致部署失败的核心原因。

方案

设计Agent系统应从低复杂度、高可靠性的任务入手，随着模型性能提升及信任关系建立，逐步解锁更复杂的能力。要让任务复杂度匹配当前模型的实际能力，而非对标理论潜力。

核心原则：

从已验证的「甜蜜点」起步：

低认知负荷、高重复性的任务
「对传统自动化而言过于动态，但具备足够可预测性，AI可稳定处理」的任务
优先聚焦信息收集与合成，而非复杂推理
定义明确的成功判定标准

定义能力层级：

层级1（可立即部署）：

- 数据录入与调研
- 内容分类
- 信息提取
- 基于模板的生成

层级2（验证通过后解锁）：

- 含人工审核环节的多步骤工作流
- 可生成结构化输出的条件逻辑
- 多工具集成
- 个性化与适配能力

层级3（未来解锁）：

- 自主决策
- 复杂推理链
- 创造性问题解决
- 全新任务泛化能力

渐进式解锁机制：

基于性能指标触发能力扩展
晋升更高层级前设置人工审核关卡
针对新能力开展对标基准的A/B测试
逐步推广并持续监控运行状态

工作流演进示例：

graph TD
    subgraph "阶段1：信息收集"
        A[Agent调研潜在客户数据] --> B[向人工展示调研结果]
        B --> C[人工撰写邮件]
    end

    subgraph "阶段2：结构化生成"
        D[Agent调研+资质审核] --> E[Agent草拟邮件]
        E --> F[人工审批/编辑]
        F --> G[人工发送邮件]
    end

    subgraph "阶段3：条件自动化"
        H[Agent调研+资质审核] --> I{置信度>0.8？}
        I -->|是| J[自动发送邮件]
        I -->|否| K[人工审核]
    end

    C -.已验证稳定可靠.-> D
    G -.已验证稳定可靠.-> H

    style A fill:#90EE90
    style D fill:#FFD700
    style H fill:#FF6347

如何使用

适用场景：

将Agent部署到生产环境
构建内部自动化工具
面向客户的Agent应用
高风险或受监管领域
可靠性未经验证的新型Agent能力

实施方法：

1. 任务复杂度分类：

class TaskComplexity:
    LOW = {
        '认知负载': '极低',
        '步骤数': 1-3,
        '工具调用数': 0-2,
        '推理深度': '浅层',
        '错误影响程度': '低'
    }

    MEDIUM = {
        '认知负载': '中等',
        '步骤数': 4-8,
        '工具调用数': 2-5,
        '推理深度': '多步骤',
        '错误影响程度': '中'
    }

    HIGH = {
        '认知负载': '显著',
        '步骤数': '8+',
        '工具调用数': '5+',
        '推理深度': '深度/创造性',
        '错误影响程度': '高'
    }

2. 定义进阶标准：

能力准入门槛:
  1级到2级:
    - 准确率阈值: 0.95
    - 人工审批通过率: 0.90
    - 处理量: 1000
    - 生产环境运行时长: 30天

  2级到3级:
    - 准确率阈值: 0.98
    - 人工干预率: 0.05
    - 处理量: 10000
    - 相关方信任度: 高

3. 实现能力开关：

class AgentCapabilities {
  constructor(private tier: 1 | 2 | 3) {}

  async processLead(lead: Lead) {
    const research = await this.research(lead); // 仅1级可用

    if (this.tier >= 2) {
      const qualification = await this.qualify(research);
      const email = await this.generateEmail(qualification);

      if (this.tier >= 3 && qualification.confidence > 0.8) {
        return this.autoSend(email); // 自主执行
      }

      return this.requestApproval(email); // 人工审核关卡
    }

    return this.presentFindings(research); // 仅1级支持
  }
}

4. 监控与进阶：

按等级跟踪成功指标
审查错误模式与边缘案例
逐步扩大Agent的权限范围
保留回滚能力

前置条件：

各能力等级具备明确的成功指标
已搭建监控与可观测性基础设施
相关方已就进阶计划达成共识
具备故障回退机制

权衡

优点：

风险缓解：限制Agent错误的影响范围
利益相关方信任：通过经证实的可靠性建立信任
聚焦型工程实践：将资源投入到已验证的能力模块中
优雅降级：即使处于低层级，系统仍保持可用性
模型演进就绪：架构已为能力增长做好充分准备
符合实际预期：使部署与模型实际表现保持一致

缺点：

价值延迟实现：全自动化收益需逐步达成，无法立竿见影
复杂度提升：需要开展层级管理并搭建升级逻辑
维护负担加重：需测试和维护多条能力路径
升级阻碍：需人工审查指标并做出层级升级决策
用户困惑：不同部署阶段的能力存在不一致性
工程投入较高：需为未来能力搭建专用基础设施

平衡方法：

向利益相关方清晰传达能力路线图
基于客观指标自动完成层级升级
保持简洁的认知模型（当前Agent可完成哪些任务？）
从设计之初就为能力增长做好规划

参考文献

关键词：

聚焦AI智能代理构建实践与大模型应用最佳实践，核心涵盖低认知负载自动化起步路径、任务复杂度与模型能力/优势适配原则，以及渐进式自主、人在回路等相关落地模式。

直译：

Vercel：我们构建智能代理的经验总结 —— “从低认知负载自动化入手，随能力成熟逐步演进升级”
Anthropic：构建高效智能代理 —— 任务复杂度与模型能力匹配
OpenAI：GPT最佳实践 —— 任务复杂度与模型优势适配

相关模式：模型演进下的渐进式自主、人在回路审批框架、控制谱系/混合主动性

来源摘要

正在获取来源并生成中文摘要…

来源: https://vercel.com/blog/what-we-learned-building-agents-at-vercel

← 返回社区