Cactus's Blog

Cactus li...大约 8 分钟

一、本章介绍

站在技术视角，分析 AI Agent 脚手架项目，这样一个产品功能需求的背景、诉求和目的。

首先，脚手架本质上是一种工程化模板体系，可视为标准化的项目骨架。通过少量参数化配置，即可自动完成 IntelliJ IDEA 项目的初始化搭建，并预置常用的基础组件与通用能力，避免在每次新项目启动时重复进行工程结构、依赖管理与基础服务的手动构建。

那么，为什么强调“技术视角”？

在互联网企业中，项目来源通常可以划分为两种类型：其一是围绕具体业务场景展开的产品型需求，其二是由研发体系主导的技术建设类项目（或由基础架构团队牵头打造的技术平台型产品）。后者的核心目标在于提升整体研发效能，减少在支持业务过程中产生的重复性工程工作，并通过统一规范与抽象能力沉淀，推动研发流程的标准化与体系化。

自2025年起，互联网行业加速推进 AI 技术对业务场景的深度赋能，AI 能力逐步渗透至各类应用场景，构建多形态的 AI Agent 智能体系统将成为常态化需求。在此背景下，工程初始化与能力集成的复杂度显著提升。为应对高频且结构相似的项目构建需求，亟需建立统一的标准化工程框架，以支持快速创建项目、沉淀通用能力模块，并在整体上降低使用门槛与研发成本，提高组织级交付效率。

二、项目背景

互联网企业构建业务场景下的 AI Agent 智能体，提供统一标准与便捷易用的脚手架。

为什么要创建脚手架？

回归本质，当前大规模语言模型（LLM）的接入方式仍以 HTTP 响应式接口调用 为主。随着应用需求持续增长，各团队在业务侧反复封装 AI HTTP 接口，带来了实现口径不一致、重复建设与维护成本上升等问题。为降低接入与封装复杂度，业界逐步演进出以 AI SDK 方式对接的设计与实现，从而显著提升开发效率与集成体验。

随后，AI 能力不再局限于“单次调用-单次返回”的基础模式，而是进一步引入 RAG（检索增强生成）知识库、Tool 工具调用（如 Function、MCP）等关键能力。同时，不同厂商的大模型（OpenAI、Google、智谱、阿里千问等）在接口协议、能力边界与参数语义上存在差异，导致多模型协同与切换成本较高。在此背景下，类似 Spring AI 的统一抽象与编排类产品应运而生，帮助开发者以更一致的方式完成多模型接入、配置管理与能力扩展。

进入下一阶段，随着 智能体（AI Agent） 概念兴起，系统建设开始从“能力调用”升级为“流程编排与自治执行”。开发者需要构建支持 顺序执行、循环执行（分析与决策）、并行执行 等复杂控制流的智能体方案，并在工程化层面解决状态管理、工具编排、异常恢复与可观测性等问题。Google 发布的 ADK（Agent Development Kit） 智能体框架，在一定程度上标志着该阶段逐步走向工程成熟，并呈现出标准化与生态化的发展趋势。

综上所述，构建一个完整的智能体系统，需要对前述各类技术体系与核心能力进行系统化整合与协同应用。为实现技术规范统一、开发流程标准化以及整体易用性的提升，有必要建设一套统一的 AI Agent 智能体开发框架。该框架旨在抽象并封装底层通用能力，消除重复性与高复杂度的工程环节，降低开发门槛，从而支持业务能力的快速集成与规模化落地，加速智能体应用的高效构建与迭代。

背景，2025 年 11 月 27 日，Google 在 Maven 中央仓库正式发布了 ADK 0.4.0 版本。该版本首次引入了对 Spring AI 的官方集成能力（google-adk-spring-ai）。基于这一版本特性，我决定围绕这套技术组合体系，构建一套面向企业级应用的智能体脚手架方案。
首先，Google ADK 本身是一套面向智能体构建的框架体系。它原生支持对接各类主流大模型 API，并能够直接构建 ChatModel 进行交互式调用。但在融合 Spring AI 与 LangChain4J 之后，其整体生态兼容性与企业落地能力显著增强，使得已经采用这些技术栈的企业在接入 Google ADK 时更加顺畅、低成本，因此更具吸引力。
其次，Spring AI 主要解决的是 AI 接入链路中的“前半段能力”。它可以帮助开发者高效封装 AI API、模型适配、Prompt 管理、RAG 检索增强以及 Tool（Function、MCP）等能力，从而快速构建一个完整的单体 AI Agent 服务（也可以理解为一个标准化的 AI 客户端）。
然后，Google ADK 关注的核心问题则是：多个 AI Agent 之间如何进行流程编排与协同执行。其内置支持多种执行模式，包括 Sequential（顺序执行）、Loop（循环执行）、Parallel（并行执行）。这些执行模式不仅可以独立使用，还可以进行嵌套与组合，例如将 Parallel 或 Loop 作为节点编排进 Sequential 中形成更复杂的执行流程（参考图中颜色区分）。其中浅绿色代表大模型服务节点，这些节点可以被深浅黄或浅蓝模块进行封装后，再统一编排至 SequentialAgent 中实现顺序调度。
最后，Google ADK 提供了具备上下文记忆能力的 Runner 执行器（同时也支持自定义扩展实现）。在执行器内部，还提供了可插拔的 Hook 机制，允许开发者在流程执行的不同阶段进行拦截与增强。这种机制类似于 Spring 容器对 Bean 生命周期的扩展处理，例如 before、after 等阶段性回调，使得整个智能体运行过程具备更强的可控性与扩展能力。

3. 执行框架

首先，在整体架构层面设计了一套 AI Agent 装配执行机制。该机制基于责任链模式与规则树通用模型构建，通过将装配流程拆解为可组合、可扩展的处理节点，实现装配逻辑的解耦与动态编排，从而增强系统的灵活性与可维护性。
之后，在实际使用层面，用户基于该脚手架初始化最小化的 AI Agent 工程骨架。随后，通过工程内的 yml 配置文件（如右侧所示示例配置），即可完成特定场景智能体的结构化装配。配置内容涵盖 API、Model、Tool 以及智能体装配策略等核心要素，使得智能体能力的组合与切换以声明式方式完成，而无需修改底层代码。
最后，在完成智能体基础能力装配后，用户可在 Business 模块中编写自身业务逻辑代码，与智能体能力进行深度融合，以满足具体业务诉求。例如：构建特定场景的 AI 客服系统、实现周期性监控巡检任务、开展运营数据的每日分析处理，或为各类软件系统提供智能体赋能（如 draw.io、SSH 工具、SFTP 工具等）。通过这种分层设计，各类业务场景均可低成本、快速接入智能体能力，实现智能化升级。

一、本章介绍

二、项目背景

三、产品方案

1. 产品概述

2. 架构模型

2.1 智能体设计

3. 执行框架