# 一、引言
# 1. AI Agent 概念
AI Agent 概念雏形源于哲学领域,早期哲学家构想的能与环境互动的自主意识实体,为它埋下思想种子。20世纪50年代,阿兰·图灵提出图灵测试,“Agent”进入人工智能领域,指具有感知、决策、行动的人工实体。
近年,大模型成为AI Agent发展关键转折点,它以海量参数和深度学习能力革新底层架构,赋予 AI Agent 超强自然语言理解与生成力,助其摆脱领域限制,应对多样任务。
# 1.1四大关键组件协同
AI Agent 的基础架构由规划、记忆、工具和行动四大关键组件紧密咬合而成。
- 记忆模块:包括短时记忆和长期记忆,是运行的基础,用于存储和调用信息,帮助 Agent 在不同情境下做出决策和行动。
- 工具使用:利用多种工具,如日历、计算器、代码解释器、搜索等,来辅助完成任务,这些工具为 Agent 提供了额外的能力和信息获取渠道。
- 规划能力:借大模型推理能力,通过反映、自我批评、思想链和子目标分解等方式,把复杂任务拆为子任务,规划最优路径。
- 行动执行:贯彻规划指令,调动资源执行操作,基于记忆、工具和规划,Agent 最终执行具体的行动,以实现目标。
# 1.2运作流程与智能决策
AI Agent 的运作流程涵盖感知、理解、决策、行动与反馈多个关键节点。
- 信息输入与记忆存储:Agent 首先接收外部信息,部分信息会存储在短时记忆中,重要或需要长期使用的信息会进入长期记忆。
- 工具调用:当面临任务时,Agent 会根据需要调用相应的工具,例如需要计算时调用计算器,需要查找信息时使用搜索功能等。这些工具的使用结果会进一步丰富 Agent 的信息储备和决策依据。
- 规划阶段:
- 反映:Agent 对当前任务和已有信息进行初步的反应和思考,了解任务的大致情况和要求。
- 自我批评:Agent 会对可能的行动方案进行自我评估,分析其优缺点,以优化决策。
- 思想链:通过一系列的逻辑思考和推理,形成解决问题的思路和步骤,类似于人类思考问题时的思维链条。
- 子目标分解:将复杂的任务分解为多个子目标,使任务更具可操作性和可管理性。
- 行动执行:根据规划阶段确定的方案和步骤,Agent 采取具体的行动,在行动过程中,可能会继续与记忆和工具交互,以确保行动的有效性和适应性。
Agent(智能体)=LLM(大模型)+ Planning(规划)+Memory(记忆)+ Tools(工具)。
当这些要素具备了,而且之间有明确的连接关系之后,那么一个 Agent 也就形成了。
# 2. 发展趋势
从初期的Prompt 工程借提示词引导 AI 生成内容。随后,Prompt 工程与 RAG 结合,使 AI 可从外部知识库检索信息,成领域知识型助手,增强内容准确性与丰富度,如答专业问题时结合资料。现今,已演进至可创建原生应用的 AI Agent 阶段,未来将现更多创新场景,推动广泛应用与发展。
整体可以看到,AI应用呈现从简单助手向能解决复杂问题的Agent助手发展,应用壁垒提高,场景更丰富深入的趋势。
Workflow 开发范式是一种系统化工作流程设计与管理方法,具有可视化结构化、流程标准化、自动化集成、可扩展灵活等特点。主要步骤包括流程定义、角色职责分配、工具技术选择、流程建模设计、测试优化、部署监控,能广泛应用于各业务领域,提升运营效率、协同能力与管理水平,实现业务流程规范化和自动化。 鉴于现阶段业界及实际业务场景下,应用开发大多遵循固定的流程任务来开展,本课程将着重围绕 Workflow 模式展开详细介绍与教学。
# 3. 具体实践
基于大模型应用架构逐渐往复杂工程系统发展的趋势下,讯飞星火正式升级了全链路、可定制、可优化的「讯飞星火智能体平台 (opens new window)」。平台基于主流 MOM 混合应用开发架构,首次实现应用场景驱动全链路大小模型可微调定制,让大模型应用落地更高效、效果更稳定。支持 Agent 设置为工作流(Workflow)开发范式,用户交互均会触发固定的工作流处理,要依据任务特性、环境因素以及资源配置,进行灵活且严谨的组合编排。作为一站式大模型应用开发平台,无论您是否有编程经验,都可以快速上手构建各类大模型应用,快速完成业务产品 PMF 验证。
👉具体操作步骤:
- 登录「讯飞星火SparkDesk (opens new window)」产品首页,往右上角,点击进入“新建智能体”;
- 点击“创建高阶智能体”;
(“一句话创建智能体”尚处于 Prompt Agent 的早期阶段,本课程不会对此展开过多赘述,感兴趣的同学不妨关注上期 Prompt 工程师认证课程。)
- 输入自己的智能体信息后,点击“自定义创建”,或根据模板“立即同款”,即可快速进行 Agent 创建。