鹤山区网站建设国外广告联盟平台

张

张建站

2026/5/29 6:40:10

10分钟阅读

鹤山区网站建设,国外广告联盟平台,电子商务网站建设以为例,外贸wap网站本文深入探讨了AI Agent的技术架构构建#xff0c;对比了人大论文与OpenAI提出的两大热门框架#xff0c;并提炼出包含感知、配置、规划推理、行动、记忆、学习、上下文管理和编排的八模块整体架构。详细解析了各模块功能及协同工作流程#xff0c;旨在为读者提供构建智能体…本文深入探讨了AI Agent的技术架构构建对比了人大论文与OpenAI提出的两大热门框架并提炼出包含感知、配置、规划推理、行动、记忆、学习、上下文管理和编排的八模块整体架构。详细解析了各模块功能及协同工作流程旨在为读者提供构建智能体系统的全面指导。第3章构建 AI Agent 的技术架构我们了解了AI Agent的概念框架后我们就想构建智能体但如何构建智能体呢有没有一些设计模式或最佳实践可遵循这些设计模式或最佳实践就形成技术架构。这节我们就深入的探索构建 AI Agent 的技术架构。近年来由于大语言模型LLMs展现出来的智能潜力引发了基于大语言模型的智能体的研究热潮产生了许多基于大语言模型的智能体项目如AutoGPT、BabyAGI等。有些机构和专家学者对基于大语言模型的智能体项目进行了系统的总结并提出了统一的技术框架。其中比较全面、热门的有两篇一篇是2023年8月中国人民大学发表的论文“A SurveyonLargeLanguageModelbasedAutonomous**Agents“基于大语言模型的智能体研究综述。另一篇是2023年6月OpenAI 的应用研究主管 Lilian Weng 撰写了一篇博客“LLM Powered Autonomous Agents”。本章首先分别介绍这两篇文章中所提出的技术框架然后梳理出构建智能体的整体技术框架最后详细的解析构成框架的每个组件使我们对如何构建智能体有个整体且细致的了解。3.1 技术架构一23年8月份中国人民大学发表的论文“A Survey on Large Language Model based Autonomous Agents“基于大语言模型的智能体研究综述提出了一个构建基于大语言模型的统一框架这个框架的整体结构如下图所示image-20250415120526740图 2 基于大语言模型LLM的自主智能体架构设计的统一框架。该框架有四个模块组成配置文件模块、记忆模块、规划模块和行动模块。**配置文件模块**旨在明确智能体的角色特征。智能体在执行任务时通常会预设一个特定的角色如程序员、教师和领域专家这些角色特征通常写入提示中用以影响大语言模型的行为。例如在处理编程相关问题如代码漏洞修复等任务时将智能体的角色预设为 “你是一个专业的资深程序员” 时大语言模型会以程序员的思维方式和专业术语来进行回答。智能体的配置信息包括基本信息(年龄、性别和职业等)、个性的心理信息以及描述Agent之间社交关系的信息等。配置哪些信息取决于具体的应用场景例如如果应用旨在研究人类认知过程那么心理信息就变得至关重要。**记忆模块**记忆模块存储从环境中感知到的信息并利用记录的记忆来辅助未来的行动。记忆模块可以帮助智能体积累经验、自我进化使其行为更加一致、合理和有效。人类记忆通常从感知输入的感觉记忆开始到短暂存储信息的短期记忆再到长期巩固信息的长期记忆。智能体的记忆机制仿照人类记忆可以分为短期记忆短暂保持信息和长期记忆在较长时间内巩固信息短期记忆这种结构仅模拟人类的短期记忆通常通过上下文学习实现记忆信息直接写入提示中。例如在聊天智能体应用中维护一个内部对话历史记录。在每一轮对话中这些历史记录追加到当前输入提示中充当智能体的短期记忆发送给大语言模型。短期记忆受 Transformer 架构上下文窗口输入信息的限制。长期记忆长期记忆则是在较长时间内巩固的信息这类信息一般被编码为嵌入向量并存储在向量数据库中智能体可根据需要随时从向量数据库中快速查询和检索相关的信息。**规划模块**面对复杂任务时人类倾向于将其分解为更简单的子任务并分别解决它们。规划模块的目标是赋予Agent这种能力使Agent的行为更加合理、强大和可靠并具有可解释性。列如思维链Chain of ThoughtCoT就是一种常见的规划策略它将解决复杂问题的推理步骤示例输入到提示中来启发大语言模型逐步规划和行动。在这种方法中计划是基于提示中的示例启发而创建的。零样本思维链Zero-shot-CoT通过用 “一步一步思考” 这样的触发语句提示大语言模型使其能够生成任务推理过程。与 CoT 不同这种方法在提示中不包含推理步骤作为示例。其它的策略如自洽思维链Self-consistent CoTCoT-SC、思维树Tree of ThoughtsToT等等后续会详细的介绍。**行动模块**负责将智能体的决策转化为具体结果。该模块位于最下游位置直接与环境交互受配置文件模块、记忆模块和规划模块的影响。从四个角度来看行动目标涉及Agent行动的预期结果是什么。行动产生描述了行动是如何从Agent的决策过程中产生出来的两种常用的行动生成策略1通过记忆回忆生成行动。在这种策略中行动是根据当前任务从智能体记忆中提取信息生成的。2通过遵循计划生成行动**。**在这种策略中智能体按照预生成的计划采取行动。行动空间指的是智能体能够执行的所有可能行动的集合。一般来说可以将行动分为两类1外部工具如调用外部 API、数据库、外部模型等等2大语言模型的内部知识。行动影响指的是智能体行动所产生的后果。主要有三个方面1、改变环境智能体通过行动改变环境状态如移动位置、收集物品、建造建筑等2、改变内部状态包括更新记忆、制定新计划、获取新知识等3、触发新行动在任务完成过程中一个行动往往会引发后续行动。在该架构中配置文件模块用于确定智能体的角色记忆模块和规划模块将智能体置于动态环境中使其能够回忆过去的行为并规划未来的行动行动模块负责将智能体的决策转化为具体输出。在这些模块中配置文件模块影响记忆模块和规划模块而这三个模块共同影响行动模块。3.2 技术架构二另一个由大语言模型驱动的自主Agent系统架构是2023年6月由OpenAI公司的安全系统主管Lilian Weng在其撰写了一篇博客“LLM Powered Autonomous Agents”中提出的该架构包含规划Planning、记忆Memory、工具Tools、执行Action四大模块。如下图所示图. 由大语言模型驱动的自主智能体系统概览。在由大语言模型驱动的自主智能体系统中大语言模型LLM充当智能体的大脑并由几个关键组件组成规划PlanningAgent 具备思考、规划、决策能力能有效地执行复杂任务。涉及子目标的分解Subgoal decomposition、思维链Chain of thoughts、自我批评Self-critics以及对过去行动的反思Reflection。该组件作为Agent的大脑由大语言模型LLM来担任具体包括以下两个方面子目标与分解智能体将大型任务分解为更小、更易于管理的子目标从而能够高效处理复杂任务。赋予大模型分析、推理、规划、决策能力。反思与优化智能体可以对过去的行为进行自我批评和自我反思从错误中吸取教训并针对未来的步骤进行优化从而提高最终结果的质量。这赋予大模型自主学习迭代改进的能力。记忆Memory记忆可以定义为用于获取、存储、保留和稍后检索信息的过程包含短期记忆和长期记忆两种短期记忆将所有的上下文学习比如Prompt Engineering、In-Context Learning都是利用模型的短期记忆来进行学习。长期记忆这使智能体能够在较长时间内保留和检索无限的信息的能力通常是通过利用外部向量存储和快速检索来实现。**工具Tool**工具扩展了Agent的行动能力使其能与外部环境进行交互。由于大模型一旦完成预训练其内部能力和知识边界基本固定下来而且难以拓展智能体可以利用工具如调用外部API、数据库查询来获取模型权重中确少的额外信息提升输出结果质量。其它工具如日历、计算器、代码执行能力、搜索、访问专有信息源等。**行动Action**执行由规划模块决策的具体行动包括输出文本内容、调用工具来完成任务等。在这个架构中Lilian Weng提出了AgentLLM 规划记忆行动(工具使用)的基础架构。其中 LLM 扮演了 Agent 的 “大脑”强调LLM作为系统的核心控制器提供推理、规划、决策的能力记忆组件提供记忆能力使其能够存储和检索外部的相关信息来优化决策行动组件执行决策产生的行动也可利用工具与外部环境进行交互而 Agent位于中心位置它通过协同各种组件来处理复杂的流程最终自主完成目标任务。3.3 构建AI Agent的整体技术架构通过之前对AI Agent概念框架的了解再来看构建Al Agent的技术架构对其所需要的核心组件就会有更清晰的认知。我们梳理了当前许多研究人员及机构对构建智能体技术架构的研究成果结合实践经验提炼出构建AI Agent的整体技术架构包括八个模块Profile配置、Percept感知、Planning Reasoning规划推理、Action行动、Memory记忆、Learning学习、Context Management上下文管理和 Orchestration编排。如下图所示构建AI Agent的整体技术架构具体模块说明如下**Percept感知**负责接收外部环境的输入信息包括 Text文本、Image图像、Sound音频、Video视频等多种模态数据是智能体获取外界信息的窗口为后续处理提供原始素材。**Profile配置**定义智能体角色、职责及能力边界聚焦个性化与适配特定场景。智能体通常扮演特定角色来执行任务不同角色决定智能体具备的能力及可执行操作范围。如 coder程序员角色具备代码编写、调试等能力teacher教师角色擅长知识讲解、教学规划。该模块并不是必须的根据具体的应用场景而配置。**Planning Reasoning规划与推理**智能体的 “思考决策中枢”主要有大语言模型来承担负责推理、规划并决策下一步行动。有多种推理、规划和反思的模式主要包含两类模式任务分解将复杂任务拆分为更小、更易于管理的子目标从而能够高效处理复杂任务。这方面的模式如 CoT思维链Chain of Thought 能让智能体将复杂问题分解为一系列中间步骤进行推理ToT树状思维Tree of Thought 可用于探索不同解题路径寻找最佳的解决路径方案GoT图状思维Graph of Thought基于节点关联实现更灵活的任务拆解。**反思优化**对过去的行为进行自我批评和自我反思来优化未来的决策步骤。典型模式包括ReAct 融合推理和行动Reflection反思能让智能体基于过往经验优化未来的策略Self-Consistency自一致性校验生成多个不同路径的推理结果通过结果比对筛选出高可靠性结论。这些推理、规划、反思的设计模式也叫做认知策略后面章节我们会详细解析主流的认知策略模式及其技术实现。**Action行动**负责执行由规划与推理模块输出的具体行动行动类型分为两类输出内容如生成文本、图像等多模态内容工具调用通过调用外部工具实现复杂功能如查询数据库、调用 API、控制硬件设备等。其中工具扩展了Agent的行动能力充当 agent 的抽象能力和现实世界之间的桥梁。主流工具调用模式包括指令解析调用基于自然语言指令匹配适配工具适配简单场景。函数调用Function Calling通过标准化函数定义实现工具的精准调用支持复杂参数配置。MCP 协议Model Context Protocol统一大模型与外部数据源和工具之间的通信协议提升多工具协同效率。**Memory记忆**负责信息的存储、更新与高效检索为智能体的决策提供历史经验与领域知识支撑。分为短期记忆和长期记忆短期记忆存储实时交互的临时信息如对话上下文、当前任务状态、中间推理结果核心实现方式是利用大语言模型的上下文窗口保障任务执行的连贯性。长期记忆存储需长期复用的信息如历史任务经验、领域知识库、用户偏好核心实现架构为外部向量数据库 RAGRetrieval-Augmented Generation检索增强生成支持从海量数据中快速检索相关信息辅助决策。**Learning学习**支撑智能体的持续迭代与自我优化核心是构建 “交互 - 评估 - 反思 - 学习” 的闭环学习机制首先智能体通过与环境 / 用户的交互获取反馈其次通过评价模块对反馈数据进行量化评估如准确率、效率、满意度指标等再通过反思环节深挖问题根源最后从反思结论中学习提取关键经验与洞见并更新至长期记忆并优化决策策略形成 “交互 - 评估 - 反思- 洞见 - 优化” 的全链路闭环实现持续的自我改进迭代。**Context Management上下文管理**负责上下文信息的全生命周期管理包括构建、检索、更新、修剪与压缩上下文信息核心目标是 “填充恰好适配下一步任务的上下文信息”—— 既保障信息与当前任务的强相关性也避免信息冗余导致的推理效率下降。**Orchestration编排**是智能体的 “指挥中枢”负责协调各模块的交互逻辑与执行流程确保组件有序配合实现自主、高效的任务完成。例如规划好何时以及调用哪个组件、处理数据格式转换、循环控制、异常处理如工具调用失败重试、推理超时中断、必要时人类参与复杂决策时请求人类介入、终止条件判断达成目标或触发最大迭代次数时停止。主流工作模式分为两类Agentic 模式自主代理模式支持根据任务进展自主动态调整模块调用适配复杂多变场景。Workflow 模式工作流模式基于固定流程模板调度模块适配标准化、重复性任务。具体而言AI Agent的运行流程图如下流程说明如下信息感知接入通过Percept感知模块接收外部环境或用户的输入信息包括 Text文本、Image图像、Sound声音、Video视频等多种模态数据经过基础预处理后传递至记忆模块。记忆动态更新记忆模块将实时输入信息存入短期记忆利用模型上下文窗口维护对话连贯性同时根据任务需求将历史交互记录存入长期记忆为后续通过 RAG 技术从长期记忆如向量数据库中检索相关历史经验或领域知识为决策提供精准知识支撑。**上下文构建**上下文管理模块联合记忆模块整合系统指令、短期记忆对话上下文、当前任务状态、长期记忆检索结果历史交互记录、用户偏好、Profile 角色配置、通过RAG技术从知识库中检索的关联信息如公司季度数据、历史报告模板、行业规范、可用工具Available Tools等多源信息。对这些信息进行融合优化与冗余修剪生成精准上下文信息传递至规划与推理模块。**决策策略生成**规划与推理模块基于精准上下文进行思考、规划、推理过程如采用 CoT、ToT 、ReAct等认知策略进行推理分析将复杂任务拆解为子目标序列生成行动策略清单并决策出下一步的行动。推理过程中可实时与上下文管理模块交互若发现信息缺失动态补充缺失信息如请求记忆模块检索最新行业数据。**行动执行与反馈**行动模块执行由规划与推理模块输出的具体行动行动可以是输出文本、图片等多模态内容也可以是调用工具与外部环境交互如通过Function Calling模式调用指定工具如调用公司数据库API提取销售数据、通过MCP协议同步调用工具返回结果。行动结果会对环境产生新的影响并更新内部状态同时决策和行动的操作轨迹及其结果也保存为记忆信息。学习迭代优化学习模块接收行动反馈数据启动“交互 - 评估 - 反思 - 学习”闭环通过评价指标量化任务完成质量反思深挖问题根源提炼结构化经验及洞见并更新至长期记忆。使智能体能够根据过去的经验优化未来的决策实现自主改进。循环与终止编排模块评估任务完成情况若未达成目标则启动下一轮“感知-记忆-上下文-决策-行动-学习”循环若达成目标或触发终止条件如最大迭代次数则停止运行并输出最终结果。整个流程中Orchestration编排模块始终承担“中枢调度”角色协调各个组件间的交互流程并评估其进展情况进行异常错误恢复如设置检查点或在遇到障碍时暂停并请求人类反馈等、循环控制直达到目标或触发停止条件如最大迭代次数时终止使整个系统高效运行确保智能体自主完成目标任务。接下来我们针对各模块的技术实现细节展开深入解析。如何系统的学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。一直在更新更多的大模型学习和面试资料已经上传带到CSDN的官方了有需要的朋友可以扫描下方二维码免费领取【保证100%免费】01.大模型风口已至月薪30K的AI岗正在批量诞生2025年大模型应用呈现爆发式增长根据工信部最新数据国内大模型相关岗位缺口达47万初级工程师平均薪资28K数据来源BOSS直聘报告70%企业存在能用模型不会调优的痛点真实案例某二本机械专业学员通过4个月系统学习成功拿到某AI医疗公司大模型优化岗offer薪资直接翻3倍02.大模型 AI 学习和面试资料1️⃣ 提示词工程把ChatGPT从玩具变成生产工具2️⃣ RAG系统让大模型精准输出行业知识3️⃣ 智能体开发用AutoGPT打造24小时数字员工熬了三个大夜整理的《AI进化工具包》送你✔️ 大厂内部LLM落地手册含58个真实案例✔️ 提示词设计模板库覆盖12大应用场景✔️ 私藏学习路径图0基础到项目实战仅需90天第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】