深圳网站建设哪家公司好,链接交易网,ppt模板免费下载完整版免费无需会员,天津业之峰装饰公司怎么样本文介绍了Anthropic的Skills概念#xff0c;即如何将特定任务的“经验/流程/指南”打包成可复用的“知识胶囊”#xff0c;让Agent按需加载并遵循#xff0c;提升任务执行质量。文章探讨了如何通过LangChain的DeepAgents框架实现Skills的支持#xff0c;包括技能发现、系统…本文介绍了Anthropic的Skills概念即如何将特定任务的“经验/流程/指南”打包成可复用的“知识胶囊”让Agent按需加载并遵循提升任务执行质量。文章探讨了如何通过LangChain的DeepAgents框架实现Skills的支持包括技能发现、系统提示注入、渐进式加载和任务执行等环节。通过实际案例测试展示了Skills在复杂任务处理中的优势如提高任务可靠性、优化上下文利用、易于共享维护等。最后文章展望了Skills作为可迁移能力范式的发展趋势并提供了创建Skills的几种方法供开发者参考。1、Skills回顾 一种Agent能力注入方式Skills 是 Anthropic 提出的一种全新的 Agent 能力注入方式。一个 Skill 本质上就是一个文件夹里面至少有一个 SKILL.md 描述文件另外还可以附带参考资料、模板、脚本、代码等资源。Agent 在需要时读取或执行这些内容相当于临时“加载一套做事方法”从而更稳定、更高质量地完成特定任务。【Skills如何诞生】Skills 的诞生离不开 Anthropic 的拳头产品 Claude Code。作为 “Agentic Coding” 的代表作如今也逐步扩展到通用任务它的一个重要设计是给Agent配备“一台电脑”— 让它更多地访问本地计算机环境如 Shell、文件系统、浏览器等来完成复杂任务用更少的原子工具完成更长链路的工作。但这里带来一个问题工具数量可能更少但组合使用的复杂度可能更高 — 需要更好的步骤规划、处理中间结果、子任务拆分等。所以借助 Skills把“经验/流程/指南 必要资源”打包成可复用的知识胶囊用来教会 Agent “怎么做”也就顺理成章。【Skills的渐进式加载】Skills 的核心特点是“渐进式加载”。简单说Agent 一开始只会加载每个Skill的基本信息名称、简短描述等 YAML 元数据到系统提示只有在后续过程中当 Agent 认为需要某个Skill时才会进一步加载详情 SKILL.md 正文甚至更多资源模板、脚本等这样的好处一是节省上下文窗口 Token二是降低 LLM 的认知负荷不需要在每次调用都“背着整本操作手册”而是”先看到目录再按需翻阅对应章节“。因为Skills的“目录 文档 资源”的结构足够简单、可迁移、可复用Skills 已经被越来越多工具生态借鉴与支持如Codex等各类编程智能体等。2、问题如何让通用框架也支持Skills如果研究 Skills 的工程实现它其实并不依赖某种“特殊的LLM接口”本质上是一套可移植的组合Prompt 工程 工具调用 文件组织。我们用下图表示Skills需要Agent所具备的能力发现与识别SkillsAgent 需要能在已配置的目录中发现Skills也就是扫描并识别其中的各个Skill读取每个Skill的元数据通常来自 SKILL.md中顶部的name和 description即了解”有哪些可用的Skill它们大致能做什么“。系统提示注入将Skills元数据注入系统提示 - 让LLM每轮对话开始前能看到有哪些技能可用以及各自概略用途同时还需要附上必要的使用指南例如渐进式加载的原则、何时加载详情、如何执行脚本等。渐进式加载在模型决定使用某个技能时能够读取完整说明以激活技能 - 即加载 SKILL.md的正文完整任务指南/SOP/最佳实践到上下文让后续行动有据可依。任务执行与完成模型会按 SKILL.md 的流程调用必要工具来访问资源并推进任务比如读写文件、调用 API甚至运行 Shell 脚本、安装依赖、执行命令等至此一个 Skills 的“能力闭环”就完成了发现技能 → 注入目录 → 按需加载 → 按 SOP 执行。接下来我们以DeepAgents框架来实现这个“能力闭环”。3、实现让DeepAgents也能支持SkillsDeepAgents 是 LangChain 新开源的一个通用开发框架用来开发处理复杂多步任务的 Agent。它还提供了一个交互式命令行工具CLI可以看作一个本地的 AI 编程与通用助手。你基本上可以这么映射DeepAgents 对应 Claude Agent SDKDeepAgents-CLI 对应 Claude Code重要的是DeepAgents-CLI 提供了对 Skills 的支持。这意味着我们可以直接透过它的源代码理解 Skills 在 LangChain 体系里如何实现并进一步把这套实现方式“迁移”到更通用的 DeepAgents 开发框架中。我们依次来看如何让DeepAgents支持Skills的上述四个环节。一、发现与识别Skills这是最简单的环节扫描设定的 Skills 目录如 ~/.deepagents/agent/skills遍历其中各个技能子目录读取每个子目录内的 SKILL.md并解析其头部 YAML区域提取 name、description 等信息并格式化形成一个 SkillMetadata 列表SkillMetadata 列表的作用更像一个目录索引它将会在下一步被注入到 System Prompt 的专用区域。二、系统提示注入那么在什么时候识别Skills并注入系统提示呢一种方法是自行在创建create_agent时通过system_prompt静态注入。但是更优雅的方式是借助LangChain1.x的Middleware中间件机制在不改动Agent主流程的前提下通过”钩子“函数来控制其内部运行机制。以下是如何借助一个“SkillsMiddleware”将Skills元数据注入定义一个 SkillsMiddleware在before_agent钩子函数中准备Skills的提示片段并在wrap_model_call 钩子函数中将其附加到 system_prompt上。Skills提示片段借助上述的Skills识别将 SkillMetadata 列表组成一段列表文本并附上一段Skills使用的指令与提示。形成类似以下的提示片段即可** 可用Skill:fullstack-template-generator: .....web-research: ......** 如何使用(渐进式加载原则):Skills follow a progressive disclosure pattern......** 什么时候使用Skill:......** 如何执行Skill中的脚本:......** Skill使用流程示例......** Skill使用注意点......将Skills提示注入system_prompt在 wrap_model_call 方法中将上述 Skills 提示附加到 system_prompt :classSkillsMiddleware(AgentMiddleware): #从skills目录生成skills的metadata描述、名称、作用 defbefore_agent(self, state: SkillsState, runtime: Runtime) - SkillsStateUpdate | None: defwrap_model_call( self, request: ModelRequest, handler: Callable[[ModelRequest], ModelResponse], ) - ModelResponse: # ......准备skills提示片段....... # 给system_prompt注入Skills使用的系统提示 if request.system_prompt: system_prompt request.system_prompt \n\n skills_section else: system_prompt skills_section return handler(request.override(system_promptsystem_prompt))这个SkillsMiddleware将在后续创建Agent时传入用来在不增加人工步骤的情况下让 Agent “知晓”当前有哪些技能可用并匹配任务需求。三、渐进式加载当模型决定需要使用某个 Skill 时会触发接下来的渐进式加载流程。由于 DeepAgents 框架默认给 Agent 配备了文件系统访问的工具因此可以借助 read_file 工具读取完整的SKILL.md以拿到完整的Skill”说明书“。四、任务执行与完成拿到完整的Skill说明后就如同人拿到详尽的操作手册一样随后在任务过程中按需加载必要的附加资源脚本、参考资料等、调用必要的工具以完成任务。以一个 web-research 的Skill为例它定义了一个标准的研究流程先围绕研究主题制定多角度的研究计划再使用子智能体并行展开检索与整理最后汇总研究结果并输出标注数据源的报告。那么在这个Skill”指导“下的完整交互过程如下【关于Skills需要的工具】最后需要补齐一个重要的问题在 Skills 的闭环里有一些工具是“刚需”没有它们 Skills 很难完整跑起来。文件系统工具由于Skills的动态加载特征 以及针对长距离复杂任务而设计具备Skills能力的Agent通常需要配备可靠的文件系统后端及访问工具。不过在 DeepAgents 中这部分文件访问工具会被默认注入因此不需要再手工补齐这一块Shell命令工具由于很多Skill 需要执行脚本例如运行 Python 代码、或者执行 OS 命令例如拷贝文件、安装依赖那么还需要配备一个 Shell 工具。你可以借助 Middleware 注入也可以用 tool 定义...#通过Middleware或者直接提供shell工具tool(shell, description...)def shell_tool( command: str, runtime: ToolRuntime[None, AgentState],) - ToolMessage | str:try:... result subprocess.run( command, checkFalse, shellTrue, capture_outputTrue, textTrue, timeoutself._timeout, envself._env, cwdself._workspace_root, )...必须强调Shell 工具风险较高建议加入人类审批HITL或沙箱环境并限制执行范围、超时时间、输出大小等。PART 04测试一个具有Skills能力的Deep Agent现在把前面实现的 Skills 中间件、Shell 工具等集成到一个 Deep Agent 中做一次端到端测试验证 Skills 是否真的能在 DeepAgents 框架里跑出预期的渐进式加载与长流程执行效果。【创建Deep Agent】主体代码如下省略部分细节...# 系统指令 SYSTEM_PROMPT 你是拥有多种技能的智能体能够帮助用户完成各种任务。......def make_backend(runtime): return CompositeBackend( defaultFilesystemBackend(), routes{ /fs/: FilesystemBackend(root_dir./fs,virtual_modeTrue), /memories/: StoreBackend(runtime) } )....#Skills中间件设置skills存放的目录skills_middleware SkillsMiddleware( skills_dirUSER_SKILLS_DIR, assistant_idagent, project_skills_dirNone,)#Shell中间件用来给agent注入Shell工具#也可以创建Toolshell_middleware ShellMiddleware( workspace_rootWORKSPACE_ROOT, timeout120.0, max_output_bytes100_000,)#一个子智能体使用search、fetch_url工具做信息检索与总结research_subagent { name: search-agent, description: 使用互联网工具进行信息搜索、访问与研究的智能体, system_prompt: 你是智能Web搜索与研究智能体。, tools: [search,fetch_url], model:model }#创建主智能体使用上面的子智能体、中间件agent create_deep_agent( modelmodel, tools[], subagents[research_subagent], backendmake_backend, middleware[skills_middleware, shell_middleware], system_promptSYSTEM_PROMPT,debugTrue).with_config({recursion_limit: RECURSION_LIMIT})简单说明配置一个后端(用于持久化读写的装置默认使用本地文件系统创建中间件分别用来注入Skills系统提示与增加Shell执行工具创建Research子智能体用来并行完成独立的搜索研究子任务创建主智能体集成上述的中间件与子智能体【测试web-research技能】我们以上面提到的web-research技能为例来测试。为了便于调试首先使用LangGraph启动智能体langgraph dev准备好Skill从 deepagents-cli源代码 的 examples 目录中复制 web-research 技能到上面代码对应的目录 USER_*SKILLS_*DIR 。现在输入一个测试任务观察Agent的执行过程。1首先会看到SkillsMiddleware中间件的before_agent被调用以获得目前Skills元数据并被注入系统提示2随后进入如下过程– LLM判断该任务可以使用web-research技能– LLM需要读取SKILL.md以获取技能详情– LLM返回一个read_file工具调用以读取SKILL.md3在使用read_*file工具读取SKILL.md以后此时LLM“学习到”如何来展开研究并开始第一步要求调用write_*file创建研究计划4在使用write_file工具创建计划后LLM要求派发多个子任务 — 调用DeepAgents 内置task工具将子任务派发给子智能体并行研究5子智能体执行研究任务并把研究成果写入到文件系统。6在子任务全部结束后主Agent负责汇总与合成最后的的报告写入文件系统并最终输出用户的反馈结果整个过程完全符合我们对Skills的使用预期通过把一个标准化的 Web 研究操作流程SOP定义成 Skill给 LLM 注入了一颗“知识胶囊”。它既能利用推理能力灵活调用工具完成任务又能明显减少无约束的“自由发挥”从而提升可控性与稳定性。最后对于正在迷茫择业、想转行提升或是刚入门的程序员、编程小白来说有一个问题几乎人人都在问未来10年什么领域的职业发展潜力最大答案只有一个人工智能尤其是大模型方向当下人工智能行业正处于爆发式增长期其中大模型相关岗位更是供不应求薪资待遇直接拉满——字节跳动作为AI领域的头部玩家给硕士毕业的优质AI人才含大模型相关方向开出的月基础工资高达5万—6万元即便是非“人才计划”的普通应聘者月基础工资也能稳定在4万元左右。再看阿里、腾讯两大互联网大厂非“人才计划”的AI相关岗位应聘者月基础工资也约有3万元远超其他行业同资历岗位的薪资水平对于程序员、小白来说无疑是绝佳的转型和提升赛道。对于想入局大模型、抢占未来10年行业红利的程序员和小白来说现在正是最好的学习时机行业缺口大、大厂需求旺、薪资天花板高只要找准学习方向稳步提升技能就能轻松摆脱“低薪困境”抓住AI时代的职业机遇。如果你还不知道从何开始我自己整理一套全网最全最细的大模型零基础教程我也是一路自学走过来的很清楚小白前期学习的痛楚你要是没有方向还没有好的资源根本学不到东西下面是我整理的大模型学习资源希望能帮到你。扫码免费领取全部内容最后1、大模型学习路线2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、 入门必看大模型学习书籍文档.pdf书面上的技术书籍确实太多了这些是我精选出来的还有很多不在图里4、AI大模型最新行业报告2026最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、面试试题/经验【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】6、大模型项目实战配套源码适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】