网站开发 组织架构,乘客电梯做推广的网站,怎么做简单网站首页,wordpress调整配置文件随着AI 2.0时代的到来#xff0c;大模型在知识、逻辑和推理能力上取得了突破#xff0c;但仍存在幻觉、知识时效性、领域知识不足及数据安全等问题。RAG#xff08;检索增强生成#xff09;技术应运而生#xff0c;通过结合外部知识库与大模型#xff0c;实现检索与生成的…随着AI 2.0时代的到来大模型在知识、逻辑和推理能力上取得了突破但仍存在幻觉、知识时效性、领域知识不足及数据安全等问题。RAG检索增强生成技术应运而生通过结合外部知识库与大模型实现检索与生成的有机结合弥补大模型在领域问题和实时任务上的不足。RAG技术可广泛应用于企业知识管理、客户支持、医疗、金融等领域提供实时、高准确性和领域专有知识的解决方案。RAG技术流程包括索引、检索和生成三个核心阶段通过检索与生成的有机结合显著提升大模型在领域任务中的准确性和实时性。与微调相比RAG更适用于需要动态响应、频繁更新外部知识的场景而微调则适合固定领域内的深度优化与推理。一、为什么选择 RAG 技术二、RAG 技术的定义三、RAG 技术应用场景三、RAG 标准技术流程3.1、索引Indexing3.2、检索Retriever3.3、生成Generation四、RAG 与微调的选择一、为什么选择 RAG 技术在由 OpenAI ChatGPT 引领的 AI 2.0 大模型时代我们见证了大模型LLM, Large Language Model在知识、逻辑、推理能力上的突破其通识理解能力已超越许多人类专家并且仍在飞速进步尚未达到顶峰。Scaling Law、压缩产生智能、边际成本为零就是理想中的 AGIAI 2.0 技术范式的变革正在引发 AI 软件时代的巨大变迁正如移动互联网时代的到来使得 PC 时代的软件应用迅速成为历史一样大模型将带来大量应用机会AI“杀手级应用”将不断涌现且数量会越来越多。作为软件工程师我们正处于一个充满机遇的历史时刻拥抱 AI 应用已成为必然选择。尽管大模型功能强大但它当前仍存在幻觉、知识时效性、领域知识不足及数据安全问题的局限性。RAGRetrieval Augmented Generation检索增强生成技术正是在这样的背景下应运而生成为了当前大模型应用的重要技术方向文档问答类 LLM RAG 应用也被认为是 AI 2.0 时代最早落地的应用类型之一。幻觉模型基于概率生成文本有时会输出看似合理但实际错误的答案。知识时效性指模型难以处理实时信息因为训练过程耗时且成本高昂模型一旦训练完成就难以获取和处理新信息。领域知识不足大模型的知识来源于训练数据这些数据主要来自公开的互联网和开源数据集无法覆盖特定领域或高度专业化的内部知识。数据安全性企业应用中尤为重要如何在确保数据安全的前提下使大模型有效利用私有数据进行推理和生成是一个具有挑战性的问题。在这里插入图片描述为了解决这些问题仅依赖 LLM 本身是不足的。RAGRetrieval-Augmented Generation检索增强生成技术应运而生。通过将非参数化的外部知识库、文档与大模型相结合RAG 使模型在生成内容之前能够先检索相关信息从而弥补模型在知识专业性和时效性上的不足减少生成不确定性在确保数据安全的同时充分利用领域知识和私有数据。选择 RAG而不是直接将所有知识库数据交给大模型处理主要是因为模型能够处理的 token 数有限输入过多 token 会增加成本。更重要的是提供少量相关的关键信息能够带来更优质的回答。在图中 RAG 的案例中用户提出了一个涉及 OpenAI 公司 CEO Sam Altman 的实时问题询问其在短时间内被解雇和重聘的事件。在不使用 RAG 的情况下由于大语言模型LLM无法访问实时更新的外部信息用户只能得到一个无法提供有效回答的结果。而通过 RAG 技术将相关的实时信息转化为知识库内容并通过检索模块检索到与用户查询高度相关的文档片段最终生成的回答不仅准确而且涵盖了实时信息的背景和细节为用户提供了有价值的解答。二、RAG 技术的定义RAG 技术是一种结合检索与生成的自然语言处理NLP模型架构。这个技术由 Facebook AI 于 2022 年提出旨在提升生成式模型在处理开放域问答、对话生成等复杂任务中的性能。RAG 通过引入外部知识库利用检索模块Retriever从大量文档中提取相关信息并将这些信息传递给生成模块Generator从而生成更准确且有用的回答。RAG 模型的核心思想在于通过检索与生成的有机结合弥补大模型在处理领域问题和实时任务时的不足。传统的生成模型在面对复杂问题时往往由于知识储备不足生成出错误或无关的回答。而 RAG 通过检索模块获取相关的背景信息使生成模块能够参考这些信息从而生成更具可信度和准确性的答案。这种方法不仅增强了生成内容的准确性还提高了模型在应对特定领域知识和动态信息时的适应能力。三、RAG 技术应用场景RAG 技术凭借其将检索与生成相结合的优势可广泛应用于多个领域和场景满足了在大模型应用中实时性、高准确性和领域专有知识获取的需求。在企业或领域知识管理与问答系统中RAG 能够实时从企业或领域的私有知识库中检索相关信息确保生成的回答不仅准确且符合企业内部的最新动态解决了大模型在处理特定领域知识时的局限性。在客户支持与智能客服系统中RAG 可以动态地将用户的询问与最新的产品信息、客服知识等外部数据相结合生成的回答更加贴合客户的实际需求且满足企业要求。RAG 在医疗、金融等对数据准确性、时效性要求极高的专业领域中尤为重要。通过实时检索最新的研究成果、市场动态或文档资料RAG 确保了生成的内容不仅基于最新信息同时具备领域专有知识的深度分析能力。这些场景中RAG 的应用有效优化了大模型的固有缺陷为大模型应用提供了更高的可靠性和场景可落地性。三、RAG 标准技术流程RAG 标准流程由索引Indexing、检索Retriever和生成Generation三个核心阶段组成。在这里插入图片描述索引阶段通过处理多种来源多种格式的文档提取其中文本将其切分为标准长度的文本块chunk并进行嵌入向量化embedding向量存储在向量数据库vector database中。检索阶段用户输入的查询query被转化为向量表示通过相似度匹配从向量数据库中检索出最相关的文本块。生成阶段检索到的相关文本与原始查询共同构成提示词Prompt输入大语言模型LLM生成精确且具备上下文关联的回答。通过这一流程RAG 实现了检索与生成的有机结合显著提升了 LLM 在领域任务中的准确性和实时性。3.1、索引Indexing索引是 RAG 系统的基础环节包含四个关键步骤。首先将各类数据源及其格式如书籍、教材、领域数据、企业文档等txt、markdown、doc、ppt、excel、pdf、html、json 等格式统一解析为纯文本格式。接着根据文本的语义或文档结构将文档分割为小而语义完整的文本块chunks确保系统能够高效检索和利用这些块中包含的信息。然后使用文本嵌入模型embedding model将这些文本块向量化生成高维稠密向量转换为计算机可理解的语义表示最后将这些向量存储在向量数据库 (vector database) 中并构建索引完成知识库的构建。这一流程成功将外部文档转化为可检索的向量支撑后续的检索和生成环节。3.2、检索Retriever检索是连接用户查询与知识库的核心环节。首先用户输入的问题通过同样的文本嵌入模型转换为向量表示将查询映射到与知识库内容相同的向量空间中。然后通过相似度度量方法检索模块从向量数据库中筛选出与查询最相关的前 K 个文本块这些文本块将作为生成阶段输入的一部分。最后通过相似性搜索检索模块有效获取了与用户查询切实相关的外部知识为生成阶段提供了精确且有意义的上下文支持。3.3、生成Generation生成是 RAG 流程中的最终环节。将检索到的相关文本块与用户的原始查询整合为增强提示词Prompt并输入到大语言模型LLM中。LLM 基于这些输入生成最终的回答确保生成内容既符合用户的查询意图又充分利用了检索到的上下文信息使得回答更加准确和相关充分使用到知识库中的知识。通过这一过程RAG 实现了具备领域知识和私有信息的精确内容生成。四、RAG 与微调的选择在大模型专业领域场景的应用中RAG 与微调都是可行的选择选择的关键在于应用场景更注重外部知识的需求还是模型领域能力的需求。RAG 擅长于高效整合外部知识尤其在频繁处理实时信息或者需要回答复杂且依赖外部知识的问题、回答需要具备可解释性需求时RAG 通过结合检索系统和生成模型能够实时利用最新信息生成上下文相关且准确的答案。因此当应用场景对外部知识的利用有较高需求时RAG 是更为适宜的方案。微调更适合需求稳定、领域知识固定且不需要频繁更新知识库的场景。通过使用特定领域的数据对模型进行深度优化微调可以提升模型在特定任务或领域中的推理能力确保输出内容的专业性和一致性。因此当任务侧重于某一特定领域并且对实时信息的依赖较低时微调更能满足这些需求。在这里插入图片描述总的来说RAG 更适用于需要动态响应、频繁更新外部知识的场景而微调则适合固定领域内的深度优化与推理。当应用场景中既需要利用最新的外部知识又需要保持高水平的领域推理能力时可以考虑结合使用 RAG 和微调以实现最优的性能和效果。如何系统的学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。一直在更新更多的大模型学习和面试资料已经上传带到CSDN的官方了有需要的朋友可以扫描下方二维码免费领取【保证100%免费】01.大模型风口已至月薪30K的AI岗正在批量诞生2025年大模型应用呈现爆发式增长根据工信部最新数据国内大模型相关岗位缺口达47万初级工程师平均薪资28K数据来源BOSS直聘报告70%企业存在能用模型不会调优的痛点真实案例某二本机械专业学员通过4个月系统学习成功拿到某AI医疗公司大模型优化岗offer薪资直接翻3倍02.大模型 AI 学习和面试资料1️⃣ 提示词工程把ChatGPT从玩具变成生产工具2️⃣ RAG系统让大模型精准输出行业知识3️⃣ 智能体开发用AutoGPT打造24小时数字员工熬了三个大夜整理的《AI进化工具包》送你✔️ 大厂内部LLM落地手册含58个真实案例✔️ 提示词设计模板库覆盖12大应用场景✔️ 私藏学习路径图0基础到项目实战仅需90天第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】