自己做网站做淘宝客,粉丝社区网站怎么做,成功网站案例分析,百度一下你就知道百度官网DeepSeek app上架18天之后#xff0c;便在全球160多个国家登顶#xff0c;日活跃用户数突破1500万#xff0c;成了全球增速最快的AI应用。 并且在这个过程中#xff0c;它曾一度让美股市值一晚上蒸发超1万亿美金#xff0c;英伟达股价单日下跌16%。 能获得这个成就的原因只…DeepSeek app上架18天之后便在全球160多个国家登顶日活跃用户数突破1500万成了全球增速最快的AI应用。并且在这个过程中它曾一度让美股市值一晚上蒸发超1万亿美金英伟达股价单日下跌16%。能获得这个成就的原因只有一个那就是他们发布了一个免费且无比聪明的模型——DeepSeek R1。尤其是“聪明”这个特性让大量的提示词技巧开始失效你只需要很简单地表述你的需求便能获得超出预期的回答。如果回顾大语言模型发展历程的话2025年1月20日DeepSeek R1的发布会是一个注定被记录的时间节点2022年11月30日ChatGPT的发布让大模型进入了大众视野而两年后的DeepSeek R1则是让一个足够优秀的模型变得触手可及。作为一名在B站/YouTube做了一年多ChatGPT等AI产品教学教学视频播放量超400万的AI博主一方面我很高兴原来教授的技巧成了无用的屠龙之术有更多人可以更轻松容易地使用AI去辅助自己的工作、学习和生活了。另一方面经过我这几天每天5小时以上的爆肝体验以及看了一些网友们的测试之后我发现很多人对大语言模型依然怀着错误的认知和预期而这很可能会阻碍使用R1的体验。所以更符合实际的情况是你不再需要那么多的提示词技巧但是还有两点非常关键。1. 你需要理解大语言模型的工作原理与局限这能帮助你更好地知道AI可完成任务的边界2. 在和R1合作时你最好有管理者的思维和经验你需要知道如何向R1这个聪明程度比你高很多的下属布置你的任务。所以带着这样的预期我为你准备了19条帮助你更好使用DeepSeek R1的经验包括5个大语言模型的特点7项与R1对话的技巧以及7种验证无效你可以舍弃的提示策略。这篇长文主要包含以下四个部分第一部分我会向你解释DeepSeek R1模型和你可能使用过的豆包、ChatGPT等产品的差异为什么这个模型可以使用更简单的提示策略了。第二部分我会向你介绍大型语言模型最重要的5个特点让你理解为什么AI在完成某些任务时很糟糕以及它的能力与知识边界是什么样的。第三部分则会向你介绍使用DeepSeek R1的所谓“技巧”其实这些技巧你更多可以理解为是作为领导向聪明的下属布置任务时所需要关注的点。第四部分则是会谈及此前很有效但是现在已失效的提示策略如果你有丰富的大模型使用经验了你可以在这里看看你可以舍弃什么。不过在做任何深入的介绍之前如果你还没使用过DeepSeek的话强烈建议你先去做一些尝试再返回看文章效果会更佳你有两种官方使用方式1. 访问DeepSeek官网https://chat.deepseek.com/2. 在AppStore或安卓应用商店搜索“DeepSeek”下载免费使用即可在使用时注意聊天输入框下方的两个选择“深度思考R1”和“联网搜索”。关于“深度思考R1”1. 当你需要更简单快速的回答时不必打开“深度思考”使用默认模型V3即可2. 当你需要完成更复杂的任务你希望AI输出的内容更结构化更深思熟虑时你应该打开“深度思考R1”选项这也是今天我这篇文章主要在讨论的模型关于“联网搜索”1. 当你的任务所涉及的知识在2023年12月之前你无须打开“联网搜索”功能大模型本身就有此前被充分训练过的语料知识2. 当你的任务所涉及的知识在2023年12月及之后时比如昨天NBA比赛的赛果硅谷对DeepSeek R1的评价等你必须打开“联网搜索”功能否则大模型在回答时会缺乏相应的知识。推理模型与指令模型在阐述任何技巧之前你最先需要知道的是DeepSeek的R1是个与你日常使用的对话类AI非常不同的模型。像OpenAI的GPT-4o、DeepSeek V3、豆包等都属于指令模型instruct model这类模型是专门设计用于遵循指令生成内容或执行任务的。而DeepSeek R1属于推理模型reasoning model专注于逻辑推理、问题解决的模型能够自主处理需要多步骤分析、因果推断或复杂决策的任务。实际上还有一个知名的模型也就是OpenAI的o1也是推理模型但你必须每个月花20美元成为plus会员才能使用且每周只有50次的使用权限。想要更多那请掏出200美金/每月也就是1437元。而DeepSeek R1现在完全免费从我实际的体验来说R1在大量的写作、写代码的任务上甚至比o1更强。按理说R1擅长数学推理、编程竞赛是很合理的事它也只应该擅长这些任务。但是令人意外的是有了超强的推理能力之后R1似乎在所有任务上都获得了质的飞跃“涌现”出了意料之外的技能。在原本指令模型的时代AI的能力受到了很强的限制你需要通过提示词的各类技巧才能激发模型更好的表现而对普通人来说学这些技巧实在让人头大不已。在DeepSeek R1模型下你只需要清晰、明确地表达你的需求就好了。就像你拥有一个比你聪明得多的清北毕业的具有10年工作经验的下属你不需要一步步套路它指导它的工作你只需要把所有他需要知道的信息告诉他然后将你的任务布置下去即可。但如何布置任务呢首先你需要知道这个下属的特点。理解大型语言模型的本质特征尽管像DeepSeek R1这样的推理模型相比指令模型有了非常大的进步你不需要那么多技巧了但他依然是个大型语言模型LLM他依然存在语言模型的局限性理解它的特点将会帮助你更好的应用他。特点1: 大模型在训练时是将内容token化的大模型所看到和理解的世界与你不一样在理解模型行为之前我们需要了解它是如何“学习”的。大型语言模型的预训练本质上是让模型建立文本片段之间的关联规律。为了实现这个目标所有训练数据包括书籍、网页、对话记录等都会经过特殊处理首先将文本切割成称为token的基本单元类似文字的“碎片”然后将这些token转化为数字编码。这个过程就像把现实世界的语言翻译成只有模型能理解的“密码本”。在推理模型出来之前很多人非常喜欢用来考察大模型智商的一个问题是Strawberry这个单词中有几个r字母此前像GPT-4、GPT-4o这类被认为很强大的大模型也没法把这个问题回答准确这不是因为模型不够“聪明”而是它在被训练时的特点导致了这一结果。而所谓的token化就是大模型为了训练会将部分单词、中文字符进行拆分分解比如在GPT3.5和GPT4的训练中“词”这个字就被拆成了两个tokenStrawberry则被拆成三个token分别是“Str”“aw”“berry”。这种切割方式取决于训练时采用的tokenizer算法也可能把生僻词拆解成无意义的片段。举这个例子是想告诉你大模型所看到的世界和你所看到的不一样。当你在数字母时看到的是连续的字符流而模型看到的却是经过编码的token序列。所以类似于数单词中的字母数量或者精确要求大模型为你输出特定字数的内容都是有些强模型所难的他的机制决定了他不擅长处理这些任务。当然现在推理模型理论上可以完成我例子中的任务但是你看看他推理的过程……是不是觉得还是有些费劲有些于心不忍。特点2大模型知识是存在截止时间的虽然DeepSeek R1在2025年1月才正式发布但其基础模型的训练数据窗口期早在数月前就已关闭。这就像出版一本百科全书——从资料收集到最终付印需要完整的生产周期。具体来说存在三重时间壁垒1. 预训练阶段需要处理PB级原始数据2. 数据清洗需要经历去重、脱敏、质量验证等工序3. 后期还要进行监督微调、强化学习、基于人类反馈的强化学习RLHF等迭代优化。这种知识滞后性会带来一系列的问题和幻觉比如DeepSeek R1目前还认为GPT-4是世界上最强的模型GPT-4o、Claude3.5Sonnet等2024年后发布的模型它是不知道的它也无法告诉你2024巴黎奥运会赛事结果无法告诉你2025年春晚或春节档的电影表现。这些都是模型训练的特点导致的很多人拿类似任务去问R1发现R1答非所问轻易得出R1模型太差的结论。事实上这就像要求2020年出版的《辞海》必须记载2021年的新词——本质是知识载体的物理特性使然。要突破这种知识限制也有方法1. 激活联网搜索功能给R1提供自主搜索查找信息的权力2. 补充必要知识你可以通过上传文档、在提示词中提供充足的信息之后再让R1去为你执行具有更近时效性的任务。特点3大模型缺乏自我认知/自我意识DeepSeek R1或者任何模型其实都缺乏“我是谁”的概念如果他自发有了那可能说明AGI临近我们可能反而该警惕了。很多模型都不知道自己叫xx模型这是很正常的现象除非大模型厂商在部署的时候在系统提示词中做了设定或者预训练完成后用了特定的语料进行微调。以及因为这种自我认知的缺乏会带来两个问题1. AI有时候会给出错误的自我认知比如deepseek以及很多别的模型都可能认为自己是ChatGPT因为ChatGPT发布后很多人将自己与ChatGPT的对话内容发布在了网上。所以你在问一个模型“你是谁”“who are you”的时候模型偶尔的幻觉是很常见的现象。2.你没法让DeepSeek R1来告诉你它自己有什么样的特点使用它有哪些技巧等等。这也是我依然需要依靠大量自己的脑力算力去写作这篇文章的原因。特点4记忆有限多数大模型都有上下文长度的限制deepseek R1目前提供的上下文只有64k token长度官方API文档的说明实际聊天对话的长度待确认对应到中文字符大概是3万4万字这带来的问题是你没法一次投喂太长的文档给他以及你没法与他进行太多轮次的对话。当你发送的文档长度超过3万字时你可以理解为他是通过RAG也就是检索增强的方式去选取你文档中的部分内容作为记忆的一部分来展开与你的对话的而不是全部内容。而当你与他对话的轮次过多时他很可能会遗忘你们最初聊天的内容。这部分的限制在你开展让AI写代码的任务时会感受尤其明显。特点5输出长度有限相比上下文对话的输入长度大模型的输出长度则会更短得多多数大模型会将输出长度控制在4k或者8k也就是单次对话最多给你2千4千中文字符。所以你没法复制一篇万字长文让DeepSeek一次性完成翻译也不能让DeepSeek一次性帮你写一篇5000字以上的文章这些都是模型输出长度限制导致你需要理解这个问题的存在。如果要解决这个问题的话翻译类的任务你可以通过多次复制或者自己写代码去调用API多次执行任务完成一篇长文甚至一本书的翻译。而长文写作类的任务比较妥当的做法是先让R1梳理框架列出提纲目录再根据目录一次次分别生成不同阶段的内容。有效的R1使用技巧技巧1提出明确的要求能说清楚的信息不要让DeepSeek去猜。DeepSeek虽然很聪明但它不是你肚子中的蛔虫你需要明确告诉DeepSeek需要他帮你做什么做到什么程度。比如如果你复制一段英文文本给它你需要明确表达你的指令也就是你需要它做什么。否则DeepSeek并不会理解你想要做什么。是翻译总结还是你要学英语让他出题这些信息不要让R1去猜。又比如你想写一篇500字的公众号文章那你就明确表达你写的文章主题需要500字虽然我们前面提过了大模型并不擅长计算数字它大概率只会给你返回300-700之间长度的文章但这至少是大致符合你的篇幅要求的。错误示范为跨境电商平台写个用户增长方案优化方案为服饰跨境电商平台设计30天新用户增长计划我们期望重点突破东南亚市场目标国家印尼/越南/泰国。你的方案中需包含社交媒体运营策略、KOL合作框架、ROI预估模型技巧2要求特定的风格具有思维链的R1在进行特定风格的写作时相比其他模型我发现R1已经出现了断层领先的水平比如让R1用李白的风格写诗按贴吧暴躁老哥的风格骂人用鲁迅的文风进行讽刺或者模仿任意作家风格进行写作按脱口秀演员风格创作脱口秀脚本等其他模型在这方面的表现都追不上R1的车尾。在这个模式下有个很有效的表述方式是让R1“说人话”或者让R1认为“你是初中生”他就能将复杂概念简化为你提供更易理解的解释。技巧3提供充分的任务背景信息当你让DeepSeek帮助你完成某项工作时提供充分的上下文背景信息告诉他你为什么做这件事你面临的现实背景是什么或问题是什么让DeepSeek将其纳入所生成文本的思考中这可以让结果更符合你的需要。比如当你要DeepSeek帮你生成减肥计划时你最好告诉他你的身体状况你目前的饮食摄入和运动情况是什么样的。错误示范帮我生成为期一个月的减肥计划。优化方案我是男性目前身高175体重160斤每天运动量是步行1公里我希望1个月内瘦到150斤请帮我制定一个运动及饮食减肥计划。技巧4主动标注自己的知识状态当你向DeepSeek寻求知识型帮助时最好能明确标注自己相对应的知识状态。就像老师备课前需要了解学生学力水平清晰的知识坐标能让AI输出的内容精准匹配你的理解层次。像我们前面提到了告诉R1“我是初中生”或者“我是小学生”是个把自己放置在一个知识背景约等于0的知识状态的好方式但是当某些内容你希望能和AI深入探讨时你最好更清晰表达你在该领域的知识状态或者你是否存在关联领域的知识这能让AI更理解你为你提供更精确的回答。错误示范给我讲讲机器学习优化方案我是刚接触AI的文科生请用生活案例解释什么是机器学习要求300字以内避免数学公式进阶示例我有三年Python开发经验正在学习Transformer架构请对比RNN和Transformer在长文本处理中的性能差异需包含注意力机制的核心公式技巧5定义目标而非过程R1作为推理模型现在完成任务的思维过程非常令人印象深刻。所以我很建议你提供清楚你的目标让R1具备一定的思考空间去帮助你执行得更好而非提供一个机械化执行指令。你应该像产品经理提需求般描述“要什么”而不是像程序员写代码般规定“怎么做”。比方说你的产品评审会可能需要整理录音文字稿一种做法是直接要求如何整理比如“删掉语气词按时间分段每段加小标题”这也是个非常清晰明确的优质提示语但是你同样可以进一步思考下这段录音文字稿所总结出的材料要如何使用为R1提供目标让他创造性地为你完成任务。普通示范优化下面这段录音转录的文字稿删掉语气词按时间分段每段加小标题优化方案优化下面这段录音转录的文字稿需要整理成可供新员工快速理解的会议纪要重点呈现功能迭代决策与风险点技巧6提供AI不具备的知识背景我们在第二部分提到过AI模型具有“知识截止时间”的特性当任务涉及模型训练截止后的新信息如2024年赛事结果、行业趋势时或者你们公司有一些内部信息是AI不具备的时候你需要像拼图者般主动填补缺失的图块。通过结构化输入帮助AI突破知识限制避免因信息缺乏导致出现错误回答。错误示范分析2024年巴黎奥运会中国代表团的金牌分布优化方案***上传《2024巴黎奥运会中国夺金项目统计表》***基于我提供的奥运会数据请分析2024年巴黎奥运会中国代表团不同运动项目的金牌贡献率技巧7从开放到收敛R1的思维链是全透明在你明前展开的我常常会觉得我从R1思考的过程中能收获的信息比他给我提供的结果还多尤其是他在展开思考你提的需求时会做一个可能性的推测。有时在看到这部分推测后你才发现原来自己没有考虑到某些方面的信息如果把对应的内容补充得更完善的话就不需要R1去猜了。由此R1也能为你提供更精准的、符合你需要的结果。比方说在下面这个案例中R1在思考时为我们提供了三种不同的涨价方法分阶段涨价、增加产品价值、通过营销活动转移注意力以及预测了我们可能具有的两种深层需求保持市场份额or提升品牌形象。我们可以借此思考自己倾向的方法和目标是什么对提示词进行进一步的收敛那么接下来能得到的回答也将会更加精准。无效的提示词技巧在使用R1时以下prompt策略经验证已基本失效甚至部分技巧会起反作用比如1. 思维链提示比如要求模型一步步思考或者提供解答问题的思维思路等这都是完全无效甚至起反作用的策略R1通过强化学习自己能产生更好的思维链了。2. 结构化提示词可以有但也没那么需要你依然可以使用markdown格式的语句去让信息结构更清晰人类查看和机器阅读的时候更好理解但是因为你需要提示的内容少了所以必要性也大大衰减。3. 要求扮演专家角色已经变得完全没必要现在R1本身就是专家模型专家思维除非你是需要R1从特定学科视角为你提供解答在那种情况下你只需要去提示学科即可不需要药企专家了。4. 假装完成任务后给奖励之类的小技巧也无效甚至会被R1是笑话所以就不要再骗AI了省得它觉醒之后要来找你麻烦。5. 少示例提示few-shot这是DeepSeek团队在发布R1技术报告时明确建议规避的一个提示技巧不要有示例你说清楚要求比给示例更重要。6. 角色扮演R1不太擅长你很难用R1去搭建一个AI女友/男友可能是因为情感化的对话都是依赖直觉是反深思熟虑的。7. 对已知概念进行解释没必要进行解释比如我们文章前面提到的当你让AI去模仿某个作家、名人的风格时你没必要解释那个作家是谁他的风格是什么样的AI有自己的理解并且在思考过程中对你所提供的概念能完成丰富和深入的解构。如何学习AGI大模型作为一名热心肠的互联网老兵我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。因篇幅有限仅展示部分资料需要点击下方链接即可前往获取**一、2025最新大模型学习路线一个明确的学习路线可以帮助新人了解从哪里开始按照什么顺序学习以及需要掌握哪些知识点。大模型领域涉及的知识点非常广泛没有明确的学习路线可能会导致新人感到迷茫不知道应该专注于哪些内容。我们把学习路线分成L1到L4四个阶段一步步带你从入门到进阶从理论到实战。L1级别:AI大模型时代的华丽登场L1阶段我们会去了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理关键技术以及大模型应用场景通过理论原理结合多个项目实战从提示工程基础到提示工程进阶掌握Prompt提示工程。L2级别AI大模型RAG应用开发工程L2阶段是我们的AI大模型RAG应用开发工程我们会去学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。L3级别大模型Agent应用架构进阶实践L3阶段大模型Agent应用架构进阶实现我们会去学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造我们自己的Agent智能体同时还可以学习到包括Coze、Dify在内的可视化工具的使用。L4级别大模型微调与私有化部署L4阶段大模型的微调和私有化部署我们会更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。整个大模型学习路线L1主要是对大模型的理论基础、生态以及提示词他的一个学习掌握而L3 L4更多的是通过项目实战来掌握大模型的应用开发针对以上大模型的学习路线我们也整理了对应的学习视频教程和配套的学习资料。二、大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF三、大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。四、大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。五、大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。因篇幅有限仅展示部分资料需要点击下方链接即可前往获取