大模型的几种思维模式

一、 COT、TOT和GOT思维

0. 刚性分类

现在好多提示词不好的原因主要是刚性分类,那什么是刚性分类:
给了LLM一堆严格的定义,并要求它“仅选择一个”。这种方法在输入非常纯净、意图单一时效果尚可,但一旦用户的输入变得模糊、包含复合意图,或者严重依赖上下文,LLM就很容易“选错”。

而大模型更加适合这种思考和推理,所以有了以下的思维方式。

1. COT(Chain of Thought)思维

思维链(CoT)是一种用于设计 prompt 的方法,即 prompt 中除了有任务的输入和输出外,还包含推理的中间步骤(中间思维)。他是一种链式的思维方式,即 按照一定的逻辑顺序,逐步深入地表达观点或解决问题。

主要用于有依赖任务的,例如需要LLM先完成第一步,然后根据第一步的结果处理第二步。这个时候同时也需要将第一步的结果输出。否则大模型可能会偷懒。

应用方式:在项目中的应用,比如在撰写项目报告、策划方案或进行技术讲解时,可以采用 COT 思维。首先明确核心问题,然后按照逻辑顺序,分步骤地阐述问题的背景、分析过程、解决方案以及预期效果。例如,在撰写市场调研报告时,先介绍市场现状,再分析消费者需求,接着提出产品定位策略,最后预测市场反应。

2. TOT(Tree of Thoughts)思维

TOT:**一种用树结构解决复杂问题的方法,**CoT通常只有一条解决问题的路径,ToT等于是CoT的一个拓展,把一条reasoning路径拓展至多条reasong paths,这样模型可以综合多条reasoning path的结果得到最终的结论。

ToT的一个具体实例化涉及回答四个问题:1.如何将中间过程分解为思维步骤;2.如何从每种状态中产生潜在的thought;3.如何启发式地评估状态;4.使用什么搜索算法。所以ToT就被分为了Thought Decomposition,Thought Generator,State Evaluator,Search algorithms四部分,第一部分是Thought Decompution,这个根据具体问题而定。

第二部分是Thought Generator,给定一个树的状态,我们要从k个候选项中决定下一个step,一般采用采样和投票的方法。State evaluator,给定不同状态的边界,状态评估器评估他们在解决问题方面取得的进展,并作为搜索算法的启发式算法,以确定要继续探索哪些状态以及以何种顺序进行探索,state evaluator有两种,可以是value类型的分类或者打分,另一种就是投票的形式。Search algorithm:ToT框架可以拔插式的使用不同的搜索算法。

举例:Create Writing是给你给定四个句子,然后产生4个paragraph,分别以这4个句子结尾,这样的任务是开放式和探索性的,挑战创造性思维和高层规划,ToT的做法是首先产生k=5个候选的plan,投票选择最佳的passage,基于最佳的plan,产生5个passage,然后选择其中产生的最佳passage,投票的过程是一个zero-shot的过程,例如(analyze choices below, then conclude which is most promising for the instruction)

3. GOT(Graph of Thoughts)思维

Graph of Thoughts(GoT)和其他prompting的策略的比较如上图,可以看到GoT直接构建了一个有向图来解决问题。了解了GoT的核心思想,我们来看一下怎么实现一个GoT的系统,GoT系统结构包含一系列的交互模块,如下图所示,这些模块包括Prompter(为LLM准备消息)、Parser(从LLM的回复中提取信息)、Scoring module(验证LLM回复并对其进行评分)和Controller(协调整个推理过程,并决定如何进行推理)。控制器包含另外两个重要元素:Graph of Operations(GoO)和Graph Reasoning State(GRS)。GoO是一种静态结构,它指定了给定任务的图分解,它规定了应用于LLM思想的转换,以及它们的顺序和依赖关系。GRS是一个动态结构,它保持正在进行的LLM推理过程的状态(其思想及其状态的历史)。图中蓝色部分包含架构概述,绿色部分列出API,示例图如下:

下图红色部分包含示例提示以及GRS和相关操作,具体是归并排序(先把list array,分解成sub array,sort后进行合并)任务的prompt的示例:

4. AOT【Algorithm of Thoughts】思维

AOT:一种用DFS/BFS示例解决问题的方法

上图显示的是LLM解决推理问题的几种方法,绿框表示LLM认为有前景的想法,而红框表示不太有前景的概念。可以看到AoT和ToT的方法的区别是,ToT会对节点进行剪枝,然后推理过程是一个树的结构;AoT利用示例的方式模仿DFS或者BFS,能够激发LLM的能力(论文说在GPT4上有很好的效果,估计对LLM本身的能力要求比较高),得到更好的结果。

🧠 大模型高级思维模式(LLM Thinking Paradigms)

🎯 背景:告别刚性分类

概念 描述 弊端
刚性分类 给出LLM一堆严格的定义,并要求它“仅选择一个”作为输出。 1. 脆弱性强: 仅适用于输入纯净、意图单一的情况。 2. 推理不足: 面对模糊、复合意图或高度依赖上下文的输入时,LLM容易跳过推理过程而直接“选错”,导致结果不可靠。
新思维模式 通过引入推理、搜索和结构化的中间步骤,让LLM进行深度思考。 克服了刚性分类的缺陷,更符合大模型擅长推理的特性。

在复杂的推理任务中,传统的“刚性分类”要求模型严格遵循定义并“仅选择一个”,这极易在输入模糊或意图复合时导致错误。以下高级思维模式旨在通过结构化和多路径的推理,克服这一局限。

模式 核心结构 推理路径 搜索机制
COT 链式/线性(Chain) 单条,顺序依赖 无(直接推理)
TOT 树状(Tree) 多条,分支与剪枝 评估与搜索(BFS/DFS/Beam Search)
GOT 图状(Graph) 并行、合并、迭代 系统级协调(GoO & GRS)
AOT 算法模仿(Algorithm) 多条,按范例算法(DFS/BFS) 范例驱动(Few-shot)

  1. COT (Chain of Thought) 思维:线性推理

核心思想

链式推理(线性、逐步深入):将复杂任务分解为一系列按逻辑顺序排列的中间步骤,确保每一步的输出都作为下一步的输入。

适用场景

  • 顺序任务: 需要先完成第一步,再根据结果处理第二步的任务。
  • 依赖计算: 多步数学题、复杂公式推导。
  • 逻辑阐述: 项目报告、技术方案的分步骤讲解。

🛠️ 结构与提示词示例

应用场景 任务描述 核心价值 提示词侧重
复杂代码审查 审查一段新的业务逻辑代码,确保其符合所有的业务规则和安全标准。 确保逻辑覆盖和步骤完整性 。LLM 必须先理解业务规则,再逐步检查代码是否满足每一条规则。 “请先列出代码必须满足的 5 个安全检查点,然后逐一检查并报告结果。”
多步骤差旅规划 根据预算和时间限制,规划从 A 地到 B 地的包含火车、飞机和出租车的全程路线。 解决有依赖关系的连续性问题 。下一步的交通选择(如出租车)依赖于上一步(如飞机降落时间)。 “请根据以下预算和时间限制,分步(行程、住宿、预算)规划您的差旅,并输出每一步的决策。”
财报数据分析 计算某公司特定季度的净利润和同比增幅。 避免计算错误和偷懒 。强制 LLM 报告中间计算结果(如营收、成本、毛利),确保最终结果准确。 “请分步计算公司的营收、总成本、毛利润、净利润,并计算净利润的同比增幅。要求输出所有中间值。”

  1. TOT (Tree of Thoughts) 思维:树状探索

核心思想

树状探索(多路径、选择最优):将单条推理路径拓展为多条推理分支,通过评估和搜索机制,在多个潜在的“想法”中选择最佳方案。

适用场景

  • 开放式任务: 创意写作、头脑风暴、战略规划。
  • 探索性问题: 需要多个方案对比、选择最佳路径的复杂决策。

🛠️ 结构与关键组件

ToT 通过以下四个步骤实现树状搜索:

组件 功能
思维分解 将任务分解为更小的思维步骤。
想法生成 从当前状态生成 个潜在的下一步“想法”作为子节点。
状态评估 使用启发式方法(如分类、打分、投票)评估每个状态(节点)的潜力。
搜索算法 使用 BFS、DFS 或 Beam Search 进行探索和剪枝。

💡 示例 Prompt

请采用 ToT 思维模式,为我们的新产品提出 3 个推广计划,并选出最佳。

    1. 生成想法: 提出 Plan A(内容营销)、Plan B(社媒病毒)、Plan C(线下体验)。
    1. 评估状态: 根据“用户覆盖度”和“预算可行性”对三个计划进行 评分。
    1. 深化选择: 选出总分最高的计划,并详细阐述其执行步骤。
应用场景 任务描述 核心价值 提示词侧重
市场进入策略 为一个新的高科技产品制定进入市场的策略(是价格竞争、高端定位还是蓝海策略)。 探索多种可能性并进行评估 。LLM 分别生成 3-5 个市场策略,然后根据市场数据和目标人群进行打分和比较。 “请提出至少 4 个独特的市场进入策略。然后,请根据‘潜在收益’和‘执行难度’两维度对每个策略进行评分(1-10),并选择得分最高的方案进行详细展开。”
产品功能设计 设计一个新软件模块的核心功能,要求同时考虑用户体验、开发成本和技术可行性。 权衡多重约束的最优解 。LLM 提出不同的功能组合方案,通过评估模型对各方案进行权衡。 “请生成 3 个不同的功能设计草案。接下来,使用‘用户体验评分’和‘开发成本预算’对它们进行评估,最终投票选出最佳方案并解释原因。”
创意写作 为一个新电影写出 3 个不同的结局,并选择一个最能引发观众共鸣的结局。 激发并筛选创造性思维 。LLM 分支生成多个结局,然后通过“情感冲击力”等标准评估选择。 “请创作 3 个风格迥异的电影结局。随后,分析哪个结局在叙事和主题上最具优势,并选出作为最终版本。”

  1. GOT (Graph of Thoughts) 思维:图状关联

核心思想

图状关联(非线性、灵活合并):构建一个有向图结构来解决问题,允许思想(节点)之间进行并行处理、灵活的合并、迭代和转换,是比 ToT 更灵活的结构。

适用场景

  • 高度结构化任务: 涉及并行计算、多源信息整合、迭代优化。
  • 复杂算法流程: 如归并排序、多线程任务协调。

🛠️ 结构与系统组件

GoT 不仅是提示词方法,更是一个系统架构,通过以下模块协调推理:

组件 功能
GoO (Graph of Operations) 静态结构 :指定图分解,规定 LLM 思想的转换顺序和依赖关系(如:B 和 C 必须并行,D 依赖于 B 和 C 的合并)。
GRS (Graph Reasoning State) 动态结构 :保持推理过程的状态、思想及其历史。
Prompter/Parser 准备 LLM 消息/从 LLM 回复中提取信息。
Scoring Module 验证和评分 LLM 的回复。

💡 示例 Prompt(系统指令)

将任务分解为 GoT 结构:数据清洗(B) 和 特征提取(C) 必须并行执行;只有当 B 和 C 同时完成后,才能进行 模型训练(D)。

应用场景 任务描述 核心价值 提示词侧重
项目任务调度 协调一个包含多个并行和依赖任务的复杂项目(如软件开发)。 结构化并行处理和合并 。LLM 必须理解某些任务可以并行(如前端开发和后端开发),而最终的集成(合并)必须等待它们全部完成。 “请将 [项目名称] 的任务分解为 GoT 结构。任务 A 和 B 必须并行;任务 C 必须依赖于 A 和 B 的结果合并后才能开始。请输出 GoO 流程图。”
多源信息摘要 综合处理来自 3 份不同新闻报道、1 份内部报告和 2 个社交媒体评论,形成一份统一的风险分析报告。 高效的交叉引用和信息整合 。LLM 同时处理多个信息流(并行),识别冲突或冗余,并在最终的风险分析中进行合并。 “请同时分析以下 6 份文件。首先,并行提取每份文件的核心观点;然后,将观点合并并识别其中的冲突点;最后,基于所有信息撰写一份结构化风险报告。”
推荐系统优化 迭代优化一个推荐算法,需要根据用户的实时反馈(评分)不断进行微调。 支持循环和迭代优化 。LLM 在图结构中可以设置一个“反馈回路”节点,不断接收评分并调整算法参数,直到评分达到预定阈值。 “根据 GoT 机制,设置一个推荐结果生成节点和一个用户反馈评分节点。每次评分低于 80 分时,启动‘参数微调’操作,并循环回到生成节点,直到目标达成。”

  1. AOT (Algorithm of Thoughts) 思维:算法模仿

核心思想

算法模仿(范例驱动搜索):通过提供明确的、完整的算法执行示例(如 DFS/BFS),引导 LLM 模仿这种特定的搜索和推理逻辑。

适用场景

  • 系统性搜索: 需要穷举或按特定规则移动的搜索/解谜任务。
  • 复杂逻辑谜题: 依赖特定算法路径才能找到答案的问题。

🛠️ 结构与提示词示例

元素 描述
结构 任务输入 范例算法步骤(DFS/BFS) LLM 模仿推理 最终输出
Prompt 关键 “请像一个使用‘深度优先搜索(DFS)’算法的思考者一样来解决这个问题。”、“请用这种 [算法逻辑] 的思维方式来解决以下谜题。”

💡 示例 Prompt

请模仿 DFS 算法的逻辑来分析并解决以下谜题:

DFS 范例:

    1. 从起点 A 开始,选择最深的路径 A B。
    1. 在 B,继续选择最深的路径 B C,失败。
    1. 回溯到 B,选择 B 的下一个未探索路径 B D。

请使用这种“一直探索到尽头,失败则回溯”的思维方式来解决: [谜题内容]

应用场景 任务描述 核心价值 提示词侧重
复杂逻辑谜题求解 解决一个需要穷举或状态空间搜索的谜题(如狼、羊、菜过河问题,或复杂的数独变种)。 引导 LLM 遵循特定搜索规则 。通过 DFS/BFS 范例,确保 LLM 系统性地探索所有可能的状态,而不是跳跃式思考。 “请使用模仿 DFS 算法的思维方式来解决以下谜题:先尝试最远的状态,失败则回溯。提供一个完整的 DFS 解决过程作为范例。”
法律条文匹配 在复杂的法律体系中,从数千条法规中找到一条最匹配特定案例的条款,要求按法律层级(联邦法 州法 地方法)进行搜索。 模仿分层搜索算法 。LLM 模仿 BFS 或层次搜索,确保先在联邦法层面搜索,无果后才进入下一层级。 “请模仿层次搜索算法(如 BFS)的逻辑,从联邦法开始搜索,如果未找到匹配项,再进入州法搜索。请展示搜索的层次和路径。”
最短路径规划 在一个复杂的、非标准化的地图上,规划从起点到终点的最短路径,需要考虑多个中间检查点。 利用图搜索算法(如 A 或 Dijkstra)的逻辑 *。通过范例,引导 LLM 进行启发式搜索,选择最有前景的路径。 “请模仿图搜索算法的原理,为以下复杂的路径规划提供解决方案。每一步都需要评估当前路径的‘累计成本’和‘未来潜力’,并选择最优路径。”

普通人如何抓住AI大模型的风口?

为什么要学AI大模型

当下,⼈⼯智能市场迎来了爆发期,并逐渐进⼊以⼈⼯通⽤智能(AGI)为主导的新时代。企业纷纷官宣“ AI+ ”战略,为新兴技术⼈才创造丰富的就业机会,⼈才缺⼝将达 400 万!

DeepSeek问世以来,生成式AI和大模型技术爆发式增长,让很多岗位重新成了炙手可热的新星,岗位薪资远超很多后端岗位,在程序员中稳居前列。

在这里插入图片描述

与此同时AI与各行各业深度融合,飞速发展,成为炙手可热的新风口,企业非常需要了解AI、懂AI、会用AI的员工,纷纷开出高薪招聘AI大模型相关岗位。
在这里插入图片描述

AI大模型开发工程师对AI大模型需要了解到什么程度呢?我们先看一下招聘需求:

在这里插入图片描述

知道人家要什么能力,一切就好办了!我整理了AI大模型开发工程师需要掌握的知识如下:

大模型基础知识

你得知道市面上的大模型产品生态和产品线;还要了解Llama、Qwen等开源大模型与OpenAI等闭源模型的能力差异;以及了解开源模型的二次开发优势,以及闭源模型的商业化限制,等等。

img

了解这些技术的目的在于建立与算法工程师的共通语言,确保能够沟通项目需求,同时具备管理AI项目进展、合理分配项目资源、把握和控制项目成本的能力。

产品经理还需要有业务sense,这其实就又回到了产品人的看家本领上。我们知道先阶段AI的局限性还非常大,模型生成的内容不理想甚至错误的情况屡见不鲜。因此AI产品经理看技术,更多的是从技术边界、成本等角度出发,选择合适的技术方案来实现需求,甚至用业务来补足技术的短板。

AI Agent

现阶段,AI Agent的发展可谓是百花齐放,甚至有人说,Agent就是未来应用该有的样子,所以这个LLM的重要分支,必须要掌握。

Agent,中文名为“智能体”,由控制端(Brain)、感知端(Perception)和行动端(Action)组成,是一种能够在特定环境中自主行动、感知环境、做出决策并与其他Agent或人类进行交互的计算机程序或实体。简单来说就是给大模型这个大脑装上“记忆”、装上“手”和“脚”,让它自动完成工作。

Agent的核心特性

自主性: 能够独立做出决策,不依赖人类的直接控制。

适应性: 能够根据环境的变化调整其行为。

交互性: 能够与人类或其他系统进行有效沟通和交互。

img

对于大模型开发工程师来说,学习Agent更多的是理解它的设计理念和工作方式。零代码的大模型应用开发平台也有很多,比如dify、coze,拿来做一个小项目,你就会发现,其实并不难。

AI 应用项目开发流程

如果产品形态和开发模式都和过去不一样了,那还画啥原型?怎么排项目周期?这将深刻影响产品经理这个岗位本身的价值构成,所以每个AI产品经理都必须要了解它。

img

看着都是新词,其实接触起来,也不难。

从0到1的大模型系统学习籽料

最近很多程序员朋友都已经学习或者准备学习 AI 大模型,后台也经常会有小伙伴咨询学习路线和学习资料,我特别拜托北京清华大学学士和美国加州理工学院博士学位的鲁为民老师(吴文俊奖得主)
在这里插入图片描述

给大家准备了一份涵盖了AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频 全系列的学习资料,这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效地掌握AI大模型的各个知识点。

图片

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

适学人群

应届毕业生‌: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。
在这里插入图片描述

AI大模型系统学习路线

在面对AI大模型开发领域的复杂与深入,精准学习显得尤为重要。一份系统的技术路线图,不仅能够帮助开发者清晰地了解从入门到精通所需掌握的知识点,还能提供一条高效、有序的学习路径。

  • 基础篇,包括了大模型的基本情况,核心原理,带你认识了解大模型提示词,Transformer架构,预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门AI大模型
  • 进阶篇,你将掌握RAG,Langchain、Agent的核心原理和应用,学习如何微调大模型,让大模型更适合自己的行业需求,私有化部署大模型,让自己的数据更加安全
  • 项目实战篇,会手把手一步步带着大家练习企业级落地项目,比如电商行业的智能客服、智能销售项目,教育行业的智慧校园、智能辅导项目等等

img

但知道是一回事,做又是另一回事,初学者最常遇到的问题主要是理论知识缺乏、资源和工具的限制、模型理解和调试的复杂性,在这基础上,找到高质量的学习资源,不浪费时间、不走弯路,又是重中之重。

AI大模型入门到实战的视频教程+项目包

看视频学习是一种高效、直观、灵活且富有吸引力的学习方式,可以更直观地展示过程,能有效提升学习兴趣和理解力,是现在获取知识的重要途径

在这里插入图片描述
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

海量AI大模型必读的经典书籍(PDF)

阅读AI大模型经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验。对于想要深入学习AI大模型开发的读者来说,阅读经典书籍是非常有必要的。
在这里插入图片描述

600+AI大模型报告(实时更新)

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

AI大模型面试真题+答案解析

我们学习AI大模型必然是想找到高薪的工作,下面这些面试题都是总结当前最新、最热、最高频的面试题,并且每道题都有详细的答案,面试前刷完这套面试题资料,小小offer,不在话下
在这里插入图片描述

在这里插入图片描述

AI时代,企业最需要的是既懂技术、又有实战经验的复合型人才,**当前人工智能岗位需求多,薪资高,前景好。**在职场里,选对赛道就能赢在起跑线。抓住AI这个风口,相信下一个人生赢家就是你!机会,永远留给有准备的人。

如何获取?

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐