大模型计算为啥需要GPU

摘要冯诺依曼架构是现代计算机的基础，包含输入设备、寄存器、控制器、运算器和输出设备。CPU作为中央处理器，负责控制和通用计算，其特点是少量核心但缓存和控制器复杂。GPU则专为图形处理设计，拥有数千个简单核心，擅长并行计算。在AI领域，大模型的训练需要GPU进行海量并行运算，而CPU更适合管理和调度任务。这种架构差异使得GPU成为AI计算的关键组件。（147字）

柯南小海盗

601人浏览 · 2025-07-08 09:24:11

柯南小海盗 · 2025-07-08 09:24:11 发布

冯诺依曼架构

在这里插入图片描述

现代计算机是基于冯诺依曼架构的。在冯诺依曼架构中，包括输入设备、寄存器、控制器和运算器、以及输出设备。通过输入设备输入数据后，将数据存储到寄存器中，然后寄存器中的数据交给控制器进行调度，然后交给运算器做相应的计算，随后将运算结果通过输出设备输出。

CUP又叫中央处理器，包括控制器和运算器两个部分，负责数据和运算的控制调度和计算。

GPU和CPU

在这里插入图片描述

CPU

CPU和GPU本质上是一样的，只是侧重的任务不同。CPU是计算机中的核心部分，主要负责处理计算器通用的运算和控制，CPU的内核(包括了ALU(算数逻辑运算))数量比较少，最多只有几十个。但是，CPU有大量的缓存(Cache)和复杂的控制器(CU)。

这样设计的原因，是因为CPU是一个通用处理器。作为计算机的主核心，它的任务非常复杂，既要应对不同类型的数据计算，还要响应人机交互。

复杂的条件和分支，还有任务之间的同步协调，会带来大量的分支跳转和中断处理工作。它需要更大的缓存，保存各种任务状态，以降低任务切换时的时延。它也需要更复杂的控制器，进行逻辑控制和调度

CPU的强项是管理和调度。真正干活的功能，反而不强(ALU占比大约5%~20%)。

如果我们把处理器看成是一个餐厅的话，CPU就像一个拥有几十名高级厨师的全能型餐厅。这个餐厅什么菜系都能做，但是，因为菜系多，所以需要花费大量的时间协调、配菜，上菜的速度相对比较慢。

GPU

GPU为图形处理而生，任务非常明确且单一。它要做的，就是图形渲染。图形是由海量像素点组成的，属于类型高度统一、相互无依赖的大规模数据。所以，GPU的任务，是在最短的时间里，完成大量同质化数据的并行运算。所谓调度和协调的“杂活”，反而很少。并行计算，当然需要更多的核啊。

GPU的内核远远超过CPU，可以达到几千甚至上万个。GPU的核，称为流式多处理器(Stream Multi-processor，SM)，是一个独立的任务处理单元。

在整个GPU中，会划分为多个流式处理区。每个处理区，包含数百个内核。每个内核，相当于一颗简化版的CPU，具备整数运算和浮点运算的功能，以及排队和结果收集功能。

PU的控制器功能简单，缓存也比较少。它的ALU占比，可以达到80%以上。

虽然GPU单核的处理能力弱于CPU，但是数量庞大，非常适合高强度并行计算。同等晶体管规模条件下，它的算力，反而比CPU更强。

还是以餐厅为例。GPU就像一个拥有成千上万名初级厨师的单一型餐厅。它只适合做某种指定菜系。但是，因为厨师多，配菜简单，所以大家一起炒，上菜速度反而快。

AI和CPU

大模型的训练和推理运算过程中，需要大量的并行运算的过程。在前期训练模型阶段，需要通过大量的数据进行计算，从而形成一个比较负责的神经网络模型，以此在推理阶段，根据训练好的模型得出结论。

训练环节由于涉及海量的训练数据，以及复杂的深度神经网络结构，所以需要的计算规模非常庞大，对芯片的算力性能要求比较高。而推理环节，对简单指定的重复计算和低延迟的要求很高。

因此在大模型的领域内，要完成一个大模型的构建等操作，需要有大量的GPU来训练

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

Chess用户界面设计：Tailwind CSS样式系统和组件库

GitHub推荐项目精选中的ch/chess是一个类似chess.com的多人在线象棋平台，它采用现代化的前端技术栈构建，尤其在用户界面设计上通过Tailwind CSS样式系统和组件库实现了优雅且功能丰富的交互体验。本文将深入探讨该项目如何利用Tailwind CSS打造一致的设计语言和高效的组件系统，为象棋爱好者提供沉浸式的游戏界面。## 🎨 Tailwind CSS样式系统：构建统一视

火山引擎 ADG 社区

终极指南：GPT-Engineer如何通过AI自动发现代码问题并提升质量

GPT-Engineer是一款强大的AI驱动代码工具，它能帮助开发者自动检测潜在代码问题、优化代码质量，让编程效率提升3倍以上。无论是新手还是资深开发者，都能通过这款工具轻松发现代码中的隐藏缺陷，减少调试时间，释放更多精力在创造性工作上。## 一键发现代码问题：GPT-Engineer的AI审查魔力GPT-Engineer的核心能力在于其内置的智能代码分析系统。通过集成Python代码格式

火山引擎 ADG 社区

SatDump中的纠错编码技术：从RS码到Turbo码的完整实现指南

在卫星数据传输过程中，信号往往会受到各种干扰，导致数据错误。SatDump作为一款通用卫星数据处理软件，集成了多种先进的纠错编码技术，确保从卫星接收到的数据能够准确解码。本文将深入解析SatDump中从Reed-Solomon（RS）码到Turbo码的实现细节，帮助读者理解这些技术如何保障卫星通信的可靠性。## 为什么纠错编码对卫星数据至关重要？卫星与地面站之间的通信链路面临着空间辐射、大