🔹各个概念的定义

  1. 人工智能(AI, Artificial Intelligence)

    • 最广义的概念:让机器具备类似人类的智能(感知、推理、决策、学习)。
    • 例子:专家系统、搜索引擎、自动驾驶、推荐系统。
  2. 机器学习(ML, Machine Learning)

    • AI 的一个子集。
    • 机器通过数据 自动学习规律,而不是靠人工写规则。
    • 例子:垃圾邮件分类、房价预测。
  3. 深度学习(DL, Deep Learning)

    • ML 的一个子集。
    • 使用 多层神经网络(deep neural networks) 从数据中学习复杂模式。
    • 例子:图像识别(CNN)、语音识别(RNN/Transformer)。
  4. 基础模型(FM, Foundation Model)

    • 一类在 大规模数据 上预训练,并能 迁移到多个任务 的大模型。
    • 特点:通用性强,可以在下游场景进行微调。
    • 例子:BERT、CLIP、GPT。
  5. LLM(Large Language Model)

    • FM 的一种,专门面向 自然语言
    • 特点:参数规模大(亿到万亿级),擅长理解和生成文本。
    • 例子:GPT-3、GPT-4、LLaMA、Claude。
  6. GPT(Generative Pre-trained Transformer)

    • LLM 的代表架构之一。
    • 来自 OpenAI,以 Transformer 为核心,采用 预训练 + 微调
    • 能进行对话、写代码、翻译、推理。
  7. Generative AI(生成式人工智能)

    • 指能 生成新内容(文本、图像、音频、视频)的 AI 系统。
    • LLM(如 GPT)是 Generative AI 在文本领域的典型代表。
    • 其他例子:MidJourney(图像)、Suno(音乐)、Runway(视频)。

🔹关系层级图

可以这样看待它们:

人工智能 AI
│
├── 机器学习 ML
│   │
│   └── 深度学习 DL
│        │
│        └── 基础模型 FM
│             │
│             ├── LLM (大语言模型)
│             │     └── GPT(代表性架构)
│             │
│             └── 其他 FM(BERT, CLIP, DALL·E)
│
└── Generative AI (跨模态生成式AI)
      ├── 文本 → LLM / GPT
      ├── 图像 → Stable Diffusion, MidJourney
      ├── 音频 → MusicGen, Suno
      └── 视频 → Sora, Runway

🔹一句话总结

  • AI 是最大的集合。
  • ML 是 AI 的一个分支,靠数据学习。
  • DL 是 ML 的子集,用神经网络。
  • FM 是用海量数据预训练的大模型,可以迁移。
  • LLM 是 FM 的一种,专门搞语言。
  • GPT 是 LLM 的代表。
  • Generative AI 是能生成新内容的 AI,GPT 属于其中的文本生成部分。
Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐