说到近些年的火热名词,“人工智能”必须榜上有名。随着春节deepseek爆火出圈,“AI(Artificial Intelligence,人工智能)”屡次霸屏热搜榜,由以前的AI的概念已经进入到了AI的时代,在接下来,不管是哪个行业的人,我觉得大家都要去拥抱他,人工智能、机器学习、深度学习,到底是个啥,他们之间有什么关系???接下来争取通过这张图给大家一次性说明白,不管以后谈论AI agent 、机器学习、深度学习、大模型,我们脑海中一定要有这张图,明白他是处于那一环。

图片

一、AI 的概念

(一)AI(人工智能)

简单来讲,人工智能就是让计算机系统变得跟人一样聪明(顶级的人类智慧),能去完成各种复杂的任务。像学习新知识、进行推理思考、理解我们日常说的话,还有识别看到的东西,这些都属于 AI 的本事。从应用的范围来看,AI 主要分成两大类:

窄人工智能 (Narrow AI):这就好比是只擅长一门绝技的高手,只专注于做特定的任务。比如说咱们平常使用的文字处理软件,能精准识别语音的工具,还有给图像分类的程序等,它们在各自负责的领域里可厉害了。

通用人工智能 (AGI):这是一种理想化的人工智能,它就像个全能冠军,不管什么领域的知识,它都能理解、学习,还能运用起来,拥有和人类一样高水平的智能。不过呢,到现在它还在研究阶段,科学家们还在努力攻克这个难题。

(二)机器学习和深度学习

我们日常听到的AI,他其实是基于一套完整的理论,机器学习(算法);

机器学习是人工智能里特别重要的一部分,它让计算机不用靠复杂的编程,就能从数据里学到东西,让自己变得更厉害。它的关键在于那些巧妙的算法和统计模型,能从大量的数据里找出有价值的规律和知识。机器学习又可以细分成下面这几种类型:

监督学习:这就像学生在老师指导下学习,用已经标好答案的数据来训练,这样就能学会从输入到输出的对应关系。在实际生活中,像给事物分类,或者预测数值这样的任务,大多都属于监督学习。

无监督学习:没有老师在旁边指导,计算机就自己用那些没有标答案的数据,去发现数据里面隐藏的规律和结构。比如说把相似的数据归到一起,或者把复杂的数据简化,这些就是无监督学习在干的事儿。

强化学习:计算机通过和周围环境不停地互动,根据得到的奖励或者惩罚,来调整自己的行为策略。就好比游戏里的角色,通过一次次尝试,找到能得高分的最好玩法。

深度学习呢,是机器学习这个领域里特别厉害的一个分支,它主要靠深度神经网络来学习。我们现在听到的最多的是什么?大模型,目前来看都是“文本大模型”,文本大模型就是基于深度学习开发的。它的模型有好多层,这就让它能处理特别复杂的数据,在很多地方都取得了很大的突破:

图像识别:卷积神经网络(CNN)在识别图像里的物体方面,表现得特别出色,能准确地说出图片里是什么东西。

自然语言处理(大模型):循环神经网络(RNN)和(Transformer)在这里发挥了大作用,它们让机器能理解我们说的话,还能生成像人说的那样自然流畅的语言,在翻译、写文章这些方面都很有用。

这里要注意,机器学习是包含深度学习的,机器学习是人工智能的一部分,就像一个大套小的盒子一样,这就是它们之间的包含关系。

(三)AIGC

AIGC,就是 AI generated content 的缩写,这个离我们最近,意思是利用人工智能技术自动生成各种内容,基本上把互联网上能传播的东西都包括了,像文本、图像、声音还有视频。

图片

文本生成:现在有好多 AIGC 的应用,能写出有条理、通顺的文章。像百度的文心一言、阿里的通义千问、科大讯飞的讯飞星火,还有特别厉害的 ChatGPT、DS,它们都能按照咱们的要求,生成质量很高的文字内容。

图像生成:只要在这类 AIGC 应用里输入画画的提示,它很快就能生成特别好看、质量很高的图像,就算你从来没学过画画,也能轻松实现自己的创意。

声音生成:它能把文字快速变成听起来很自然的语音,而且有好多不同的 AI 声音可以选,对那些需要把文字变成语音的人来说,极为方便。

视频生成:按照视频脚本,它就能合成、编辑视频,做出有特定场景、角色和动作的视频片段,大大提高了做视频的效率。

图片

Generative AI 生成的内容,国内叫做 AIGC。

(四)大语言模型 (LLM)

大语言模型是基于深度学习技术,专门用来处理自然语言的 AI 模型。它通过学习海量的文本数据,能生成、理解和翻译我们人类的语言。

OpenAI 的 GPT - 3 和 GPT - 4 就是这类大语言模型的典型代表。大语言模型在聊天机器人、写文章、总结内容等好多任务里都用得很广泛。从本质上来说,大语言模型属于那种有超多参数(一般都在十亿个以上)的神经网络模型,现在大部分的大模型都用的是 transformer 架构。

图片

大语言模型是人工智能在自然语言处理这个方向上的一种应用,它也是基于深度学习技术发展起来的,和前面说的深度学习、机器学习、人工智能也存在着一层包含关系,深度学习是大语言模型实现的技术基础,而大语言模型又是人工智能在特定领域(自然语言处理)的具体体现。

二、AI Agent(智能体)

(一)AI Agent 的概念

AI Agent,直接翻译过来就是 AI 代理人,它是一种能自己去完成任务或者实现目标的系统。它可以是一个软件程序,也能是一台智能机器。AI Agent 能感知周围的环境,然后根据这些信息做出合理的决定。它能把好多技术结合起来。

包括AI大模型(LLM),但它们的核心是交互性和目标导向性。而AI大模型通过深度学习技术,开始“理解”人类的语言了(本质上就是通过Al大模型,对下一个token的预测准确率大大的提高了,如何通过prompt(提示词)也就是输入进一步提高准确率),这个时候和“它”对话,其作用逐渐显现出来,感觉也越来越像人一样智能了。

(二)AI Agent 的应用场景

AI Agent能干什么事, 总结下来它应用场景很多,生活和工作的好多地方都能看到它:

自媒体领域:做自媒体的人可以用 AI Agent,快速模仿出不同平台上的爆款视频或者文案,还能突出特定的风格和特点。

智能客服:现在好多企业都用像真人一样的聊天机器人当客服,它们能和客户很顺畅地交流,回答各种问题,处理电商里订单退换货这些业务。

自动驾驶:像理想汽车的自动驾驶,还有百度的萝卜快跑自动驾驶。它能处理传感器传来的数据,规划好行驶路线,自动躲开行人和其他车辆,实现安全又高效的自动驾驶。

股票交易:AI Agent 能根据股票市场的价格、成交量这些指标,自动帮投资者选股票,计划好什么时候买卖,做出交易的决定,让投资者不用天天盯着股票大盘看。

企业运营:有些企业利用 AI Agent 从自媒体平台上收集用户搜索的关键词,分析用户的需求,再结合自己的产品,生成很有针对性的图文内容,发布出去吸引用户。然后再用 AI Agent 筛选用户,最后完成销售。

(三)AI Agent 与传统程序的区别

AI Agent 和传统程序有很大不同:

学习能力:AI Agent 特别会学习,能通过训练数据和得到的反馈,不断让自己变得更好,解决问题的能力也会越来越强。可传统程序一旦编好,功能和行为就固定了,没办法自己学习新东西、做出改变。

自主决策:AI Agent 能根据环境的变化和设定的目标,自己决定怎么做。传统程序就只能按照程序员一开始写好的规则和流程,死板地运行,没有自己做决定的能力。

适应性:AI Agent 能在一定程度上适应那些不确定、一直在变的环境,灵活应对各种复杂情况。传统程序大多依赖固定的输入和规则,遇到变化就不太好办了。

灵活性:碰到复杂的情况或者数据,AI Agent 能更灵活地处理,更好地应对各种没遇到过的状况。传统程序要是遇到超出原来设定范围的情况,往往就表现不好了。

泛化能力:AI Agent 有时候能把在训练中学到的知识,用在新的数据上,做出合理的判断。传统程序一般就只能处理那些已经知道的、特定的情况,没有这种举一反三的能力。

随着技术不断进步,AI Agent 正慢慢走进我们的生活。以后,它肯定会在更多地方发挥大作用,把我们的生活和工作方式彻底改变。让我们一起期待 AI Agent 带来的各种可能吧!

最后

如果你真的想学习人工智能,请不要去网上找那些零零碎碎的教程,真的很难学懂!你可以根据我这个学习路线和系统资料,制定一套学习计划,只要你肯花时间沉下心去学习,它们一定能帮到你!

这里也给大家准备了人工智能各个方向的资料,大家可以微信扫码找我领取哈~

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐