[特殊字符] 什么是AI,什么是大模型,它是怎么工作的
GPT、豆包、文心一言……你肯定用过至少一个。
大家嘴边天天挂着“AI”“大模型”,但这两个词到底是不是一回事?
我猜不少人其实没仔细想过。😅
今天把这个说清楚,不堆术语,说完你应该能跟别人讲明白了。
🤔 AI 到底是什么?
AI,全称人工智能,说白了就是让机器去做那些“本来需要人类智能”的事情。
这个定义听起来玄,其实很早就有AI了:
📱 你手机相册能自动识别照片里是谁,那就是AI。
📧 邮箱把某些邮件自动归为垃圾邮件,那也是AI。
♟ 上世纪九十年代IBM的“深蓝”下赢国际象棋冠军,那还是AI。
但这些早期的AI有个共同特点——它们都是专才。

一个AI只会干一件事。下棋的AI不会识别猫,识别猫的AI不会过滤垃圾邮件。
它们被训练来做某一个具体任务,换一个场景就废了。
就像你培养了一个专门算税的高手,结果他连超市找零都算不利索。💸
本质上是这么个过程:
人类把规则写出来,把数据喂进去,让机器自己从数据里找规律。找得够准,就算“智能”了。
❌ AI ≠ 大模型,别搞混了
这是最多人搞错的。
传统AI是专才,大模型是通才。
大模型,全称大语言模型,英文是 Large Language Model,缩写 LLM。
记住这个缩写,后面看技术文章会频繁碰到。
“大语言模型”这个名字其实已经把关键信息都告诉你了:
🔹 大:参数规模大、训练数据大、烧的钱也大
🔹 语言:处理的是文字(当然现在多模态也能处理图、声音,但根子上还是从文字起步的)
🔹 模型:从数据里学出来的数学函数,别想太多
一个传统AI做一个任务,一个大模型能做无数个任务。
你让它写代码,它能写;你让它作诗,它能作;你让它帮你写周报(虽然我不建议你这么干),它也能整。
所以准确的说法是:
大模型是AI的一种,而且是当前最火的那一种。
就像“电动车是车的一种”,但你说“车”的时候,别人最先想到的可能还是燃油车。
AI和大模型的关系也是这个感觉——大模型火了,大家就把AI和大模型混着用了。
🧠 大模型到底是怎么工作的?
说穿了其实挺朴素的。
大模型本质上是一个“下一个词预测器”。
你输入一句话,它做的事情是:
看前面所有的词,然后算出来“下一个词最可能是什么”,挑概率最高的那个放上去。
放上去之后,再把新这个词加进上下文,继续预测再下一个词。
接、接、接……接出来的那串东西,就是你看到的回答。
🌰 举个例子:
你输入“今天天气”,模型可能会接“很”,然后接“好”,然后接“适合”,然后接“出门”——于是你看到了“今天天气很好适合出门”。
它本身不知道“天气好”是什么意思,它只是在做概率计算。

这里要提一个概念:参数。
你可以把参数理解为大模型“大脑里的神经元连接数”。
参数越多,模型的“脑容量”越大,能记住的规律越多,表现出来就越“聪明”。
现在主流的大模型,参数规模都是几百亿到几千亿这个量级。
千亿参数什么概念?人类大脑大概有860亿个神经元,单比数量的话……
好吧这个类比其实不太准确,但意思你懂的——很大。🧠💥
训练数据也很大。
大模型训练时“读过”的文字,几乎是整个互联网的文本——网页、书籍、论文、代码、论坛帖子……什么都读。
所以它“见过的东西”比任何一个人一辈子能读的都多。
💡 那它为什么“看起来”会思考?
这是最让人迷惑的地方。
一个只会“预测下一个词”的东西,为什么能回答哲学问题、能调试代码、能写小说?
答案叫涌现。
当模型的规模(参数、数据、算力)达到某个临界点之后,它会自发地出现一些训练时没有被明确教过的能力。
不是程序员教它“怎么写诗”,而是它读多了,自己“悟”出来了。
这个现象目前科学界也没完全解释清楚。
就像你往一个系统里砸足够多的数据和算力,突然之间——哎,它就会干一些没教过的事了。
但有一点很明确:
它不是真的在思考。
它是在用极其复杂的数学运算,模拟出“看起来像思考”的效果。
它没有意识,没有意图,没有“想不想回答你”这个念头——它只是在算概率。
🚫 几个常见的误区
说几个我经常听到的误解。

❌ 误区一:大模型有意识
没有。它就是一个数学模型,跑完就完了。关机之后什么都没留下,开机之后也不记得上次跟你说过了什么(除非产品层面做了对话历史功能)。它的“聪明”是计算,不是意识。
❌ 误区二:大模型什么都知道
不对。它知道的是“哪些词经常出现在哪些词后面”,不是“事实本身”。所以它会一本正经地胡说八道,而且说错的时候语气跟说对的时候一模一样,你根本看不出来。这就是为什么用AI生成的内容一定要人工核实。
❌ 误区三:我跟它聊完,它会变聪明
不会。每次对话,对模型本身来说都是“重新开始”。你跟它说的话不会改变它的参数,下一次别人用它的时候,它还是原来的样子。有些产品做了“记忆功能”,但那是在模型之外单独存了数据,不是模型本身在“学习”。
❌ 误区四:大模型 = 搜索引擎
完全两回事。搜索引擎是在现成的网页里找答案,大模型是“现编”答案——它根据学过的规律生成文字,这些文字在训练数据里可能根本没出现过。所以搜索引擎告诉你“我不知道”的时候是真的不知道,大模型告诉你“我不知道”的时候……它可能其实“知道”,只是不想说,或者它以为自己不知道。
知道大模型是什么、不是什么,不一定能让你更好地用它。
但至少,当有人跟你说“AI马上要取代所有人”的时候,你能心里有数。
它很强,但它不是魔法。
也不是人。
📝 写在最后
这篇文章是「AI原理科普」系列的开篇。
后面我会用同样的路子,把Token、Transformer、训练过程这些概念一个个拆清楚,不堆公式,不说废话,说完你能跟不懂的人讲明白那种。
一起进步,一起进化 🦐

更多推荐


所有评论(0)