“新五强”争锋，基础大模型玩家再洗牌

***在AI应用落地如火如荼、Scaling Law边际效益递减的今天，继续押注基础大模型还有价值吗？100天之前，DeepSeek的发布无疑给行业了一个无比确定的答案。“一切变化都太快了，每天早上起来，新模型、新产品的发布都可能颠覆掉过往的认知。”一位创业者向光锥智能感慨道。正如我们上面提到，这半年，模型发布的速度不减反增。同时，由模型能力提升带来的技术红利让DeepSeek们站到台前，而没有技

网络安全学习资源库

842人浏览 · 2025-05-19 21:39:16

网络安全学习资源库 · 2025-05-19 21:39:16 发布

大模型公司正在进行新一轮的排位赛。

AI应用如火如荼，但在“看不见”的水面之下，基础大模型的战争仍在继续。不像预期般放缓脚步，而是变得更“卷”了：

*据光锥智能不完全统计，2025年开始至今，中国参与模型竞争的百度、字节、阿里、DeepSeek和“六小虎”等主要大模型公司，发布了超过45款基础大模型（不包括行业垂类大模型），相当于每3.3天，就有一款新的模型发布。*

而在上半年，国内大模型公司的第一梯队，正在无限接近海外第一梯队的格局。

对比三家大厂+两家创业公司组合成海外“五强”的OpenAI、Google、Anthropic、X.AI和Meta，*国内大模型团队也在分化成由阿里、字节、DeepSeek、阶跃星辰和智谱的“3+2”组合，成为国内的“新基模五强”。*

神仙打架，“新基建五强”

半年发30个大模型

**
**

上半年，基础大模型领域仍然是“神仙打架”的局面。

以国内“基模五强”公司上半年发布的模型数量统计来看，五家公司共发布32个大模型。从发布数量上来看，阿里和阶跃星辰是突出的两个“卷王”，其中阶跃星辰发布11款模型，阿里发布9款模型，加起来超过五家公司的半数。

结合大模型行业发展趋势，*开源、推理和多模态，成为三个关键词：*

从时间线来看，五家公司中，阿里、智谱和DeepSeek三家早就坚定走开源路线。

其中，阿里是独一无二的“开源卷王”，自2023年起，阿里就将旗下多款模型发布在开源社区。无论从开源数量还是类型来说，阿里都是最全面的一家。

这也让阿里成为了当下多个领域的开源SOTA提供者。4月29日上线的混合推理模型Qwen3成为目前全球最强的开源模型，而其成本仅为DeepSeek-R1的35%。

当然，在Qwen3之前，国内上一个掀起推理模型热的公司，就是“鲶鱼”DeepSeek。

对比上述四家公司，DeepSeek是唯一一家“专才”，不做大模型矩阵。比如春节期间发布的推理大模型DeepSeek R1，性能拉满的同时做到了极低成本，训练只要GPT-4o的1/10，输入成本更是低至2%，一举出圈，成为后续推理大模型的“标杆”。

*多模态大模型，则是今年大模型公司的研发重点方向。*

比如，被称为“多模态卷王”的阶跃星辰，目前共发布22个基础模型，其中多模态领域的大模型高达16个。

其中，阶跃星辰联合吉利开源文生视频大模型Step-Video-T2V，成为当时全球范围内参数量最大、性能最好的开源视频生成大模型，Step-Audio则是行业内首个产品级的开源语音交互模型。

布局全面的字节今年在多模态领域表现也开始加入第一梯队。以文生图模型Seedream 3.0来说，除了提升画质和生成效率之外，它还提升了AI生图在商业化领域的应用能力。由此，其对应产品即梦AI的文生图效果一度出圈。

不过，相比大语言模型，行业内多模态大模型的发展程度还远远不够。用姜大昕的话来说，“多模态模型领域，目前还没有出现GPT-4时刻。”

在姜大昕看来，它的卡点就在于整个行业缺少多模态领域的理解生成一体化架构。大语言模型已经做到了，但多模态大模型的理解和生成仍然由不同的模型完成。对于计算机视觉来说，这是一个几十年没有解决的顽固问题。

对比大语言模型的ChatGPT和推理模型DeepSeek-R1，多模态领域仍有机会等到下一个爆款模型。

走向AGI，什么是必经之路？

**
**

在AI应用落地如火如荼、Scaling Law边际效益递减的今天，继续押注基础大模型还有价值吗？

100天之前，DeepSeek的发布无疑给行业了一个无比确定的答案。

“一切变化都太快了，每天早上起来，新模型、新产品的发布都可能颠覆掉过往的认知。”一位创业者向光锥智能感慨道。

正如我们上面提到，这半年，模型发布的速度不减反增。同时，由模型能力提升带来的技术红利让DeepSeek们站到台前，而没有技术优势的公司则在投资热情退潮时，失去了继续立在第一梯队的机会。

为了更长久地留在牌桌上，无论是大厂还是创业公司，抢钱、抢人才，依旧是2025年的主旋律。

如今，*算力、人才和资金仍然是衡量大模型公司立在牌桌上的三个**硬*****指标。****对大厂来说，资金自然不成问题，但对于创业公司来说，必须拉到足够的投资来为公司前期的研发买单。

*以资金作为衡量指标，**大厂自然相对充沛，但是初创阵营中**只有“北京队”智谱和“上海队”阶跃星辰这两家被国资看好的企业，可以在大模型公司的寒冬期**持续获得资本青睐**。*

以智谱来说，它在三月接连拿下杭州、珠海和成都三家国资的投资，累计共达到18亿人民币；去年12月，阶跃星辰拿到数亿美元资金，完成B轮融资。

****再从人才衡量，目前“基模五强”正在展现对人才的虹吸效应。****以字节来说，从2023-2025年，这家公司挖走了海内外的多位研发骨干，比如曾任谷歌DeepMind研究副总裁的吴永辉，今年加入字节成为大模型团队Seed的基础研究负责人。

在大量堆积资金和人才的基础上，上述基模五强逐渐建立了优势：“开源卷王”阿里用生态拉拢B端用户，字节则一边补齐基础模型的版图，一边靠豆包、扣子等应用反哺模型升级，DeepSeek靠性能和低价成为性价比之王，智谱的大模型落地在政企端优势明显，阶跃则成了“多模态卷王”，发出多款SOTA模型。

上述企业的目标都是继续提升大模型的“智能上限”，用溢出的模型能力支撑AI应用的能力突破。

以智能体（Agent）来说，其关键能力在于多模态、慢思考以及记忆能力。

有了多模态理解能力，才能让以大模型为技术底座的Agent能够“阅读”并理解手机和电脑屏幕中的信息，从而让AI也能够代替人类操作智能终端；而推理能力则让AI能够根据用户需求拆解任务，按照每一个规划好的步骤推进，最终完成任务。

Google DeepMind CEO Demis Hassabis认为，目前通往 AGI 的道路已经开始变得清晰，但要真正抵达这个目标，仍需要突破多个技术瓶颈，整合多项关键能力。

在有限的时间内，谁的硬指标更全面、基座模型能力更强，谁才能有机会真正获得AGI的入场券。

大模型商业化趋势：

开源、垂类场景落地

**
**

商业化是基础大模型公司不能跳过去的命题，其商业化的策略，往往和技术的战略也一脉相承。

*2025年，开源和垂类场景应用成为模型商业化的两个关键方向。*

****先来说开源，开源的中国大模型已经在全球占据了半壁江山。****目前，在开源社区HuggingFace上，前30的热门模型，已经有12个模型来自于中国公司，其中出现了阶跃星辰最新的音乐模型ACE-Step、DeepSeek的R1和Prover-v2、阿里的Qwen3系列、字节Seed的小参数代码模型和腾讯混元的AI视频模型。

开源之后，大模型公司可以尝试的商业化手段变得更加多样：国内以DeepSeek和阿里作为代表，采用的是更加开放的协议，这种模型一般可以走三种模式，最直观的是调用API付费，云厂商则通过提供GPU服务收“水电费”，另外，围绕开源模型的定制化调整和技术服务也是一种模式。

*不过，真正能直接使用开源模型的企业和个人都是少数，多数人更需要一个“开箱即用”的完整产品。所以，AI在垂类场景的应用越来越火热。*

最火热的无疑就是各行各业的智能体（Agent），从政企、金融到医疗，智能体可谓无处不在。但目前热度更高的，还是智能体和智能终端的结合。

*为什么智能体+智能终端成为了关键的落地方向？*

“汽车不仅具有高价值的软硬件系统，还与用户有着密切的联系，这使其成为理想的AI载体。”长城汽车CTO吴会肖说。同样，这条规则也适用于手机、具身智能等产品。

而对于厂商来说，和多模态、强化学习能力等相同，做Agent，同样也是大模型企业通向AGI之路的基石之一。在OpenAI给出的AGI五阶段来说，Agent对应的就是L3阶段，即AI拥有自主操作能力，在L3的基础上，AI才能进一步追求自主学习的能力。

所以，对于大模型公司来说，做Agent的商业化战略就是在技术基础上延伸而来的一步棋。

阶跃星辰和智谱，这两家大模型的南北双雄，也不约而同地都瞄准了智能终端赛道。

智谱在去年就推出了能够在手机端运行的智能体AutoGLM，让Agent接管各种应用调配，实现用户需求。

而在今年，阶跃星辰进一步扩大了Agent在智能终端的落地范围，在2月份的开放日上，这家公司放出了Agent在汽车、手机、具身智能、IoT四个领域的应用。

如今，各家大模型公司都在抢夺智能终端客户的订单。以阶跃星辰来说，在今年拿到了和OPPO、千里科技、吉利汽车集团、智元机器人等厂商的合作。

Agent能力的叠加，也在成为智能终端产品的卖点。比如，搭载了“一键全能搜”、“一键问屏”的OPPO手机Find N5和Find X8销量亮眼。据悉，其中Find X8成为Find 系列史上同期销量最高的产品。

比起其他业务来说，智能体+智能终端的合作，也为企业带来了可观的收入。据《智能涌现》报道，随着三星等大单的签订，智谱节后不到一个月，收入已经过亿。

*从这一代AI大模型公司的商业化来看，大家都在避免传统**T**o* *B赛道重复造轮子的私有化定制，希望借助技术的红利，把产品尽量做得标准化，以此来实现更高的毛利率。*

智谱节后不到一个月，收入已经过亿。

无论是提供开源工具的“自助火锅店”，还是垂类智能体的“私房菜餐厅”，大模型商业化的前景都在变得越来越乐观。

大模型岗位需求

大模型时代，企业对人才的需求变了，AIGC相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。
在这里插入图片描述

掌握大模型技术你还能拥有更多可能性：

• 成为一名全栈大模型工程师，包括Prompt，LangChain，LoRA等技术开发、运营、产品等方向全栈工程；

• 能够拥有模型二次训练和微调能力，带领大家完成智能对话、文生图等热门应用；

• 薪资上浮10%-20%，覆盖更多高薪岗位，这是一个高需求、高待遇的热门方向和领域；

• 更优质的项目可以为未来创新创业提供基石。

可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。为了让大家少走弯路，少碰壁，这里我直接把全套AI技术和大模型入门资料、操作变现玩法都打包整理好，希望能够真正帮助到大家。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

零基础入门AI大模型

今天贴心为大家准备好了一系列AI大模型资源，包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

有需要的小伙伴，可以点击下方链接免费领取【保证100%免费】

点击领取《AI大模型&人工智能&入门进阶学习资源包》*

内容包括：项目实战、面试招聘、源码解析、学习路线。

如果大家想领取完整的学习路线及大模型学习资料包，可以扫下方二维码获取
在这里插入图片描述
👉2.大模型配套视频👈

很多朋友都不喜欢晦涩的文字，我也为大家准备了视频教程，每个章节都是当前板块的精华浓缩。(篇幅有限，仅展示部分）

大模型教程

👉3.大模型经典学习电子书👈

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。（篇幅有限，仅展示部分，公众号内领取）

电子书

👉4.大模型面试题&答案👈

截至目前大模型已经超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道，我总结了大模型常考的面试题。（篇幅有限，仅展示部分，公众号内领取）

大模型面试

**因篇幅有限，仅展示部分资料，**有需要的小伙伴，可以点击下方链接免费领取【保证100%免费】

点击领取《AI大模型&人工智能&入门进阶学习资源包》

**或扫描下方二维码领取 **

在这里插入图片描述

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

Chess用户界面设计：Tailwind CSS样式系统和组件库

GitHub推荐项目精选中的ch/chess是一个类似chess.com的多人在线象棋平台，它采用现代化的前端技术栈构建，尤其在用户界面设计上通过Tailwind CSS样式系统和组件库实现了优雅且功能丰富的交互体验。本文将深入探讨该项目如何利用Tailwind CSS打造一致的设计语言和高效的组件系统，为象棋爱好者提供沉浸式的游戏界面。## 🎨 Tailwind CSS样式系统：构建统一视

火山引擎 ADG 社区

终极指南：GPT-Engineer如何通过AI自动发现代码问题并提升质量

GPT-Engineer是一款强大的AI驱动代码工具，它能帮助开发者自动检测潜在代码问题、优化代码质量，让编程效率提升3倍以上。无论是新手还是资深开发者，都能通过这款工具轻松发现代码中的隐藏缺陷，减少调试时间，释放更多精力在创造性工作上。## 一键发现代码问题：GPT-Engineer的AI审查魔力GPT-Engineer的核心能力在于其内置的智能代码分析系统。通过集成Python代码格式

火山引擎 ADG 社区

SatDump中的纠错编码技术：从RS码到Turbo码的完整实现指南

在卫星数据传输过程中，信号往往会受到各种干扰，导致数据错误。SatDump作为一款通用卫星数据处理软件，集成了多种先进的纠错编码技术，确保从卫星接收到的数据能够准确解码。本文将深入解析SatDump中从Reed-Solomon（RS）码到Turbo码的实现细节，帮助读者理解这些技术如何保障卫星通信的可靠性。## 为什么纠错编码对卫星数据至关重要？卫星与地面站之间的通信链路面临着空间辐射、大