“新五强”争锋,基础大模型玩家再洗牌
***在AI应用落地如火如荼、Scaling Law边际效益递减的今天,继续押注基础大模型还有价值吗?100天之前,DeepSeek的发布无疑给行业了一个无比确定的答案。“一切变化都太快了,每天早上起来,新模型、新产品的发布都可能颠覆掉过往的认知。”一位创业者向光锥智能感慨道。正如我们上面提到,这半年,模型发布的速度不减反增。同时,由模型能力提升带来的技术红利让DeepSeek们站到台前,而没有技
大模型公司正在进行新一轮的排位赛。
AI应用如火如荼,但在“看不见”的水面之下,基础大模型的战争仍在继续。不像预期般放缓脚步,而是变得更“卷”了:
*据光锥智能不完全统计,2025年开始至今,中国参与模型竞争的百度、字节、阿里、DeepSeek和“六小虎”等主要大模型公司,发布了超过45款基础大模型(不包括行业垂类大模型),相当于每3.3天,就有一款新的模型发布。*
而在上半年,国内大模型公司的第一梯队,正在无限接近海外第一梯队的格局。
对比三家大厂+两家创业公司组合成海外“五强”的OpenAI、Google、Anthropic、X.AI和Meta,*国内大模型团队也在分化成由阿里、字节、DeepSeek、阶跃星辰和智谱的“3+2”组合,成为国内的“新基模五强”。*
神仙打架,“新基建五强”
半年发30个大模型
**
**
上半年,基础大模型领域仍然是“神仙打架”的局面。
以国内“基模五强”公司上半年发布的模型数量统计来看,五家公司共发布32个大模型。从发布数量上来看,阿里和阶跃星辰是突出的两个“卷王”,其中阶跃星辰发布11款模型,阿里发布9款模型,加起来超过五家公司的半数。

结合大模型行业发展趋势,*开源、推理和多模态,成为三个关键词:*
从时间线来看,五家公司中,阿里、智谱和DeepSeek三家早就坚定走开源路线。
其中,阿里是独一无二的“开源卷王”,自2023年起,阿里就将旗下多款模型发布在开源社区。无论从开源数量还是类型来说,阿里都是最全面的一家。
这也让阿里成为了当下多个领域的开源SOTA提供者。4月29日上线的混合推理模型Qwen3成为目前全球最强的开源模型,而其成本仅为DeepSeek-R1的35%。
当然,在Qwen3之前,国内上一个掀起推理模型热的公司,就是“鲶鱼”DeepSeek。
对比上述四家公司,DeepSeek是唯一一家“专才”,不做大模型矩阵。比如春节期间发布的推理大模型DeepSeek R1,性能拉满的同时做到了极低成本,训练只要GPT-4o的1/10,输入成本更是低至2%,一举出圈,成为后续推理大模型的“标杆”。
*多模态大模型,则是今年大模型公司的研发重点方向。*
比如,被称为“多模态卷王”的阶跃星辰,目前共发布22个基础模型,其中多模态领域的大模型高达16个。
其中,阶跃星辰联合吉利开源文生视频大模型Step-Video-T2V,成为当时全球范围内参数量最大、性能最好的开源视频生成大模型,Step-Audio则是行业内首个产品级的开源语音交互模型。
布局全面的字节今年在多模态领域表现也开始加入第一梯队。以文生图模型Seedream 3.0来说,除了提升画质和生成效率之外,它还提升了AI生图在商业化领域的应用能力。由此,其对应产品即梦AI的文生图效果一度出圈。
不过,相比大语言模型,行业内多模态大模型的发展程度还远远不够。用姜大昕的话来说,“多模态模型领域,目前还没有出现GPT-4时刻。”
在姜大昕看来,它的卡点就在于整个行业缺少多模态领域的理解生成一体化架构。大语言模型已经做到了,但多模态大模型的理解和生成仍然由不同的模型完成。对于计算机视觉来说,这是一个几十年没有解决的顽固问题。
对比大语言模型的ChatGPT和推理模型DeepSeek-R1,多模态领域仍有机会等到下一个爆款模型。
走向AGI,什么是必经之路?
**
**
在AI应用落地如火如荼、Scaling Law边际效益递减的今天,继续押注基础大模型还有价值吗?
100天之前,DeepSeek的发布无疑给行业了一个无比确定的答案。
“一切变化都太快了,每天早上起来,新模型、新产品的发布都可能颠覆掉过往的认知。”一位创业者向光锥智能感慨道。
正如我们上面提到,这半年,模型发布的速度不减反增。同时,由模型能力提升带来的技术红利让DeepSeek们站到台前,而没有技术优势的公司则在投资热情退潮时,失去了继续立在第一梯队的机会。
为了更长久地留在牌桌上,无论是大厂还是创业公司,抢钱、抢人才,依旧是2025年的主旋律。
如今,*算力、人才和资金仍然是衡量大模型公司立在牌桌上的三个**硬*****指标。****对大厂来说,资金自然不成问题,但对于创业公司来说,必须拉到足够的投资来为公司前期的研发买单。
*以资金作为衡量指标,**大厂自然相对充沛,但是初创阵营中**只有“北京队”智谱和“上海队”阶跃星辰这两家被国资看好的企业,可以在大模型公司的寒冬期**持续获得资本青睐**。*
以智谱来说,它在三月接连拿下杭州、珠海和成都三家国资的投资,累计共达到18亿人民币;去年12月,阶跃星辰拿到数亿美元资金,完成B轮融资。
****再从人才衡量,目前“基模五强”正在展现对人才的虹吸效应。****以字节来说,从2023-2025年,这家公司挖走了海内外的多位研发骨干,比如曾任谷歌DeepMind研究副总裁的吴永辉,今年加入字节成为大模型团队Seed的基础研究负责人。
在大量堆积资金和人才的基础上,上述基模五强逐渐建立了优势:“开源卷王”阿里用生态拉拢B端用户,字节则一边补齐基础模型的版图,一边靠豆包、扣子等应用反哺模型升级,DeepSeek靠性能和低价成为性价比之王,智谱的大模型落地在政企端优势明显,阶跃则成了“多模态卷王”,发出多款SOTA模型。
上述企业的目标都是继续提升大模型的“智能上限”,用溢出的模型能力支撑AI应用的能力突破。
以智能体(Agent)来说,其关键能力在于多模态、慢思考以及记忆能力。
有了多模态理解能力,才能让以大模型为技术底座的Agent能够“阅读”并理解手机和电脑屏幕中的信息,从而让AI也能够代替人类操作智能终端;而推理能力则让AI能够根据用户需求拆解任务,按照每一个规划好的步骤推进,最终完成任务。
Google DeepMind CEO Demis Hassabis认为,目前通往 AGI 的道路已经开始变得清晰,但要真正抵达这个目标,仍需要突破多个技术瓶颈,整合多项关键能力。
在有限的时间内,谁的硬指标更全面、基座模型能力更强,谁才能有机会真正获得AGI的入场券。
大模型商业化趋势:
开源、垂类场景落地
**
**
商业化是基础大模型公司不能跳过去的命题,其商业化的策略,往往和技术的战略也一脉相承。
*2025年,开源和垂类场景应用成为模型商业化的两个关键方向。*
****先来说开源,开源的中国大模型已经在全球占据了半壁江山。****目前,在开源社区HuggingFace上,前30的热门模型,已经有12个模型来自于中国公司,其中出现了阶跃星辰最新的音乐模型ACE-Step、DeepSeek的R1和Prover-v2、阿里的Qwen3系列、字节Seed的小参数代码模型和腾讯混元的AI视频模型。

开源之后,大模型公司可以尝试的商业化手段变得更加多样:国内以DeepSeek和阿里作为代表,采用的是更加开放的协议,这种模型一般可以走三种模式,最直观的是调用API付费,云厂商则通过提供GPU服务收“水电费”,另外,围绕开源模型的定制化调整和技术服务也是一种模式。
*不过,真正能直接使用开源模型的企业和个人都是少数,多数人更需要一个“开箱即用”的完整产品。所以,AI在垂类场景的应用越来越火热。*
最火热的无疑就是各行各业的智能体(Agent),从政企、金融到医疗,智能体可谓无处不在。但目前热度更高的,还是智能体和智能终端的结合。
*为什么智能体+智能终端成为了关键的落地方向?*
“汽车不仅具有高价值的软硬件系统,还与用户有着密切的联系,这使其成为理想的AI载体。”长城汽车CTO吴会肖说。同样,这条规则也适用于手机、具身智能等产品。
而对于厂商来说,和多模态、强化学习能力等相同,做Agent,同样也是大模型企业通向AGI之路的基石之一。在OpenAI给出的AGI五阶段来说,Agent对应的就是L3阶段,即AI拥有自主操作能力,在L3的基础上,AI才能进一步追求自主学习的能力。
所以,对于大模型公司来说,做Agent的商业化战略就是在技术基础上延伸而来的一步棋。
阶跃星辰和智谱,这两家大模型的南北双雄,也不约而同地都瞄准了智能终端赛道。
智谱在去年就推出了能够在手机端运行的智能体AutoGLM,让Agent接管各种应用调配,实现用户需求。
而在今年,阶跃星辰进一步扩大了Agent在智能终端的落地范围,在2月份的开放日上,这家公司放出了Agent在汽车、手机、具身智能、IoT四个领域的应用。
如今,各家大模型公司都在抢夺智能终端客户的订单。以阶跃星辰来说,在今年拿到了和OPPO、千里科技、吉利汽车集团、智元机器人等厂商的合作。
Agent能力的叠加,也在成为智能终端产品的卖点。比如,搭载了“一键全能搜”、“一键问屏”的OPPO手机Find N5和Find X8销量亮眼。据悉,其中Find X8成为Find 系列史上同期销量最高的产品。
比起其他业务来说,智能体+智能终端的合作,也为企业带来了可观的收入。据《智能涌现》报道,随着三星等大单的签订,智谱节后不到一个月,收入已经过亿。
*从这一代AI大模型公司的商业化来看,大家都在避免传统**T**o* *B赛道重复造轮子的私有化定制,希望借助技术的红利,把产品尽量做得标准化,以此来实现更高的毛利率。*
智谱节后不到一个月,收入已经过亿。
*从这一代AI大模型公司的商业化来看,大家都在避免传统**T**o* *B赛道重复造轮子的私有化定制,希望借助技术的红利,把产品尽量做得标准化,以此来实现更高的毛利率。*
无论是提供开源工具的“自助火锅店”,还是垂类智能体的“私房菜餐厅”,大模型商业化的前景都在变得越来越乐观。
大模型岗位需求
大模型时代,企业对人才的需求变了,AIGC相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。
掌握大模型技术你还能拥有更多可能性:
• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;
• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;
• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;
• 更优质的项目可以为未来创新创业提供基石。
可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把全套AI技术和大模型入门资料、操作变现玩法都打包整理好,希望能够真正帮助到大家。
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用
零基础入门AI大模型
今天贴心为大家准备好了一系列AI大模型资源,包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
有需要的小伙伴,可以点击下方链接免费领取【保证100%免费】
内容包括:项目实战、面试招聘、源码解析、学习路线。





如果大家想领取完整的学习路线及大模型学习资料包,可以扫下方二维码获取
👉2.大模型配套视频👈
很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。(篇幅有限,仅展示部分)

大模型教程
👉3.大模型经典学习电子书👈
随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。(篇幅有限,仅展示部分,公众号内领取)

电子书
👉4.大模型面试题&答案👈
截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。(篇幅有限,仅展示部分,公众号内领取)

大模型面试
**因篇幅有限,仅展示部分资料,**有需要的小伙伴,可以点击下方链接免费领取【保证100%免费】
**或扫描下方二维码领取 **

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)