近期有个重磅的AI现状报告发布,通过OpenRouter平台上百万亿个token分析了当前全球AI的现状。OpenRouter有点像是LLM的聚合平台,上面提供了多数主流闭源和开源的LLM模型供调用。

  • 整体来看,美国主导闭源,中国主导开源。

  • LLM范式从直接生成到多步骤推理。

  • 开源模型与闭源模型大致的比例是3:7,也就是当前全球开源模型占三成左右。中国基本上主导了开源模型的发展,有实力的厂商包括deepseek、qwen、kimi。中国开源占了13%份额,而非中国开源占13.7%。

  • deepseek当时凭借V3和R1主导开源,占了一半token使用份额。不过后面qwen、minimax、kimi、gpt-oss等瓜分了一些份额。竞争非常激烈,需要持续更新发布新模型才能保持份额。

  • 模型参数量从最开始小参量和大参量,后来为适应市场很多厂家推出中参量。小于15B是小参量,15-70B是中参量,大于70B是大参量。小参量效果较差越来越少人用,大参量效果好但耗资源,所以实际落地还得是中参量,中参量成为主流。

  • 国内外开源模型使用场景有些差异,整体来说都是以角色扮演和编程为主。

  • 有一个明显的趋势是推理模型占比越来越大,从年初时几乎无人使用到现在整体token份额超50%。主流推理模型厂商是xAI、google、openai。

  • 还有一个趋势是工具调用使用越来越多,年初几乎没人使用,现在大概有13%的token占比。提供模型的厂家主要有openai、anthropic、google、z-ai。

  • 相比2024年每个请求的token数增长了近4倍,输入从1.5k增加到6k,输出则是从150增长到400。

  • 提出了一个所谓的灰姑娘玻璃鞋效应,描述了用户粘性与模型选择的现象,早期用户根据自己需求和模型特性进行选择。一旦用户嵌入到自己的工作流后就迁移到其它模型的可能性就很小,体现了模型的先发优势。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐