嘿,听说了吗?前阵子著名 AI 科学家李飞飞所在团队(Stanford HAI)最新发布的《2025 年人工智能指数报告》里,阿里表现挺抢眼,有 6 款模型入选了「值得关注的 AI 模型」位列全球第三。这背后,是阿里多年来选择开源、技术积累的硬实力。

图片

这不,阿里又带着他们家「通义千问」系列的新成员——Qwen3 来了! 而且一上来就霸气侧漏,表现超过了 Deepseek-R1,并给全球开源模型排行榜来了波“大换血”,向世界秀了一波中国开源大模型的实力。

图片

GitHub 地址:github.com/QwenLM/Qwen3

那么,这位阿里开源大模型的新同学——Qwen3,到底厉害在哪儿呢?咱们一起来瞅瞅。

一、Qwen3 全家桶:从小到大,满足不同需求

阿里这次真的是掏家底了,直接来了个「Qwen3 全家桶」,一口气开源了 8 款不同尺寸的模型:

  • 常规款(Dense 模型):从 0.6B 到 32B 参数,有小到能在手机上跑的迷你版,也有能支撑企业级应用的实力派

  • 隐藏菜单(MoE 模型):更猛的 30B-A3B 和 235B-A22B。

    • 235B 的旗舰版:只需 4 张 H20 显卡就能实现本地部署,显存占用仅为性能相近模型的三分之一。

    • 30B 的平民版:性能接近之前的 Qwen2.5-32B,适用于消费级别显卡。

图片

这么多型号,不管你是个人开发者捣鼓着玩,还是精打细算的企业用户,都能找到适合你的“菜”。

二、混合推理模型:快起来像闪电,思考起来像学霸

这次 Qwen3 全系列均为混合推理模型,原生支持两种模式:

  • 快速响应模式:遇到简单问题,“嗖”一下就能给答案,反应快,计算成本也低。

  • 深度思考模式:碰到复杂问题,它也能像个老师一样,一步步来分析推理并自我反思,给出更周全、深入的回答。

图片

切换模式也十分方便,请求时用 /think 和 /no_think 指令随时切换。厉害的是,Qwen3 能在同一个模型里稳定地玩转这两种模式,切换时性能损失也很小。仅需部署一个模型,就能支持两种模式,真正做到“一脑双模”。

# Ollama
ollama run qwen3:30b-a3b
# SGLang
python -m sglang.launch_server --model-path Qwen/Qwen3-30B-A3B --reasoning-parser qwen3
# vLLM
vllm serve Qwen/Qwen3-30B-A3B --enable-reasoning --reasoning-parser deepseek_r1

想要禁用思考模式,也可以在启动时移除 --reasoning-parser 和 --enable-reasoning参数。

三、那性能到底怎么样?

说到成绩单 Qwen3 这次也取得了不俗的表现,最新的基准测试(Benchmark)结果:

图片

旗舰版 Qwen3-235B-A22B,在好几个领域测试中刷新了开源模型的纪录

图片

通过优化架构、数据和训练方法,Qwen3 Dense 基础模型显著提升了效率,可以用更小的模型规模达到与 Qwen2.5 相当的性能水平。例如,Qwen3-1.7B/4B/8B/14B/32B-Base 的表现分别与 Qwen2.5-3B/7B/14B/32B/72B-Base 相当。

四、Agent 时代?Qwen3 已经准备好了

现在的大模型,光能聊天还不行,还得会干活!这就是 Agent 时代。

Qwen3 明显是有备而来,它天生就懂怎么跟其他工具和 API 打配合,原生支持 MCP 协议、工具调用、结构化输出等能力。

已关注

关注

重播 分享 赞

关闭

观看更多

更多

    退出全屏

    切换到竖屏全屏退出全屏

    HelloGitHub已关注

    分享视频

    ,时长00:55

    0/0

    00:00/00:55

    切换到横屏模式

    继续播放

    进度条,百分之0

    播放

    00:00

    /

    00:55

    00:55

    全屏

    倍速播放中

    0.5倍 0.75倍 1.0倍 1.5倍 2.0倍

    超清 流畅

    您的浏览器不支持 video 标签

    继续观看

    阿里 Qwen3 开源了,这次有点猛!

    观看更多

    转载

    ,

    阿里 Qwen3 开源了,这次有点猛!

    HelloGitHub已关注

    分享点赞在看

    已同步到看一看写下你的评论

    视频详情

    这意味着,开发者可以用阿里开源的 Qwen-Agent 框架结合 Qwen3,更轻松快速地开发自己的 Agent 应用。比如,让 AI 帮你处理邮件、自动操作软件、查询信息并执行后续步骤等等,让 AI 从“能说”进化到“能做”!

    GitHub 地址:github.com/QwenLM/Qwen-Agent

    五、想试试?很简单,还免费!

    看到这里,是不是有点心动,想上手体验下?安排!获取和使用 Qwen3 的途径不少:

    • 直接下载模型:魔搭社区(ModelScope)或 Hugging Face 就能找到。

    • 在线体验:打开通义 APP 或网站,可以直接跟 Qwen3 对话。

    • API 调用:阿里云百炼平台提供了 API 服务。

    图片

    Qwen3 在线体验:chat.qwen.ai

    哦对了,提一嘴:Qwen3 系列模型用的是 Apache 2.0 开源协议,可以免费商用,这点挺重要的。

    六、最后我的感觉:开源大模型,阿里是认真的

    从一代千问到 Qwen2.5,再到今天的 Qwen3,能看到阿里在开源大模型这条路上走的很坚决。这不仅仅是秀肌肉,更是实打实的技术积累和开源决心。

    之前大佬李飞飞团队就基于 Qwen 做出了不错的成果(s1-32B),现在有了更强的 Qwen3,无疑给全球开发者提供了一个更强大的基础模型,让大家能更容易地去探索和创新。

    阿里也表态了,未来计划投入 3800 亿,继续加强云计算和 AI 基础设施。意思挺明白:基础打好了,欢迎大家来上面构建应用,一起把 AI 生态做大做强。

    好了,介绍得差不多了,对 Qwen3 感兴趣的话,不妨去试试看吧!

    • 在线体验:chat.qwen.ai

    • Hugging Face:huggingface.co/Qwen

    • GitHub:github.com/QwenLM/Qwen3

     

     如何系统的去学习大模型LLM ?

    大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

    事实上,抢你饭碗的不是AI,而是会利用AI的人。

    科大讯飞、阿里、华为等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?

    与其焦虑……

    不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

    但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。

    基于此,我用做产品的心态来打磨这份大模型教程,深挖痛点并持续修改了近70次后,终于把整个AI大模型的学习门槛,降到了最低!

    在这个版本当中:

    第一您不需要具备任何算法和数学的基础
    第二不要求准备高配置的电脑
    第三不必懂Python等任何编程语言

    您只需要听我讲,跟着我做即可,为了让学习的道路变得更简单,这份大模型教程已经给大家整理并打包,现在将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

    一、LLM大模型经典书籍

    AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。

    在这里插入图片描述

    二、640套LLM大模型报告合集

    这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
    在这里插入图片描述

    三、LLM大模型系列视频教程

    在这里插入图片描述

    四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)

    在这里插入图片描述

    五、AI产品经理大模型教程

    在这里插入图片描述

    LLM大模型学习路线 

    阶段1:AI大模型时代的基础理解

    • 目标:了解AI大模型的基本概念、发展历程和核心原理。

    • 内容

      • L1.1 人工智能简述与大模型起源
      • L1.2 大模型与通用人工智能
      • L1.3 GPT模型的发展历程
      • L1.4 模型工程
      • L1.4.1 知识大模型
      • L1.4.2 生产大模型
      • L1.4.3 模型工程方法论
      • L1.4.4 模型工程实践
      • L1.5 GPT应用案例

    阶段2:AI大模型API应用开发工程

    • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。

    • 内容

      • L2.1 API接口
      • L2.1.1 OpenAI API接口
      • L2.1.2 Python接口接入
      • L2.1.3 BOT工具类框架
      • L2.1.4 代码示例
      • L2.2 Prompt框架
      • L2.3 流水线工程
      • L2.4 总结与展望

    阶段3:AI大模型应用架构实践

    • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。

    • 内容

      • L3.1 Agent模型框架
      • L3.2 MetaGPT
      • L3.3 ChatGLM
      • L3.4 LLAMA
      • L3.5 其他大模型介绍

    阶段4:AI大模型私有化部署

    • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。

    • 内容

      • L4.1 模型私有化部署概述
      • L4.2 模型私有化部署的关键技术
      • L4.3 模型私有化部署的实施步骤
      • L4.4 模型私有化部署的应用场景

    这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

     

    Logo

    中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

    更多推荐