阿里开源旗下首个深度研究 Agent 模型:通义 DeepResearch!性能超 OpenAI、DeepSeek 旗舰模型
具体来说,在Humanity's Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA以及Frames等评测集中,通义DeepResearch模型以3B激活参数,性能超越了基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent。
戳下方名片,关注并星标!
回复“1024”获取2TB学习资源!
👉体系化学习:运维工程师打怪升级进阶之路 4.0
— 特色专栏 —
大家好,我是民工哥!
阿里开源旗下首个深度研究Agent模型——通义DeepResearch!

阿里开源的通义DeepResearch是其旗下首个深度研究Agent模型,该模型在多个权威评测集中取得SOTA成绩,性能超越OpenAI、DeepSeek等旗舰模型,且已全面开源,助力全球开发者推动智能体技术发展。
通义DeepResearch在HLE、BrowseComp-zh、GAIA等多个权威评测集上取得了SOTA(State-of-the-art)成绩,这一表现超越了OpenAI Deep Research、DeepSeek-V3.1等同类模型。

具体来说,在Humanity's Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA以及Frames等评测集中,通义DeepResearch模型以3B激活参数,性能超越了基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent。
目前,通义DeepResearch的模型、框架和方案均已全面开源,用户可在Github、Hugging Face和魔搭社区社区下载模型和代码。

通义DeepResearch的开源标志着阿里在智能体技术领域取得了重要突破,其性能超越OpenAI、DeepSeek等旗舰模型,展现了阿里在人工智能领域的强大实力。
👍 既然都看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~
公众号读者专属技术群
构建高质量的技术交流社群,欢迎从事后端开发、运维技术进群(备注岗位,已在技术交流群的请勿重复添加微信好友)。主要以技术交流、内推、行业探讨为主,请文明发言。广告人士勿入,切勿轻信私聊,防止被骗。
扫码加我好友,拉你进群


我用 LazyLLM 做了一个打工人述职 Agent,朋友直呼打工人的福利,太完美了!
CentOS 停服后,Rocky Linux 凭什么后来者居上成为千万服务器的新选择?
为什么高性能场景选用 Postgres SQL 而不是 MySQL?
马斯克的 xAI 一刀裁掉 500 人!训练大模型的人说失业就失业了?
刚刚!OpenAI 发布 GPT-5-Codex 新模型,可独立工作超 7 小时,还能审查、重构大型项目
网信办发布《国家网络安全事件报告管理办法》!2025 年 11 月 1 日起正式施行
刚刚!阿里正式开源下一代基础模型架构 Qwen3-Next,训练成本直降 90%
9 月编程语言排行榜 | Perl 杀进前十,Python 稳居榜首,C、C++ 依旧胜 Java 一筹
快手 AI 超级员工上线!一句话剪出完整视频,从文案到发布一条龙

PS:因为公众号平台更改了推送规则,如果不想错过内容,记得读完点一下“在看”,加个“星标”,这样每次新文章推送才会第一时间出现在你的订阅列表里。点“在看”支持我们吧!
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)