近日,DeepSeek在官方渠道对腾讯技术团队表示感谢,高度评价其对DeepEP通信框架的优化贡献,称其带来了“huge speedup(巨大加速)”级别的技术提升。


DeepEP是DeepSeek于2024年2月开源发布的五大核心代码库之一,专为AI大模型的MoE(专家混合)架构打造。它以300%的通信效率提升,显著降低了对英伟达NCCL的依赖,成为AI开发者关注的热点。然而,面对成本更优、应用场景更广的RoCE网络,DeepEP仍面临性能瓶颈。

腾讯星脉网络团队在框架开源后迅速响应,锁定了双端口网卡带宽利用不充分、CPU控制面延迟过高两大核心问题。通过定向优化,DeepEP在RoCE网络下性能翻倍,在IB(InfiniBand)网络中性能提升达30%,彻底突破性能瓶颈。
目前,该优化成果已回馈开源社区,并广泛应用于腾讯混元等大模型的训练与推理任务中。在腾讯星脉团队基于H20服务器构建的高性能架构中,DeepEP展现了极强的兼容性与高效性,为企业部署AI大模型提供了经济可靠的新路径。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐