可用于部署 DeepSeek 的国产 GPU 计算卡
JM 系列与 DeepSeek-R1-Distill-Qwen-1.5B 和 DeepSeek-R1-Distill-Qwen-7B 模型完美融合,景宏系列全面适配 DeepSeek R1 全系列模型,覆盖从 1.5B 到 70B 参数规模。宣布与 Gitee AI 合作,完成了与 DeepSeek-R1 模型的适配工作,并已上线多个大模型服务,包括 1.5B、7B、14B 等版本。通过多台搭载芯
可用于部署 DeepSeek 的国产 GPU 计算卡有以下几种:
芯瞳
型号:CQ2040 系列。
特点:基于 llama.cpp 推理框架研发,采用全国产化生产工艺,构建在统一渲染架构之上,配备 1152 个流处理器核心,单精度浮点算力高达 1.3 TFLOPS。兼容多种图形 API,包括 OpenGL、OpenGLES 和 Vulkan,并支持 WebGL。
解决方案:
单机单卡版:配备 1 颗芯瞳 GPU,支持 DeepSeek R1 32B 参数模型,适合个人用户及小团队。
多卡版:可支持 4 至 8 颗芯瞳 GPU,能够部署 DeepSeek R1 70B 参数模型,便于中小企业多用户访问。
多机多卡版:通过多台搭载芯瞳 GPU 的电脑组建集群,支持 DeepSeek V3 和全量 R1 模型,适用于大型企业。
海光
型号:DCU。
特点:海光推出的高性能 GPGPU 架构 AI 加速卡,为行业客户提供自主可控的全精度通用 AI 加速计算解决方案,已在科教、金融、医疗、政务、智算中心等多个领域实现规模化应用。
适配情况:海光信息技术团队已成功完成 DeepSeek V3 和 R1 模型与海光 DCU 的适配,用户可通过 “光合开发者社区” 中的 “光源” 板块访问并下载相关模型。
摩尔线程
型号:MTT S80、MTT S4000、夸娥(KUAE)GPU 智算集群。
特点:自主研发的全功能 GPU,通过开源与自研双引擎方案,提升模型的计算效率和资源利用率。
适配情况:已实现对 DeepSeek 蒸馏模型推理服务的部署,基于 Ollama 开源框架,完成 DeepSeek-R1-Distill-Qwen-7B 蒸馏模型的部署。即将开放的夸娥集群将全面支持 DeepSeek V3、R1 模型及新一代蒸馏模型的分布式部署。
沐曦
型号:曦云 GPU。
特点:国产高性能计算芯片。
适配情况:联合中国开源大模型平台 Gitee AI 发布了全套 DeepSeek-R1 千问蒸馏模型,2 月 2 日首批上线 1.5B、7B、14B、32B 四个较小规模的模型。
天数智芯
型号:通用 GPU。
特点:国内头部超级算力系统提供商,其通用 GPU 产品具有高性能、通用性、灵活性等特点。
适配情况:宣布与 Gitee AI 合作,完成了与 DeepSeek-R1 模型的适配工作,并已上线多个大模型服务,包括 1.5B、7B、14B 等版本。
景嘉微
型号:JM 系列、景宏系列。
特点:国产 GPU 代表产品,具有自主知识产权。
适配情况:JM 系列与 DeepSeek-R1-Distill-Qwen-1.5B 和 DeepSeek-R1-Distill-Qwen-7B 模型完美融合,景宏系列全面适配 DeepSeek R1 全系列模型,覆盖从 1.5B 到 70B 参数规模。
华为
型号:昇腾系列。
特点:昇腾全栈 AI 软硬件平台及 CANN 计算架构,为 AI 应用开发、部署和运行提供全方位支持。
适配情况:硅基流动联合华为云上线了基于华为云昇腾云服务的 DeepSeek-R1/V3 推理服务。
更多推荐
所有评论(0)