标注:官网|Github|HF地址|主力版本|协议|商用|特点|部署显存参考(GGUF量化)
闭源备注:讯飞星火、豆包Doubao无开源权重,仅API,不入下表

开源模型推荐

一梯队|全球头部、中文落地首选

1. Qwen 通义千问(阿里)

  • 官网:https://tongyi.aliyun.com/
  • Github:https://github.com/QwenLM/Qwen2.5
  • HuggingFace:https://huggingface.co/Qwen
  • 主力:Qwen2.5 / Qwen3.5(7B~32B/MoE)
  • 协议:Apache 2.0|✅完全免费商用
  • 显存:7B(4bit量化≈5G)、14B(4bit≈8G)、32B(4bit≈16G)
  • 亮点:中文综合天花板、多模态齐全、社区衍生模型最多、128K上下文

2. DeepSeek 深度求索

  • 官网:https://www.deepseek.com/
  • Github:https://github.com/deepseek-ai
  • HuggingFace:https://huggingface.co/deepseek-ai
  • 主力:DeepSeek-V3.2、R1推理系列、DeepSeek-Coder
  • 协议:Apache 2.0|✅免费商用
  • 显存:7B(4bit≈5G)、32B(4bit≈15G)
  • 亮点:数学/代码/逻辑推理国产顶尖,R1专项推理模型性价比极高

3. GLM 智谱AI

  • 官网:https://www.zhipuai.cn/
  • Github:https://github.com/THUDM/GLM-4
  • HuggingFace:https://huggingface.co/THUDM
  • 主力:GLM-4/GLM-5(6B~MoE超大参)
  • 协议:开源版可商用|✅商用友好
  • 显存:6B(4bit≈4G)、32B(4bit≈16G)
  • 亮点:长文本、Agent工具调用、文档RAG适配优秀,政企落地成熟

4. Llama(Meta)

  • 官网:https://ai.meta.com/llama/
  • Github:https://github.com/meta-llama
  • HuggingFace:https://huggingface.co/meta-llama
  • 主力:Llama3.3、Llama4 Scout
  • 协议:Meta商用授权(免费申请)|✅获批可商用
  • 显存:8B(4bit≈5G)、70B(4bit≈35G)
  • 亮点:全球生态第一、微调基座首选、英文顶尖,中文需微调优化

二梯队|国产新锐、多模态/专项强势

5. StepFun 阶跃星辰

  • 官网:https://www.stepfun.com/
  • Github:https://github.com/stepfun-ai
  • HuggingFace:https://huggingface.co/stepfun-ai
  • 主力:Step3.5/3.7 Flash、Step-Video文生视频
  • 协议:Apache2.0/MIT|✅全免费商用
  • 显存:7B(4bit≈5G)、MoE11B激活(4bit≈7G)
  • 亮点:开源罕见全栈(文/图/音/视频)、Agent工具调用极强、256K上下文

6. MiMo 小米

  • 官网:https://mimo.xiaomi.com/
  • Github:https://github.com/XiaomiMiMo/MiMo
  • HuggingFace:https://huggingface.co/XiaomiMiMo
  • 主力:MiMo-V2.5-Pro、7B Base
  • 协议:MIT|✅完全免费商用
  • 显存:7B(4bit≈5G)
  • 亮点:代码&推理突出、超长上下文1M、端侧&云端双适配

7. Moonshot Kimi(月之暗面)

  • 官网:https://kimi.com/
  • Github:https://github.com/moonshotai/kimi-K2
  • HuggingFace:https://huggingface.co/moonshotai
  • 主力:K2.5/K2.6 MoE
  • 协议:自定义MIT衍生|✅商用友好
  • 显存:激活32B(4bit≈18G)
  • 亮点:超长256K上下文、PDF/论文文档理解业界标杆、RAG最优基座之一

8. Baichuan 百川智能

  • 官网:https://www.baichuan-ai.com/
  • Github:https://github.com/baichuan-inc
  • HuggingFace:https://huggingface.co/baichuan-inc
  • 主力:Baichuan4/Baichuan5(7B~72B)
  • 协议:Apache2.0|✅免费商用
  • 显存:7B(4bit≈5G)、13B(4bit≈8G)
  • 亮点:原生中文对话顺滑、合规性优秀,金融政务场景成熟

9. ERNIE 文心(百度)

  • 官网:https://yiyan.baidu.com/
  • Github:https://github.com/PaddlePaddle/ERNIE
  • HuggingFace:https://huggingface.co/baidu
  • 主力:ERNIE4.5开源轻量系列
  • 协议:Apache2.0|✅免费商用
  • 显存:3B(4bit≈2G)、7B(4bit≈5G)
  • 亮点:知识增强大模型,知识库问答、低幻觉,适配国产硬件

三梯队|海外优质开源小参精品

10. Mistral AI(法国)

  • 官网:https://mistral.ai/
  • Github:https://github.com/mistralai
  • HuggingFace:https://huggingface.co/mistralai
  • 主力:Mixtral-8x7B、Large2
  • 协议:Apache2.0|✅免费商用
  • 显存:8x7B(4bit≈10G)
  • 亮点:小体积高性能、推理速度拉满、边缘部署首选

11. Gemma(Google)

  • 官网:https://ai.google.dev/gemma
  • Github:https://github.com/google/gemma
  • HuggingFace:https://huggingface.co/google/gemma-2
  • 主力:Gemma2(2B/9B/27B)
  • 协议:Apache2.0|✅免费商用
  • 显存:9B(4bit≈6G)
  • 亮点:安全对齐优秀、幻觉低,适合教育&轻量化产品

12. xAI Grok‑1

  • 官网:https://x.ai/
  • GitHub:https://github.com/xai-org/grok-1
  • Hugging Face:官方无 HF 权重,社区有转换版(搜索 xai-org/grok-1)
  • 特点:314B MoE(激活约 86B)、8k 上下文、原始未对齐、风格犀利、幽默、敢说
  • 许可证:Apache 2.0
  • 是否商用友好:✅ 完全友好,可商用、可修改、可分发、专利授权
  • Grok‑2/3/4:闭源,仅 API,无开源权重。

13. BigCode(StarCoder2 系列,开源代码模型)

  • 官网:https://www.bigcode-project.org/
  • GitHub:https://github.com/bigcode-project
  • Hugging Face:https://huggingface.co/bigcode
  • 代表模型:
    • StarCoder2‑3B/7B/15B(2024,16k 上下文,FIM 填充)
    • StarCoder(15.5B,初代)
  • 特点:代码专用、多语言强、训练数据合规(The Stack)、适合代码生成 / 补全 / 重构
  • 许可证:BigCode OpenRAIL‑M v1
  • 是否商用友好:✅ 可商用(免版税),但禁止生成恶意软件、需标注 AI 生成内容

快速选型备忘

  1. 国内商用落地+中文:Qwen > DeepSeek > Baichuan > ERNIE
  2. 长文档/RAG:Kimi > GLM > StepFun
  3. 代码数学:DeepSeek > MiMo > Llama3
  4. 多模态图文视频:StepFun > Qwen
  5. 低配显卡(≤8G显存):Qwen7B、Gemma2-9B、Baichuan7B、MiMo7B
Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐