mlx-lm模型支持清单：主流LLM适配情况全汇总

mlx-lm作为基于Apple MLX框架的大语言模型运行工具，提供了对众多主流LLM（Large Language Model，大型语言模型）的支持。通过分析[mlx_lm/models/](https://link.gitcode.com/i/2d25e0bf696f6851a1d8e04655ac4b47)目录下的源码文件，可以系统了解其适配的模型种类及特性。本文将全面汇总mlx-lm支持的

卫标尚

1474人浏览 · 2025-10-05 05:02:28

卫标尚 · 2025-10-05 05:02:28 发布

mlx-lm模型支持清单：主流LLM适配情况全汇总

【免费下载链接】mlx-lm Run LLMs with MLX 项目地址: https://gitcode.com/GitHub_Trending/ml/mlx-lm

mlx-lm作为基于Apple MLX框架的大语言模型运行工具，提供了对众多主流LLM（Large Language Model，大型语言模型）的支持。通过分析mlx_lm/models/目录下的源码文件，可以系统了解其适配的模型种类及特性。本文将全面汇总mlx-lm支持的主流模型清单，为开发者选择合适模型提供参考。

模型支持概览

mlx-lm的模型支持通过mlx_lm/models/init.py文件统一管理，采用模块化设计，每种模型对应独立的实现文件。目前已支持超过60种不同架构的LLM，涵盖基础模型、多模态模型、MoE（Mixture of Experts，混合专家）模型等多种类型。

主流模型适配清单

基础大语言模型

模型名称	实现文件	核心特性
Llama系列	llama.py、llama4.py	支持Llama 2/3/4及Llama 4 Text变体
GPT系列	gpt2.py、gpt_neox.py	涵盖GPT-2、GPT-NeoX架构
Gemma系列	gemma.py、gemma3.py、gemma3_text.py	支持Gemma 1/2/3及文本专用版本
Phi系列	phi.py、phi3.py、phi3small.py	包含Phi-1/2/3及Phi-3 Small
Mistral	mistral3.py	Mistral 3架构支持

多模态模型

mlx-lm对多模态模型的支持主要集中在视觉语言领域，代表性实现包括：

qwen2_vl.py：Qwen2-VL多模态模型
kimi_vl.py：Kimi多模态模型
lfm2-vl.py：LFM2-VL视觉语言模型

MoE架构模型

混合专家模型通过专家并行提升模型能力，mlx-lm支持的MoE模型包括：

qwen3_moe.py：Qwen3 MoE模型
glm4_moe.py：GLM4 MoE模型
ernie4_5_moe.py：ERNIE 4.5 MoE模型
olmoe.py：OLMoE模型
granitemoe.py：GraniteMoE模型

国产模型支持

针对中文场景优化的国产模型支持情况：

qwen.py、qwen2.py、qwen3.py：通义千问系列
glm.py、glm4.py：GLM系列
ernie4_5.py：ERNIE 4.5模型
hunyuan.py、hunyuan_v1_dense.py：混元大模型
internlm2.py、internlm3.py：InternLM系列

特殊架构模型

除Transformer架构外，mlx-lm还支持多种创新架构：

mamba.py、mamba2.py：Mamba时序模型
longcat_flash.py：LongCat长文本模型
apertus.py：Apertus架构模型

模型适配原理

mlx-lm的模型适配基于统一的基类设计，所有模型均继承自base.py中定义的基础模型类。这种设计确保了不同模型在加载、推理等流程上的一致性。以Llama模型为例，其实现遵循标准接口：

class LlamaModel(Model):
    def __init__(self, config: dict):
        super().__init__(config)
        # 模型初始化逻辑
        
    def __call__(self, inputs: mx.array) -> mx.array:
        # 前向传播实现

模型使用指南

要使用mlx-lm运行特定模型，可通过命令行指定模型名称：

python -m mlx_lm.generate --model <模型名称> --prompt "你的提示词"

具体支持的模型名称可参考mlx_lm/generate.py中的模型加载逻辑，或查看mlx_lm/models/init.py中的模型注册信息。

未来支持计划

根据CONTRIBUTING.md中的路线图，mlx-lm团队计划持续扩展模型支持范围，重点包括：

新增对最新开源模型的适配
优化多模态模型性能
增强MoE模型训练支持

开发者可通过提交PR参与模型适配工作，具体流程参见CONTRIBUTING.md。

【免费下载链接】mlx-lm Run LLMs with MLX 项目地址: https://gitcode.com/GitHub_Trending/ml/mlx-lm

智能体开发者社区

中国智能体开发者社区，聚焦智能体与大模型开发，提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动，促进经验交流与协作，助力开发者快速构建创新智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

智能体开发者社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

智能体开发者社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla