mlx-lm模型支持清单:主流LLM适配情况全汇总
mlx-lm作为基于Apple MLX框架的大语言模型运行工具,提供了对众多主流LLM(Large Language Model,大型语言模型)的支持。通过分析[mlx_lm/models/](https://link.gitcode.com/i/2d25e0bf696f6851a1d8e04655ac4b47)目录下的源码文件,可以系统了解其适配的模型种类及特性。本文将全面汇总mlx-lm支持的
mlx-lm模型支持清单:主流LLM适配情况全汇总
【免费下载链接】mlx-lm Run LLMs with MLX 项目地址: https://gitcode.com/GitHub_Trending/ml/mlx-lm
mlx-lm作为基于Apple MLX框架的大语言模型运行工具,提供了对众多主流LLM(Large Language Model,大型语言模型)的支持。通过分析mlx_lm/models/目录下的源码文件,可以系统了解其适配的模型种类及特性。本文将全面汇总mlx-lm支持的主流模型清单,为开发者选择合适模型提供参考。
模型支持概览
mlx-lm的模型支持通过mlx_lm/models/init.py文件统一管理,采用模块化设计,每种模型对应独立的实现文件。目前已支持超过60种不同架构的LLM,涵盖基础模型、多模态模型、MoE(Mixture of Experts,混合专家)模型等多种类型。
主流模型适配清单
基础大语言模型
| 模型名称 | 实现文件 | 核心特性 |
|---|---|---|
| Llama系列 | llama.py、llama4.py | 支持Llama 2/3/4及Llama 4 Text变体 |
| GPT系列 | gpt2.py、gpt_neox.py | 涵盖GPT-2、GPT-NeoX架构 |
| Gemma系列 | gemma.py、gemma3.py、gemma3_text.py | 支持Gemma 1/2/3及文本专用版本 |
| Phi系列 | phi.py、phi3.py、phi3small.py | 包含Phi-1/2/3及Phi-3 Small |
| Mistral | mistral3.py | Mistral 3架构支持 |
多模态模型
mlx-lm对多模态模型的支持主要集中在视觉语言领域,代表性实现包括:
- qwen2_vl.py:Qwen2-VL多模态模型
- kimi_vl.py:Kimi多模态模型
- lfm2-vl.py:LFM2-VL视觉语言模型
MoE架构模型
混合专家模型通过专家并行提升模型能力,mlx-lm支持的MoE模型包括:
- qwen3_moe.py:Qwen3 MoE模型
- glm4_moe.py:GLM4 MoE模型
- ernie4_5_moe.py:ERNIE 4.5 MoE模型
- olmoe.py:OLMoE模型
- granitemoe.py:GraniteMoE模型
国产模型支持
针对中文场景优化的国产模型支持情况:
- qwen.py、qwen2.py、qwen3.py:通义千问系列
- glm.py、glm4.py:GLM系列
- ernie4_5.py:ERNIE 4.5模型
- hunyuan.py、hunyuan_v1_dense.py:混元大模型
- internlm2.py、internlm3.py:InternLM系列
特殊架构模型
除Transformer架构外,mlx-lm还支持多种创新架构:
- mamba.py、mamba2.py:Mamba时序模型
- longcat_flash.py:LongCat长文本模型
- apertus.py:Apertus架构模型
模型适配原理
mlx-lm的模型适配基于统一的基类设计,所有模型均继承自base.py中定义的基础模型类。这种设计确保了不同模型在加载、推理等流程上的一致性。以Llama模型为例,其实现遵循标准接口:
class LlamaModel(Model):
def __init__(self, config: dict):
super().__init__(config)
# 模型初始化逻辑
def __call__(self, inputs: mx.array) -> mx.array:
# 前向传播实现
模型使用指南
要使用mlx-lm运行特定模型,可通过命令行指定模型名称:
python -m mlx_lm.generate --model <模型名称> --prompt "你的提示词"
具体支持的模型名称可参考mlx_lm/generate.py中的模型加载逻辑,或查看mlx_lm/models/init.py中的模型注册信息。
未来支持计划
根据CONTRIBUTING.md中的路线图,mlx-lm团队计划持续扩展模型支持范围,重点包括:
- 新增对最新开源模型的适配
- 优化多模态模型性能
- 增强MoE模型训练支持
开发者可通过提交PR参与模型适配工作,具体流程参见CONTRIBUTING.md。
【免费下载链接】mlx-lm Run LLMs with MLX 项目地址: https://gitcode.com/GitHub_Trending/ml/mlx-lm
更多推荐
所有评论(0)