mlx-lm模型支持清单:主流LLM适配情况全汇总

【免费下载链接】mlx-lm Run LLMs with MLX 【免费下载链接】mlx-lm 项目地址: https://gitcode.com/GitHub_Trending/ml/mlx-lm

mlx-lm作为基于Apple MLX框架的大语言模型运行工具,提供了对众多主流LLM(Large Language Model,大型语言模型)的支持。通过分析mlx_lm/models/目录下的源码文件,可以系统了解其适配的模型种类及特性。本文将全面汇总mlx-lm支持的主流模型清单,为开发者选择合适模型提供参考。

模型支持概览

mlx-lm的模型支持通过mlx_lm/models/init.py文件统一管理,采用模块化设计,每种模型对应独立的实现文件。目前已支持超过60种不同架构的LLM,涵盖基础模型、多模态模型、MoE(Mixture of Experts,混合专家)模型等多种类型。

主流模型适配清单

基础大语言模型

模型名称 实现文件 核心特性
Llama系列 llama.pyllama4.py 支持Llama 2/3/4及Llama 4 Text变体
GPT系列 gpt2.pygpt_neox.py 涵盖GPT-2、GPT-NeoX架构
Gemma系列 gemma.pygemma3.pygemma3_text.py 支持Gemma 1/2/3及文本专用版本
Phi系列 phi.pyphi3.pyphi3small.py 包含Phi-1/2/3及Phi-3 Small
Mistral mistral3.py Mistral 3架构支持

多模态模型

mlx-lm对多模态模型的支持主要集中在视觉语言领域,代表性实现包括:

MoE架构模型

混合专家模型通过专家并行提升模型能力,mlx-lm支持的MoE模型包括:

国产模型支持

针对中文场景优化的国产模型支持情况:

特殊架构模型

除Transformer架构外,mlx-lm还支持多种创新架构:

模型适配原理

mlx-lm的模型适配基于统一的基类设计,所有模型均继承自base.py中定义的基础模型类。这种设计确保了不同模型在加载、推理等流程上的一致性。以Llama模型为例,其实现遵循标准接口:

class LlamaModel(Model):
    def __init__(self, config: dict):
        super().__init__(config)
        # 模型初始化逻辑
        
    def __call__(self, inputs: mx.array) -> mx.array:
        # 前向传播实现

模型使用指南

要使用mlx-lm运行特定模型,可通过命令行指定模型名称:

python -m mlx_lm.generate --model <模型名称> --prompt "你的提示词"

具体支持的模型名称可参考mlx_lm/generate.py中的模型加载逻辑,或查看mlx_lm/models/init.py中的模型注册信息。

未来支持计划

根据CONTRIBUTING.md中的路线图,mlx-lm团队计划持续扩展模型支持范围,重点包括:

  1. 新增对最新开源模型的适配
  2. 优化多模态模型性能
  3. 增强MoE模型训练支持

开发者可通过提交PR参与模型适配工作,具体流程参见CONTRIBUTING.md

【免费下载链接】mlx-lm Run LLMs with MLX 【免费下载链接】mlx-lm 项目地址: https://gitcode.com/GitHub_Trending/ml/mlx-lm

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐