赛事链接

一、前置说明

  1. 提交要求:所有交付需提交至 MACA-vLLM 仓库的文档对应目录。
  2. 参考资料

二、Level 1:环境与基础验证类(5/10分)

核心目标

熟悉 vLLM-MetaX 基础环境开发,完成 MACA 平台上的模型推理验证。

任务内容

  1. 环境验证任务(5分)

    • 使用 MACA 3.2.1 + PyTorch 2.6 镜像 完成 vLLM 源码安装;
    • 检查环境变量配置及日志输出;
    • 提交运行截图、验证日志至对应比赛的 Issue。
    • 参考教程
  2. 代码编译构建文档完善并被合并(10分)

    • 完善编译与构建文档,补充 MACA 环境下的依赖安装、环境变量配置及常见的编译错误解决方案;
    • 提交更新文档的 PR 至 docs/,并附带运行截图与验证日志。

三、Level 2:模型验证与适配类(5/15分)

模型验证清单

  • vLLM 官方模型支持列表
  • 紫色标记的是已验证过可以在MACA-vLLM上支持的,故分值为5,若选手在验证过程中发现存在BUG并提出,可获得额外加分。
  • 白色标记成功验证可在MACA-vLLM上支持,即得15分;若验证不成功提交详细日志和验证步骤也得15分。

核心目标

完成 vLLM 官方支持模型在 MACA 平台的验证。

任务内容

  1. MACA-vLLM社区支持模型验证
    • vLLM 官方模型支持列表的紫色标签部分;
    • 验证 已列入 MACA 开源模型支持列表 能正确运行;
    • 提交验证日志与推理结果截图;
    • 验证离线推理(Offline Inference)与在线推理(Online Serving)均能正常运行;
    • 计分标准:每完成 1 个模型验证得 5 分,单人上限 10 分,先到先得。
  2. 不在 MACA 支持列表的模型验证(测试验证vLLM官方支持列表,并加入MACA 开源模型支持列表)
    • 选择 在vLLM官方支持列表,但 MACA 开源模型支持列表暂未支持的模型,即表格中的白色标签部分;
    • 尝试在 MACA-vLLM 上进行验证、复现或完善使用文档;
    • 验证离线推理(Offline Inference)与在线推理(Online Serving)均能正常运行;
    • 成功完成验证并提交对应验证文档合并到MACA开源模型支持列表的可得 15 分

四、Level 3:特性功能验证与 BUG 分析类(5/15分)

核心目标

验证 vLLM 关键特性在 MACA 上的实现情况,发现潜在兼容性问题。

任务内容

  1. 特性验证任务
    • 选择 1 项 vLLM 功能(如 KV Cache、Quantization、LoRA、Paged Attention 等);
    • 验证其在 MACA 平台是否可正常工作;
    • 提供完整测试步骤与日志;
    • 首次验证通过计 5 分,单人上限 10 分。
  2. BUG 复现任务
    • 找出 MACA 平台与 CUDA 平台差异导致的特性不支持问题或BUG;
    • 提供复现方法与详细日志;
    • 若能定位问题原因并提交详细分析,得 15 分。

五、Level 4:开发与贡献类(50分)

核心目标

完成特性修复、性能优化或完整案例开发,实现对 MACA 平台的增强贡献。

任务内容

  1. BUG 修复与 PR 提交
    • 找出 vLLM 在 MACA 平台的核心问题;
    • 提供复现步骤、问题定位及修复代码;
    • 提交可合并的 PR 并通过 Review;
    • 合并后得 50 分。

六、补充说明

议题 内容说明
环境变量配置 需在文档中明确说明关键环境变量及默认值(如 VLLM_USE_MACA=1
限制条件 量化方法支持受限,单卡推理模型尺寸受显存限制
新特性支持 仅列出 MACA 独有特性(其余引用 vLLM 官方文档)
模型验证维度 需验证量化参数与 CUDA 结果一致性
验证方式 离线推理(Offline Inference)与在线推理(Online Serving)均需覆盖

七、附录与参考链接

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐