开源GPU创新生态赛赛题二 | mc-vLLM推理框架文档任务解读
熟悉 vLLM-MetaX 基础环境开发,完成 MACA 平台上的模型推理验证。验证 vLLM 关键特性在 MACA 上的实现情况,发现潜在兼容性问题。完成特性修复、性能优化或完整案例开发,实现对 MACA 平台的增强贡献。完成 vLLM 官方支持模型在 MACA 平台的验证。
·
一、前置说明
- 提交要求:所有交付需提交至 MACA-vLLM 仓库的文档对应目录。
- 参考资料:
- vLLM 官方文档:https://docs.vllm.ai
- vLLM for MACA 版本社区文档
二、Level 1:环境与基础验证类(5/10分)
核心目标
熟悉 vLLM-MetaX 基础环境开发,完成 MACA 平台上的模型推理验证。
任务内容
-
环境验证任务(5分)
- 使用 MACA 3.2.1 + PyTorch 2.6 镜像 完成 vLLM 源码安装;
- 检查环境变量配置及日志输出;
- 提交运行截图、验证日志至对应比赛的 Issue。
- 参考教程
-
代码编译构建文档完善并被合并(10分)
- 完善编译与构建文档,补充 MACA 环境下的依赖安装、环境变量配置及常见的编译错误解决方案;
- 提交更新文档的 PR 至 docs/,并附带运行截图与验证日志。
三、Level 2:模型验证与适配类(5/15分)
模型验证清单
- vLLM 官方模型支持列表
- 紫色标记的是已验证过可以在MACA-vLLM上支持的,故分值为5,若选手在验证过程中发现存在BUG并提出,可获得额外加分。
- 白色标记成功验证可在MACA-vLLM上支持,即得15分;若验证不成功提交详细日志和验证步骤也得15分。
核心目标
完成 vLLM 官方支持模型在 MACA 平台的验证。
任务内容
- MACA-vLLM社区支持模型验证
- vLLM 官方模型支持列表的紫色标签部分;
- 验证 已列入 MACA 开源模型支持列表 能正确运行;
- 提交验证日志与推理结果截图;
- 验证离线推理(Offline Inference)与在线推理(Online Serving)均能正常运行;
- 计分标准:每完成 1 个模型验证得 5 分,单人上限 10 分,先到先得。
- 不在 MACA 支持列表的模型验证(测试验证vLLM官方支持列表,并加入MACA 开源模型支持列表)
- 选择 在vLLM官方支持列表,但 MACA 开源模型支持列表暂未支持的模型,即表格中的白色标签部分;
- 尝试在 MACA-vLLM 上进行验证、复现或完善使用文档;
- 验证离线推理(Offline Inference)与在线推理(Online Serving)均能正常运行;
- 成功完成验证并提交对应验证文档合并到MACA开源模型支持列表的可得 15 分。
四、Level 3:特性功能验证与 BUG 分析类(5/15分)
核心目标
验证 vLLM 关键特性在 MACA 上的实现情况,发现潜在兼容性问题。
任务内容
- 特性验证任务
- 选择 1 项 vLLM 功能(如 KV Cache、Quantization、LoRA、Paged Attention 等);
- 验证其在 MACA 平台是否可正常工作;
- 提供完整测试步骤与日志;
- 首次验证通过计 5 分,单人上限 10 分。
- BUG 复现任务
- 找出 MACA 平台与 CUDA 平台差异导致的特性不支持问题或BUG;
- 提供复现方法与详细日志;
- 若能定位问题原因并提交详细分析,得 15 分。
五、Level 4:开发与贡献类(50分)
核心目标
完成特性修复、性能优化或完整案例开发,实现对 MACA 平台的增强贡献。
任务内容
- BUG 修复与 PR 提交
- 找出 vLLM 在 MACA 平台的核心问题;
- 提供复现步骤、问题定位及修复代码;
- 提交可合并的 PR 并通过 Review;
- 合并后得 50 分。
六、补充说明
| 议题 | 内容说明 |
|---|---|
| 环境变量配置 | 需在文档中明确说明关键环境变量及默认值(如 VLLM_USE_MACA=1) |
| 限制条件 | 量化方法支持受限,单卡推理模型尺寸受显存限制 |
| 新特性支持 | 仅列出 MACA 独有特性(其余引用 vLLM 官方文档) |
| 模型验证维度 | 需验证量化参数与 CUDA 结果一致性 |
| 验证方式 | 离线推理(Offline Inference)与在线推理(Online Serving)均需覆盖 |
七、附录与参考链接
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)