开源GPU创新生态赛赛题二 | mc-vLLM推理框架文档任务解读

熟悉 vLLM-MetaX 基础环境开发，完成 MACA 平台上的模型推理验证。验证 vLLM 关键特性在 MACA 上的实现情况，发现潜在兼容性问题。完成特性修复、性能优化或完整案例开发，实现对 MACA 平台的增强贡献。完成 vLLM 官方支持模型在 MACA 平台的验证。

zhang_jinnan

726人浏览 · 2025-11-07 13:48:26

zhang_jinnan · 2025-11-07 13:48:26 发布

赛事链接

一、前置说明

提交要求：所有交付需提交至 MACA-vLLM 仓库的文档对应目录。
参考资料：
- vLLM 官方文档：https://docs.vllm.ai
- vLLM for MACA 版本社区文档

二、Level 1：环境与基础验证类（5/10分）

核心目标

熟悉 vLLM-MetaX 基础环境开发，完成 MACA 平台上的模型推理验证。

任务内容

环境验证任务（5分）
- 使用 MACA 3.2.1 + PyTorch 2.6 镜像 完成 vLLM 源码安装；
- 检查环境变量配置及日志输出；
- 提交运行截图、验证日志至对应比赛的 Issue。
- 参考教程
代码编译构建文档完善并被合并（10分）
- 完善编译与构建文档，补充 MACA 环境下的依赖安装、环境变量配置及常见的编译错误解决方案；
- 提交更新文档的 PR 至 docs/，并附带运行截图与验证日志。

三、Level 2：模型验证与适配类（5/15分）

模型验证清单

vLLM 官方模型支持列表
紫色标记的是已验证过可以在MACA-vLLM上支持的，故分值为5，若选手在验证过程中发现存在BUG并提出，可获得额外加分。
白色标记成功验证可在MACA-vLLM上支持，即得15分；若验证不成功提交详细日志和验证步骤也得15分。

核心目标

完成 vLLM 官方支持模型在 MACA 平台的验证。

任务内容

MACA-vLLM社区支持模型验证
- vLLM 官方模型支持列表的紫色标签部分；
- 验证 已列入 MACA 开源模型支持列表 能正确运行；
- 提交验证日志与推理结果截图；
- 验证离线推理(Offline Inference)与在线推理（Online Serving）均能正常运行；
- 计分标准：每完成 1 个模型验证得 5 分，单人上限 10 分，先到先得。
不在 MACA 支持列表的模型验证（测试验证vLLM官方支持列表，并加入MACA 开源模型支持列表）
- 选择 在vLLM官方支持列表，但 MACA 开源模型支持列表暂未支持的模型，即表格中的白色标签部分；
- 尝试在 MACA-vLLM 上进行验证、复现或完善使用文档；
- 验证离线推理(Offline Inference)与在线推理（Online Serving）均能正常运行；
- 成功完成验证并提交对应验证文档合并到MACA开源模型支持列表的可得 15 分。

四、Level 3：特性功能验证与 BUG 分析类（5/15分）

核心目标

验证 vLLM 关键特性在 MACA 上的实现情况，发现潜在兼容性问题。

任务内容

特性验证任务
- 选择 1 项 vLLM 功能（如 KV Cache、Quantization、LoRA、Paged Attention 等）；
- 验证其在 MACA 平台是否可正常工作；
- 提供完整测试步骤与日志；
- 首次验证通过计 5 分，单人上限 10 分。
BUG 复现任务
- 找出 MACA 平台与 CUDA 平台差异导致的特性不支持问题或BUG；
- 提供复现方法与详细日志；
- 若能定位问题原因并提交详细分析，得 15 分。

五、Level 4：开发与贡献类（50分）

核心目标

完成特性修复、性能优化或完整案例开发，实现对 MACA 平台的增强贡献。

任务内容

BUG 修复与 PR 提交
- 找出 vLLM 在 MACA 平台的核心问题；
- 提供复现步骤、问题定位及修复代码；
- 提交可合并的 PR 并通过 Review；
- 合并后得 50 分。

六、补充说明

议题	内容说明
环境变量配置	需在文档中明确说明关键环境变量及默认值（如 `VLLM_USE_MACA=1`）
限制条件	量化方法支持受限，单卡推理模型尺寸受显存限制
新特性支持	仅列出 MACA 独有特性（其余引用 vLLM 官方文档）
模型验证维度	需验证量化参数与 CUDA 结果一致性
验证方式	离线推理(Offline Inference)与在线推理（Online Serving）均需覆盖

七、附录与参考链接

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

Chess用户界面设计：Tailwind CSS样式系统和组件库

GitHub推荐项目精选中的ch/chess是一个类似chess.com的多人在线象棋平台，它采用现代化的前端技术栈构建，尤其在用户界面设计上通过Tailwind CSS样式系统和组件库实现了优雅且功能丰富的交互体验。本文将深入探讨该项目如何利用Tailwind CSS打造一致的设计语言和高效的组件系统，为象棋爱好者提供沉浸式的游戏界面。## 🎨 Tailwind CSS样式系统：构建统一视

火山引擎 ADG 社区

终极指南：GPT-Engineer如何通过AI自动发现代码问题并提升质量

GPT-Engineer是一款强大的AI驱动代码工具，它能帮助开发者自动检测潜在代码问题、优化代码质量，让编程效率提升3倍以上。无论是新手还是资深开发者，都能通过这款工具轻松发现代码中的隐藏缺陷，减少调试时间，释放更多精力在创造性工作上。## 一键发现代码问题：GPT-Engineer的AI审查魔力GPT-Engineer的核心能力在于其内置的智能代码分析系统。通过集成Python代码格式

火山引擎 ADG 社区

SatDump中的纠错编码技术：从RS码到Turbo码的完整实现指南

在卫星数据传输过程中，信号往往会受到各种干扰，导致数据错误。SatDump作为一款通用卫星数据处理软件，集成了多种先进的纠错编码技术，确保从卫星接收到的数据能够准确解码。本文将深入解析SatDump中从Reed-Solomon（RS）码到Turbo码的实现细节，帮助读者理解这些技术如何保障卫星通信的可靠性。## 为什么纠错编码对卫星数据至关重要？卫星与地面站之间的通信链路面临着空间辐射、大