英伟达微调qwen2.5-32B模型，开源推理模型：OpenCodeReasoning-Nemotron-32B

OpenCodeReasoning-Nemotron-32B 是一个基于 Qwen2.5-32B-Instruct 开发的大型语言模型，专为代码生成推理任务优化，支持 32,768 个标记的上下文长度，适用于商业和非商业用途。该模型在 LiveCodeBench 和 CodeContest 等基准测试中表现出色，尤其在代码生成任务中展现了强大的推理能力。其核心优势包括长上下文支持、硬件优化（专为

Panesle

1291人浏览 · 2025-05-11 14:54:16

Panesle · 2025-05-11 14:54:16 发布

一、模型概述

OpenCodeReasoning-Nemotron-32B 是一个大型语言模型，基于 Qwen2.5-32B-Instruct 开发，专为代码生成推理任务进行了后续训练，支持 32,768 个标记的上下文长度，适用于商业和非商业用途。

二、性能表现

在 LiveCodeBench 和 CodeContest 等基准测试中的表现如下表：

模型	LiveCodeBench 平均值	CodeContest 全部
DeepSeek-R1	65.6	26.2
QwQ-32B	61.3	20.2
Bespoke-Stratos-7B	14.7	2.0
OpenThinker-7B	25.5	5.0
R1-Distill-Qwen-7B	38.0	11.1
OlympicCoder-7B	40.9	10.6
OCR-Qwen-7B	48.5	16.3
OCR-Qwen-7B-Instruct	51.3	18.1
R1-Distill-Qwen-14B	51.3	17.6
OCR-Qwen-14B	57.7	22.6
OCR-Qwen-14B-Instruct	59.4	23.6
Bespoke-Stratos-32B	30.1	6.3
OpenThinker-32B	54.1	16.4
R1-Distill-Qwen-32B	58.1	18.3
OlympicCoder-32B	57.4	18.0
OCR-Qwen-32B	61.8	24.6
OCR-Qwen-32B-Instruct	61.7	24.4

三、使用方法

导入必要的库：

import transformers
import torch

创建文本生成管道：

model_id = "nvidia/OpenCodeReasoning-Nemotron-32B"
pipeline = transformers.pipeline(
    "text-generation",
    model=model_id,
    model_kwargs={"torch_dtype": torch.bfloat16},
    device_map="auto",
)

定义提示信息：

prompt = """You are a helpful and harmless assistant. You should think step-by-step before
Please use python programming language only.
You must use ```python for just the final solution code block with the following format: ```python # Your code here ```
{user} """

生成消息并获取输出：

messages = [{"role": "user", "content": prompt.format(user="Write a program to calculate the sum of the first $"}]
outputs = pipeline(messages, max_new_tokens=32768)
print(outputs[0]["generated_text"][-1]['content'])

四、数据集和评估

训练语料库是 OpenCodeReasoning 数据集，包含来自 OpenCodeReasoning 的 736,000 个样本，包括编程竞赛问题和 DeepSeek-R1 生成的响应。数据收集和标记方法为混合模式，结合了自动化、人工和合成方法。

五、核心优势

推理与代码生成：专为代码生成推理任务进行了后续训练。
长上下文支持：支持 32,768 个标记的上下文长度。
硬件优化：专为 NVIDIA GPU 加速系统设计，利用 NVIDIA 硬件和软件框架实现更快的训练和推理时间。
适应性：适用于开发者和研究人员构建大型语言模型。

六、原文链接

论文原文可在 arXiv 上找到。

七、核心技术汇总

在这里插入图片描述

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla