YiXin-Distill-Qwen-72B推理模型开箱实测：最新开源技术深度体验！

本文带大家本地部署并实测了 YiXin 最新开源的推理模型。体感非常棒，强烈推荐有需求的朋友去试下~效果媲美主流大厂模型，推理方面甚有超越。此外，72B 的尺寸很好平衡了通用能力和推理能力，作为垂直领域应用的基座模型，基于私有数据进行微调，香的很！

Python怎么学啊

1232人浏览 · 2025-04-01 14:34:24

Python怎么学啊 · 2025-04-01 14:34:24 发布

当大家都在热衷于接入 DeepSeek 时。。。

最近一家叫易鑫的金融科技公司，开源了 YiXin-Distill-Qwen-72B 推理模型。

我看了下，它以 Qwen2.5-72B 为基座，自研迭代式蒸馏和强化学习做训练，

整体感受是对数学、推理任务做了深度优化，一句话总结：小体积，高精度。

看官方的评测结果，综合性能媲美 DeepSeek-R1，除了自用，简直是企业级AI落地的福音。

1. 强在哪

YiXin-Distill-Qwen-72B是一个侧重于数学和推理的大模型，参数规模仅72B就达到了开源王者 DeepSeek-R1 的能力。

数学和推理方面代表性的基准评测集有：AIME2024/2025、GPQA Diamond、MATH-500、MMLU-PRO。

不多说了，一图胜千言：

接下来我们本地部署并实测一番。

2. 本地部署

硬件要求：推荐8卡 RTX 3090/4090（24G），可处理8k上下文。显存越大，上下文越长。

部署流程：

1、环境配置：安装 Python 3.10、PyTorch 2.1.0 及 CUDA 12.1

2、下载模型：

export HF_ENDPOINT=https://hf-mirror.com # 引入镜像地址
huggingface-cli download --resume-download YiXin-AILab/YiXin-Distill-Qwen-72B --local-dir ./ckpts/qwen-72b

3、安装sglang推理框架：

pip install uv 
uv pip install "sglang[all]>=0.4.4.post1" -i https://flashinfer.ai/whl/cu124/torch2.5/flashinfer-python

4、模型加载，并启动服务：

python3 -m sglang.launch_server --model YiXin-AILab/YiXin-Distill-Qwen-72B --trust-remote-code --tp 4 --port 8000

5、测试请求：

curl http://localhost:8000/v1/chat/completions \
    -H "Content-Type: application/json" \
    -d '{
    "model": "YiXin-AILab/YiXin-Distill-Qwen-72B",
    "messages": [
        {"role": "system", "content": "You are a helpful and harmless assistant.You should think step-by-step."},
        {"role": "user", "content": "8+8=?"}
    ]
}

6、为了方便测试和使用，可以用Gradio搭建前端，让交互更友好，首先安装Gradio：

pip install gradio

7、创建一个python文件，命名为run.py，用来启动前端服务：

import gradio as gr
import openai
client = openai.Client(base_url=f"http://127.0.0.1:8000/v1", api_key="None")
def predict(message, history):
    history.append({"role": "user", "content": message})
    stream = client.chat.completions.create(messages=history, model="YiXin-AILab/YiXin-Distill-Qwen-72B", stream=True)
    chunks = []
    for chunk in stream:
        chunks.append(chunk.choices[0].delta.content or "")
        yield "".join(chunks)
chatbot = gr.Chatbot(type="messages",label='YiXin-Distill-Qwen-72B')
demo = gr.ChatInterface(predict, chatbot=chatbot)
if __name__ == "__main__":
    demo.launch()

8、启动服务

python run.py

9、打开浏览器，输入 127.0.0.1:7860 即可看到前端页面：

3. 效果实测

3.1、逻辑推理题

• 只有在下雨天，我才会带伞。今天我带了伞。今天下雨了吗?

• 一个农夫需要运两只鸡过河，一次可以运一人+两只动物，最少需要过几次河?

这道农夫过河的题目曾让很多大模型打脸，YiXin 毫无压力。

• 有一个小偷费劲力气进入到了银行的金库里。在金库里他找到了一百个箱子，每一个箱子里都装满了金币。不过，只有一个箱子里装的是真的金币，剩下的 99 个箱子里都是假的。真假金币的外形和质感完全一样，任何人都无法通过肉眼分辨出来。它们只有一个区别：真金币每一个重量为 101 克，而假金币的重量是 100 克。在金库里有一个电子秤，它可以准确地测量出任何物品的重量，精确到克。但很不幸的是，这个电子秤和银行的报警系统相连接，只要被使用一次就会立刻失效。请问，小偷怎么做才能只使用一次电子秤就找到装着真金币的箱子呢？

这道题非常考验数学和推理能力，就问问你花了多久？

3.2、物理题

• 假设我从月球发射一道激光到地球，那么地球上的人大概多久能接收到?

• 以下物理常识题目，哪一个是错误的?

A.在自然环境下，声音在固体中传播速度最快。

B.牛顿第一定律:一个物体如果不受力作用，将保持静止或匀速直线运动的状态。

C.牛顿第三定律:对于每个作用力，都有一个相等而反向的反作用力。

D.声音在空气中的传播速度为1000m/s

上点难度：清华大学的物理期末考试计算题👇

反正我是不会，YiXin 成功搞定！

3.3、数学题

2024年考研数学：已知函数f(x,y)=x^3+y^3-(x+y)^2+3，设T是曲面z=f(x,y)在点(1,1,1)处的切平面，D为T与坐标平面所围成的有界区域在xOy平面上的投影. 求T的方程：

考研真题，推理过程有点长，不过回答完全正确。

• 在三棱锥 P−ABC 中，若 PA⊥ 底面 ABC，且棱 AB, BP, BC, CP 的长分别为1, 2, 3, 4，则该三棱锥的体积为？

几何问题，依然干的漂亮！

总席位为奇数的三个不结盟的派别在会议中实行半数通过方案，任意一派席位不过半数。尝试用数学证明：三派分别占有的席位和他们在表决中的权重是什么关系？

A. 正比

B. 反比

C. 无关

这道题几乎国内外大模型都会翻车，但 YiXin 搞定了，尽管推理过程较长，有点出乎我意料。

3.4 语文题

• 你是一个小学数学科老师，要教小学生异分母分数加减的单元，提出跟这个单元的概念有关的同理性问题、推论性问题、评论性问题、价值性问题，各5个，请以小学生能懂得且有兴趣的语言来说。

• 仿《过秦论》的风格写一篇《过美利坚论》

思考不长，但精彩绝伦，连注释都贴心给你了。

不过，我发现代码能力还差点意思：

有以下数据：[{“table_name”:“sy_cd_me_buss_std_gjbzjh”,“param_info”:[{“param_name”:“#{issueDate}”,“value”:[2009,2010,2011,2012]},{“param_name”:“#{projectStat}”,“value”:[“正在征求意见”,“已发布”,“正在审查”]}],“explanation”:“输出标准名称projectCnName、计划号、项目状态”}] ，请写sql查询年份为#{issueDate}年项目状态为#{projectStat}状态计划发布的国家标准有哪些？

像模像样地错了，正确答案应该是：

SELECT DISTINCT planNum, projectCnName, projectStat 
FROM sy_cd_me_buss_std_gjbzjh 
WHERE 
`planNum` IS NOT NULL 
AND `dataStatus` != 3 
AND `isValid` = 1 
AND projectStat=#{projectStat} 
AND DATE_FORMAT(`issueDate`, '%Y')=#{issueDate}

写在最后

本文带大家本地部署并实测了 YiXin 最新开源的推理模型 YiXin-Distill-Qwen-72B。

体感非常棒，强烈推荐有需求的朋友去试下~

效果媲美主流大厂模型，推理方面甚有超越。

此外，72B 的尺寸很好平衡了通用能力和推理能力，作为垂直领域应用的基座模型，基于私有数据进行微调，香的很！

大模型&AI产品经理如何学习

求大家的点赞和收藏，我花2万买的大模型学习资料免费共享给你们，来看看有哪些东西。

1.学习路线图

第一阶段：从大模型系统设计入手，讲解大模型的主要方法；

第二阶段：在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用；

第三阶段：大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统；

第四阶段：大模型知识库应用开发以LangChain框架为例，构建物流行业咨询智能问答系统；

第五阶段：大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型；

第六阶段：以SD多模态大模型为主，搭建了文生图小程序案例；

第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源，但基本上都残缺不全的，这是我自己整理的大模型视频教程，上面路线图的每一个知识点，我都有配套的视频讲解。

（都打包成一块的了，不能一一展开，总共300多集）

因篇幅有限，仅展示部分资料，需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档，有几百本，都是目前行业最新的。

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。

👉学会后的收获：👈
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集***

👉获取方式：
😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

火山引擎 ADG 社区

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla