Github 50K star，从零开始构建大模型：LLMs-from-scratch（附PDF）

《Build a Large Language Model (From Scratch)》是机器学习和 AI 研究员、畅销书《 Python 机器学习》的作者Sebastian Raschka 所著的一本新书，旨在为读者揭示从零开始构建大型语言模型（LLM）的全过程。

程序学到昏

1219人浏览 · 2025-06-04 10:10:42

程序学到昏 · 2025-06-04 10:10:42 发布

《Build a Large Language Model (From Scratch)》是一本理论与实践相结合的教程，能够帮助读者深刻理解LLM的工作原理，并学会如何构建和优化属于自己的模型，对于希望在AI领域深入发展的学习者来说，是一本不可或缺的参考书籍。

内容简介

这本书通过清晰的文字、图表和实例，详细解释了构建大型语言模型的每一个阶段，从最初的设计和创建，到使用通用语料库进行预训练，直至针对特定任务进行微调。书中具体讲解了如何规划和编码LLM的所有部分、准备适合LLM训练的数据集、使用自己的数据微调LLM、应用指令调整方法来确保LLM遵循指令以及将预训练权重加载到LLM中。

这本《从零构建大模型》中英文双语版已整理并打包好PDF了

扫扫即可拿到↓↓↓

主要亮点

从头开始的构建过程：展示了如何从零开始构建一个工作中的LLM，带领读者深入了解LLM的内部工作原理。
开源代码库：作者在GitHub上开源了书中涉及的所有代码，方便读者获取并实践书中的内容。代码库链接：https://github.com/rasbt/LLMs-from-scratch?tab=readme-ov-file，目前已有 50.6 k stars。
实用的指令微调方法：重点介绍了指令微调的方法，包括如何将数据格式化为指令-响应对、如何应用prompt-style模板以及如何使用掩码等，这些技巧能够有效提升模型的性能。

适合读者

本书适合具有Python基础知识的读者阅读，拥有一定机器学习模型开发经验者更佳。无论是学生、研究员还是业界从业人员，都可以通过本书学习到构建和应用LLM的实用技巧。

火山引擎开发者社区是火山引擎打造的AI技术生态平台，聚焦Agent与大模型开发，提供豆包系列模型（图像/视频/视觉）、智能分析与会话工具，并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长，新用户可领50万Tokens权益，助力构建智能应用。

更多推荐

OpenClaw 本地部署完整指南（Windows + Ollama）

本文档基于实际部署经验编写，旨在帮助你在 Windows 系统上从零开始搭建 OpenClaw，并连接本地 Ollama 模型（如 Qwen2.5 或 Qwen3），使其具备完整的智能体能力。文档包含了所有关键步骤以及常见问题的解决方案。

火山引擎 ADG 社区

OpenClaw 小白安装指南（Windows版）

（类似一个能自动执行任务的AI机器人），不是游戏。API Key只保存在你本地电脑的加密文件里，不会上传到任何地方。访问：https://github.com/miaoxworld/openclaw-manager/releases。: 一键安装脚本会自动安装Node.js 22+，如果失败，手动下载安装：https://nodejs.org/：在PowerShell中，鼠标右键就是粘贴，不需要按

火山引擎 ADG 社区

飞书 × OpenClaw 接入指南：不用服务器，用长连接把机器人跑起来

这个项目存在的意义，就是把“飞书接 OpenClaw”这件事，整理成一套的配置入口，并把官方文档没覆盖到的坑集中写成排查清单。先说清楚它的角色：OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu，功能更完整、维护也更及时。，说明飞书 + AI 的接入已经走通。另外，仓库也推荐了一个新项目：把 OpenClaw 变成“多 Agent 团队”，用多个 Agent 分工，Sla