Github 50K star,从零开始构建大模型:LLMs-from-scratch(附PDF)
《Build a Large Language Model (From Scratch)》是机器学习和 AI 研究员、畅销书《 Python 机器学习》的作者Sebastian Raschka 所著的一本新书,旨在为读者揭示从零开始构建大型语言模型(LLM)的全过程。
《Build a Large Language Model (From Scratch)》是机器学习和 AI 研究员、畅销书《 Python 机器学习》的作者Sebastian Raschka 所著的一本新书,旨在为读者揭示从零开始构建大型语言模型(LLM)的全过程。
《Build a Large Language Model (From Scratch)》是一本理论与实践相结合的教程,能够帮助读者深刻理解LLM的工作原理,并学会如何构建和优化属于自己的模型,对于希望在AI领域深入发展的学习者来说,是一本不可或缺的参考书籍。

内容简介
这本书通过清晰的文字、图表和实例,详细解释了构建大型语言模型的每一个阶段,从最初的设计和创建,到使用通用语料库进行预训练,直至针对特定任务进行微调。书中具体讲解了如何规划和编码LLM的所有部分、准备适合LLM训练的数据集、使用自己的数据微调LLM、应用指令调整方法来确保LLM遵循指令以及将预训练权重加载到LLM中。
这本《从零构建大模型》中英文双语版 已整理并打包好PDF了
扫扫即可拿到↓↓↓

主要亮点
-
从头开始的构建过程:展示了如何从零开始构建一个工作中的LLM,带领读者深入了解LLM的内部工作原理。
-
开源代码库:作者在GitHub上开源了书中涉及的所有代码,方便读者获取并实践书中的内容。代码库链接:https://github.com/rasbt/LLMs-from-scratch?tab=readme-ov-file,目前已有 50.6 k stars。
-
实用的指令微调方法:重点介绍了指令微调的方法,包括如何将数据格式化为指令-响应对、如何应用prompt-style模板以及如何使用掩码等,这些技巧能够有效提升模型的性能。
适合读者
本书适合具有Python基础知识的读者阅读,拥有一定机器学习模型开发经验者更佳。无论是学生、研究员还是业界从业人员,都可以通过本书学习到构建和应用LLM的实用技巧。
目录
-
理解大型语言模型
-
处理文本数据
-
编码注意力机制
-
从零开始实现一个GPT模型以生成文本
-
在无标签数据上进行预训练
-
为分类任务进行微调
-
为遵循指令进行微调
这本《从零构建大模型》中英文双语版 已整理并打包好PDF了
扫扫即可拿到↓↓↓

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)