一、项目意义

Datawhale 是一个专注于数据科学与 AI 领域的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员。Datawhale 的小伙伴们一起制作了一份优质的中文教程:面向开发者的大模型手册 - LLM Cookbook

由吴恩达老师与 OpenAI 联合推出的官方教程,如 ChatGPT Prompt Engineering for DevelopersLangChain for LLM Application DevelopmentBuilding Systems with the ChatGPT API 等,预计将成为 LLM 的重要入门教程。然而,目前这些教程仅支持英文版,且国内访问受限。因此,创建中文版并确保国内流畅访问的教程具有重要意义。此外,考虑到 ChatGPT 对中文和英文的理解能力存在差异,贡献者在多次对比和实验后,确定了效果大致相当的中文 Prompts,以支持学习者研究如何提升 ChatGPT 在中文语境下的理解和生成能力。

这份教程为开发者提供了学习如何基于 LLM 搭建应用程序的实践路径。为了支持国内中文学习者,这份教程将该系列课程翻译为中文,复现了范例代码,并为一个视频增加了中文字幕。该项目还实现了与原文效果相当的中文 Prompts,以便国内学习者在中文语境下体验 LLM 的使用,并对比学习多语言环境下的 Prompts 设计与 LLM 开发。在未来,这个项目将进一步丰富本课程内容,加入更多提示工程的高级技巧,以帮助开发者掌握更多、更实用、更巧妙的提示工程技能!


二、项目简介

https://github.com/datawhalechina/llm-cookbook/tree/main

这个项目是一本大模型手册,专为满足国内开发者的实际需求而设计,旨在全面引导开发者入门 LLM。该项目以吴恩达老师的大模型系列课程为基础,对课程内容进行筛选、翻译、复现和优化,涵盖了从 Prompt Engineering 到 RAG 开发、模型微调的全过程,以最适合国内学习者的方式,引导他们入门和实践 LLM 相关项目。

Datawhale 的小伙伴们根据吴恩达老师的 11 门大模型课程的不同特点进行了翻译和复现,并考虑到国内学习者的实际情况,对课程进行了分级和排序。初学者可以先系统地学习必修课程,掌握 LLM 的基础技能和概念,然后根据自己的兴趣选择性地学习选修课程,不断在感兴趣的方向上探索和学习。

如果有你非常喜欢的吴恩达老师的大模型课程,但课程还未进行复现,该项目欢迎每一位开发者参考已有课程的格式和风格,复现课程并提交 PR。一旦 PR 审核通过,项目负责人会根据课程内容进行分级并合并到课程中。非常欢迎每一位开发者的贡献!

其他相关材料

面向开发者的 LLM 入门教程 - PDF

*DeepLearning.AI 中关于大模型的系列课程


三、学习指南

这份教程适合具备 Python 基础并希望入门 LLM 的开发者。如果您打算开始学习本教程,您需要具备以下条件:

  • 至少熟悉一个 LLM API(推荐 OpenAI Python API library,如果您使用其他 API,可能需要参考相关教程修改 API 调用代码)。

  • 熟练使用 Python Jupyter Notebook。

这份教程共包括 11 门课程,分为必修和选修两类。必修课程包含了入门 LLM 所需的所有基础技能和概念,这些课程非常适合初学者。该项目还为这些课程提供了在线阅读和 PDF 版本,并建议学习者按照这样的顺序进行学习。选修课程是对必修课程的进一步拓展,涵盖了 RAG 开发、模型微调、模型评估等多个方面,适合已掌握必修课程的学习者根据自己的兴趣选择学习。

必修类课程包括

  • 面向开发者的 Prompt Engineering 是基于吴恩达老师的 ChatGPT Prompt Engineering for Developers 课程打造的。这门课程面向入门 LLM 的开发者,深入浅出地介绍了如何构造 Prompt,并基于 OpenAI 提供的 API 实现包括总结、推断、转换等多种常用功能。这是入门 LLM 开发的第一步。

  • 搭建基于 ChatGPT 的问答系统是基于吴恩达老师的 Building Systems with the ChatGPT API 课程打造的。这门课程指导开发者如何基于 ChatGPT 提供的 API 开发一个完整的、全面的智能问答系统。通过代码实践,我们可以实现基于 ChatGPT 开发问答系统的全流程,这是大模型开发的实践基础。

  • 使用 LangChain 开发应用程序是基于吴恩达老师的 LangChain for LLM Application Development 课程打造的。这门课程对 LangChain 进行了深入的介绍,帮助学习者了解如何使用 LangChain,并基于 LangChain 开发完整的、具备强大能力的应用程序。

  • 使用 LangChain 访问个人数据是基于吴恩达老师的 LangChain Chat with Your Data 课程打造的。这门课程深入拓展了 LangChain 提供的个人数据访问能力,指导开发者如何使用 LangChain 开发能够访问用户个人数据、提供个性化服务的大模型应用。

选修课程包括

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

如何学习AI大模型?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高

那么针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉[CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)]()👈

学习路线

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐