Minimind Github原文:GitHub - jingyaogong/minimind: 🚀🚀 「大模型」2小时完全从0训练26M的小参数GPT!🌏 Train a 26M-parameter GPT from scratch in just 2h!

前言

本文章旨在记录所有在使用Minimind自训练模型时,遇到的问题以及自己对于一些知识点的心得。Github上面的文章实际上需要一些基础才能看懂,本文想作为Github教程的一种补充,来帮助完全0基础的小白接触这个领域。

问题汇总

我的python版本:Python 3.12.4

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

1. 问题描述:

在直接运行环境准备代码时报错

报错内容:

ERROR: Could not open requirements file: [Errno 2] No such file or directory: 'requirements.txt'

 解决方法:

由于在复制完Minimind的代码后,路径并没有到minimind下,因此无法搜索到requirement的文本文件,只需要移动到minimind的路径底下即可

cd minimind

2. 问题描述:

缺少各种环境依赖,导致环境配置报错

报错内容:

ERROR: Failed to build installable wheels for some pyproject.toml based projects (matplotlib, pandas, tiktoken, ujson)

解决方法:

1. 对于pandas和ujson来说,是因为缺少微软的vs c++依赖。去微软官网

Microsoft C++ Build Tools - Visual Studio下载build tool,打开安装程序

选择“使用C++的桌面开发”,进行安装

安装完成后,pandas和ujson即可成功进行安装

2. 对于tiktoken来说,是因为缺少rust编译器依赖导致的。rust下载:Install Rust - Rust Programming Language

注:有可能国内下载速度会非常非常慢,可以使用国内镜像解决,以下提供我的方法

        安装powershell,地址:Install PowerShell on Windows, Linux, and macOS - PowerShell | Microsoft Learn

安装完成后,打开powershell,在powershell中分别输入以下代码:

$ENV:RUSTUP_DIST_SERVER='https://mirrors.ustc.edu.cn/rust-static'
$ENV:RUSTUP_UPDATE_ROOT='https://mirrors.ustc.edu.cn/rust-static/rustup'

然后直接使用powershell界面运行从rust官网上下载的“rustup-init.exe”文件

cd C:\Users\Username\Downloads //这里的路径是存放 rustup-init.exe 文件的路径
./rustup-init.exe //运行文件

注意复制的时候不要复制注释内容

此时下载速度就会正常,等rust安装结束后,tiktoken即可成功进行安装

rust下载过慢问题参考文献:window运行rustup-init.exe下载rust很慢_通常不会下载rustup-init.exe。请在打开前确保信任rustup-init.exe。-CSDN博客

3. matplotlib报错多半是由于python版本问题导致的,在研究了2个小时后发现了这篇文章:[Bug]: ERROR at installation: bulding wheel for matplotlib 3.5.3 · Issue #28671 · matplotlib/matplotlib · GitHub

3.5.3 的matplotlib不支持3.10以上的python版本,因此我卸载了我的3.12的python,重新安装了python3.10,然后matplotlib就安装成功了。

总结:下次还是要用aconda独立出环境,版本问题对于python来说过于致命了 

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐