0

0

DeepSeek爆了,普通人如何3小时完全从0训练自己的大模型

雪夜

雪夜

发布时间:2025-04-22 17:36:20

|

450人浏览过

|

来源于php中文网

原创

deepseek爆了,普通人如何3小时完全从0训练自己的大模型

今天为大家介绍一个非常实用的开源项目 - MiniMind。它使得我们能够使用普通电脑,在短短3小时内训练出一个迷你版的ChatGPT!

这个项目为何如此特别?目前市场上的大型语言模型通常具有数十亿参数,训练成本高昂。即便是想要学习和研究的人,也常常被高昂的硬件门槛所阻隔。而MiniMind通过巧妙的设计,将模型参数压缩到了最低,使得个人开发者也能亲手训练AI模型!

最小版本仅有26M大小(约为GPT-3的1/7000),普通的游戏显卡即可运行。项目提供了完整的训练流程:

基础语言能力训练(预训练)对话能力训练(指令微调)快速适应新任务(LoRA微调)优化回答质量(DPO偏好对齐)环境需要代码语言:javascript代码运行次数:0运行复制```javascript CPU: Intel(R) Core(TM) i9-10980XE CPU @ 3.00GHz内存:128 GB显卡:NVIDIA GeForce RTX 3090(24GB) * 2环境:python 3.9 + Torch 2.1.2 + DDP单机多卡训练

Ubuntu == 20.04Python == 3.9Pytorch == 2.1.2CUDA == 12.2requirements.txt(本项目环境依赖)实际应用场景1. 个性化助手开发你可以训练一个针对特定领域的AI助手,比如:

客服机器人:根据公司产品知识库训练教育辅导:针对特定学科的习题讲解行业助手:为特定行业提供专业建议2. 技术学习与研究了解大语言模型的工作原理实践各种训练方法尝试模型优化和改进3. 产品原型验证快速验证AI产品创意测试不同场景下的效果收集用户反馈进行迭代技术亮点解析轻量级架构采用Transformer的Decoder-Only结构使用RMSNorm预标准化提升性能引入旋转位置编码处理长文本创新的专家模型版本(MoE)提供4×26M的混合专家模型通过专家分工提升模型能力保持较低的计算资源需求灵活的部署选项支持单卡/多卡训练兼容主流深度学习框架提供网页交互界面上手有多简单?只需几步就能开始:

代码语言:javascript代码运行次数:0http://www.w3.org/2000/svg"youjiankuohaophpcnzuojiankuohaophpcnpath d="M6.66666 10.9999L10.6667 7.99992L6.66666 4.99992V10.9999ZM7.99999 1.33325C4.31999 1.33325 1.33333 4.31992 1.33333 7.99992C1.33333 11.6799 4.31999 14.6666 7.99999 14.6666C11.68 14.6666 14.6667 11.6799 14.6667 7.99992C14.6667 4.31992 11.68 1.33325 7.99999 1.33325ZM7.99999 13.3333C5.05999 13.3333 2.66666 10.9399 2.66666 7.99992C2.66666 5.05992 5.05999 2.66659 7.99999 2.66659C10.94 2.66659 13.3333 5.05992 13.3333 7.99992C13.3333 10.9399 10.94 13.3333 7.99999 13.3333Z" fill="currentcolor">运行http://www.w3.org/2000/svg"youjiankuohaophpcnzuojiankuohaophpcnpath clip-rule="evenodd" d="M4.5 15.5V3.5H14.5V15.5H4.5ZM12.5 5.5H6.5V13.5H12.5V5.5ZM9.5 2.5H3.5V12.5H1.5V0.5H11.5V2.5H9.5Z" fill="currentcolor" fill-rule="evenodd">复制```javascript

1. 克隆项目git clone https://www.php.cn/link/c7e2ac420af977df8c6ccc95ac8dc911# 2. 安装依赖pip install -r requirements.txt# 3. 开始对话测试python 2-eval.py

如果想要可视化界面,还可以使用内置的网页版:

代码语言:javascript代码运行次数:0运行复制```javascript

堆友
堆友

Alibaba Design打造的设计师全成长周期服务平台,旨在成为设计师的好朋友

下载

streamlit run fast_inference.py

定制大模型1. 克隆项目代码代码语言:javascript代码运行次数:0http://www.w3.org/2000/svg"youjiankuohaophpcnzuojiankuohaophpcnpath d="M6.66666 10.9999L10.6667 7.99992L6.66666 4.99992V10.9999ZM7.99999 1.33325C4.31999 1.33325 1.33333 4.31992 1.33333 7.99992C1.33333 11.6799 4.31999 14.6666 7.99999 14.6666C11.68 14.6666 14.6667 11.6799 14.6667 7.99992C14.6667 4.31992 11.68 1.33325 7.99999 1.33325ZM7.99999 13.3333C5.05999 13.3333 2.66666 10.9399 2.66666 7.99992C2.66666 5.05992 5.05999 2.66659 7.99999 2.66659C10.94 2.66659 13.3333 5.05992 13.3333 7.99992C13.3333 10.9399 10.94 13.3333 7.99999 13.3333Z" fill="currentcolor">运行http://www.w3.org/2000/svg"youjiankuohaophpcnzuojiankuohaophpcnpath clip-rule="evenodd" d="M4.5 15.5V3.5H14.5V15.5H4.5ZM12.5 5.5H6.5V13.5H12.5V5.5ZM9.5 2.5H3.5V12.5H1.5V0.5H11.5V2.5H9.5Z" fill="currentcolor" fill-rule="evenodd">复制javascript git clone https://www.php.cn/link/c7e2ac420af977df8c6ccc95ac8dc911cd minimind
  1. 环境安装代码语言:javascript代码运行次数:0运行复制javascript pip install -r requirements.txt -i https://www.php.cn/link/a6455ffc4e47fd737db213366771ec0e# 测试torch是否可用cudaimport torchprint(torch.cuda.is_available())

如果不可用,请自行去torch_stable下载whl文件安装。参考链接,

  1. 自己训练数据集下载数据集放到./dataset目录下python data_process.py命令处理数据集,例如pretrain数据提前进行token-encoder、sft数据集抽离qa到csv文件./model/LMConfig.py中调整model的参数配置这里仅需调整dim和n_layers和usemoe参数,分别是(512+8)(768+16),对应于minimind-v1-smallminimind-v1`python 1-pretrain.py执行预训练,得到pretrain.pth作为预训练的输出权重python 3-full_sft.py执行指令微调,得到fullsft.pth作为指令微调的输出权重python 4-lora_sft.py执行lora微调(非必须)python 5-dpo_train.py`执行DPO人类偏好强化学习对齐(非必须)持续进化中项目正在快速发展,目前已支持:

文本对话:流畅的中英文交互视觉理解:可以理解和描述图像知识更新:持续优化训练数据性能提升:不断改进模型结构最后MiniMind降低了AI开发的门槛,让更多人能够参与到大语言模型的探索中来。无论你是:

想入门AI的开发者需要定制化AI助手的企业对语言模型感兴趣的研究者这个项目都能帮你快速起步,并在实践中不断成长。项目完全开源,想要了解更多MiniMind项目信息的读者可以查看项目地址:

https://www.php.cn/link/ac65fa3ab83a6deeaa332196ad0ebabb

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

727

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

630

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

747

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

617

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1236

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

575

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

702

2023.08.11

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

177

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 2.7万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号