网友分享MacMini M4 微调训练 DeepSeek-R1 蒸馏模型

阿银

18小时前更新

网络上的各种教程基本都是使用了LLaMA-Factory，接下来跟随我一步步来实际操作，一块体验下如何进行大模型的微调和训练。

训练环境：

MacMini M4 （10c/24g）

准备conda环境，用来管理python版本

wget –user-agent=”Mozilla” https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2024.10-1-MacOSX-arm64.sh

执行安装脚本

bash Anaconda3-2024.10-1-MacOSX-arm64.sh

安装成功后，可以查看conda信息

conda version

使用conda创建 python venv环境

conda create -n llama_fatory python=3.10

激活llama_fatory环境

conda activate llama_fatory

查看当前python env 环境

conda env list

根据github上的安装说明，安装LLaMA-Factory

git clone –depth 1 https://github.com/hiyouga/LLaMA-Factory.git

cd LLaMA-Factory

pip install -e “.[torch,metrics]” -i https://pypi.tuna.tsinghua.edu.cn/simple

LLaMA-Factory的安装简单吧，可以看看帮助

(llama_fatory) ➜  LLaMA-Factory-main llamafactory-cli help
----------------------------------------------------------------------
| Usage:                                                             |
|   llamafactory-cli api -h: launch an OpenAI-style API server       |
|   llamafactory-cli chat -h: launch a chat interface in CLI         |
|   llamafactory-cli eval -h: evaluate models                        |
|   llamafactory-cli export -h: merge LoRA adapters and export model |
|   llamafactory-cli train -h: train models                          |
|   llamafactory-cli webchat -h: launch a chat interface in Web UI   |
|   llamafactory-cli webui: launch LlamaBoard                        |
|   llamafactory-cli version: show version info                      |
----------------------------------------------------------------------
(llama_fatory) ➜  LLaMA-Factory-main