LLaMA-Factory 是一个基于 Hugging Face 和 DeepSeek 模型的开源工具,主要用于大模型微调、推理及可视化操作。以下是其核心用法:
环境准备
- 安装 Anaconda :创建Python环境(推荐Python 3.11),激活环境后安装依赖(如
torch
、metrics
等)。 - 下载模型:通过
pip install modelscope download --model Qwen/Qwen2.5-VL-7B-Instruct --local_dir /data2/users/yszhang/quickllm/qwen2.5-vl-instruct
命令下载模型参数。