模型微调 ·
LoRA 微调流程
梳理 LoRA 的基本思想、训练数据准备、参数配置和实验复盘方式。
LoRA PEFT Fine-tuning
基本思想
LoRA 通过在部分线性层旁边注入低秩矩阵来学习任务增量,冻结原始模型参数,从而显著降低训练成本。
实验流程
- 明确任务格式,例如问答、分类、指令跟随或领域生成。
- 清洗数据,保证输入输出格式稳定。
- 选择 base model、目标层、rank、learning rate 和 batch size。
- 训练并保存 adapter 权重。
- 用独立验证集评估效果,并记录失败样例。
复盘重点
不要只看 loss 曲线。还要看输出风格、事实性、任务边界和过拟合迹象。对大模型微调来说,数据质量经常比参数搜索更关键。