返回文章列表

模型微调 ·

LoRA 微调流程

梳理 LoRA 的基本思想、训练数据准备、参数配置和实验复盘方式。

LoRA PEFT Fine-tuning

基本思想

LoRA 通过在部分线性层旁边注入低秩矩阵来学习任务增量,冻结原始模型参数,从而显著降低训练成本。

实验流程

  1. 明确任务格式,例如问答、分类、指令跟随或领域生成。
  2. 清洗数据,保证输入输出格式稳定。
  3. 选择 base model、目标层、rank、learning rate 和 batch size。
  4. 训练并保存 adapter 权重。
  5. 用独立验证集评估效果,并记录失败样例。

复盘重点

不要只看 loss 曲线。还要看输出风格、事实性、任务边界和过拟合迹象。对大模型微调来说,数据质量经常比参数搜索更关键。