模型微调 · 2026/01/20

LoRA 微调流程

梳理 LoRA 的基本思想、训练数据准备、参数配置和实验复盘方式。

LoRA PEFT Fine-tuning

基本思想

LoRA 通过在部分线性层旁边注入低秩矩阵来学习任务增量，冻结原始模型参数，从而显著降低训练成本。

不要只看 loss 曲线。还要看输出风格、事实性、任务边界和过拟合迹象。对大模型微调来说，数据质量经常比参数搜索更关键。