返回项目列表

LoRA 微调实验

围绕指令数据构建的 LoRA 微调实验项目,记录数据准备、训练配置、评测和失败样例。

PyTorch Transformers PEFT LoRA WandB

项目目标

建立一套可复现的 LoRA 微调流程,便于比较不同数据集、rank 和学习率对模型行为的影响。

实验内容

  • 指令数据清洗和模板化。
  • PEFT 参数配置。
  • 训练过程记录。
  • 人工评测与自动评测结合。

经验记录

低质量数据会让模型更快学到错误模式。训练前的数据审计比训练后的反复调参更重要。