[其他] 6个问题讲清楚LoRA微调 [推广有奖]

0关注
22粉丝

已卖：2028份资源

大师

21%

还不是VIP/贵宾

威望: 1 级
论坛币: 556 个
通用积分: 575.5673
学术水平: 66 点
热心指数: 130 点
信用等级: 37 点
经验: 114119 点
帖子: 6765
精华: 0
在线时间: 2993 小时
注册时间: 2022-8-18
最后登录: 2026-4-9

楼主

2023Hua

发表于 2026-3-3 07:33:35 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

6个问题讲清楚LoRA微调
举例说明什么是LoRA
假设大模型原始权重矩阵(W) 是：

全量微调需要更新全部5×4=20个参数
假设微调后的参数是：

其中增量权重矩阵可以进行LoRA 低秩分解：
△W=A·B

(A) 有 5×2=10 个参数。
(B) 有 2×4=8 个参数。
LoRA 总参数：1 0 + 8 = 1 8 个
结论：通过LoRA 微调，调参对象从W变为A、B, 使得参数量从20个减少为18个，这是简化的例子。在
实际案例中，参数量可以减少为0.01%~3%左右。
LoRA 开山论文：2021 年 Microsoft Research 提出，首次提出了通过低秩矩阵分解的方式来进行部分
参数微调，极大推动了 AI 技术在多行业的广泛落地应用：LoRA: Low-Rank Adaptation of Large
Language Models
为什么需要LoRA
它的目标是解决大模型微调中的两大痛点
资源消耗太大训练效率低下
大型语言模型动辄几亿甚至几千亿参数，全参数 ...