发布时间:2026/6/12 23:31:39
LoRA微调:大模型低成本微调的标准答案
在小模型时代BERT全量微调**更新预训练模型的所有参数**是常规操作但在千亿/万亿参数的大模型时代全量微调存在如下问题。算力成本爆炸普通玩家玩不起以7B参数模型为例全量微调一次需要同时加载模型权重、优化器状态、梯度、中间激活显存需求很容易超过 100GB即便上优化手段也需要一张 A100/H100才能跑。对于更大的大模型需要多卡集群才行。过拟合风险高灾难性遗忘严重大模型的预训练知识是通用的全量微调会直接修改所有参数很容易在下游任务上过拟合同时遗忘预训练学到的通用知识灾难性遗忘。微调后的模型在其他任务上的性能会大幅下降通用性完全丧失。为了解决上述问题许多局部微调技术LoRA、Prefix Tuning、Prompt Tuning等被提出。经过大浪淘沙LoRA已成为现在的主流微调技术。LoRALow-Rank Adaptation低秩适配用更少的训练参数来近似LLM全参数微调所得的增量参数从而达到使用更少显存占用的高效微调。LoRA 的思想很简单。在原始 PLM (Pre-trained Language Model) 旁边增加一个旁路Adapter做一个降维再升维的操作来模拟所谓的内在秩。训练的时候固定 PLM 的参数只训练降维矩阵 A 与升维矩阵 B 。而模型的输入输出维度不变输出时将 BA 与 PLM 的参数叠加。用随机高斯分布初始化 A用 0 矩阵初始化 B 保证训练的开始此旁路矩阵依然是 0 矩阵。Q1什么是秩答秩是矩阵里独立信息线性无关的向量的数量。矩阵秩高表示矩阵含有很多互相独立的向量矩阵秩低表示矩阵的很多信息是重复线性组合真正有用的向量很少。全参数微调ΔW 看起来是高维矩阵但实际上它**内在秩很低**大部分更新都是重复、线性相关的真正独立有用的方向只有很少几个因此只需要用一个低秩分解 BA 就能完美模拟 ΔW。假设要在下游任务微调一个预训练语言模型如 GPT-3则需要更新预训练模型参数公式表示如下W0 ΔWW0 是预训练模型初始化的参数ΔW 就是需要更新的参数。如果是全参数微调则它的参数量为W0如果是 GPT-3则 ΔW ≈ 175B代价非常高。对于 LORA 来说只需要微调 ΔW。假设预训练的矩阵为W0∈Rd×k 它的更新可表示为其中秩 r ≪ min(d,k) k 表示输入维度d 表示输出维度。LoRA 在训练过程中W0是固定不变的只有 A 和 B 是训练参数。在推理过程中LoRA 也几乎未引入额外的推理延迟只需要合并权重W W0 ΔW即可。LoRA 与 Transformer 的结合也很简单仅在 QKV Attention 的计算中增加一个旁路。Q2LoRA的实际效果如何答经过在多个数据集上的对比LoRA在性能上可与全参数微调持平、甚至超过全参数微调。并且LORA 相比其它微调方法增加参数量不会导致性能的下降。所以一般我们进行SFT微调时使用LoRA即可。Q3Transformer中LoRA一般适配哪些参数占全量参数多大比例答一般默认只适配Self-Attention 里的线性层FFN 一般不动。为什么呢因为注意力层的参数更新秩最低加 LoRA 收益最大FFN参数多ΔW **秩高**加了收益小。Self-Attention 里的线性层包括Query 投影层 Wq、**Key 投影层 Wk、**Value 投影层 Wv还有输出投影层 Wo。这些参数加起来一般只占大模型全量参数的0.1~0.2%。Q4: LoRA的秩一般设置成多少比较好答一般情况下设置为r16即可想省显存、快训 设置r8复杂专业领域 可以设置r32。****AI行业迎来前所未有的爆发式增长从DeepSeek百万年薪招聘AI研究员到百度、阿里、腾讯等大厂疯狂布局AI Agent再到国家政策大力扶持数字经济和AI人才培养所有信号都在告诉我们AI的黄金十年真的来了在行业火爆之下AI人才争夺战也日趋白热化其就业前景一片蓝海我给大家准备了一份全套的《AI大模型零基础入门进阶学习资源包》包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。有需要的小伙伴可以V扫描下方二维码免费领取人才缺口巨大人力资源社会保障部有关报告显示据测算当前****我国人工智能人才缺口超过500万****供求比例达1∶10。脉脉最新数据也显示AI新发岗位量较去年初暴增29倍超1000家AI企业释放7.2万岗位……单拿今年的秋招来说各互联网大厂释放出来的招聘信息中我们就能感受到AI浪潮比如百度90%的技术岗都与AI相关就业薪资超高在旺盛的市场需求下AI岗位不仅招聘量大薪资待遇更是“一骑绝尘”。企业为抢AI核心人才薪资给的非常慷慨过去一年懂AI的人才普遍涨薪40%脉脉高聘发布的《2025年度人才迁徙报告》显示在2025年1月-10月的高薪岗位Top20排行中AI相关岗位占了绝大多数并且平均薪资月薪都超过6w在去年的秋招中小红书给算法相关岗位的薪资为50k起字节开出228万元的超高年薪据《2025年秋季校园招聘白皮书》AI算法类平均年薪达36.9万遥遥领先其他行业总结来说当前人工智能岗位需求多薪资高前景好。在职场里选对赛道就能赢在起跑线。抓住AI风口轻松实现高薪就业但现实却是仍有很多同学不知道如何抓住AI机遇会遇到很多就业难题比如❌ 技术过时只会CRUD的开发者在AI浪潮中沦为“职场裸奔者”❌ 薪资停滞初级岗位内卷到白菜价传统开发3年经验薪资涨幅不足15%❌ 转型无门想学AI却找不到系统路径83%自学党中途放弃。他们的就业难题解决问题的关键在于不仅要选对赛道更要跟对老师我给大家准备了一份全套的《AI大模型零基础入门进阶学习资源包》包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。有需要的小伙伴可以V扫描下方二维码免费领取

相关新闻

当无人机学会“丈量”世界:arXiv 2026 数据集深度解读《AirZoo》
2026/6/3 18:56:31

当无人机学会“丈量”世界:arXiv 2026 数据集深度解读《AirZoo》

它不再只从地面丈量世界,而是将视角拉升至云端——让每一架无人机都拥有一双理解三维空间的“几何之眼”。 想象一架无人机掠过一座陌生的城市。它需要精确计算出前方那栋建筑的高度,判断自己与地面车辆的距离,或者在高楼林立的环境中准确找到…

阅读更多
CloudBeaver实战部署指南:从零构建高效Web数据库管理平台
2026/6/7 21:25:47

CloudBeaver实战部署指南:从零构建高效Web数据库管理平台

CloudBeaver实战部署指南:从零构建高效Web数据库管理平台 【免费下载链接】cloudbeaver Cloud Database Manager 项目地址: https://gitcode.com/gh_mirrors/cl/cloudbeaver CloudBeaver是一款强大的开源云数据库管理工具,提供统一的Web界面支持多…

阅读更多
区块链原理与技术:全系列持续更新
2026/6/3 18:56:31

区块链原理与技术:全系列持续更新

区块链原理与技术01 区块链原理与技术01:区块链概述(上) 随着比特币等数字货币的兴起,其底层支撑技术——区块链,逐渐进入公众和研究机构的视野。区块链技术凭借其去中心化、不可篡改、透明可追溯等核心特性&#xf…

阅读更多
SpaceX上市:24年逆袭,从火箭回收、星链到太空算力,新故事能成真吗?
2026/6/13 19:57:30

SpaceX上市:24年逆袭,从火箭回收、星链到太空算力,新故事能成真吗?

SpaceX正式挂牌纳斯达克6月12日,SpaceX正式挂牌当天,马斯克前往得州的星舰基地,和数百名员工一起,远程敲响了纳斯达克的开市钟。他自嘲地说:“如果当年有人告诉我会有今天,我大概率觉得那个人嗑嗨了。因为当…

阅读更多
AI 驱动的 UI 组件智能组合推荐:从用户行为到布局方案的自动推导
2026/6/13 19:57:30

AI 驱动的 UI 组件智能组合推荐:从用户行为到布局方案的自动推导

AI 驱动的 UI 组件智能组合推荐:从用户行为到布局方案的自动推导 一、组件组合的"设计瓶颈":从需求到布局的经验依赖 前端开发中,将 UI 需求转化为组件组合方案是一个高度依赖经验的环节。一个"用户信息展示"的需求&…

阅读更多
调问更新:手机号验证、Excel 导入等新功能,提升问卷数据收集与分析体验
2026/6/13 19:57:29

调问更新:手机号验证、Excel 导入等新功能,提升问卷数据收集与分析体验

调问更新:数据收集与分析功能大升级调问自开源以来坚持前后端代码 100% 开源,助力企业搭建自己的问卷调研系统。此次更新全面提升了数据收集效率与分析专业度。全新上线手机号验证与 Excel 数据导入功能,前者保障了数据收集的真实性&#xff…

阅读更多
深入解析Kinetis SDK时钟管理器:从核心结构体到外设配置实战
2026/6/13 19:57:29

深入解析Kinetis SDK时钟管理器:从核心结构体到外设配置实战

1. 时钟管理器在Kinetis SDK中的核心地位与设计哲学在嵌入式开发领域,尤其是基于ARM Cortex-M内核的NXP Kinetis系列微控制器,时钟系统堪称整个芯片的“心跳”。它远不止是提供一个简单的节拍,而是整个系统功耗、性能和外设精度的总调度中心。…

阅读更多
一张照片变3D浮雕:ImageToSTL如何让你5分钟成为3D艺术家?
2026/6/13 19:57:29

一张照片变3D浮雕:ImageToSTL如何让你5分钟成为3D艺术家?

一张照片变3D浮雕:ImageToSTL如何让你5分钟成为3D艺术家? 【免费下载链接】ImageToSTL This tool allows you to easily convert any image into a 3D print-ready STL model. The surface of the model will display the image when illuminated from t…

阅读更多
别再暴力遍历了!用C语言strchr函数5分钟搞定PTA L1-011 A-B字符串过滤
2026/6/13 18:57:29

别再暴力遍历了!用C语言strchr函数5分钟搞定PTA L1-011 A-B字符串过滤

用C语言strchr函数高效解决PTA字符串过滤问题 在编程竞赛和在线评测系统(如PTA)中,字符串处理是最基础也最常遇到的题型之一。许多初学者面对"A-B"这类字符串过滤问题时,第一反应往往是使用暴力双循环遍历——这种解法虽然直观,但效…

阅读更多
JPEXS Free Flash Decompiler完整指南:免费SWF逆向工程实用教程
2026/6/12 9:49:36

JPEXS Free Flash Decompiler完整指南:免费SWF逆向工程实用教程

JPEXS Free Flash Decompiler完整指南:免费SWF逆向工程实用教程 【免费下载链接】jpexs-decompiler JPEXS Free Flash Decompiler 项目地址: https://gitcode.com/gh_mirrors/jp/jpexs-decompiler 你是否曾经遇到过需要修改一个Flash文件,却发现源…

阅读更多
抖音无水印视频下载器:终极技术实现与部署指南
2026/6/13 15:08:27

抖音无水印视频下载器:终极技术实现与部署指南

抖音无水印视频下载器:终极技术实现与部署指南 【免费下载链接】douyin_downloader 抖音短视频无水印下载 win编译版本下载:https://www.lanzous.com/i9za5od 项目地址: https://gitcode.com/gh_mirrors/dou/douyin_downloader 想要获取纯净的抖音…

阅读更多
工业级数据血缘分析:基于 Python 构建大规模图数据库关系拓扑与数据沿袭(Data Lineage)追踪算法
2026/6/13 11:19:35

工业级数据血缘分析:基于 Python 构建大规模图数据库关系拓扑与数据沿袭(Data Lineage)追踪算法

工业级数据血缘分析:基于 Python 构建大规模图数据库关系拓扑与数据沿袭(Data Lineage)追踪算法在企业级数据中台、大型分布式数据仓库(如 Hive、MaxCompute、ClickHouse)及数据治理体系的建设演进中,数据血…

阅读更多
终极指南:如何在macOS上轻松解密QQ音乐QMC格式文件
2026/6/13 0:57:15

终极指南:如何在macOS上轻松解密QQ音乐QMC格式文件

终极指南:如何在macOS上轻松解密QQ音乐QMC格式文件 【免费下载链接】QMCDecode QQ音乐QMC格式转换为普通格式(qmcflac转flac,qmc0,qmc3转mp3, mflac,mflac0等转flac),仅支持macOS,可自动识别到QQ音乐下载目录,默认转换…

阅读更多
从IEEE 754到Verilog:手把手搞定浮点数与整数的$rtoi/$itor/$realtobits转换(附代码示例)
2026/6/13 0:57:15

从IEEE 754到Verilog:手把手搞定浮点数与整数的$rtoi/$itor/$realtobits转换(附代码示例)

从IEEE 754到Verilog:深入解析浮点数与整数的系统级转换实践在FPGA和ASIC设计中,处理浮点数运算一直是个棘手的问题。Verilog作为一种硬件描述语言,原生支持整数和位向量操作,但对浮点数的直接支持有限。当我们需要在算法建模、测…

阅读更多
面试官连环问:从TCP序号绕回到窗口计算,这道‘古董题’到底在考察什么?
2026/6/13 0:57:15

面试官连环问:从TCP序号绕回到窗口计算,这道‘古董题’到底在考察什么?

TCP协议深度解析:从序号绕回到窗口计算的面试核心考点当面试官抛出"TCP序号用尽怎么办"这类问题时,他们期待的绝非教科书上的标准答案。这些看似陈旧的"古董题"背后,隐藏着对候选人协议设计思想、问题解决能力和工程实践…

阅读更多
GIT修改用户名
2026/6/13 10:50:23

GIT修改用户名

在GIT中修改用户名可按以下步骤操作: 查看当前git的用户名,使用命令git config --list或git config user.name。修改git用户名,使用命令git config --global user.name "xxx(新的用户名)",将其中…

阅读更多
Win11Debloat:让你的Windows系统重获新生的终极优化工具
2026/6/13 15:45:46

Win11Debloat:让你的Windows系统重获新生的终极优化工具

Win11Debloat:让你的Windows系统重获新生的终极优化工具 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and …

阅读更多
技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践
2026/6/13 11:10:35

技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践

技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter m4s-converter是一个…

阅读更多