LoRA：大模型微调的“轻量级外挂”_AI热词解释_游乐网

LoRA：大模型微调的“轻量级外挂”

类型：技术方法2026-05-14

LoRA是一种用于大语言模型高效微调的技术，它通过向模型注入少量可训练的参数（适配器），来学习特定任务或领域知识，而无需重新训练整个庞大的模型。

本次查询：LoRA

中文解释：低秩自适应

常见场景：大模型定制化 / 垂直领域应用 / 个人电脑微调模型

LoRA（Low-Rank Adaptation）是一种大模型的高效微调技术，它像给模型加一个“轻量级外挂模块”，只训练这个外挂来让大模型学会新任务，从而极大节省计算和存储成本。

随着ChatGPT等大模型兴起，如何低成本地让通用大模型适应医疗、法律、编程等专业领域成为关键。LoRA让普通开发者甚至个人用户能在消费级显卡上微调大模型，推动了AI应用的民主化和场景化落地。

LoRA的核心思想是“冻结原模型，只学参数增量”。它假设模型在适应新任务时，权重矩阵的变化是低秩的。因此，它将需要学习的参数变化分解为两个更小矩阵的乘积，仅训练这两个小矩阵，再将其输出叠加到原模型的冻结权重上，实现高效的知识注入。

1. 角色扮演与风格模仿：用LoRA微调模型，使其模仿特定作家或角色的语言风格。

2. 垂直领域问答：为医疗、金融、客服等领域注入专业知识，构建专业助手。

3. 图像生成定制：在Stable Diffusion等文生图模型中，训练特定画风或人物形象的LoRA模型。

4. 资源受限环境：在个人电脑或单张GPU上，快速实验和部署定制化模型。

LoRA vs. 全量微调：LoRA只训练新增的小参数，原模型参数冻结；全量微调则更新所有参数，成本极高。

LoRA vs. 提示词工程：LoRA是改变模型内部参数；提示词工程仅通过输入文本来引导模型，不改变模型本身。LoRA效果更深刻持久。

LoRA与适配器：LoRA是适配器方法的一种流行实现，但通常特指其低秩分解的数学形式，已成为该技术的事实代名词。

来源：AI 热词解释频道整理

LoRA 模型微调大模型 PEFT AI训练