输入一个热词,快速查看术语含义、常见场景和相关概念。
集中展示常见热词解释,方便按概念和场景继续浏览。
Q-LoRA是一种高效的大语言模型微调技术,它通过将预训练模型量化为4位精度,并冻结量化参数,同时结合LoRA技术对少量低秩适配参数进行微调,从而在保持模型性能的同时,极大降低了计算内存需求和硬件门槛。
近期常被查询的 AI 概念。