输入一个热词,快速查看术语含义、常见场景和相关概念。
集中展示常见热词解释,方便按概念和场景继续浏览。
训练后对齐是指在大型语言模型完成预训练后,通过RLHF、DPO等技术调整模型行为,使其输出更符合人类价值观、安全准则和实际需求的过程。这是当前AI从“能生成”到“会生成”的核心技术,广泛应用于聊天机器人、内容审核等场景。
近期常被查询的 AI 概念。