输入一个热词,快速查看术语含义、常见场景和相关概念。
集中展示常见热词解释,方便按概念和场景继续浏览。
Preference Model 是一种从人类偏好数据中学习排序或评分规律的模型,广泛应用于强化学习人类反馈(RLHF)、推荐系统和内容排序场景,帮助AI输出更符合用户期待的结果。
近期常被查询的 AI 概念。