AI热词解释列表页

首页/AI热词解释

AI 热词解释

输入一个热词，快速查看术语含义、常见场景和相关概念。

工具入口

大语言模型大模型 RAG 智能体扩散模型 AIGC 代码生成向量数据库

热词列表

集中展示常见热词解释，方便按概念和场景继续浏览。

热词解释 · 2026-06-01

GRPO：大模型强化学习的新范式

GRPO（Group Relative Policy Optimization）是一种用于训练大语言模型的强化学习算法，通过对比同一问题下多个回答的相对优劣来更新策略，无需依赖独立的评论模型，显著降低算力消耗。它被用于 DeepSeek-R1 等推理模型，是当前开源社区关注的热点。

热门热词

近期常被查询的 AI 概念。