在开源大模型领域迎来了一项里程碑式突破:由Stable Diffusion的创造者StabilityAI正式发布了首个基于人类反馈强化学习(RLHF)训练的开源对话模型——StableVicuna。
具体而言,StableVicuna是在Vicuna v0 13b模型基础上进一步优化与对齐的成果。该模型首先进行了指令微调,使其能更准确地理解自然语言指令,随后接受了RLHF训练,从而让模型的回答更贴近人类偏好与价值观。其底层架构依托于参数量达130亿的LLaMA基座模型。
这意味着,开发者和研究社区如今能够获得的,不再仅仅是一个具备基础对话能力的模型,而是一个经过深度对齐、行为更可控、输出更安全可靠的开源对话AI。这一进展为开源人工智能生态的持续创新与实际应用部署,奠定了更为坚实的技术基础。
