游乐游手机版
首页/AI热点日报/热点详情

Cohere最新开源AI模型Aya Expanse性能显著超越谷歌及Meta同规格

类型:热点整理2026-06-28
最近,Cohere 发布了两个全新的开源 AI 模型,隶属于 Aya 项目。该项目的初衷在于弥补大模型在非英语语言处理上的不足。新模型分别命名为 Aya Expanse 8B 和 35B,目前已在 Hugging Face 开放下载。这两款模型一经推出,便使 23 种语言的 AI 表现实现了显著提升

最近,Cohere 发布了两个全新的开源 AI 模型,隶属于 Aya 项目。该项目的初衷在于弥补大模型在非英语语言处理上的不足。新模型分别命名为 Aya Expanse 8B 和 35B,目前已在 Hugging Face 开放下载。这两款模型一经推出,便使 23 种语言的 AI 表现实现了显著提升。

Cohere新开源AI模型Aya Expanse,能力碾压谷歌、Meta同规模模型

Cohere 在官方博客中指出,8B 参数版本让全球研究人员能够更便捷地应用突破性技术,而 35B 版本则提供了业界领先的多语言能力。实际上,Aya 项目于去年启动,核心目标在于让非英语语言也能受益于基础模型的便利。今年 2 月,他们发布了覆盖 101 种语言的 Aya 101,同时推出了配套的 Aya 数据集,用于辅助其他语言的模型训练。

Aya Expanse 在构建过程中继承了 Aya 101 的多项核心理念。Cohere 表示,此次改进基于多年来对机器学习底层模块的重新审视与突破。他们的研究方向非常明确——缩小语言差距,并取得了若干关键突破,包括数据套利、针对通用性能与安全性的偏好训练,以及模型合并等技术。

在多项基准测试中,Aya Expanse 的两个模型表现十分亮眼。Cohere 称,它们全面超越了 Google、Mistral 和 Meta 等公司同尺寸的 AI 模型。具体而言,32B 版本在多语言基准测试中击败了 Gemma 2 27B、Mistral 8x22B,甚至强于更大的 Llama 3.1 70B;而较小的 8B 版本同样超越了 Gemma 2 9B、Llama 3.1 8B 和 Ministral 8B,胜率区间为 60.4% 至 70.6%。

Cohere新开源AI模型Aya Expanse,能力碾压谷歌、Meta同规模模型

为避免模型生成难以理解或不可靠的内容,Cohere 采用了一种名为“数据套利”的采样方法。该方法在处理低资源语言时尤为出色,能使模型学习效果更佳。此外,他们还专门引导模型向“全球偏好”发展,将不同文化与语言的视角纳入考量,从而在提升性能的同时增强了安全性。

总的来说,Aya 项目旨在让大模型在非英语语言研究领域站稳脚跟。尽管许多大模型最终都会推出多语言版本,但在训练时常常面临数据匮乏的挑战,尤其是针对低资源语言。Cohere 此次的努力,对于构建真正多语言的 AI 模型而言,具有重要的推动作用。

来源:https://www.1ai.net/22101.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。