首页 游戏 软件 资讯 排行榜 专题
首页
AI
李开复发布零一万物大模型AI20时代正式开启

李开复发布零一万物大模型AI20时代正式开启

热心网友
19
转载
2026-05-16

11月初,AI领域传来一个重磅消息:由李开复博士领衔的零一万物公司,正式开源发布了其Yi系列大模型,包含34B和6B两个版本。

这次发布之所以引发广泛关注,关键在于其展现出的惊人效率。Yi-34B模型仅用了不及LLaMA2-70B一半、Falcon-180B五分之一的参数量,就在多项核心评测中超越了这些庞然大物。凭借这一表现,它迅速跻身全球顶级开源基础模型的行列。

根据Hugging Face英文开源社区和C-Eval中文评测的最新榜单,Yi-34B预训练模型拿下了多项SOTA性能指标,成为全球开源大模型的“双料冠军”。值得一提的是,这也是首个成功登顶Hugging Face全球开源模型排行榜的国产模型。

Hugging Face Open LLM Leaderboard (pretrained) 大模型排行榜(2023年11月5日)

“Yi”这个名字,源于中文“一”的拼音。其标志设计也别有深意:“Y”上下颠倒后形似汉字“人”,与AI中的“i”结合,寓意“Human + AI”,强调技术发展以人为本的核心精神。

零一万物创始人李开复博士在发布中表达了团队的雄心:“从写下第一行代码、设计第一个模型开始,我们的目标就是跻身全球第一梯队。” 从宣布进军AI 2.0到交出首份成绩单,零一万物的步伐清晰而迅速。

一、零一万物大模型 Yi 首次曝光

作为国产大模型,Yi-34B一个显而易见的优势是对中文语境更深的理解。对比GPT-4,在CMMLU、E-Eval、Gaokao等关键中文评测集上,Yi-34B展现出了相当的竞争力,这为其更好地服务本土市场奠定了基础。

当然,模型的实力更体现在综合能力上。在评估大模型通用能力的核心基准——如MMLU(大规模多任务语言理解)和BBH上,Yi-34B同样表现突出,在知识推理、阅读理解等多个维度评比中均取得领先,这与Hugging Face的评测结果相互印证。

各评测集得分:Yi 模型 v.s. 其他开源模型

在语言模型中,上下文窗口长度是衡量其综合处理能力的关键指标,直接决定了模型能理解和生成多长、多复杂的文本。更长的窗口意味着能消化更庞大的知识库,输出更连贯、精准的内容。

此次开源的Yi-34B模型,最引人瞩目的特性之一,便是其支持200K超长上下文窗口的版本。这意味着它能一次性处理约40万汉字的文本输入,足以理解超过1000页的PDF文档。在许多场景下,这种能力甚至可以替代需要额外构建的向量数据库。

对比来看,OpenAI的GPT-4上下文窗口为32K,约2.5万字。今年三月,Anthropic的Claude2将窗口扩展到了100K。而零一万物直接将这个数字翻倍,并且是首家在开源社区开放如此超长上下文窗口的大模型公司。

当然,扩展上下文窗口绝非易事,面临计算、内存和通信等多重挑战。受限于这些因素,此前多数大模型仅支持几千tokens的长度。为了突破限制,零一万物技术团队实施了一系列深度优化,包括计算通信重叠、序列并行、通信压缩等,最终在大规模训练中实现了近100倍的效率提升。

Yi系列模型亮眼成绩的背后,离不开其强大的AI基础设施(AI Infra)支撑。通过高精度系统、弹性训练和接力训练等全栈解决方案,团队确保了训练过程的高效与稳定。得益于此,Yi-34B模型的训练成本实测下降了40%,实际训练完成时间与预测时间的误差被控制在一小时以内。模拟推算,未来千亿规模模型的训练成本有望进一步降低50%。

截至目前,零一万物的Infra能力已实现故障预测准确率超90%,故障提前发现率达99.9%,无需人工干预的故障自愈率超过95%。

无论是台前的性能表现,还是幕后的技术攻坚,都源于零一万物数月来锤炼的一套“科学训模”方法论。大模型的效果极度依赖高质量数据,团队在数据处理管线上投入了巨大成本。通过将以往类似“炼丹”的玄学过程,转变为极度细致和科学化的管线与规模预测训练,不仅保障了当前模型的高性能,也为未来更大规模模型的训练压缩了时间和成本。

经过大量建模实验,团队自研出“规模化训练实验平台”,用于指导模型设计与优化。数据配比、超参搜索、模型结构等实验均可在此平台上进行小规模验证,其对34B模型每个节点的预测误差可控制在0.5%以内。

在开源首发日,李开复博士同时宣布,在完成Yi-34B预训练的同时,团队已旋即启动下一个千亿参数模型的训练。“我们的数据处理管线、算法研究、实验平台、算力资源和AI Infra都已就绪,接下来的动作会越来越快。”

二、从「AI 1.0」到「AI 2.0」

零一万物的首次成果亮相,不仅是一次技术展示,更揭示了其背后的商业逻辑与行业趋势。

今年3月,李开复博士阐述了AI从1.0迈向2.0时代的观点。随后,零一万物在此框架下成立,并吸引了前百度安全副总裁马杰、前微软副总裁祁瑞峰等众多技术精英加入,阵容堪称豪华。

回顾过去十年,深度学习催生了第一批AI明星公司,但随后行业经历了短暂低谷,甚至出现“AI泡沫”、“AI寒冬”的讨论。其根源在于,AI 1.0时代的技术公司在商业化落地上的步伐,比预想中要缓慢。

然而,自去年Stable Diffusion掀起AIGC热潮,特别是ChatGPT发布以来,全球AI行业看到了全新的机遇。这个新阶段,正是李开复所定义的“AI 2.0”。

ChatGPT之后,技术进步体现在通用人工智能(AGI)雏形初显,而商业应用则呈现出平台级爆发的趋势。这个“平台”的核心目标,是大幅降低开发AI应用的成本。可以类比电与电网:电是伟大发明,但只有建成了电网,微波炉、电动汽车等创新应用才得以涌现。AI 2.0之于1.0,正是将技术转化为平台,从定制走向通用,从单点突破扩展到全面赋能。

过去十年的实践验证了AI 1.0的瓶颈:数据越多效果越好,但依赖大量人工标注,成本高昂;且应用多是垂直领域的“孤岛”,难以互联互通形成生态。

AI 2.0的技术基石则是自监督学习,模型无需标注也能从海量跨领域数据中学习,形成一个具备世界知识的基础模型(即大模型)。在此基础上进行微调,就能快速适配不同任务。这带来了三大优势:减少人工标注、模型具备通用知识、微调成本极低。因此,AI 2.0时代,每个行业都有机会用大模型重构原有应用,以更短时间、更低成本生产高质量内容,实现精准化、个性化服务,催生更伟大的商业模式。

要实现这一愿景,两大关键挑战必须攻克:一是降低训练成本,这是催生海量应用的前提;二是突破长文本处理瓶颈,这是解锁高阶应用(如处理长篇合同、交叉分析论文、基于长剧本进行创作、研读多份财报等)的钥匙。

正因如此,“长文本处理”在下半年成为大模型赛道的必争之地。自Anthropic向OpenAI发起挑战后,国内厂商也纷纷取得突破:月之暗面的Kimi Chat支持20万字,百川智能的Baichuan2支持35万字,而零一万物的Yi-34B则将上限推至40万字。

此次开源的Yi-34B模型支持200K上下文窗口、处理40万字文本,正是李开复AI 2.0思想的直接实践。同时,依托底层计算设施与算法优化,其训练成本下降了40%。

模型上传至Hugging Face后,迅速获得社区关注,两天内下载量即突破千次,收获近150次点赞。

长文本技术的突破,不仅是Token数字的游戏,更深层的意义在于,它体现了整个行业对AI 2.0时代商业潜力的共识与信心。正是这种信心,吸引了大量顶尖人才涌入,才能在短时间内快速攻克一个又一个技术难关。

目前,攻克长文本的主流技术方法包括直接堆叠显存、滑动窗口、降采样,或在注意力机制中进行动态插值等。这些方法效果显著,但计算开销巨大。好在,随着各大云厂商的持续投入,算力壁垒正在被逐渐打破。

毫无疑问,AI正迈入一个全新的时代。AI 2.0描绘了一个广阔的商业愿景,道路虽长,参与者众,而作为后来者的零一万物,已然展现出成为其中重要一员的潜力。接下来的表现,值得期待。

来源:https://www.leiphone.com/category/yanxishe/NaA4p9cj3IQ458gD.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

李开复发布零一万物大模型AI20时代正式开启
AI
李开复发布零一万物大模型AI20时代正式开启

零一万物开源Yi系列大模型,其中Yi-34B以较少参数在多项评测中超越更大规模模型,登顶全球开源榜单。该模型对中文理解深入,支持200K超长上下文窗口,可处理约40万字文本。通过技术优化,训练成本降低40%,展现了高效AI基础设施能力,体现了AI2 0时代通过大模型赋能各行业、降低开发成本的趋势。

热心网友
05.16
李开复 AI 公司零一万物被曝多处变动:计划拆分数字人业务,关停部分项目
AI
李开复 AI 公司零一万物被曝多处变动:计划拆分数字人业务,关停部分项目

李开复AI公司零一万物被曝多处变动:计划拆分数字人业务,关停部分项目 最近,AI圈内又传出了新的动态。据《智能涌现》昨日援引多名独立信源的消息,由李开复创立的AI独角兽零一万物,近期内部进行了多处调整。 具体来看,这次变动主要体现在两个方面: 计划拆分数字人业务,由零一万物数字人业务研发负责人杨昌鹏

热心网友
04.28
2026中关村论坛年会聚焦AI,一日洞察人工智能千里之行
科技数码
2026中关村论坛年会聚焦AI,一日洞察人工智能千里之行

从美国加州圣何塞参加2026年GTC大会回到北京不到一周,杨植麟站上2026中关村论坛年会全体会议的演讲台。这位Kimi创始人兼CEO分享了团队在残差结构上的新思考,一份获得马斯克称赞的技术报告。演

热心网友
03.27
龙虾AI风靡,4个月斩获25万颗星标爆火内幕
科技数码
龙虾AI风靡,4个月斩获25万颗星标爆火内幕

俗称“龙虾”的开源AI(人工智能)智能体OpenClaw持续爆火。近日,OpenClaw(曾用名Clawdbot、Moltbot)的热度逐渐升温。该项目已经成为代码平台GitHub历史上增速最快的开

热心网友
03.07
OpenClaw如何百天内超越Linux?李开复谈企业多智能体技术元年
业界动态
OpenClaw如何百天内超越Linux?李开复谈企业多智能体技术元年

3月6日消息,近日,开源AI智能体项目OpenClaw以超过24 8万的GitHub星标数登顶平台星标榜,超越Linux与React成为有史以来最受欢迎的开源软件。这个被全球开发者称为“龙虾”的项目

热心网友
03.06

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

阿里钉钉文档全功能解析在线协同办公套件使用指南
AI
阿里钉钉文档全功能解析在线协同办公套件使用指南

钉钉文档官网 在探讨企业级协同办公解决方案时,钉钉文档无疑是备受瞩目的核心工具之一。作为阿里巴巴钉钉官方推出的旗舰级应用套件,它深度融合了在线文档编辑、智能表格、思维导图等多种高效创作工具。其核心优势在于与钉钉平台生态的无缝衔接,能够直接同步企业内部组织架构与通讯录,实现团队成员间的即时协作与信息流

热心网友
05.15
商汤小浣熊智能助手基于自研大语言模型
AI
商汤小浣熊智能助手基于自研大语言模型

在数字化转型浪潮中,高效、易用的数据分析工具已成为企业提升决策效率的关键。商汤科技推出的“办公小浣熊”智能助手,正是基于自研大语言模型打造的一款创新产品,旨在彻底降低数据分析的技术门槛。用户无需掌握编程知识或复杂操作,即可通过自然对话完成从数据查询、处理到可视化洞察的全流程,让数据价值触手可及。 办

热心网友
05.15
MiniMax新一代智能模型矩阵全面解析与应用指南
AI
MiniMax新一代智能模型矩阵全面解析与应用指南

在人工智能技术快速发展的今天,MiniMax作为一家专注于全栈自研的AI公司,正以其独特的技术路径和前瞻性的布局,在业界脱颖而出。公司致力于构建覆盖文本、图像、语音和视频的新一代多模态智能模型矩阵,这不仅体现了对核心底层技术自主权的深度掌控,也展现了对未来人机交互与内容生成形态的前瞻思考。 那么,M

热心网友
05.15
Apollo Credit Fund价格预测逻辑解析 ACRED未来走势与投资前景
web3.0
Apollo Credit Fund价格预测逻辑解析 ACRED未来走势与投资前景

ApolloCreditFund(ACRED)作为连接传统信贷与DeFi的桥梁,其价格受市场情绪、协议基本面及宏观环境影响。其价值逻辑根植于现实世界资产(RWA)的收益捕获与链上流动性释放。短期价格波动难以预测,但长期发展取决于信贷资产质量、协议安全性和市场采用度。投资者需关注其底层资产表现、代币经济模型及整个RWA赛道的发展趋势。

热心网友
05.15
智能客服机器人解决方案:AI客服系统提升企业服务效率
AI
智能客服机器人解决方案:AI客服系统提升企业服务效率

在数字化转型浪潮中,一套能够深度适配业务、彰显品牌特色的智能客服系统,已成为企业提升服务效率与用户体验的关键工具。然而,市场上许多解决方案往往模式固化,难以满足个性化需求。如何让AI客服不仅具备基础的自动化应答能力,更能承载独特的品牌文化与服务哲学?其核心在于系统是否支持深度的自定义与持续的AI训练

热心网友
05.15