零一万物是什么公司 它的AI模型与产品特点解析
2023年11月6日,零一万物重磅推出“Yi”系列开源预训练大语言模型,首期即发布Yi-6B与Yi-34B两款不同参数规模的版本。此次发布迅速在全球开源AI社区引发广泛关注,其核心原因在于模型展现出的卓越性能远超行业预期。
根据国际权威平台Hugging Face开源大模型排行榜及国内顶尖的C-Eval中文大模型评测基准最新数据显示,Yi-34B预训练模型一举斩获多项SOTA(业界最佳)性能指标,荣膺全球开源大模型领域的“双料冠军”。其综合表现成功超越了包括Meta的LLaMA2-70B、阿联酋的Falcon-180B在内的众多国际知名开源模型,实现了历史性突破。
尤为值得关注的是,Yi-34B成为首个登顶Hugging Face全球开源模型综合性能排行榜榜首的中国原生大模型,这标志着中国在开源基础模型领域取得了里程碑式的重大成就。
高效架构,问鼎全球中英文权威大模型评测双榜首
具体分析其性能表现,在Hugging Face的英文预训练开源模型综合排名中,Yi-34B以70.72的高分位居全球第一,上演了一场经典的“以少胜多”效率奇迹。其模型参数量显著低于LLaMA2-70B和Falcon-180B等竞争对手,却在多项核心评测任务中实现了性能的全面领先。
这背后体现的是极高的训练与架构效率。Yi-34B的参数量仅为LLaMA2-70B的一半左右,更是只有Falcon-180B的大约五分之一。正是在这种更为精炼高效的“轻量化”设计下,它在包括常识推理、知识问答在内的多项测试中超越了当时的全球领跑者,稳固跻身世界顶级开源基础模型之列。
来源:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
作为源自中国的大模型,Yi-34B在中文语言理解与生成能力上的优势更为突出。它在C-Eval中文权威评测榜单上超越了所有同期的开源模型,展现出对中文文化、语境与表达习惯的深刻把握。相较于GPT-4,Yi-34B在CMMLU(中文多任务语言理解)、E-Eval及Gaokao(高考)等核心中文评测集上建立了显著优势,这使其能更精准地理解和服务于中文用户及本土市场的多样化需求。
从大模型综合能力评估视角看,在衡量模型核心智能水平的“MMLU”(大规模多任务语言理解)以及BBH(BIG-Bench Hard)等具有挑战性的评测集上,Yi-34B的表现同样最为亮眼。无论是在通用知识、复杂推理还是深度阅读理解方面,它都展现出全面领先的实力,这一结论与Hugging Face的独立评测结果高度一致。
当然,模型也存在可优化的空间。与LLaMA2类似,Yi系列模型在GSM8k(数学问题求解)和MBPP(代码生成)等特定领域的评测中,表现暂未超越GPT系列模型。针对这一情况,零一万物官方表示,后续计划推出专注于代码与数学能力持续训练的专项优化模型,以完善其全场景能力矩阵。
开创性支持200K超长上下文,模型完全开源
除了基础性能的卓越表现,此次发布的另一大核心亮点在于其开创性的上下文窗口长度。对于大语言模型的实际部署与应用而言,能够处理多长的连续文本(即上下文窗口)至关重要。此次开源的Yi-34B版本,原生支持高达200K tokens的超长上下文窗口,这在当时创下了全球开源大模型的纪录。
200K上下文窗口意味着什么?它大约可以一次性处理相当于40万汉字长度的超长文本输入,其容量堪比一部完整的《儒林外史》。作为对比,OpenAI的GPT-4 Turbo的上下文窗口为128K,而早期GPT-4的上下文窗口仅为32K。这种数量级的提升,为长文档摘要、跨章节知识问答、复杂多轮对话以及长程逻辑推理等高级应用场景,开辟了前所未有的可能性。
相关攻略
2023年11月6日,零一万物重磅推出“Yi”系列开源预训练大语言模型,首期即发布Yi-6B与Yi-34B两款不同参数规模的版本。此次发布迅速在全球开源AI社区引发广泛关注,其核心原因在于模型展现出的卓越性能远超行业预期。 根据国际权威平台Hugging Face开源大模型排行榜及国内顶尖的C-Ev
在AI大模型竞争日益激烈的今天,零一万物(Lingyiwanwu)作为一家新兴的AI公司,正迅速进入公众视野。它究竟有何独特定位?简单来说,零一万物是一家专注于“AI 2 0”时代的全球化人工智能企业,其核心目标是推动通用人工智能(AGI)的研发与普及应用。公司秉持“技术为人”的理念,致力于通过“H
零一万物近期完成核心高管团队调整。前百度高管沈鹏飞加盟,统筹国内ToB与ToG业务拓展。同时擢升赵斌强、宁宁为副总裁,分别负责AI模型研发与国际业务咨询。此次布局旨在协同市场、技术与国际三大方向,全面升级企业级大模型解决方案能力,以支撑其“AllintoB”与“一把手工程”战略的落地推进。
知乎举办“AI上头俱乐部”活动,李开复、刘知远等专家共议AI前沿。李开复分享零一万物“模型+基础设施+应用”战略,其模型以低成本达世界前列。刘知远预测智能体网络将推动AI“第二次涌现”。活动还展示了知乎直答的专业搜索功能,可解析学术论文,覆盖海量文献。
字节跳动正筹建大模型研究院,高薪引入外部顶尖AI人才,包括秦禹嘉、黄文灏等已加入。公司此前大模型团队多来自内部,现策略转向外部引进。去年以来,字节陆续推出自研模型“云雀”、AI产品“豆包”及开发平台Coze等,持续加码大模型布局。
热门专题
热门推荐
广东无人机适飞空域扩大16%至10 24万平方公里,覆盖全省57%陆地面积,滨海、郊野、工业园区及非核心城区公园等区域开放,深圳市区新增连片适飞区。飞行需通过民航局UOM平台提前申请,严禁“黑飞”,违者将受处罚。平台已升级,实现全国规则统一与分钟级空域更新,支持低空物流与巡检等应用。
杭州Costco门店因iPhone17系列手机引发抢购热潮,数百人排队致迅速断货。抢购源于官方降价与地方补贴叠加:iPhone17Pro全系直降千元,同时当地青年消费补贴可再减10%,最高省千元。双重优惠下,256GB版iPhone17Pro到手价低至7172元,较电商平台便宜近千元,吸引本地及周边消费者。目前门店仍处缺货状态,补货时间未定。
5月17日晚,长征八号运载火箭在海南商业航天发射场点火升空,成功将千帆星座第九批组网卫星送入预定轨道。此次发射是该发射场启用以来的第15次成功发射,也是今年第5次发射,体现了我国商业航天发射能力的日益成熟和常态化运营的稳步推进。
七彩虹新款iGameM15 M16Origo2026款游戏本已发售,起售价11499元。M15为15 3英寸黑色机身,配备2 5K300Hz屏,最高可选Ultra9处理器与RTX5070显卡。M16为16英寸白色款,屏幕规格相同,处理器性能更强,电池容量更大。两款均提供多种配置,享受国家补贴后价格更具竞争力,面向中高端游戏玩家与创作者。
联想在北美市场推出新款ThinkPadT14Gen7商务笔记本,支持用户自行更换LPCAMM2内存。该机型提供多款英特尔酷睿Ultra处理器选项,内存可选16GB至64GB,电池与屏幕亦有多种配置,其中顶配版搭载OLED屏幕。产品起售价为1618美元,高配版本价格超过3700美元,主要面向商用及专业办公市场,兼顾性能、可升级性与不同预算需求。





