Transformer作者质疑Scaling Law,掀起AI开源新浪潮
人工智能的发展并非一场只属于巨头的游戏,模型也未必越大越聪明。最近,Transformer奠基人中的Ashish Vaswani与Niki Parmar共同发布了一个仅80亿参数的开源小模型,其直指规模定律的软肋,为轻量化、开放化的AI探索开辟了新方向。
近期,这个“小模型”在AI圈引发了广泛热议。
这款名为Rnj-1的开源模型,由Ashish Vaswani与Niki Parmar创立的Essential AI Labs正式推出。

他们正是2017年那篇里程碑式论文《注意力就是一切》(Attention is All You Need)的作者之二。

相关攻略
3月12日消息,近日,网易有道正式推出国内首个AI Agent(智能体)产品——“有道龙虾”(LobsterAI),这也是国内首个实现代码100%全开源的AI Agent产品。据了解,有道龙虾已上线
截至3月9日11时30分,港股通互联网板块震荡运行,港股通互联网指数(931637)报879 13点,当日下跌2 11%,但板块内部分相关个股表现亮眼,金山云(03896 HK)涨5 28%领涨板块
AI不应是巨头游戏,模型也不是越大越聪明。近日,「Transformer八子」中的Ashish Vaswani和Parmar共同推出了一个8B的开源小模型,剑指Scaling Law软肋,为轻量化、
2025年的AI行业,从一场震动开始。1月20日,DeepSeek发布了开源推理模型R1。硅谷顶级风投Marc Andreessen在社交媒体上写道:“这是我见过的最惊人、最令人印象深刻的突破之一。
开源大模型,进入中国时间。10 月,公开数据显示,来自中国的开源大模型已经牢牢占据榜单前五。阿里的 Qwen 系列和 DeepSeek,更是从 2024 年下半年起,就在开源社区构建起越来越深远的影
热门专题
热门推荐
《Zero Parades: For Dead Spies》的媒体评测已经解禁,结果相当亮眼。这款被许多人视为《极乐迪斯科》精神续作的作品,在OpenCritic上拿到了86分的媒体均分,在Metacritic上也有83分。游戏将于5月21日正式登陆PC平台,看来2026年的必玩叙事RPG名单上,又
目录 你是否也遇到过这些问题 处理效果 前置准备 超简单AI自动化解决方案 第1步:准备好你的原始数据 第2步:针对指定的文件下达指令 第3步:验收 还能解决这些同类问题 指令为什么这么有用? 更多场景直接抄作业 销售数据三级汇总 成本数据多级汇总 库存数据汇总 员工薪资汇总 常见问题答疑 核心价值
AI Agent 的发展,正迎来一个关键的转折点,从概念验证迈向真正的生产力交付。 想象一下,当一个 AI 智能体能够在无需人工介入的情况下,独立完成一个复杂项目的全流程,并将成功经验固化为可随时调用的“技能”——这是否标志着 AI 在职场中的角色,已经从辅助工具演变为自主的生产力单元? 随着 Op
彭博社的马克・古尔曼在最新报道中透露了一个有趣的发现:苹果为WWDC 26发布的宣传海报,其设计细节可能暗藏玄机,指向了即将在iOS 27中亮相的全新Siri交互界面。 根据古尔曼的分析,新版Siri的核心变化在于与灵动岛的深度融合。唤醒时,它将不再以传统的全屏或底部卡片形式出现,而是会以一个扩展的
GitHub 的 Star 数量还值得信赖吗?真相可能比你想象的更严峻。 开源社区中“购买 Star”的现象早已不是秘密,其便捷程度甚至超过点外卖,单价低廉且支持批量折扣。然而,卡内基梅隆大学(CMU)一项被 ICSE 2026 顶会收录的最新研究,首次系统性地揭示了这场“造假生意”的惊人规模:Gi





