埃隆·马斯克近日在社交媒体上透露,其旗下人工智能企业xAI正在开发的全新一代语言模型Grok 5,预计有10%的可能性实现通用人工智能(AGI)的宏伟目标,而且这一概率正在稳步提升。作为特斯拉与SpaceX的掌舵人,马斯克这次的预测在科技界引发了关于AGI实现路径的热烈探讨。
xAI的技术路线与马斯克对AI效率的追求一脉相承。以Grok系列模型为例,2024年11月问世的Grok-1凭借3300亿参数,在性能上逼近参数规模翻倍的LLaMA 2(700亿),同时训练资源消耗仅需后者的一半。今年4月推出的多模态版本Grok-1.5V更胜一筹,不仅能通过视觉信息生成Python代码,还在RealWorldQA基准测试中超越同类竞品,展现出跨模态理解与代码生成能力的深度融合。
业界将Grok 5视为xAI技术突破的关键里程碑。据内部消息,该模型采用全新的架构设计,可能摆脱对海量数据的依赖,通过更高效的自学习机制显著降低训练成本。这一方向与当前主流模型依赖大规模数据标注和算力堆砌的模式形成鲜明对比——若能实现突破,将大幅缩短AGI的研发周期。
面对网友对技术路径的质疑,马斯克以幽默方式回应称,Grok 5在AI工程领域的表现已超越加拿大深度学习专家安德烈·卡帕西。曾主导meta AI实验室研究的卡帕西提出过“模型规模即性能”的范式,而xAI通过自主研发的训练架构(基于Kubernetes、Rust和JAX的定制框架),在资源利用率方面取得显著突破,为模型效率优化开辟了新路径。
