△CogView-3-Plus能力实测。图源:作者测试
此外,CogView-3-Plus还具备强大的图片编辑能力,可轻松实现物体颜色更改、物品替换等操作。

△CogView-3-Plus图片编辑示例。图源:智谱AI
从今年1月到8月,智谱AI耗费超过7个月的时间,才为2024年1月发布的几款模型增添了“Plus”后缀——这也是自2023年以来,他们推出新模型所经历的最长周期。
谈到此处,不得不提一个关键转折点:GPT-4o。它如同一道能力分水岭,横亘在众多AI大模型企业面前。多模态融合的大门刚刚被推开,语言理解的“黑箱”才露出一丝光芒,便被GPT-4o迅速关闭。
面对这一挑战,国内大多数模型厂商选择“分而治之”的策略:先将不同模态的单一模型能力打磨扎实,再回头攻克融合这一难题。
目前,智谱AI的模型矩阵仍处于各自迭代的“分治”阶段。不过,视频通话功能的上线,已让用户隐隐看到了多模态融合的雏形。
