面壁智能发布 MiniCPM-o 2.6 全模态模型,号称“端侧 GPT-4o”
面壁智能发布MiniCPM-o 2.6全模态模型,号称“端侧GPT-4o”

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
AI模型轻量化竞争,又迎来一个标志性节点。面壁智能近日正式推出了旗下“小钢炮”系列的新成员——MiniCPM-o 2.6端侧全模态模型。别看这款模型的总参数量控制在8B级别,但其官方公布的性能对标目标却相当大胆:直接叫板GPT-4o与Claude-3.5-Sonnet这类顶级商用模型。
端到端全模态架构,性能对标顶级闭源模型
这款模型的核心看点,在于其采用的端到端多模态架构。简单来说,它能在一个统一的框架内,同时消化和理解文本、图像、音频乃至视频等多种格式的数据输入,并生成高质量的文本或语音回应。这种设计思路,正是当前多模态大模型演进的主流方向。
官方给出的评测结果颇为亮眼:在视觉理解、语音交互及多模态流式响应能力上,MiniCPM-o 2.6声称已经达到了GPT-4o-202405版本的水平。这意味着,在开源社区里,它很可能成为了当前模态支持最全面、综合性能最突出的选项之一。
不只是对话:情感控制与声音克隆成为亮点
除了基础的多模态理解与生成,MiniCPM-o 2.6在交互体验上也做了不少文章。它支持中英双语语音对话,并且用户可以配置不同的声音特性。更进阶的功能还包括对生成语音的情感、语速和风格进行细致调控,甚至能够实现端到端的声音克隆和深度的角色扮演。这些能力让它在人机交互的拟真度和趣味性上迈出了一大步。
打破设备限制:iPad上的实时多模态交互
另一个值得关注的突破是设备兼容性。官方强调,MiniCPM-o 2.6是首个能够在iPad这类移动端侧设备上,实现多模态实时流式交互的大模型。这背后的优化功不可没,它让高性能的多模态AI体验不再局限于云端或高性能工作站,真正向随身设备普及。
性能数据提供了有力支撑。在OpenCompass榜单上,该模型综合八个主流多模态评测基准,取得了平均70.2的得分。尤其引人注目的是,在单张图像理解这一关键任务上,它以8B的“小巧身材”,超越了GPT-4o-202405、Gemini 1.5 Pro和Claude 3.5 Sonnet等一众参数规模大得多的闭源商业模型。
开源可获取
目前,模型及相关资源已面向社区开源:
- GitHub:https://github.com/OpenBMB/MiniCPM-o
- huggingface:https://huggingface.co/openbmb/MiniCPM-o-2_6
此举无疑为开发者和研究者提供了一个强有力的端侧多模态基础模型选择,也进一步推动了高性能AI在本地设备上的部署与应用实践。
热门专题
热门推荐
小米Note 3铃声管理全攻略:从定位到自定义,一步到位 手里拿着小米Note 3,想换个铃声却找不到地方?别急,这事儿其实比想象中简单。系统预置的铃声,都规规矩矩地躺在内部存储的一个特定文件夹里:SDcard MIUI ringtone 。这个目录就像MIUI系统的“声音仓库”,里面分门别类地存放
小米电饭煲重置网络提示失败怎么回事? 遇到小米电饭煲重置网络总是失败,先别急着怀疑是硬件坏了。这事儿本质上,是设备在配网流程中没能和路由器成功“握手”,建立通信授权。背后的原因,往往出在几个容易被忽略的细节上:比如Wi-Fi频段没选对、密码格式太复杂、App里还残留着旧配置,或者是路由器那边设置了“
按摩椅力度调小后依然有效,关键在于匹配个体身体状态与使用需求 现代中高端按摩椅普遍配备多级力度调节系统,但很多人心里犯嘀咕:力度调小了,是不是就变成隔靴搔痒,没什么实际作用了? 事实恰恰相反。实测数据显示,轻柔档位(比如30%—50%的输出强度)在缓解日常肩颈僵硬、改善浅层血液循环方面,有着明确的生
米家扫地机器人怎么用手机远程控制 想随时随地指挥家里的扫地机器人干活?这事儿其实很简单。米家APP就是你的万能遥控器,只要几步设置,无论你是在公司、在出差,还是躺在沙发上,都能稳定、便捷地通过手机远程掌控全局。操作逻辑很清晰:在手机上安装好官方米家APP并登录你的小米账号,让扫地机器人连上家里的Wi
PoE交换机好坏,普通测线仪说了不算 想用普通网线测线仪来判断一台PoE交换机的好坏?这个想法很危险。原因很简单:普通测线仪只能干些基础活儿,比如看看网线通不通、线序对不对、有没有短路断路。但对于PoE交换机的核心能力——供电电压是否达标、输出功率稳不稳定、是否兼容最新的IEEE标准、带载后电压会不





