感谢热心网友四文鱼提供的行业动态线索!
8月6日消息,人工智能领域迎来重要突破——面壁智能于8月5日正式开源了新一代视觉语言模型 MiniCPM-V 4.0。令人瞩目的是,该模型在图像理解性能指标上已经超越了业界标杆 GPT-4.1-mini-20250414。
此次开源的MiniCPM-V 4.0不仅完美继承了上一代2.6版本的优秀特性,更在推理效率上实现了质的飞跃。值得一提的是,为方便移动端用户使用,面壁智能同时开源了适配iPhone和iPad的iOS原生应用程序。
据官方技术文档披露,MiniCPM-V 4.0作为MiniCPM-V系列的最新力作,整体参数规模控制在4B。在权威评测基准OpenCompass中,其图像理解能力表现优异,成功超越了包括GPT-4.1-mini-20250414、Qwen2.5-VL-3B-Instruct以及InternVL2.5-8B在内的多个业界主流模型。

面壁智能技术团队特别强调,这款模型凭借精巧的参数设计和高效的架构体系,堪称"移动端AI部署的绝佳选择"。实际测试数据显示,在iPhone 16 Pro Max等旗舰设备上运行配套iOS应用时,首token响应时间可控制在2秒以内,持续解码速率更可达到每秒17个token以上。


附MiniCPM-V 4.0开源项目地址:
https://huggingface.co/openbmb/MiniCPM-V-4
