智能眼镜的赛道,今年秋天要迎来一位重磅玩家了。5月20日,谷歌正式宣布,其首款定位为“智能眼镜”的可穿戴设备,将在秋季上市。这标志着谷歌不再满足于仅仅提供软件平台,而是亲自下场,要将AI能力直接“戴”在用户的脸上。
这款产品基于谷歌为AR/VR头显和智能眼镜打造的Android XR平台开发。有意思的是,谷歌并非单打独斗,而是拉上了三星、时尚眼镜品牌Gentle Monster以及平价眼镜品牌Warby Parker共同合作,推出多款AI音频眼镜。从目前公布的信息看,初代产品的设计思路相当明确:强化听觉与感知,而非视觉沉浸。机身会内置摄像头、扬声器和麦克风,但镜片本身并不配备显示屏——换句话说,它更像一个高度智能化的“听觉增强”设备,而非试图在你眼前投射一个虚拟世界。
目前,谷歌已经展示了来自Gentle Monster和Warby Parker的两种设计方案。可以预见,在产品开售时,这两家合作伙伴会推出各自完整的款式系列,以满足从时尚潮流到日常实用等不同用户的审美和佩戴需求。当然,无论外观如何变化,所有款式的“大脑”都是统一的:它们都将深度集成谷歌的Gemini人工智能系统。交互方式也很直观,用户只需说出唤醒词,或者轻触镜框侧边,就能随时召唤Gemini。
能看会听,AI成为你的“实时解说员”
那么,戴上这样一副眼镜,具体能做什么?谷歌描绘的场景相当贴近生活。Gemini将结合眼镜的摄像头和各类传感器,化身为你视野的“实时解说员”。当你看到一家感兴趣的餐厅,可以直接询问它的口碑和评分;抬头望天,它能告诉你云层的形态和天气变化;甚至面对复杂的停车标志牌,它也能快速解读出规则。在导航方面,它支持逐向语音引导,你还能随时添加途经点,或者让它帮你寻找附近的咖啡厅、加油站。
不止于信息,更是通信与创作工具
除了充当信息助手,这款眼镜还将承担起通信和多媒体中心的角色。通过语音指令,你可以管理来电、发送信息、让Gemini总结长篇文章的要点,或者直接播放手机里的音乐。设备内置的摄像头支持拍照和视频录制,拍下的内容还能通过名为“Nano Banana”的图像编辑引擎进行智能优化处理。对于经常需要跨语言交流的用户来说,Gemini提供的实时语音和文字翻译功能,或许能成为打破沟通壁垒的利器。
谷歌强调,Gemini的能力不止于执行简单命令。它可以处理多步骤的复杂任务,例如,你只需说一句“帮我从DoorDash订一杯咖啡送到公司”,剩下的选择、下单、支付流程它都能代为完成。同时,它也支持通过语音操作手机上已经安装的各类应用,大大扩展了实用性。在兼容性这个关键问题上,谷歌给出了明确的答案:产品上市时将同时支持Android手机和苹果iPhone,这无疑能最大化其潜在用户群体。
未来已来:显示型眼镜与行业竞争
值得注意的是,谷歌此次的发布更像是一个“序章”。官方透露,未来还会推出配备小型镜片显示屏的“显示型眼镜”,届时Gemini提供的信息可以直接呈现在你的眼前,交互体验将更进一步。当然,这类产品预计会晚于今年秋季上市的初代音频眼镜。
谷歌的加速入局,也让智能眼镜领域的竞争图景愈发清晰。有消息称,苹果也在紧锣密鼓地研发自家的AI智能眼镜,但按照目前的进度,相关产品可能要到2027年前后才会准备就绪。从今年秋天开始,随着谷歌首款产品的落地,一场围绕“可穿戴AI”的硬件与生态之争,或许将正式拉开帷幕。
