8月21日,谷歌宣布为其人工智能助手Gemini Live带来多项重磅升级,这些新功能将大幅优化人机实时对话体验。其中最引人注目的是画面标注功能——从下周开始,当用户开启摄像头共享时,Gemini Live能够直接在屏幕上高亮显示特定物品。

这个功能的实用性很强,比如当你面对一堆工具不知如何选择时,只需用手机摄像头扫视工具堆,AI就会把最合适的工具标注出来。该功能将率先在8月28日发布的Pixel 10系列手机上亮相,随后会陆续推送给其他安卓设备,iOS版本也将在未来几周内上线。

此次更新还强化了Gemini Live与其他应用的联动性。现在它能更顺畅地与消息、电话、时钟等核心应用互动。举个例子:如果你正在和Gemini规划出行路线时发现可能要迟到,可以随时打断对话说:"这条路线不错。现在给亚历克斯发消息说我大概会晚10分钟。"Gemini就会帮你起草并发送这条信息。

值得关注的是,谷歌还为Gemini Live开发了全新的音频模型,能更精准地捕捉人类语音中的语调变化、语速快慢和音高等要素。不久后Gemini就能根据谈话主题自动调整语气,比如在面对压力相关话题时会采用更平和的语调。
用户现在可以自由调节Gemini的语速,还能要求它以特定角色或历史人物的视角讲故事。为了实现更生动的叙述效果,AI甚至可能模仿相应的地方口音,让整个讲述过程更具感染力。
谷歌Made by Google活动主题演讲专题
