在机器人技术持续革新的当下,中美两国在这一领域的竞争格局备受瞩目。作为Google DeepMind机器人部门的高级研究科学家兼技术负责人,谭杰分享了他在机器人领域发展的深刻洞见。谭杰本科毕业于上海交通大学,随后赴美深造,在计算机图形学领域获得博士学位,逐渐将研究方向转向机器人技术。
谭杰指出,中美在机器人领域的发展路径有着明显差异。中国在硬件制造方面发展迅猛,而美国则在机器人智能系统设计上保持领先地位。他强调,机器人技术的进步不仅依赖于硬件突破,更需要强大的算法架构与数据处理能力。谭杰认为,机器人与图形学有着紧密关联,图形学中的多项技术可以应用于机器人领域,尤其在仿真模拟和数据处理层面更具价值。
在谈及机器人基础模型的独立性时,谭杰表示,尽管目前机器人基础模型在很大程度上依赖于多模态大模型,但随着数据量和计算能力的提升,机器人模型有望发展出更加自主的架构体系。他提到,Google DeepMind团队最新发布的Gemini Robotics 1.5,通过引入“思维链”机制和跨本体迁移技术,显著提升了机器人的泛化能力和任务执行效率。
谭杰详细解析了Gemini Robotics 1.5的两项重要突破。首先,通过在模型中植入“思维链”机制,机器人在执行复杂任务时能够进行多步推理,并将思考过程可视化,增强了人机交互的透明度与安全性。其次,跨本体迁移技术使得不同机器人之间的数据可以共享和复用,从而解决了数据稀缺的难题。这项技术通过“运动迁移”方法,实现了不同构型机器人之间的任务转移,大幅提高了数据利用效率。
在数据获取方面,谭杰强调,机器人领域面临的最大挑战之一是数据的质量和规模。他指出,现实世界的数据采集成本高昂,而仿真数据虽然可以大规模生成,但与现实世界存在差距。为了弥合这一差距,谭杰认为,生成式AI技术,如视频生成模型,将在未来发挥关键作用。通过生成大量逼真的仿真数据,可以显著提升机器人模型的训练效果和泛化能力。
谭杰还分享了他对机器人架构演进的看法。他认为,尽管分层式模型在短期内更具实用性,但端到端的统一模型可能是未来的发展方向。他提到,Google DeepMind团队正在积极探索端到端模型的研究,并已在部分实验中取得初步成果。谭杰相信,随着计算能力的提升和算法的优化,端到端模型将在未来占据主导地位。
在展望机器人领域未来时,谭杰表示,未来两到三年内,机器人技术将迎来重要突破,具有泛化能力的机器人将开始在工业和物流等领域落地应用。然而,要实现机器人在家庭场景的广泛普及,可能需要更长的周期。他预计,未来五到十年内,机器人将逐步进入家庭,为人们的日常生活提供协助。
谭杰还分享了他对中美机器人领域合作的见解。他认为,中美在机器人领域的合作具有巨大潜力,特别是在硬件制造和算法研发方面。他指出,中国的硬件制造能力强大,而美国在算法和数据处理方面具有优势,双方的合作将推动机器人技术的快速发展。
在个人经历方面,谭杰提到,他在Google DeepMind团队工作已近十年,见证了团队从最初的几人发展到如今的规模。他强调团队的成功离不开高效的管理协作机制,以及公司对长期研究的支持。谭杰表示,他将持续致力于推动机器人技术的发展,为实现通用人工智能(AGI)在物理世界的应用贡献力量。
谭杰还分享了他的个人爱好和生活状态。他喜欢旅行、园艺和骑行,认为这些爱好有助于缓解工作压力。他有两个孩子,大孩子已经开始学习编程和机器人技术,小孩子则刚刚出生。谭杰表示,家庭生活让他更加珍惜时间,也让他更专注于工作。
