红杉YC投资的AI视频通话，几乎无延迟且具虚拟形象

首页/AI教程/文章详情

红杉YC投资的AI视频通话，几乎无延迟且具虚拟形象

时间：2026-07-03 15:19

Tavus推出对话视频AI，用户可实时视频通话，响应速度低于一秒，打断后能立即倾听。基于自研Phoenix-2模型，结合3D高斯泼溅与GAN，渲染效率超100FPS，训练速度快70%。支持多语言但仅限英文，提供免费和付费版本。

最近，Ta vus推出了一款全新的对话视频AI，不少用户认为，这种形式比阅读文档或文字聊天更有趣，甚至有人用“震撼”来形容它的实时响应速度。

许多体验者将其视为一种全新的人机交互方式，试用后纷纷表示“停不下来”。

网页端可免费试玩2分钟

得知这一消息后，我们第一时间访问了Ta vus的官方网站。

官网提供了2分钟的在线体验机会，让你亲身感受这款“史上最快对话视频”的魅力。

体验时，对话对象是Ta vus预设的一个虚拟角色——卡特。他的人物设定是Ta vus公司的一名AI视频研究员，风格幽默，乐于助人。

就是下面这位：

虽然是虚拟人物，但与他视频通话的感觉，就像和朋友聊天一样自然流畅。

官方建议，体验时最好选择安静的环境，并授权摄像头和麦克风。

卡特在聊天中透露，大家最喜欢和他聊的话题，除了了解Ta vus背后的AI技术，就是分享自己的日常生活与心路历程，或者讲笑话。说到兴头上，他当场讲了一个冷笑话，讲完后还自娱自乐地笑了两声。

实际体验了2分钟，总体感受如下：

首先，响应速度确实快得惊人，完全符合官方宣称的“一秒以内”。即便你在说话时突然打断，他也能立刻停下，认真倾听你的最新发言。

其次，虽然官方表示支持30多种语言，但无论你用中文还是英文提问，他都无法用中文回答。问“Can u speak Chinese”时，卡特会礼貌地拒绝：“我更愿意用英文对话呢！”

第三，Ta vus的AI确实具备“视觉”能力。体验过程中一度冷场，不知该问什么，只能傻笑。卡特立刻捕捉到这一情况，主动开口找话题。

第四，在试玩版本中，卡特的口型与说话内容几乎完全同步，几乎感觉不到延迟。难怪有网友体验后直呼“有点吓人”。

现在，注册后即可直接使用Ta vus的对话视频AI。正式版本中，可选的AI形象不止卡特一个，有男有女，身份设定从销售顾问到生活指导，丰富多样。聊天背景也可以根据用户喜好更换，不再局限于办公室场景。同时，还能手动输入对话上下文，个性化定制的程度相当高。

目前提供免费和收费两种形式，对应不同的生成权益。

基于自研模型打造

支撑这一切的背后，是Ta vus团队自研的Phoenix-2模型。

该模型融合了音频与文本驱动的3D模型及2D GANs，能够生成1-2分钟的逼真短视频。生成流程大致分为四步：TTS（文本转语音）——头部和肩部3D重建——提示词脚本驱动的面部动画——高保真渲染。

为了让AI形象更加逼真，团队在构建渲染pipeline时，创新性地结合了GAN与3D高斯泼溅。传统GAN受限于图像分辨率，而体积模型在时间一致性上有所不足。因此，Ta vus将两者结合——用3D模型作为“中间体”，实现了超过100 FPS的渲染效率，同时由于动态物体周围的物理感知约束，可控性和通用性也更强。

相比初代Phoenix模型，Phoenix-2最大的改进是替换掉了NeRF，转而利用3D高斯泼溅来学习驱动3D空间中的面部动态变形，并根据未知的音频渲染视图。从实际表现来看，3D高斯泼溅在数据、内存、计算复杂度、流程和渲染效率上，均明显优于NeRF。基于3D高斯泼溅的Phoenix-2，训练速度比初代快70%，渲染速度达到60+ FPS。

Ta vus表示，对话中加入了回合结束检测和可中断性，使互动过程更加真实。此外，由于面部信息非常敏感，团队还配备了安全检查、安全协议、自动内容审核和反幻觉检查，以保障信息安全。

值得一提的是，Phoenix系列模型还支撑了Ta vus的另一款产品——生成用户数字孪生形象的对话视频。只需提供2分钟素材、花费1美元（起），就能调用API生成视频内容。

官方提示，这是一个端到端的解决方案，具备以下能力：

使用API，构建安全、真实的数字孪生或AI Agent
定制LLM、对话的人物角色和背景
在嵌入式会议室中流式传输、转录并分享对话记录
通过生产级可扩展性处理高流量

“不<1s，就不是人了”

Ta vus是一家成立四年的AI视频初创公司，团队规模不大。成员大多来自Amazon、Descript、Google和Apple。公开资料显示，截至今年3月，公司已获得红杉、Scale VC、YC的A轮投资，融资额约1800万美元。

Ta vus的联合创始人兼CEO是Hassaan Raza，曾在谷歌和苹果工作过。

联合创始人兼COO在Producthunt上留言表示，这款对话视频AI花费了数千个小时的研究、工程和构建。至于为什么要追求1秒或更短的延迟？官方的答案很简单：为了尽可能模拟真实人类之间的视频对话——因为如果反应速度不低于1秒，那跟你聊天的就不是人了。

参考链接

[1]https://www.ta vus.io/careers

[2]https://x.com/heyta vus/status/1824075891271749903

[3]https://www.producthunt.com/posts/conversational-replicas-by-ta vus

来源：https://www.aiagiai.com/2776.html

上一篇Canva上线魔力工作室用AI赋能视觉设计 下一篇谷歌前CEO施密特说真话实则是装糊涂高手

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-07-03

批处理BAT入门教程第一篇

提供13个批处理实战技巧，覆盖全盘查找并删除文件夹或文件、拷贝移动文件、创建畸形文件夹及设置隐藏属性等场景，可一键完成系统维护与文件管理工作，极大提升自动化操作效率和便捷性。

AI教程 · 2026-07-03

从零开始批处理命令For循环详解与实战案例

批处理For命令支持 d、 l、 r、 f四个参数。 d仅列出当前目录下的目录名； r递归搜索指定路径及其子目录中的文件； l生成数值序列； f可解析文件、字符串或命令输出，通过delims、tokens、skip、eol等选项灵活处理内容。

AI教程 · 2026-07-03

批评你的人是你生命中的贵人

批评你的人往往最值得珍惜，因为他们关注你、助你成长。面对批评应包容反思，用行动改进而非辩解。接受批评是自我完善的过程，能让人少走弯路，避免重复犯错。这样的人正是生命中的贵人，值得感恩与珍惜。

AI教程 · 2026-07-03

测试人员角色定位与职责详解

测试人员角色经历了从找问题、保证质量到分析风险的转变，最终核心职责是提供关键信息，协助团队创造优秀产品。这包括识别问题、评估风险及帮助团队了解项目状态，而非单纯把关或追求完美。

AI教程 · 2026-07-03

经营成功测试生涯的实用方法与策略

一、测试生涯的起点 1989年，我在田纳西大学攻读研究生时，意外地从软件开发人员转行成为一名软件测试工程师。这并非我主动选择，说起来还有些戏剧性——某个早晨，教授质问我为何缺席那么多开发会议，我解释说这些会议总是安排在周末早上，对我这个第一次离家、刚入学的学生来说实在不便。结果呢？等待我的不是解聘通