Scribe v2转录模型发布,支持90余种语言操作
ElevenLabs正式推出第二代转录模型Scribe v2,该系统专为高效处理离线批量语音转写与自动生成字幕而设计。新版本在英语上的词误率已降至5%左右,并对包括印地语在内的全球超过90种语言保持了低于10%的识别错误率控制。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

Scribe v2现已深度集成至ElevenLabs Studio平台,它能够处理单次时长超过10小时的超长音频文件,并全面符合GDPR、HIPAA等主流国际数据合规标准。其核心能力包括基于关键词引导的Keyterm Prompting功能,以及具备上下文感知能力的智能多说话人日志识别技术。

核心优势
- 面向大规模转录与字幕任务优化:Scribe v2专为高吞吐量语音转写、自动字幕生成及标题提取而优化,在稳定性与准确性方面显著优于前代Scribe v1,可稳健应对长时音频、自然停顿、语调起伏及长时间静音等复杂语音现象;原生支持超过90种语言,轻松覆盖多语言混合内容场景。
- 关键词引导式转录(Keyterm Prompting):用户最多可预设100个专业术语、品牌名称或技术词汇,模型将结合语境智能判断并精准还原这些关键表达,大幅提升垂直领域文本质量。
- 内置细粒度实体识别:支持识别涵盖个人身份、医疗健康、金融支付等在内的56类敏感实体,并为每个实体标注毫秒级时间戳,便于后续合规审查与内容编辑。
- 多语种无缝混识:无需人工切分或标注语种,即可自动识别并准确转录同一音频文件中交替出现的多种语言内容。
- 企业级增强能力:集成智能说话人分离、字级别精确时间轴、动态非语音事件标签(如笑声、脚步声、键盘敲击等),并通过SOC 2、ISO/IEC 27001、PCI DSS Level 1、HIPAA、GDPR等多项权威安全与隐私认证,支持零数据留存模式。
- 开箱即用与灵活接入:Scribe v2已上线ElevenLabs Studio用户界面,同时开放标准化API接口,供开发者快速集成至自有系统。
此外,为适配实时交互类应用场景(如AI Agent对话流处理),最新同步推出了Scribe v2 Realtime版本,针对极低延迟与流式语音输入进行了专项优化。
了解更多:
源码获取:
热门专题
热门推荐
可通过电子税务局 、随申办App 小程序、个税APP三种方式查询下载个税纳税记录:电子税务局需登录后搜索或按路径进入,下载PDF用身份证后6位解密;随申办依托统一认证,支持直接保存
3月26日,在SEMICON China 2026“半导体智能制造-未来工厂”论坛上,一场关于半导体制造AI未来形态的思想碰撞引发行业瞩目。智现未来董事长兼CEO管健博士受邀登台,发表题为《从“+A
南都讯 记者李洁琼 3月28日,珠海天际航空科技有限公司在金湾区天章产业园开业。作为珠海低空经济产业的新锐力量,天际航空智能制造基地的投运,标志着金湾区在载人级飞行器制造领域迈出关键一步,为珠海“天
来源:中国新闻网中新社杭州3月27日电 (鲍梦妮)随着机器人产业发展以及春晚机器人表演等热点带动,今年以来,中国多地机器人租赁业务持续升温。在上海上线的全球首个开放式机器人租赁平台“擎天租”,自去年
大象新闻·大象财富记者 李莉 张迪驰315消费者权益日刚过,广东李女士在某平台购买的“全新”打印机频繁报错,维修无果。她查询最新质保发现,整机标注保修三年,系统却显示剩余保修期不足两年,经售后核实确





