首先需要明确一点:讯飞听见并非直接生成完整的剧本——它的核心功能是将视频中的语音内容精准转换为文字稿。对于剧本创作者而言,这样的文字稿正是剧本最基础的原始素材。只要视频中有人声,例如访谈、排练录像、即兴对话或口播素材,转写出的文字就能迅速整理为台词、场景描述,甚至形成分镜脚本。总结下来,三个关键要素:转写准确、编辑高效、结构清晰。
上传前:选对视频,再简单预处理一下
并非所有视频都适合直接上传。建议优先选择人声清晰、背景噪音低、语速适中的素材,例如单人讲解、双人对话,或没有音乐干扰的排练片段。如果原视频背景音过强或多人同时发言,可先用剪映等工具进行粗剪,去除静音和嘈杂部分。无需过度精细,确保语音纯净即可。
上传时需留意以下几点:
- 格式方面,支持MP4、MOV、M4V等主流格式,单个文件不超过2GB,时长最长5小时。
- 语言通常选择“中文(普通话)”或“中英混合”。若为方言视频,如粤语或四川话,选择对应方言可显著提升识别准确率。
- 专业领域选择“影视”或“通用”即可。若视频中包含大量角色名、道具名或地名,建议在“热词优化”栏提前输入,例如“林晚”、“青石巷”、“老式怀表”,以避免系统误识别为同音错字。
转写中:用AI把结构理清楚
提交后,1小时时长的视频最快可在5分钟内完成转写,效率可观。打开文件后,右侧显示完整文字流,左侧工具栏包含三个实用功能:
- AI会议纪要:自动提取发言要点、结论及待办事项,特别适用于从采访或创作讨论视频中快速获取核心情节线索。
- 语篇规整:将口语化长句切分为自然短句,补充标点符号,并删除“呃”、“啊”等语气词,使台词更接近剧本的节奏。
- 说话人分离:若视频中多人轮流讲话且音色区分明显,系统会自动标注“说话人1”、“说话人2”。只需将其替换为角色名,如“张警官”和“嫌疑人”,即可大幅节省手动标注时间。
转写后:三步快速整理出剧本雏形
将文字稿导出为Word或TXT后,按照以下顺序整理最为高效:
- 先分场:依据视频画面切换或话题转折,在文字中标注“【场景1】内景 咖啡馆 日”、“【场景2】外景 街道 夜”等。
- 再分行:将每段对话单独成行。角色名顶格左对齐,台词缩进两格。例如:
王磊
你真打算辞职?
李薇
昨天就交了申请。 - 补动作:回放视频几秒钟,将关键肢体动作、表情、道具使用写在括号内,如“(把咖啡杯重重放下)”、“(翻出旧照片,手指停在背面)”。这些即剧本中的“舞台提示”。
进阶技巧:做个轻量补充
若仅需从抖音或B站短视频中截取一段精彩对白作为灵感,无需下载视频。直接复制链接,使用提词匠等工具,5秒即可生成带标点的文案。该工具还支持一键“智能改写”,将平淡表达转化为更具戏剧张力的台词,例如将“我觉得这事不太靠谱”改为“(冷笑)这计划,连纸糊的墙都挡不住。”这对快速打磨台词质感十分便利。
