讯飞听见工作流以Skill+Agent为核心,将语音能力无缝融入日常办公场景,实现自动化处理,无需手动操作。它支持轻量接入、智能整理与系统直连,自动完成转写、说话人区分、决策点与待办提取,生成三栏结构会议纪要。同时支持自然语言调整输出,对接钉钉/飞书等办公系统,并具备权限管控与私有化部署能力。

它并非单纯的录音转文字工具,而是将语音能力真正嵌入到您的办公系统之中。核心在于通过Skill+Agent构建自动化链路:从音频输入到最终可交付内容,全程无需手动跳转、复制粘贴或二次加工。
语音接入需轻量化,避免第一步就成为障碍
无需自行搭建服务器或编写接口代码。讯飞听见Skill专为Agent设计的即插即用模块,将上传、转写、结构化等操作封装为简单指令。只要Agent能读取本地音频文件(MP3/WAV/AAC等常见格式),即可直接触发处理流程。支持拖拽上传,也支持语音指令如“处理桌面上的会议录音.mp3”。
- 建议音频文件统一存放于“待处理/录音”文件夹,便于Agent批量识别
- 单次处理时长不限,但超过2小时的长音频建议分段,可提升转写准确率与响应速度
- 若录音包含多人发言,提前启用“区分说话人”功能,后续纪要会自动标注角色
转写仅是起点,整理才是关键需求
原始转写稿仅为基础。Agent接入Skill后,在转写完成瞬间启动语义理解:自动提取时间线、识别决策点、抓取待办事项、归纳核心结论。您获得的不是流水账,而是带有标题层级、重点高亮、待办加粗的结构化文稿。
- 默认生成三栏结构:概要(100字内)+ 主要内容(分议题展开)+ 待办清单(责任人+截止日)
- 支持自然语言调整输出风格,例如“按部门汇总发言要点”或“只保留技术方案讨论部分”
- 整理逻辑可微调,如设置关键词过滤(屏蔽闲聊词)、指定术语不替换(如“XX平台”“V3.2协议”)
结果需直接融入工作流程,避免二次加工
生成的纪要不是简单的PDF或Word文档,而是可直接对接现有办公系统。Agent能自动将结果发送至钉钉/企微群、同步到飞书多维表格、存入语雀知识库,甚至按模板生成PPT大纲或周报初稿。
- 发送消息时可指定接收人,例如“将这份纪要发送给张经理和项目组全员”
- 存档时支持自动打标签,按会议类型(评审会/复盘会/站会)和日期归类
- 需要延展写作时,一句话如“用这个纪要写一封给客户的项目进展说明”即可触发AI写作模块
权限与安全一次性配置,长期无忧
首次安装仅需四步:Agent检查环境 → 登录讯飞听见账号 → 授权语音处理权限 → 自动生成API Key。此后所有操作均在您自己的账号体系下运行,录音和文本全程加密传输,不经过第三方服务器。
- 企业用户可配置SSO单点登录,员工使用公司邮箱一键认证
- 敏感会议录音支持私有化部署选项,转写引擎部署在内网,数据不出域
- 每次调用都会记录操作日志,后台可查谁在什么时间处理了哪段音频
