想把录音文件转为文字稿?Copilot 确实能帮忙,但有个门槛你得先知道:它不支持直接上传 .m4a 这类音频文件,只接受已经转好的文本内容,或者实时语音输入。换句话说,你得先用语音备忘录之类的工具把录音转成文字,再把文字粘贴到 Copilot 界面,剩下的格式优化、标点补全、段落分拆,它都能自动搞定。网页端可以直接听写,Android 端则得曲线救国——用截图转文字。

会议录音、课堂笔记、采访音频……要变成可编辑的文字稿,Copilot 确实给了几条路径,但前提是你得搞懂它到底支持什么、不支持什么。核心一点:它不接受任意格式的音频文件上传,只认特定场景下的语音输入或已转好的文字。
iOS版Word中用Copilot转录音文件
这个方法专门对付你已经录好的 .m4a 或 iPhone 原生录音文件——前提是还没转文字。
第一步:打开 iOS 版 Word,确保登录了 Microsoft 账户,订阅状态有效。
第二步:点右下角“+”新建 → 在搜索框下方点“使用 Copilot”链接。
第三步:选语言 → 点“文档模式”或“笔记模式” → 先别急着点麦克风,右上角有个“CC”按钮,点它进入转录编辑界面。
第四步:这时候界面是空的。注意:Copilot 无法直接读取你手机录音 App 里的 .m4a 文件,必须手动粘贴已经用其他工具转好的文字。如果你已经用 iPhone 语音备忘录自带转录功能生成了文本,直接复制粘贴进去就行。
第五步:粘贴后点“完成”,Copilot 会自动重排结构、补标点、分段落,按照你选的模式优化格式。一套流程下来,干净利落。
网页端Copilot直接听写转文字
这个适合边说边转的场景——不需要提前录好文件,实时生成干净的文字稿。操作很简单:打开 copilot.microsoft.com → 用工作或学校账号登录 → 聊天框底部有个麦克风图标,点一下,然后清晰自然地口述内容。
想让标点更精准?说话时直接加指令,比如“今天开会三点开始句号,讨论预算问题换行”,Copilot 就会按要求插入符号和分段。提醒一句:首次使用会弹出麦克风授权提示,拒绝授权的话,听写功能就用不了。
Android版Copilot应用内处理录音文本
Android 用户就没那么直接了——无法导入录音文件,但有个变通办法:通过“图像到文本”功能间接处理。前提是录音内容已经被打印出来,或者显示在屏幕上。
打开 Android 版 Microsoft 365 Copilot 应用 → 点“作” → 选“图像到文本” → 拍一张或者选一张含文字的截图(比如微信语音转文字后的聊天记录截图)→ 裁剪到只剩文字区域 → 点“完成”。Copilot 会提取出纯文本,复制出来就能继续编辑。
至于操作细节?简单得很,直接把文件拖进去就行。
