开源AI语音输入法OpenLess 口语自动转结构化文本教程
在追求效率的今天,语音输入工具正成为许多人的生产力倍增器。然而,市面上主流的解决方案多为闭源订阅制,不仅存在隐私顾虑,其功能也往往局限于简单的语音转文字。今天要探讨的OpenLess,则是一款试图打破这一格局的开源利器。它不止于转录,更致力于将零散的口语,智能地转化为可直接使用的文本,甚至是为大模型量身定制的结构化指令。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
OpenLess是什么
简单来说,OpenLess是一款基于Rust + Tauri + React + TypeScript技术栈构建的、完全开源的跨平台语音输入应用。它支持macOS和Windows系统,其核心体验非常直观:按住一个全局快捷键说话,应用便会自动完成录音、语音识别(ASR)、AI润色等一系列操作,并将最终结果直接插入到你当前光标所在的位置。你可以将它视为Typeless、Wispr Flow、Lazy、Superwhisper等商业订阅制工具的开源替代品。
OpenLess的主要功能
这款工具的功能设计,紧紧围绕着“高效产出优质文本”这一目标展开:
- 全局语音输入:无论是在ChatGPT、Claude、Cursor、Notion,还是在邮件客户端或聊天软件的输入框里,只需按下全局快捷键,即可开始录音,松开后自动处理并插入文本。
- AI Prompt 模式:这是其核心差异化功能。它不仅仅是把语音转成文字,更能将零碎、随意的口语自动整理成结构清晰、带有约束条件和上下文的AI Prompt,你可以直接将其喂给ChatGPT、Claude或Cursor使用。
- 多种输出模式:为了适应不同场景,它提供了「原文」、「轻度润色」、「清晰结构(AI Prompt 模式)」和「正式表达」四种模式供你随时切换。
- 双模式录音:提供「切换式」和更符合直觉的「按住说话」两种录音方式,在任何阶段按下
Esc键都可以取消当前操作。 - 剪贴板兜底:一个非常实用的细节。如果目标应用阻止直接插入文本,处理结果会自动复制到系统剪贴板,确保你的内容不会丢失。
- 词典与热词:支持自定义专有名词、产品名、人名等词典。这些词条会作为热词注入到语音识别过程中,并在后续的AI润色阶段进行语义修正,显著提升专有名词的识别准确率。
- 应用内自动更新:通过Tauri的更新机制,客户端可以自动检查并下载安装新版本,保持体验的持续性。
如何使用OpenLess
上手OpenLess需要一些初始配置,但过程并不复杂:
- 获取与安装:从GitHub Releases页面下载对应平台的安装包。macOS用户下载
.dmg文件拖入/Applications即可;Windows用户则运行下载的.exe安装程序。 - 权限配置:首次启动时,macOS用户需要依次授予「麦克风」和「辅助功能」权限,记得退出并重新打开应用以使辅助功能权限生效。Windows用户授予麦克风权限后,需在设置中确认全局快捷键监听已激活。
- 关键设置:在应用设置中,你需要填入两套凭据:一是火山引擎流式ASR服务的APP ID、Access Token和Resource ID;二是用于润色的大模型API凭据,支持Ark、DeepSeek或任何兼容OpenAI格式的API(需要提供API Key、Model ID和Endpoint)。
- 开始使用:将光标放入任意输入框,按下预设的全局快捷键开始录音。对着麦克风自然说话,OpenLess会实时完成录音与转写。松开按键后,自动进入AI润色阶段,并根据你选择的模式处理文本。
- 结果交付:润色完成后,文本会自动插入当前光标位置。如果插入失败,则会自动降级复制到剪贴板。在整个流程的任何阶段(录音中、润色中、插入前),按
Esc键即可取消任务。 - 模式切换与词典管理:你可以在主窗口随时切换四种输出模式,以适应从草稿到正式文档的不同需求。在「词典」页面添加专有名词,能大幅提升特定领域词汇的识别和润色准确度。
- 开发者构建:对于开发者,克隆项目仓库后,进入
openless-all/app/目录,依次执行npm ci安装依赖和npm run tauri dev即可进入开发调试模式。
OpenLess的官网地址
- 官网地址:https://openless.top/
- Github仓库:https://github.com/appergb/openless
OpenLess的关键信息和使用要求
- 定位:一款面向macOS和Windows的跨平台开源语音输入工具,旨在对标Typeless、Wispr Flow、Superwhisper等闭源订阅产品。
- 核心流程:按住全局快捷键说话 → 录音 → ASR转写 → LLM润色 → 自动插入光标位置。其最突出的差异化在于AI Prompt模式,能将口语直接整理为结构化指令。
- 技术栈:采用Tauri 2(Rust后端)搭配React与TypeScript构建,兼顾性能与现代前端体验。
- 当前版本:v1.2版本,支持两种录音方式、四种输出模式,拥有中英双语UI,并支持应用内自动更新。
- 凭据要求:需要用户自行准备火山引擎流式ASR服务以及Ark、DeepSeek或兼容OpenAI的Chat Completions服务的API凭据。
- 开源协议:采用宽松的MIT License。
OpenLess的核心优势
与同类产品相比,OpenLess在设计和理念上有着鲜明的特点:
- 完全开源、本地优先:所有代码在GitHub公开,所有数据(如词典、配置)默认存储在本地,不强制绑定任何特定的模型或服务商,给予了用户充分的控制权和透明度。
- 自带云凭据,隐私可控:用户自行配置ASR和LLM服务,意味着音频和文本数据直接流向用户自己选择的服务商,避免了数据被单一商业产品收集的风险。
- 专注文本整理,不会“越俎代庖”:其内置的润色模型只负责整理和优化文本结构、语法,不会自作主张地进行问答、任务执行或项目分析,确保了输出结果的可控性和预期性。
- 中英双语UI:支持简体中文与英文界面切换,首次启动时会根据系统语言自动适配,对中文用户非常友好。
OpenLess的同类竞品对比
为了更清晰地定位OpenLess,我们可以将其与市场上两款主流竞品进行简要对比:
| 对比维度 | OpenLess | Typeless | Wispr Flow |
|---|---|---|---|
| 开源/闭源 | 完全开源(MIT License) | 闭源商业软件 | 闭源商业软件 |
| 支持平台 | macOS、Windows | Mac、Windows、iOS、Android、Web | Mac、Windows、iOS、Android |
| 定价模式 | 免费 | 免费版 4,000–8,000 词/周;Pro $30/月 或 $144/年 | 免费版 2,000 词/周;Pro $15/月 或 $144/年;Teams $12/用户/月 |
| ASR/LLM 处理方式 | 自备火山引擎流式 ASR + 兼容OpenAI的LLM | 云端AI统一处理 | 云端处理(OpenAI、Meta等) |
| 隐私架构 | 本地优先,数据存本地,无供应商锁仓 | 纯云端,音频上传至供应商服务器 | 纯云端;存在截取活动窗口截图传输至云端的行为(用于上下文感知),引发隐私争议 |
| 核心差异化功能 | AI Prompt 模式:将口语自动整理为结构化Prompt;自定义词典热词注入;剪贴板兜底插入 | 跨平台覆盖最广;免费额度在同类中最慷慨 | 上下文感知格式化:根据应用自动调整语气;Command Mode语音编辑;Whisper Mode |
| 离线能力 | 否(需联网调用ASR与LLM) | 否(纯云端,断网即停止) | 否(纯云端,无离线模式) |
| 语言支持 | 中英双语UI | 多语言自动检测 | 100+ 语言,支持代码切换 |
| 录音限制 | 无明确时长限制 | 单次录音上限6分钟 | 未明确公开时长限制 |
OpenLess的应用场景
那么,这样一款工具具体能在哪些场景中发挥作用呢?
- 为AI工具生成结构化Prompt:面对AI助手时,无需费力构思Prompt。只需口述一个模糊的需求,OpenLess便能将其整理成带约束、有上下文的详细指令,直接插入对话框使用。
- 起草邮件、需求文档:快速口述想法,让工具自动去除“嗯”、“啊”等口语填充词,修正标点符号,并重新组织段落逻辑,把随口说的话变成严谨的书面表达。
- 编写代码注释、PR描述:在编程时,将脑海中的技术思路直接口述出来,转化为规范、简洁的文本,并自动插入到IDE或Git工具的光标处,提升文档效率。
- 任何“不想打字但必须输出文字”的场景:无论是填写在线表单、撰写社交媒体帖子,还是做会议速记后的整理,只要需要产出文字,按住快捷键说话即可完成。
相关攻略
在追求效率的今天,语音输入工具正成为许多人的生产力倍增器。然而,市面上主流的解决方案多为闭源订阅制,不仅存在隐私顾虑,其功能也往往局限于简单的语音转文字。今天要探讨的OpenLess,则是一款试图打破这一格局的开源利器。它不止于转录,更致力于将零散的口语,智能地转化为可直接使用的文本,甚至是为大模型
修改主题配色需定位源码中的Less Sass变量文件(如variables less或_variables scss),调整核心变量后重新编译。避免直接修改node_modules或编译后CSS。注意区分Less与Sass语法,确保变量文件被正确加载。按需引入样式或使用CSS变量映射可优化打包体积。修改后应重启开发服务器并全面测试组件颜色是否生效。
Sublime Text 需依赖外部 CLI 工具(lessc 或 Dart Sass)编译 Less Sass,插件仅提供语法高亮与构建入口;须先全局安装对应工具、正确配置构建系统路径,并推荐用命令行 watch 实时编译。 先说一个核心事实:Sublime Text 本身并不具备编译 Less
premiere的防抖功能通过“warp stabilizer vfx”实现,适合手持拍摄或轻微抖动的画面。1 使用时需将该效果拖至素材上;2 参数调整关键包括结果(如平滑运动
动态贴纸和动画元素能让视频更生动,使用剪映电脑版可通过三步实现:找到素材、拖拽添加、调整参数。首先,在界面底部“贴纸”选项中可找到内置贴纸库,分类包括节日、日常、搞怪等,也可通过关
热门专题
热门推荐
初次接触赛车模拟器,或是观看职业赛事的方向盘特写镜头,你一定会被那些密集排列的旋钮与按键所吸引。这绝非单纯的视觉装饰,每一个控件都承载着在毫秒间精准调控车辆动态的关键使命。从牵引力控制到刹车平衡,从引擎图谱到实时数据,这些为极速盲操而生的设计,正是区分业余爱好者与专业车手的重要标志。熟练掌握其功能并
本文介绍了在OKX欧易平台首次购买USDT的完整流程,重点强调了入金、下单、划转三个关键步骤的正确顺序。内容涵盖了从法币充值到币币交易,再到资产划转至资金账户的详细操作与注意事项,旨在帮助新手用户理清逻辑,避免因操作顺序错误导致交易失败或资金滞留,实现顺畅的首次加密货币购买体验。
Dota 2 7 41c版本现已更新,对于希望使用五号位英雄上分的玩家而言,当前环境中有几位英雄的表现尤为突出。根据Yandex战队职业选手Malady在最新视频中的深度解析,发条技师、工程师以及树精卫士,均是此版本中极具上分潜力的强势辅助选择。 除了分享强势辅助英雄推荐,Malady也透露了队伍近
近日,一则关于2026年电竞世界杯可能更换举办地的消息在电竞社区引发热议。据独联体知名爆料人harumi透露,原定于沙特阿拉伯利雅得举行的本届赛事,存在将主办地转移至法国的可能性。这一潜在变动,无疑为这项全球顶级电竞赛事的最终落地增添了新的看点与悬念。 目前,电竞世界杯赛事组委会尚未对此传闻发布任何
本文介绍了在访问OKX(欧易)平台时,如何准确识别其官方网站、帮助中心及处理页面跳转问题。重点分析了官方域名的核心特征与常见后缀,并提供了遇到非官方页面时的安全验证步骤与处理建议,旨在帮助用户有效规避风险,确保资产与信息安全。





