返回首页

使用指南

从安装到精通,带你全面了解 VoiceWriter

快速开始

只需几分钟,即可完成 VoiceWriter 的全部设置。

1

激活许可证

打开 VoiceWriter,在引导页面输入购买时收到的许可证密钥,点击「激活」。每个许可证最多支持 3 台 Mac。

🖼

许可证激活界面截图

2

配置 AI 服务商

在「设置 → 服务商」页面选择 AI 服务商。Whisper 语音转录需要 OpenAI API Key;润色模型支持 OpenAI、DeepSeek、Claude 和 Ollama(本地免费)。API Key 仅存储在你的 Mac 钥匙串中,绝不会发送到其他服务器。

🖼

API Key 设置界面截图

3

授予辅助功能权限

VoiceWriter 需要「辅助功能」权限来监听快捷键和在光标处注入文字。系统会弹出提示,点击「打开系统设置」,在隐私列表中勾选 VoiceWriter。

🖼

辅助功能权限设置截图

4

授予麦克风权限

首次录音时,系统会请求麦克风访问权限。点击「允许」即可。如果不小心拒绝了,可以在「系统设置 → 隐私与安全 → 麦克风」中手动开启。

5

试一试!

一切就绪!按住 Control 键(默认快捷键),对着麦克风说一句话,松手后文字就会出现在光标处。

🖼

录音面板截图

基础用法

掌握 VoiceWriter 的核心工作流程。

1

按住快捷键开始录音

在任意应用中按住设定的快捷键(默认 Control),屏幕底部会出现录音面板,显示波形动画和录音时长。

🖼

录音面板波形动画截图

2

自然说话

像平时说话一样,不需要刻意放慢语速或咬字。Whisper 模型对自然语音的识别准确率很高。

3

松手完成

松开快捷键,录音面板显示「处理中」状态。VoiceWriter 会依次完成:语音转文字 → AI 润色(如开启)→ 注入到光标处。

🖼

处理中状态截图

4

取消录音

录音过程中按 ESC 键可以取消当前录音,面板会短暂显示「已取消」后自动消失。录音时长不足 0.3 秒也会自动取消。

支持的应用

VoiceWriter 兼容几乎所有 macOS 应用。原生应用(备忘录、邮件、Pages 等)通过辅助功能 API 直接注入文字;浏览器、Electron 应用(VS Code、Discord 等)通过剪贴板模拟粘贴实现。终端应用会自动使用剪贴板方式。

AI 文字润色

让 AI 帮你把口语转化为流畅的书面文字。

1

开启润色

在「设置 → 语音识别」中打开「文字润色」开关。开启后,每次转录完成都会经过 LLM 处理。

🖼

润色开关设置截图

2

选择服务商和模型

在「设置 → 服务商」页面选择润色使用的 AI 服务商和模型。支持 OpenAI(GPT 系列)、DeepSeek、Claude、Ollama(本地免费模型)。推荐使用 gpt-4.1-mini 兼顾速度和质量,或使用 Ollama 实现完全离线润色。

润色效果示例

润色前(口语原文)

那个嗯我觉得这个方案还行吧就是那个时间上可能有点紧

润色后(书面输出)

我认为这个方案可行,但时间上可能比较紧张。

3

语言与标点

VoiceWriter 会自动检测语音语言,中文输出使用中文标点(,。、!?),英文输出使用英文标点。你也可以在设置中手动指定语言。

编辑模式

选中文字后,用语音指令编辑它。

1

工作原理

在任意应用中选中一段文字,然后按住快捷键说出编辑指令。VoiceWriter 会检测到你选中了文字,将你的语音当作编辑指令(而非新文本)来处理。

🖼

编辑模式工作流示意

使用示例

  • 选中一段中文 → 说「翻译成英文」→ 替换为英文翻译
  • 选中一封邮件 → 说「改得更正式一些」→ 替换为正式版本
  • 选中一段代码注释 → 说「改成中文」→ 替换为中文注释
  • 选中一段话 → 说「缩短一半」→ 替换为精简版本
2

与普通模式的区别

没有选中文字时 = 听写模式(语音转文字)。有选中文字时 = 编辑模式(语音当指令)。无需手动切换,VoiceWriter 自动判断。

语音命令

用语音控制格式和操作,无需动手。

1

撤销命令

说「撤销」「删掉」或 "scratch that",立即删除上一段输出的文字。

2

格式命令

说「换行」插入换行,说「新段落」插入段落分隔。支持中英文指令。

3

标点命令

说「句号」「逗号」「问号」「感叹号」「冒号」「分号」直接插入对应标点符号。

4

自我纠正

说「不对,应该是...」或 "actually...",VoiceWriter 自动用纠正后的内容替换。支持行内纠正(如「周二,不对,周三」自动替换为「周三」)。

个人词典

添加自定义词汇,提升专业术语的识别准确率。

1

打开词典页面

在主窗口侧边栏选择「词典」页面,点击「+」添加新词汇。每个词条包含术语和可选的发音提示。

2

Whisper 识别增强

词典中的术语会作为 Whisper 的 prompt hint 传入,引导语音识别引擎优先匹配这些词汇,减少专业术语的识别错误。

3

LLM 润色纠正

润色阶段,词典内容会注入 LLM 的 system prompt,AI 会自动将发音相似但错误的词汇纠正为词典中的正确术语。

屏幕感知

AI 根据你当前使用的应用和上下文,自动调整输出风格。

1

开启方式

在「设置 → 语音识别」中,先开启「文字润色」,然后开启「屏幕感知」。屏幕感知依赖润色功能,因此需要先启用润色。

2

工作原理

VoiceWriter 会读取当前文本框中的上下文内容(最多 500 字),连同当前应用名称一起发送给 LLM,让 AI 理解你的使用场景。

场景示例

  • 在微信/Slack 中 → 输出轻松的聊天风格
  • 在邮件应用中 → 输出正式的商务语气
  • 在 VS Code 中 → 保留技术术语,格式贴合代码注释
  • 在备忘录中 → 简洁的笔记风格

会议纪要

录制完整会议,AI 自动生成结构化纪要 — 与按住说话的即时输入完全不同的工作流。

1

打开会议页面

从 Dock 图标或菜单栏点击 VoiceWriter,在主窗口侧边栏选择「会议」页面。这是一个独立的录制界面,专为长时间会议设计。

🖼

会议页面截图

2

选择音频来源

支持两种音源:麦克风(录制你的发言)和系统音频(通过 ScreenCaptureKit 捕获系统声音,适合录制线上会议)。可根据场景灵活切换。

🖼

音频来源选择截图

3

开始录制

点击开始录制后,VoiceWriter 会持续进行分段转录,实时将语音转为文字显示在界面上。无需手动停顿,系统自动分段。

🖼

实时转录界面截图

4

生成纪要

点击停止录制后,AI 会根据完整的转录内容自动生成结构化纪要,包含要点、决策和待办事项。纪要保存至 ~/Documents/VoiceWriter/Meetings/ 目录。

🖼

结构化纪要截图

与按住说话有什么不同?

按住说话是即时输入模式 — 按住快捷键说一句话,松手后文字出现在光标处,适合快速输入。会议纪要是长时录制模式 — 在独立页面持续录音数分钟到数小时,录制结束后 AI 生成完整的结构化纪要,适合会议记录。

设置详解

了解 VoiceWriter 的各项设置选项。

1

快捷键选择

在「设置 → 通用」中选择录音快捷键。可选 Control、Option 或 Globe(Fn)键。Globe 键在部分键盘上可能冲突,推荐使用 Control 或 Option。

🖼

快捷键设置截图

2

开机自启

开启后,Mac 启动时 VoiceWriter 会自动运行,随时待命。

3

语言设置

可选自动检测、中文、英文(美式)、英文(英式)。自动检测模式下,Whisper 会根据语音内容自动判断语言。

4

日志查看

在「设置 → 日志」标签页中可以查看应用运行日志,方便排查问题。支持复制和清除日志。

5

服务商配置

在「设置 → 服务商」页面管理 AI 服务商。配置各服务商的 API Key 和默认模型。支持 OpenAI、DeepSeek、Claude 和 Ollama(本地部署,无需 API Key)。

🖼

服务商配置页面截图

常见问题

按住快捷键没有反应?

请检查辅助功能权限:前往「系统设置 → 隐私与安全 → 辅助功能」,确认 VoiceWriter 已勾选。如果已勾选但仍无效,尝试取消勾选后重新勾选。

文字没有出现在光标处?

请确认辅助功能权限已授予。部分应用(如某些 Electron 应用)可能需要先点击一下输入框确保光标在正确位置。如仍无效,VoiceWriter 会自动使用剪贴板方式注入。

支持哪些 AI 服务商?

VoiceWriter 支持四种 AI 服务商:OpenAI(GPT 系列)、DeepSeek、Claude 和 Ollama(本地部署)。语音转录使用 OpenAI Whisper,需要 OpenAI API Key。润色模型可以选择任意服务商。其中 Ollama 在本地运行,无需 API Key,完全免费。

支持哪些应用?

几乎所有 macOS 应用都支持,包括备忘录、邮件、Pages、Numbers、浏览器、VS Code、微信、Slack、飞书等。终端应用(Terminal、iTerm2 等)也支持,会自动使用剪贴板方式。

隐私安全吗?

VoiceWriter 不运行任何中转服务器,语音数据直接发送到你选择的 AI 服务商 API。你的 API Key 存储在 macOS 钥匙串中,不会被发送到其他任何地方。如果使用 Ollama 本地模型,所有数据完全留在你的 Mac 上,不会联网。

如何更换 Mac 或重新激活?

在旧 Mac 上打开「设置 → 许可证」,点击「取消激活」释放名额,然后在新 Mac 上重新输入许可证密钥激活。