返回博客

Voicr Team · 2026年5月23日

如何在 Mac 上直接在收件箱里口述邮件

在 Apple Mail、Gmail 和 Outlook 中直接说出回复内容。看看每一款工具是怎么用的,以及内置工具在哪里掉了链子。

如何在 Mac 上直接在收件箱里口述邮件

普通办公人员平均每天要在邮件上花大约 2.6 小时,差不多占去三分之一的工作时间,全部用在读邮件和写邮件这一件事上。哪怕每封回复只省下几分钟,一周累计下来也能挤出一大块时间。

用口述显然是最直接的捷径。大多数人脑子里成句的速度,远比打字快。问题是,绝大多数语音工具都在收件箱之外。你得在邮件和另一个 App 之间来回切换、复制粘贴、切换窗口、反复修改。写到第三封邮件,省下的时间早就被消耗光了。

好消息是,在 Mac 上完全可以直接在邮件撰写窗口里口述。Apple Mail、Gmail 和 Outlook 都支持,只是各有各的小毛病。下面看看每款工具怎么用,内置功能从哪一步开始不够用,以及该怎么补上。

离开收件箱为什么会打断邮件思路

写邮件主要是个看上下文的活儿。你要把收件人、之前的邮件往来、想要的语气、对方具体问的问题,全都记在脑子里。把字组织出来反而是简单的部分,真正费劲的是同时把这些信息都端着。

每切换一次 App,你就丢一点上下文。打开一个单独的语音工具,等它加载,点到正确的窗口,粘贴,切回去,再找到刚才的位置。这一通操作下来,你原本想好的那句得体回复,早就跑出去三个版本了。

留在撰写窗口里,你的视线始终在原邮件上。读完对方的内容,顺势把回复说出来,草稿就直接出现在眼前。这才是值得花时间搭起来的工作流。

Mac 自带的口述快捷键

macOS 自带口述功能,已经预装好了。识别引擎称不上市面上最准的,但它免费,大部分音频都在本地处理(Apple 在隐私这块的态度还算靠谱),并且在 Mac 上所有的文本输入框里都能用。

系统设置 → 键盘 → 听写 里把它打开,挑一个你真记得住的快捷键。默认是双击 Control 或者右侧 Command 这类修饰键,比伸手按功能键那一排更顺手。

之后的流程就很简单了。点进任意文本框,按一下快捷键,直接说。需要标点时说 "逗号"、"句号" 或者 "换行"。说完再按一下快捷键,或者停顿一秒就行。

30 到 60 秒就断的小坑

自带的口述在连续说话大约一分钟之后,通常就会自动停掉。一两句话的快速回复完全没问题。但如果是稍长一点的邮件,你就得分段说、再拼起来——而这恰恰是这套流程本来要解决的窗口切换问题。

另外,在专业术语、人名和缩写的识别准确度上,自带功能也比专业转写工具弱不少。如果你的工作里有不少行业黑话,事后要修的内容会比想象中多得多。Voicr 这篇文章详细聊了 AI 语音口述在 Mac 上的工作原理,也解释了这个差距是怎么来的。

在 Apple Mail 里口述

Apple Mail 是最省心的情况。新建一封邮件,点进正文区域,触发口述快捷键,然后开口说。文字会随着你说话直接出现在邮件正文里。

实操中有几个小窍门。主题行用手打,不要用口述。它太短了,而短片段恰恰是语音识别最容易翻车的地方。收件人姓名在口述之后再亲自核对一遍:"Andrew" 和 "Andreas" 听起来就那么像,总有一个会落错。结尾的签名也别用口述。"此致,[你的名字]" 本来就是个模板,用一个键盘快捷键或者文本片段一下就敲出来了。

撰写窗口本身没有单独的口述按钮。在新近几版 macOS 里 Apple 已经精简了过去的菜单选项,所以系统级口述就是目前唯一的内置入口。

在 Mac 上的 Gmail 里口述

在浏览器里用 Gmail,有两种语音输入方式可选。

系统口述的用法和 Apple Mail 一模一样。在 Chrome、Safari 或 Firefox 里点进撰写区域,按下快捷键,直接说话。文字就像你在打字一样落进邮件正文里。

Google 自家的语音输入只在 Google Docs 里有,Gmail 没有。Gmail 撰写窗口里并没有原生的语音按钮。如果你非要 Gmail 专用的方案,Voice In 或 Voicy 之类的浏览器扩展会在撰写工具栏里加一个麦克风图标,而且没有时间限制。代价是它们只在浏览器标签页里好用,而且你得把另一个扩展放进收件箱里——它能看到的内容并不少,这一点需要心里有数。

对大多数人来说,系统口述更干净。配置一次,一个快捷键,从 Gmail 到其他所有 App 都通用。

在 Mac 版 Outlook 里口述

Mac 版 Outlook 自带一个口述按钮。新建邮件后,点工具栏里的 Dictate 图标(或者从菜单走 Message → Dictate),就可以开始说话。Microsoft 在云端处理音频,因此对较长的口述比较准,但需要联网。

Outlook 的口述按钮支持自动标点,而且不像 macOS 自带口述那样卡在 60 秒上限。代价是绑死在 Outlook 里。在 Gmail、Apple Mail、Slack 或其他任何应用里,你还是要回到系统口述,或者换一套完全不同的工具。

三个 Mac 邮件撰写窗口并排展示,每个窗口里都有一个用于语音口述的麦克风图标

原始口述不够用的地方

说点实在话:到目前为止聊到的所有口述工具——Apple 的、Microsoft 的、Google 的——给你的都是原始转写稿。你说什么,它就一字不落地记什么,连口头禅都给你保留下来。

如果你说话的方式像大多数人那样想到哪儿说到哪儿,转写稿大概会长成这样:

*"那个,我想说的是,呃,周五的会,啊不对,是周四的那个会我去不了,因为,你懂的,我那天有事,要不咱们往后挪一周或者怎么样。"*

这种东西显然没法直接发出去。所以你得删掉口头禅、调整语法、重组句子、改一遍语气。要是邮件长一点,光这一遍清理的时间,跟从头打一遍差不多。

这正是 AI 润色式口述改变这道算术题的地方。思路非常直接:对同一段录音,转写完之后再一步润色成干净、得体的书面文字。你说的是乱糟糟的版本,落到剪贴板里的是整洁的版本。粘进撰写窗口,改一次就行,不用反复修三遍。

一团带着波浪线的混乱语音气泡,正在变成一封干净利落的邮件信封

通吃所有收件箱的一键流程

Voicr 就是围绕这个思路做的一款 Mac 应用。它常驻菜单栏,默认监听 FN 键作为触发,在 Mac 上的每个 App 里表现都是一样的。整个流程是这样的: 1. 点进邮件正文。Apple Mail、Gmail、Outlook,都一样。 2. 按住 FN。 3. 自然地把回复说出来,语气词、卡壳、改口都没关系。 4. 松开 FN。 5. 用 Cmd+V 粘贴。

落进邮件里的,是一段读起来像你认真坐下来写的干净文字,而不是你嘴上说的那份原始记录。这正是 "语音输入只是个噱头" 和 "语音输入真的能替代键盘" 之间的差别。

因为触发键是系统级的,你为邮件养出来的肌肉记忆,同样适用于 Slack 消息、Notion 文档、ChatGPT 提示词,以及 Apple Notes。配置一次,之后就可以忘掉它的存在。

口述出更好邮件的几条小建议

正文用口述,其他用键盘

主题行、收件人姓名、附件文件名、URL、日期、地址、电话号码这些,通通用打字。它们短,必须一字不差,而口述偏偏在这里最容易出错。把嘴留给真正需要组织思路的那部分。

尽量把句子说完整

口述工具会根据停顿和语调来加标点。如果你说到一半就含糊过去,转写稿也会跟着含糊。每句话开口前先吸口气,清清楚楚地说完,再接下一句,稿子会明显干净不少。

别追求一次说完美

如果每说错一次就停下来重来,花的时间会比直接打字还长。一口气把整封邮件说完,错就错了,最后一起改。如果用的是带润色的口述工具,这一遍修改通常都可以省掉。

发送前再读一遍

再好的口述也做不到完全准确。"在" 和 "再",该是数字结果出成了文字,某个同音字没注意。发出去之前一定快速通读一遍,尤其是发给客户或者老板的邮件。

拿下一封邮件试试看

打开你的收件箱,挑下一封欠人家的邮件,最好是有一两段实质内容的,而不是一句话就能打发的那种。

点进撰写框,如果还没有设过口述快捷键,顺手设一个。把回复说出来,感受一下用嘴想事情和用手打字之间的差别。

如果原始转写稿要修的东西多到让你觉得不值得,那就是该试试边转写边润色的工具的时候了。用 Voicr,按住 FN,说出脑子里那段乱乱的版本,松开,然后把一段干净的草稿粘进邮件里。它在 Mac 本地运行,在每个 App 里都能用,快捷键设好之后就基本感觉不到它的存在。

不管选哪种方式,收件箱始终开着,邮件往来始终在视线里,回复也写完了。这就是整件事的意义所在。