返回博客

Voicr Team · 2026年5月23日

10 个可以用语音输入自动化的 Mac 工作流

十个可重复的 Mac 工作流,用语音替代打字——邮件处理、会议记录、Slack、PRD、文本片段等等,配置方法一并附上。

10 个可以用语音输入自动化的 Mac 工作流

你的 Mac 能替你完成 90% 的零碎打字任务。你之所以还在手动做,只是因为没人把这套方法摊开来告诉你。

每天你大概要敲上百件零碎的小事。Slack 回复、邮件处理、会议记录、Linear 工单评论、一张 Figma 便签。这些大多算不上深度工作,而是 30 秒就能搞定的小段文字,却在你开始真正重要的工作之前,把每天早上的一小时耗光。

macOS 上的现代语音输入已经足够快、足够准,几乎能搞定这一切。配置一次,从此短文本可以全部说出口,大多数长文本也一样。目标不是把 Mac 当 Siri 那样对话,而是让你别再为打字本身就是瓶颈的活儿去敲键盘。

下面是十个语音输入收益最快的 Mac 工作流,分别要怎么配置、怎么让它真正成为习惯。

为什么语音输入应该出现在你的 Mac 工作流里

语音大约是打字速度的三倍。斯坦福关于移动文本输入的研究测得语音约每分钟 150 个词,而键盘只有约 40 个词。大多数成年人打字比自己想象的慢,而说话其实更接近思考的速度。

这个差距很关键,因为写字占了你一天里比想象多得多的时间。知识工作者每周仅在邮件上就要花 11.7 小时在 Slack 上再花 1 小时 42 分钟。哪怕只把这些零碎事砍掉三分之一,你每周都能白捡一个下午。

问题在于,单凭原始听写远远不够。Apple 自带的听写是逐字转录——你还得自己改标点、把半成型的句子重新组织、按不同应用调整语气。这一通收尾把节省下来的速度又吃回去了。下面的工作流都假设你的方案能边输出边打磨,无论是 macOS 听写加自律、第三方工具,还是 Voicr 之类的产品。

工作流 1 —— 不动键盘搞定收件箱

收件箱处理是最值得先下手的地方。你读完一封邮件,心里清楚要回什么,而 90% 的回复就是 1 到 3 句话。「好的,可以。」「能不能推到周二?」「我把 Maria 也拉进来。」

打开 Mail 或者浏览器里的 Gmail,点进回复框,按住听写快捷键,用大白话把回复说出来。不用纠结正不正式,想到什么就说什么。剩下的打磨交给听写工具。

让这套做法真正落地的关键是批量处理。一口气过十封邮件,每封都用语音回,中间不切换应用、不滚动浏览。原本 45 分钟的早晨缩成 10 到 15 分钟。如果想深入了解这一点,可以看如何在 Mac 上用语音回邮件

工作流 2 —— 顺手回复 Slack 消息,不打断节奏

Slack 是打字最容易把专注力切碎的地方。每条回复都会把你从手头的事里拽出来,而消息本身往往无关紧要——一个表情就能表达的意思,被硬撑成了一句话。

语音能把这种额外开销砍掉一半。点进消息框,按住快捷键,说一句「行,我这边没问题,今晚我把 PR 推上去」,松开。搞定。

Slack 消息和邮件语气不同:随意、简短、不打招呼、不加结尾。如果你的听写工具支持按应用配置规则,就给 Slack 指定一条「随意、简短、首字母小写」的规则,从此不用再操心。下面是一条适合 Slack 的 Smart Rule 示例: ``` 按随意的 Slack 消息风格重写。保持 1-2 句话。除非是人名,否则首字母小写。不要打招呼,不要结束语。要口语化,别正式。 ``` 效果会因模型而异——把结果当作初稿,不要当作金科玉律。

四个 Mac 应用窗口围绕着一支麦克风,每个应用都以自己的写作风格接收语音输入

工作流 3 —— 通话一结束就把会议记录倒出来

会议结束后的五分钟,是你对内容记得最清楚的时候。一旦切到另一个应用去开 Linear 工单或更新 Notion 文档,一半信息就蒸发了。

打开一篇 Notes 或者 Notion 页面,按下听写快捷键,把刚才发生的事讲一遍。决策、负责人、截止时间、未决问题。别一边说一边想结构,先把内容倒出来,再去整理。

如果想让结构一步到位,可以配一个改写提示,把自由表达的内容自动整理成结构化笔记。选中文本,触发改写快捷键,挑一个像下面这样的提示: ``` 把这份会议记录重新整理为三个部分:决策、行动项(注明负责人)、未决问题。保留所有原始细节。不要凭空添加内容。 ``` 整套会后流程从 15 分钟压缩到大约 2 分钟。

工作流 4 —— 起草长文档(PRD、简报、提案)

这里就是语音从「省几分钟」跃升到「省一整个下午」的地方。任何长文档最难的都是空白页。打字一点点磨过去慢得像冰川,而用说的,20 分钟就能堆出 1500 字的粗糙初稿。

诀窍是别在第一遍就追求成稿。把文档当作正在向同事讲解的话题讲一遍。讲清楚问题、做法、未决问题、时间线。别改、别重启句子、保持往前推。

有了这份草稿,你可以手动收尾,也可以套一步文本改写(见工作流 5)来精简。大多数写作者会发现,第一遍的语音稿大约能覆盖手敲稿 80% 的内容,时间却只花了四分之一。

工作流 5 —— 原地修语法、改写任意选区

这一项严格说不算语音输入,但它是任何语音工作流缺失的另一半。听写完之后,你常常会想让语气更正式、更简短,或者结构换一换。手动去改,会把你刚刚省下的速度又赔回去。

解法是一个「选中即改写」的快捷键。选中文本,按下热键,挑一个提示——*更正式一点*、*修语法*、*精简一下*、*翻译成英文*。文本会原地被替换。不用复制粘贴到 ChatGPT,不用切换应用,也不会丢掉光标所在位置。

如果你已经在用听写,但事后还要花时间收拾输出,Voicr 把这两半一起包了。听写边说边润色,再加上一个 Option+Space 快捷键,可以按你选的提示改写任何选中的文本。你只需一次性配置好自己的改写提示(正式、随意、修语法、简化、翻译),然后在任何应用里都能触发。

工作流 6 —— 把任务录入 Things、Todoist 或 Notion

大多数任务都死在「我应该做这件事」和「我真的坐下来把它打进任务管理器」之间的缝隙里。语音能把这道缝填上。

打开任务管理器,按下听写,用自然语言把任务说出来。「周五前给 Maria 发邮件聊 Q3 预测,打上 finance 标签。」Things 之类的工具会自动解析自然语言日期,Todoist 也能在一句话里处理标签和项目。原本要打开应用、点新建任务、输入、点日期、点标签、保存的一长串动作,现在变成一个快捷键加一句话。

做收件箱清零式的每日复盘时,也可以直接把计划讲出来。手头有哪些事、哪些紧急、哪些可以等。比起默默扫一遍列表,你能多发现不少被忽略的事。

工作流 7 —— 在 GitHub PR 和 Linear 工单里留评论

代码评审和工单讨论里全是简短、依赖上下文的回复。「这段不错,但能不能把校验逻辑抽出来?」「边界情况——用户没登录的时候会发生什么?」打字会打断你的节奏,因为你得在读代码和写文字之间来回切换。

语音能把这件事处理得很干净。点进评论框,按住快捷键,把想说的说出来,松开。视线没离开代码,评论已经利落地落到位。

如果你写大量 code review,就为 github.com 和 linear.app 设一条「技术化、简洁、无寒暄」的规则。评审写出来的语气和你手敲一致,敲键次数却少得多——你也不会再害怕评审日。

工作流 8 —— 边写边翻译(任何语言 → 英文)

如果英文不是你的母语,或者你的团队里有人说日语、德语、西班牙语等其他语言,语音输入会把「先翻译再粘贴」的循环压成一步。

现代听写工具支持 50 到 100 种语言,可以用一种语言听写,再以另一种语言输出。你用母语说,光标处出现地道的英文。不用再开一个 Google 翻译标签页,不用复制粘贴,也不必再纠结自己的措辞。

反过来也一样。给德国客户写消息?用英文说,把输出语言设成德文。你会得到一份可以稍作修改的初稿,而不是用一门你并不流利的语言从零写起。想深入了解,可以看在 Mac 上用 100 种语言进行语音转文字

工作流 9 —— 在 Figma、Notion 和 Google Docs 里留评论

协作工具是语音输入最被低估的舞台。你在评审一份设计或文档,心里有反馈,但打字慢得让你索性把所有意见揉成一大段,而不是留下有用的内联批注。

点开评论,说完,继续往下看。一次评审下来,你能留下三倍的评论,而且更具体——因为你没有为了少敲键盘而妥协。

这在重异步沟通的团队里尤其有用,因为书面反馈本身就替代了会议。高质量的评论意味着更少的跟进 Slack 串,也更少「能不能简单开个会聊一下」的循环。

工作流 10 —— 用文本片段与语音叠加处理高频短语

最后一个工作流不是纯语音,而是语音加文本扩展工具,两者组合比单用任何一个都快。

对于那些你反复敲的内容——邮件签名、收件地址、固定的 SQL 查询、状态更新模板——用文本扩展。macOS 自带的「文本替换」能处理简单片段;Espanso 是流行的免费选项;aText 等付费工具则更进一步。其他一切,靠语音。

结果是:短的、重复的文本由片段触发(`;sig`、`;addr`、`;sql`),其余一切自定义内容由语音说出。你不再敲同一段两次,超过几个词的内容也不再用手打。完整设置可以看我们的Mac 文本扩展指南

特写插画:一根手指按下发光的键盘按键,一道声波正变成一行干净的文字

把十个工作流串起来的快捷键配置

这十个工作流的前提都一样:一个不用低头看就能按到的按键,在你当前所在的应用里直接启动听写。

macOS 默认的快捷键是双击 Globe(Fn)键。能用,但要掐准节奏,而且在某些键盘上,双击有一半时间被识别成单击。改成单键快捷键就能解决。

打开 系统设置 → 键盘 → 听写,找到 快捷键 下拉菜单,选一个预设,比如 *按两次右 Option 键* 或 *按两次任一 Control 键*。或者点 *自定义*,绑一个你平时不会用到的单键——如果键盘上有 F13,那就是个好选择。

最好的快捷键,是非惯用手不离开 home row 就能按到的那一个。Voicr 默认按住 FN,原因正在于此——手指不离键盘,也不存在双击时机被误判的问题。

对于原地改写的工作流(#5),再绑一个不用抬手就能按到的快捷键。Option+Space 是一个常见选择。完整步骤可以看我们的设置指南:一个按键就能在任何 Mac 应用里听写

别再打那些小事,把早晨拿回来

在 Mac 上做语音自动化,不是为了让你什么都用嘴说,而是为了让你别再为那些不值得打字的事去打字。

几条值得记住的判断准则: - 如果一条消息少于三句话,用语音。 - 如果你不在深度工作时段,用语音。 - 如果你明天还会发类似的消息,用语音(顺便考虑做一个片段)。 - 如果是在翻译,用语音。 - 如果你会更快地对身旁的同事讲出这件事,那就用语音。

复利效应是真的。早上少打 20 分钟字,就是多 20 分钟的专注时间。一个季度累计下来,你拿回了一大块时间。

最快上手的方式

挑一个工作流。就一个。明天早上试一试。

最适合入门的是收件箱处理(工作流 1):痛点最明显,回报最直接,也最难搞砸。设好听写快捷键,打开 Mail,用语音回前十封邮件。十分钟之内你就能判断这套方法是否对你奏效。

如果你想要一套自动负责润色、支持按应用配置 Smart Rules,并且为已经打好的任何文本提供一键改写快捷键的方案,Voicr 三件事都能搞定。按住 FN,说出来,粘贴——你的消息会以所在应用合适的语气、漂亮地呈现出来。

你不需要在第一天就用上十个工作流。先有一个站稳,然后第二个、第三个。半年后,你会忘记打字回 Slack 是什么感觉。