上周二,我发现自己正在给团队敲一条四段长的 Slack 进度更新。写完后我看了一眼时间戳,这条消息整整花了八分钟。
八分钟,而这件事我嘴上说出来不过九十秒。况且它根本不复杂,只是一份带着三个待解问题的项目状态汇报。
普通人每分钟大约能打 40 个单词,而说话的速度大约是每分钟 150 个。差距是 3.75 倍,可大多数人整天都耗在慢的那一侧。我想要一套真正省时间的听写工作流,而不是让事后清理比直接打字还费劲。
为什么"全都靠说"行不通
我最初的尝试很直接:打开 macOS 自带听写,把一封邮件一口气说完。结果得到一段没有标点、句子粘连的文字,里面还混进了我都没意识到自己说过的三个"嗯"。我又花了六分钟去修。
大多数人就是栽在这一步。试一次听写,看到粗糙的结果,就断定它不值得用。只有当你不需要事后收拾残局时,这本账才算得过来。
绕开它有两条路。第一条是放慢语速、字正腔圆,连标点都念出来——勉强能用,但听起来像在朗读机器人脚本。第二条是用一款会自动润色的工具。我选了后者。如果你想看横向对比,我在另一篇文章里写过 Voicr 和 Apple 自带听写的差异。
我把写作内容分成的三类
试用两周后,我意识到自己日常写的东西大致可以分进三个桶。把任务放进对的那个桶,才是这套工作流真正省时间的关键。
纯语音。 长文思考类:Slack 进度更新、状态汇报、头脑风暴笔记、项目复盘、博客开头草稿。这些从嘴里说出来远比从手指敲出来快。最难的反而是适应听自己对着笔记本讲话。
混合型。 邮件、回复以及任何需要特定结构的内容。我先口述正文,再回头用键盘调整开头、修正 AI 听错的人名,或者挪动段落顺序。语音搞定 80%,手指负责剩下的 20%。
纯键盘。 十个字以内的短回复,代码,数字、地址等需要精确的内容,还有密码。低于某个长度,说反而比敲更慢。

我的日常听写工作流,一步一步来
下面是我平常一个早晨大致的样子。
8:30,收件箱速过。 我扫一遍邮件,用键盘处理那些一句话能解决的回复("好的""周五前给你")。任何需要两段以上篇幅的,我就按住一个键说完,松开,粘贴。绝大多数回复 20 到 30 秒搞定。我在 Mac 上口述邮件的完整流程 那篇里讲得更细。
9:30,刷 Slack。 同样的套路。简单回应直接打字,较长的解释或状态更新就用说的。润色好的文字 5 到 10 秒就落到输入框里。这里有 一篇专门针对 Slack 的实操。
10:30,写作时段。 收益最大的环节就在这里。不管是写一份文档、一个简报,还是会议要点,我都先用嘴过一遍。输出不是终稿,是一份完成度 70% 的草稿,但我用 8 分钟产出原本要花 25 分钟的内容。
我用的工具是 Voicr。一个键(我用的是 FN),按下、开口、松开,文字就被润色干净。没有口头禅,没有粘连长句,没有"啊""嗯"。它直接落到剪贴板,立刻可粘贴。它还会根据所在应用切换语气:Slack 里偏轻松,邮件里偏正式,文档里则保持平实。完全不用手动切模式。

让听写真正坚持下来的五个习惯
任何新工作流都需要一点刻意经营。让我从"有时会试试"变成"根本不用想"的,就是下面这五个习惯。
1. 配一个单键快捷键。 如果你的听写工具需要先点菜单、打开应用或者折腾窗口,不到一周你就会弃用。挑一个有全局热键的,按一下、松一下,齐活。
2. 口述"初稿",事后再改。 别想着一口气念出完美的文字。先把粗版拿出来,再去修。"边说边改"的本能会把速度优势抹光。
3. 在你本来就常用的应用里用。 只能在一个应用里跑的听写没意义。我这套在 Slack、Gmail、Notion、VS Code 评论、Apple Notes,凡是有光标的地方都能用。
4. 别对听写工具"道歉"。 一旦你开始说"抱歉,让我重新说一下",这句话就会真的出现在文字里。继续往下说就好,就当是在给朋友发语音条。
5. 信任润色。 最关键的心态转变是放下"我得控制每一个字"。一旦你相信工具能把口语收拾干净,就不会在句子中间犹豫——速度的大头其实就来自这里。
我至今还不用语音处理的内容(以及原因)
诚实地划出边界,才能让其它部分的工作流可信。
我不用语音写代码。试过。注释和提交信息没问题,但实际代码不行——修符号名的时间比省下来的还多。
在公共空间不大声口述敏感内容。咖啡馆、开放工区、飞机上。要么留给键盘,要么等到独处时再说。
短消息我也不口述。"谢谢!"敲起来更快,"我在路上了"同样如此。大约 8 个字以下,键盘更划算。
任何需要一次写到位的内容也不口述。法律文本、合同、未经审阅就发给客户的东西。润色质量是好,但远谈不上无懈可击。
真正的算账:那 2 小时是怎么省出来的
我把账摊开算一遍。
在一个典型的工作周里,我大约会在邮件、消息、文档和笔记里写下 25,000 个单词。按 40 WPM 打字,大约要 10.4 小时;按润色后的实际有效速度大约 110 WPM 来算,同样的量大约 3.8 小时就能搞定。
原始差距是 6.5 小时。但我并不是所有东西都靠口述——大约 30% 的内容仍然留在键盘上(短回复、代码、需要精确输入的部分)。实际省下来的差不多就是每周 2 小时。比起那些动辄宣称"每周省 12 小时"的说法,这个数字相对保守,但一年累计下来仍是 100 多个小时。
等于多出整整三个工作日。一个一次性配好、之后零成本的习惯,能拿回这么多时间,挺值。
用一周时间试试这套听写工作流
做个实验:接下来的五个工作日,凡是超过三句话的消息全部口述。邮件回复、Slack 更新、文档草稿、会议笔记。更短的内容继续用键盘。一周结束时,看看你少掉了多少次"写了又重写"的循环。
如果你想要一款自动负责润色、让说出口的话直接变成可发送文字、省掉清理环节的工具,Voicr 在 Mac 上就是这么干的。按住 FN,开口,粘贴。每月前 5,000 个单词免费,无需信用卡。
或者,先用 macOS 自带的听写功能上手,看看自己是否愿意养成这个习惯,再决定要不要换工具。只是要做好心理准备:每次都得多花几分钟编辑。重点不在选哪款工具,而在于你是否愿意把双手能省下的活,交还给嗓子。

