返回博客

Voicr Team · 2026年5月23日

为什么说话比打字更快(以及如何用好它)

普通人每分钟打 40 个字,却能说 150 个。来看看为什么大多数写作工作用语音更快,以及该怎么真正用起来。

为什么说话比打字更快(以及如何用好它)

你脑子里那句话已经说完了。手指却还停在 “the” 的 “t” 上。等你敲到句号,后半句要说什么早就忘了。

这就是想法和文字之间的落差。大多数时候你感受不到。能感受到的,通常是那种打字像撞墙的日子:赶一份报告、写一封难写的邮件、开会时想做笔记。

语音输入以前是绕开这堵墙的办法,但以前的体验确实糟糕。现在不一样了。到了 2026 年,语音的速度优势是实打实的,准确度足够日常使用,工具还能在文字落到页面之前,把原始口语整理成可读的句子。问题已经不是语音是不是比键盘快——答案显然是肯定的——而是怎么用它,才不会让整个工作流崩掉。

用数字看清这道速度差

普通人打字的速度大约是每分钟 40 个英文单词。专业打字员能到 65 至 75。世界纪录在 200 出头,而且要靠多年的练习,加上一把为打字而生的键盘。

普通人说话的速度是每分钟 150 个英文单词。日常对话的语速从 130 到 170 不等,完全不用刻意。这就已经是 3.75 倍的差距,还没算其他因素。

早在 2016 年,斯坦福大学的研究人员就把百度的语音识别和 iPhone 键盘放在一起比。结论很硬气:语音在英文上比打字快 3 倍,在普通话上快 2.8 倍,错误率还更低。那项研究用的还是 2016 年的语音模型,这些年模型早已大幅进步。

3 倍是个保守的数字。把退格、改错别字、把想法翻译成手指动作的脑力成本都算进去,现实中的差距更接近 4 到 5 倍。打 1000 个英文单词要差不多 25 分钟,口述只要 8 分钟。

一只麦克风在赛道上跑赢一台键盘,展现说话与打字之间的速度差距

为什么说话比打字更贴合大脑

速度差只是故事的一半。语音真正占优的地方,在于它能把想法按你原本的顺序落到页面上。

打字是一种翻译。你先想出一句话,再把它转成手指动作,手指动作再敲出字母。瓶颈不在大脑,而在运动这一层。手指还在追赶,下一个念头早就溜走了。

说话跳过了翻译。想到、说出、落地。用语音写出来的初稿,几乎总是比打字版本更长、更细。你来不及反复斟酌。那个在你打字时悄悄把半句话剪掉的内在编辑,根本来不及上线。

这也是为什么经常口述的人会觉得它比打字更接近心流。键盘会打断你,麦克风不会。

什么时候语音仍然打不过键盘

语音并不是在每件事上都更快。装作什么都行,是大多数人尝试一周后就放弃口述的原因。

下面这些情况,键盘仍然更胜一筹: - 小范围修改。 改一个词、加个逗号、改一个数字。打开麦克风、等它就绪,比直接动手更慢。 - 写代码。 变量名、括号、缩进。语音擅长散文,搞不定 `useState<User | null>(null)`。 - 密码、命令行和结构化表单字段。 任何字符必须精确、又没有自然语言可以依托的地方。 - 有陌生人在的安静场所。 咖啡馆没问题,图书馆不行;那种只有你一个人会出声的开放式办公室,也不行。 - 完全不知道要说什么的最初 30 秒。 语音奖励的是边想边写,但替代不了思考。如果你压根不知道这封邮件该往哪写,键盘那种慢节奏反而能帮你找到切入点。

一条粗略的判断:只要是 15 个英文单词以上的普通散文,语音就更快。再短的话,用键盘也挺好。

最值得先用语音搞定的三件事

如果你刚开始口述,别想着第一天就把所有事都用语音处理。挑差距最大的那三件事。

1. 回邮件。 上手最该从这里开始,杠杆也最大。你早就知道自己想说什么——从打开邮件那一刻就开始想了——一字一字敲完全是没必要的摩擦。一封两段的回复,打字要四分钟,口述大约 40 秒就够,而且语气往往还更温和一点。如果你大部分时间都泡在收件箱里,可以看我们的 Mac 邮件口述指南,里面有完整的设置流程。

2. 较长的 Slack 和私信回复。 别理那些一句话能搞定的消息。重点是那种 “让我解释一下情况” 的消息——本来三句话就够,你一边想一边打,结果写成了八句。口述一遍,粘贴,发送。

3. 头脑风暴式笔记。 会议记录、会后总结、那种想趁忘掉之前先记下来的原始想法。这恰恰是速度最关键的场景,因为丢一个念头就是丢整个念头。语音能按你想到的节奏把它们抓住。

从这三件事里挑一件,坚持一周每天都用语音。等这一件做得不假思索,再加下一件。

桌面上方漂浮着三张卡片——一封邮件、一段聊天气泡和一本记事本——每张旁边都有一只小麦克风

怎么让语音在实际工作里真的更快

只要你的工作流还在跟语音对着干,速度优势就只是纸面上的。能坚持用语音、和试了一周就放弃的人,差别主要在三件事上。

用一个快捷键,在哪里都能用。 如果你得专门打开一个 App、点一下录音按钮、再把结果复制粘贴回来,那语音已经不比打字快了。整件事的意义,就是把 “我想说这句话” 和 “这句话出现在框里” 之间的距离缩到最短。一个能在任何 App(邮件、Slack、文档、浏览器)里捕捉语音的快捷键,才是习惯和新鲜玩具的分水岭。Voicr 整个设计就是围绕这一点。按住 FN,说话,松开,粘贴。就这么简单。

把润色这一层做对。 原始转写给你的,是一堆 “嗯”“呃”、半句话和缺标点的文字。这并不比打字快——你接下来还得自己改。现代语音工具会把你的语音过一遍语言模型,先去掉口头禅、修好语法,文字才会进到剪贴板。输出读起来应该像你认真写出来的,而不是顺嘴说的。如果你用的工具做不到,就该换一个了。

别在中途切换上下文。 最常见的速度杀手,就是开始口述,停下来打字改一处,再开始,再停下来想。语音奖励的是一口气说完。把整段先说出来,哪怕有几处不对,后面再清理。大部分错误,润色那层都会替你处理掉。

7 天养成语音习惯

这个习惯大概需要一周才能装上。下面是真正行得通的版本。

第 1–2 天。 选好你的那一件事(回邮件最容易)。但凡碰到这件事,都用语音。一开始对着空气说话会觉得别扭,到第四天就习惯了。

第 3–4 天。 别再为口头禅道歉。自然地说,包括 “嗯”“你知道的” 以及那些你打字时会顺手删掉的半句话。让润色那层去处理。多数人会跳过这一步——他们仍然在用一字一句精心组织好的句子说话,于是又掉回到打字的速度。

第 5–6 天。 加一件事:Slack 消息或者笔记。整个流程开始变得自动。

第 7 天。 压力测试一下。口述一些长的内容:报告里的一节、一篇 Notion 文档、给团队的一份结构化更新。如果这种内容都搞得定,几乎所有场景都能用。

一周下来,你就能感觉出来:哪些场景下语音对你更快,哪些场景你还是想直接打字。两种都没问题。

怎么真正开始

感受这道差距最快的办法,是在下一封要写的邮件里直接试一次语音,而不是先打字。别再读一篇文章了,别再挑五个工具了。挑一个符合上面工作流的——一个快捷键、输出已经润色过、在哪里都能用——直接试一次。

如果你想要专为这种工作流打造的版本,Voicr 在 Mac 上正是这么做的。在任何 App 里按住 FN,把你本来要打字的话说出来,松开,润色后的版本就在剪贴板里。Smart Rules 会自动给 Slack 用更随意的语气,给邮件用更正式的语气,完全不用手动切换。免费版每月可用 5,000 个英文单词,不用绑卡,足够你舒舒服服走完这 7 天的习惯养成。

语音输入终于好用到不再是一种妥协。剩下要放下的,只是 “明明可以说出来,却还坚持打字” 的那个习惯。