你打开 Slack,有 14 个频道挂着未读小红点。三条私信在等一个真正的回复,而不是一个点赞。你刚开始打字,就被拉去开会,回来一看,未读又多了。
语音转文字就是跳出这个循环的办法,可 Mac 版 Slack 的消息框里压根没有一个真正的口述按钮。倒是有一个麦克风图标,但它录的是语音片段——那是另一回事。要真正用语音「打出」一条 Slack 消息,你得自己带口述工具。
下面列出 2026 年所有能用的方案,从免费的系统内置工具,到能修正原生口述在 Slack 里那点硬伤的润色类应用。那点硬伤,就是语气。
Mac 版 Slack 自带哪些功能(以及缺了什么)
Mac 版 Slack 里其实有两个语音功能,经常被人搞混: - 语音消息(也叫音频片段)。消息框旁边那个麦克风图标会录一段短音频,以播放器的形式发到频道里。Slack 会自动在下面生成一段文字稿。 - Huddle。耳机图标会开启一个实时语音房间。Huddle 事后可以转录,但那是会议,不是消息。
这两个都不是大多数人理解的那种语音转「文字」。它们是语音转「音频片段」,只是附带了一份转录稿。对方看到的还是一个要点开听的播放器。如果你的目标是不打字也能发出一条看起来正常的文字消息,Slack 本身没有提供任何方案。
这就是口述要补的位。口述会把字符直接打进消息框,跟你手打出来一模一样,然后你按回车,它就是一条普通的文字消息。对方完全看不出来这是说出来的。
免费方案:在 Slack 里用 macOS 自带口述
最快的免费方案就是 Mac 自带的口述功能。它能在系统任何文本框里用,Slack 的消息框也不例外。
打开它
这样开启: 1. 系统设置 → 键盘 → 听写,把开关打开。 2. 选一个快捷键。大部分 Mac 默认是双击 fn 键。2021 年之后带专属麦克风键(F5)的 MacBook Air 和 Pro,按一下就触发。 3. 第一次打开时,macOS 可能要下载一个离线语言模型。等它装完再测试。
之后点进 Slack 的某个频道,按快捷键开始说话。屏幕上会出现一个小麦克风浮窗,你的话就落进消息框里,说完按回车就行。整个流程就这么简单。
几个值得知道的小毛病
两件事最容易把人坑到: - 自动标点在近几版 macOS 里默认开启,但效果时好时坏。句号和逗号大多能落上,问号经常掉链子。需要时直接念出来:「句号」「逗号」「问号」。 - 口头碎词全收录。每一个「嗯」「就是」「那个」、每一次开口又改口,都会进到转录里。要么你练就新闻主播的说话方式,要么按发送前花几秒手动删一删。
Apple 自家的口述在常规说话场景下大约能到 88% 的准确率,在嘈杂环境里会掉到 65–75%。回一两句话足够。要是消息更长,清理的代价就开始累积了。

为什么原始口述在 Slack 里听着不对劲
这一段是其他指南都没讲的。Slack 是有自己的语气的。它不是邮件,不是文档。大家写得短、写得随意,断句不完整很正常,小写很正常,五句一段读起来就显得咄咄逼人。
原始口述根本不懂这些。你按打电话的方式说话,整句、整段意思一气呵成,出来的转录就是一坨规规矩矩、首字母大写的书面语。读着生硬,像在发备忘录。同事是会注意到的。
试着把这句念出来:*「Hey,你能在明天 standup 之前再看一眼那份 deck 吗?想听听你对第 12 页的看法。」* Apple 口述会原封不动给你那一句,大写齐全、标点完整。发邮件挺好。在 Slack 里就像你在 cosplay 一个经理。
Slack 真正想要的更接近这样:*「hey 明天 standup 前能再看下那份 deck 吗?想听你说说第 12 页 🙏」*。同一个意思,不同的语气。这就是原始口述永远迈不过去的那道坎。
Slack 语音消息 vs. 口述:什么时候用哪个
语音消息不是个坏功能,只是用在不一样的场景。一个简单的判断标准: - 当对方之后需要扫读、搜索或复制内容时,用口述。Bug 报告、决策、状态更新,以及任何公开频道里的消息。 - 当语气很重要、文字会把你想表达的意思压扁时,用语音消息。给设计提反馈、跨团队的复杂请求,以及任何一对一的事情。
语音消息会占用对方的时间。他们得点开听,经常还得重听。一条口述出来的文字消息更尊重对方的收件箱。默认用口述。只有当文字真的承载不了你的意思时,再去发语音片段。
搭一套适合 Slack 的口述工作流
如果你想让口述在 Slack 里用着自然——而不只是「能用」——有三件事会带来明显差别。
1. 选按住说话,不要切换式
切换式(按一下开始,再按一下结束)会在你思考时一直开着麦,把「呃」和窗外狗叫一起录进来。按住说话则是按下开始、松开结束。音频更干净,输出也更干净。
Apple 默认的 fn-fn 是切换式。如果能换成按住式(新款 Mac 上的 F5 键,或者第三方工具的任意热键),就换。
2. 用一种贴合 Slack 的风格
这正是原生口述撞墙、专用工具开始派上用场的地方。润色层可以被告知什么叫「Slack 风格」:短句、小写也行、清掉啰嗦的开场、需要时保留 emoji。
这也正是 Voicr 做 Smart Rules 的原因——你给 Slack 设一种语气,给邮件设另一种,它会根据你当前在哪个 App 里自动切换。你怎么说话还是怎么说,但落到 Slack 里的文字读起来随意,落到「邮件」里的文字读起来正经。完全不用手动切换。
3. 一次只口述一条消息
直觉是想一口气把长消息说完。忍住。说一条、发一条、喘口气。语音本来就够快,攒着说省不了时间,而且短句子的转录准确率最高。
进阶技巧:用语音处理 emoji、@提及和代码块
三个 Slack 里大家以为没法用语音搞定、其实可以的细节:
@提及
macOS 口述会把「at Sarah」原样转成文字。你得手动把它改成 `@Sarah` 才会真的提醒到她。变通办法:口述时不带提及,说完再用键盘补一个 `@`。听着别扭,但比和转录较劲快。
润色类工具可以被设定为在 Slack 规则里自动把「at Sarah」转成 `@Sarah`。每一条要提醒人的消息都能省一步。
Emoji
Apple 口述支持少量 emoji,比如说「smiley emoji」「thumbs up emoji」,但词库小、效果飘忽。靠谱的做法是:口述出文字,再用 Slack 自带的选择器(Ctrl+Cmd+Space)补上 emoji。
代码块
如果你经常往 Slack 粘代码或命令,口述是不会给你反引号的。两种办法:先手打三个反引号、点进代码块里再口述;或者用一个能识别代码的润色工具,它能认出你在念命令或文件路径,并自动把它们包起来。
什么时候该跳出系统自带的口述
如果你一天发不到十条 Slack 消息,macOS 自带口述就够用了。这个量级下,清理几下不算什么。
如果 Slack 就是你工作的主战场(工程团队、客服、销售,任何一天泡在频道里的人),清理的代价就堆起来了。多数重度用户最终都会迁到一款润色型口述工具上。原因是,润色工具能做三件原生口述不会做的事: - 在文字落进消息框之前就清掉碎词、收紧语法,而不是落进来再改。 - 按 App 切换语气,同一句话,Slack 里读着随意,「邮件」里读着专业。 - 一个热键打天下,系统任何地方都能用,不用切 App。
如果你已经在用口述,但每次按发送前都得花真不少时间清理,那就是信号了。像 Voicr 这种工具(按住 FN 说话,松开自动粘贴)会自动完成润色,落进 Slack 消息框里的就已经是你打算发的那条消息。

你的第一条口述 Slack 回复:60 秒上手
如果你从没在 Slack 里口述过,试一次就能知道这玩意儿合不合你: 1. 打开 Slack,点进下一条等你回的私信或频道。 2. 触发你的口述快捷键(原生的双击 fn、Voicr 的按住 FN,或者你用的任何工具)。 3. 像平时口头说话一样把回复说出来,别去琢磨标点。 4. 松开按键(或者再按一次快捷键停下),等半秒,读一下落进消息框的内容。 5. 该改的改,按回车。
第一次你大概会改几下。到第五条,你就不再留意转录质量了。到第二十条,在 Slack 里打字会让你觉得慢。
最快的入门方式,就是拿一条你本来就要打的回复直接试。如果你想要一个能自动润色语音、并且能给 Slack 配一种独立的随意语气(和它给你的邮件、文档配的格式分开)的工具,Voicr 做的就是这件事。按住 FN、说话、粘贴、发送。落到 Slack 的那一版,本身就已经是 Slack 的语气。
想更深入了解 Mac 上的 AI 口述背后是怎么运作的,可以看 AI 语音口述在 Mac 上到底是如何工作的。如果你在对比各种选项,2026 年 Mac 最佳语音转文字应用 这篇盘点了主流口述工具在语气处理、按 App 切换风格和准确率上的表现。

