先週の火曜日、チーム向けのSlack報告を4段落も打ち込んでいる自分に気づいた。書き終えてタイムスタンプを見ると、たった1通に8分もかかっていた。
口で言えば90秒で済む内容に8分。しかも難しい話ではなく、3つの未確定事項を含むプロジェクトのステータス共有にすぎなかった。
平均的な人のタイピング速度は1分あたり約40語、*話す*速度は約150語。3.75倍の差がある。それでも私たちは仕事時間の多くを遅い側で過ごしている。私が欲しかったのは、後始末でかえって時間を食うのではなく、本当に時間を節約してくれる音声入力ワークフローだった。
「全部しゃべればいい」ではうまくいかない理由
最初に試したのはいちばん安直なやり方。macOS Dictationをオンにして、メール全文を話してみた。返ってきたのは、句読点が抜けた長文と、自分が言った覚えのない「えーと」が3回混ざった文章。そのあと6分かけて編集する羽目になった。
多くの人が落ちる典型的な落とし穴がこれだ。一度試してざらついた結果を見て、「使えない」と判断してしまう。後処理に時間を取られないことが、音声入力が成立する前提だ。
解決策は2つある。1つはゆっくり話し、はっきり発音し、句読点も口で言う方法。一応動くが、台本を読むロボットみたいな声になる。もう1つは、話した内容を自動で整えてくれるツールを使う方法。私は後者を選んだ。並べて比べたい人向けに、別の記事でVoicrとAppleの標準ディクテーションの違いについても書いている。
書く作業を分類した3つのカテゴリ
2週間試して気づいたのは、自分が書くものは3つのバケツに分けられるということだった。タスクを正しいバケツに振り分けることが、このワークフローを実際に時短へとつなげる鍵だった。
音声のみ。 思考をふくらませる長文。Slackの報告、ステータスレポート、ブレストメモ、プロジェクトの振り返り、ブログのドラフト冒頭など。指でタイプするよりはるかに速く口から出てくる。最大の難関は、ノートパソコンに向かって話す自分の声に慣れることだ。
ハイブリッド。 メールや返信、決まった構成が必要なもの。本文を口で吹き込んだあと、キーボードに戻って書き出しを微調整したり、AIが取り違えた人名を直したり、段落を入れ替えたりする。音声で80%、指で残りの20%を仕上げる。
キーボードのみ。 10語以下の短い返信、コード、数字、住所、パスワードといった正確さが必要なもの。ここから下は、話すよりタイプしたほうが速いという下限がある。

私の毎日の音声入力ワークフロー、ステップごとに
ふだんの午前中の流れはこんな感じだ。
8:30、メールのトリアージ。 受信箱をざっとながめ、1行返信(「了解です」「金曜までに対応します」)はキーボードで打つ。2段落以上になる場合は、キーを押しっぱなしにして話し、離して貼り付ける。たいていの返信は20〜30秒で終わる。メール周りのセットアップ全体はMacでのメール音声入力に関するこの記事で詳しく書いた。
9:30、Slackの追いつき。 同じ手順。とっさのリアクションはタイプ、長めの説明やステータス更新は口述。整えられたテキストが5〜10秒でメッセージ欄に流し込まれる。Slack向けの手順はこちらの記事にまとめてある。
10:30、ライティングの時間。 ここがいちばん効く。ドキュメント、ブリーフ、会議用のメモ、何を書くにしても初稿は声で出す。完成形ではなく、70%の下書きだ。だが本来25分かかるものが8分で書ける。
ここで使っているのがVoicr。キー(私はFNを使っている)を1つ押し、話し、離す。テキストが整えられる。フィラー語も冗長な言い回しも「えー」もない。クリップボードに乗ってすぐ貼り付けられる状態で届く。しかも今いるアプリに合わせて口調も変わる。Slackではカジュアル、メールではフォーマル、ドキュメントではプレーンなテキストに。モードを切り替える必要はない。

音声入力を定着させた5つの習慣
新しいワークフローを根づかせるには、ある程度の意識的な工夫が必要だ。私が「気が向いたら使う」から「考えなくても使っている」に切り替わったきっかけは、この5つの習慣だった。
1. ショートカットキーを1つに絞る。 メニューをクリックしたり、アプリを開いたり、ウィンドウをいじったりしないと使えないツールは、1週間でやめる。グローバルホットキーが使えるツールを選ぼう。1回押して、1回離すだけ。
**2. *初稿*だけ音声で、編集はあとで。** きれいな仕上がりを最初から狙わない。荒い版を一気に出して、あとで直す。「話しながら直す」癖はスピードの利点を殺す。
3. 普段使っているアプリの中で使う。 1つのアプリ専用の音声入力は意味がない。私のものはSlack、Gmail、Notion、VS Codeのコメント、Apple Notesなど、カーソルが置ける場所ならどこでも動く。
4. 音声入力ツールに「すみません」と言わない。 「ごめん、言い直します」と話し始めると、それがそのままテキストに残る。気にせず話し続ける。友達に音声メモを録っているくらいの感覚で。
5. 整えてくれることを信じる。 いちばん大きな意識の変化は、「一語一句コントロールしたい」という気持ちを手放すことだ。ツールが整えてくれると信じられたら、文の途中で迷わなくなる。スピードの大半はそこから生まれる。
今でも音声で入力しないもの(と、その理由)
正直な線引きがあってこそ、ワークフローは信用できる。
コードは口述しない。試したことはある。コメントやコミットメッセージなら使えるが、実コードはダメだ。記号の名前を直すコストのほうが、節約した時間を上回ってしまう。
人の多い場所では機密性のある内容を声に出さない。カフェ、オープンオフィス、機内などはキーボードに切り替えるか、1人になるまで待つ。
短いメッセージも音声にしない。「ありがとう!」はタイプしたほうが速い。「今向かってます」も同じ。8語以下のものはキーボードに軍配が上がる。
一発で完璧でないと困るものも音声にはしない。法務テキスト、契約書、自分の目を通さずクライアントへ渡るもの。仕上がりはよいが、完璧ではない。
本当の計算: 2時間はどこから生まれるのか
計算過程を見せよう。
ふつうの週、私はメール、メッセージ、ドキュメント、メモを合わせて約25,000語を書いている。タイピング40 WPMで計算すると、おおむね10.4時間。仕上げ後の実効値である約110 WPMの音声入力なら、同じ量を3.8時間で書ける。
差は6.5時間。とはいえ、すべてを口述しているわけではない。私の書く量のうち約30%はキーボードに残る(短い返信、コード、正確な入力)。実際に節約できているのは、ならして週2時間ほど。出回っている「週12時間」みたいな主張に比べれば控えめだが、年に換算すれば100時間を超える。
丸3営業日が戻ってくる。一度セットすればコストゼロで続けられる習慣としては悪くない。
1週間だけ、この音声入力ワークフローを試してみる
実験のルールはこうだ。今後の平日5日間、3文より長いメッセージはすべて口述する。メールの返信、Slackの更新、ドキュメントのドラフト、議事録。それより短いものはキーボードのまま。1週間後、「下書きして書き直す」ループがどれだけ減ったかを確認してみよう。
後処理なしで、話した内容がそのまま送れるきれいなテキストになるツールが欲しければ、Macでそれを実現するのがVoicrだ。FNを押し、話し、貼り付け。月の最初の5,000語まで無料、クレジットカードも不要。
ツール選びにコミットする前に習慣のほうを試したいなら、macOS標準のDictationから始めてもいい。ただし、毎回少し余計に編集する時間は覚悟しておこう。大事なのはどのツールを選ぶかではない。声でできる仕事を、わざわざ指にやらせ続けるかどうかだ。

