ブログに戻る

Voicr Team · 2026年5月23日

週に2時間を取り戻した音声入力ワークフロー

Macでのタイピング時間を音声入力で削減した方法。何を話して入力し、何をキーボードで打つか、そして習慣化を支えた5つのコツ。

週に2時間を取り戻した音声入力ワークフロー

先週の火曜日、チーム向けのSlack報告を4段落も打ち込んでいる自分に気づいた。書き終えてタイムスタンプを見ると、たった1通に8分もかかっていた。

口で言えば90秒で済む内容に8分。しかも難しい話ではなく、3つの未確定事項を含むプロジェクトのステータス共有にすぎなかった。

平均的な人のタイピング速度は1分あたり約40語、*話す*速度は約150語。3.75倍の差がある。それでも私たちは仕事時間の多くを遅い側で過ごしている。私が欲しかったのは、後始末でかえって時間を食うのではなく、本当に時間を節約してくれる音声入力ワークフローだった。

「全部しゃべればいい」ではうまくいかない理由

最初に試したのはいちばん安直なやり方。macOS Dictationをオンにして、メール全文を話してみた。返ってきたのは、句読点が抜けた長文と、自分が言った覚えのない「えーと」が3回混ざった文章。そのあと6分かけて編集する羽目になった。

多くの人が落ちる典型的な落とし穴がこれだ。一度試してざらついた結果を見て、「使えない」と判断してしまう。後処理に時間を取られないことが、音声入力が成立する前提だ。

解決策は2つある。1つはゆっくり話し、はっきり発音し、句読点も口で言う方法。一応動くが、台本を読むロボットみたいな声になる。もう1つは、話した内容を自動で整えてくれるツールを使う方法。私は後者を選んだ。並べて比べたい人向けに、別の記事でVoicrとAppleの標準ディクテーションの違いについても書いている。

書く作業を分類した3つのカテゴリ

2週間試して気づいたのは、自分が書くものは3つのバケツに分けられるということだった。タスクを正しいバケツに振り分けることが、このワークフローを実際に時短へとつなげる鍵だった。

音声のみ。 思考をふくらませる長文。Slackの報告、ステータスレポート、ブレストメモ、プロジェクトの振り返り、ブログのドラフト冒頭など。指でタイプするよりはるかに速く口から出てくる。最大の難関は、ノートパソコンに向かって話す自分の声に慣れることだ。

ハイブリッド。 メールや返信、決まった構成が必要なもの。本文を口で吹き込んだあと、キーボードに戻って書き出しを微調整したり、AIが取り違えた人名を直したり、段落を入れ替えたりする。音声で80%、指で残りの20%を仕上げる。

キーボードのみ。 10語以下の短い返信、コード、数字、住所、パスワードといった正確さが必要なもの。ここから下は、話すよりタイプしたほうが速いという下限がある。

書く作業を「音声のみ」「ハイブリッド」「キーボードのみ」の3つに分類した3つのラベル付きバケツの図

私の毎日の音声入力ワークフロー、ステップごとに

ふだんの午前中の流れはこんな感じだ。

8:30、メールのトリアージ。 受信箱をざっとながめ、1行返信(「了解です」「金曜までに対応します」)はキーボードで打つ。2段落以上になる場合は、キーを押しっぱなしにして話し、離して貼り付ける。たいていの返信は20〜30秒で終わる。メール周りのセットアップ全体はMacでのメール音声入力に関するこの記事で詳しく書いた。

9:30、Slackの追いつき。 同じ手順。とっさのリアクションはタイプ、長めの説明やステータス更新は口述。整えられたテキストが5〜10秒でメッセージ欄に流し込まれる。Slack向けの手順はこちらの記事にまとめてある。

10:30、ライティングの時間。 ここがいちばん効く。ドキュメント、ブリーフ、会議用のメモ、何を書くにしても初稿は声で出す。完成形ではなく、70%の下書きだ。だが本来25分かかるものが8分で書ける。

ここで使っているのがVoicr。キー(私はFNを使っている)を1つ押し、話し、離す。テキストが整えられる。フィラー語も冗長な言い回しも「えー」もない。クリップボードに乗ってすぐ貼り付けられる状態で届く。しかも今いるアプリに合わせて口調も変わる。Slackではカジュアル、メールではフォーマル、ドキュメントではプレーンなテキストに。モードを切り替える必要はない。

ワークフローのループ図: キーを押す、話す、AIがテキストを整える、整えられた結果がクリップボードに届きそのまま貼り付けられる

音声入力を定着させた5つの習慣

新しいワークフローを根づかせるには、ある程度の意識的な工夫が必要だ。私が「気が向いたら使う」から「考えなくても使っている」に切り替わったきっかけは、この5つの習慣だった。

1. ショートカットキーを1つに絞る。 メニューをクリックしたり、アプリを開いたり、ウィンドウをいじったりしないと使えないツールは、1週間でやめる。グローバルホットキーが使えるツールを選ぼう。1回押して、1回離すだけ。

**2. *初稿*だけ音声で、編集はあとで。** きれいな仕上がりを最初から狙わない。荒い版を一気に出して、あとで直す。「話しながら直す」癖はスピードの利点を殺す。

3. 普段使っているアプリの中で使う。 1つのアプリ専用の音声入力は意味がない。私のものはSlack、Gmail、Notion、VS Codeのコメント、Apple Notesなど、カーソルが置ける場所ならどこでも動く。

4. 音声入力ツールに「すみません」と言わない。 「ごめん、言い直します」と話し始めると、それがそのままテキストに残る。気にせず話し続ける。友達に音声メモを録っているくらいの感覚で。

5. 整えてくれることを信じる。 いちばん大きな意識の変化は、「一語一句コントロールしたい」という気持ちを手放すことだ。ツールが整えてくれると信じられたら、文の途中で迷わなくなる。スピードの大半はそこから生まれる。

今でも音声で入力しないもの(と、その理由)

正直な線引きがあってこそ、ワークフローは信用できる。

コードは口述しない。試したことはある。コメントやコミットメッセージなら使えるが、実コードはダメだ。記号の名前を直すコストのほうが、節約した時間を上回ってしまう。

人の多い場所では機密性のある内容を声に出さない。カフェ、オープンオフィス、機内などはキーボードに切り替えるか、1人になるまで待つ。

短いメッセージも音声にしない。「ありがとう!」はタイプしたほうが速い。「今向かってます」も同じ。8語以下のものはキーボードに軍配が上がる。

一発で完璧でないと困るものも音声にはしない。法務テキスト、契約書、自分の目を通さずクライアントへ渡るもの。仕上がりはよいが、完璧ではない。

本当の計算: 2時間はどこから生まれるのか

計算過程を見せよう。

ふつうの週、私はメール、メッセージ、ドキュメント、メモを合わせて約25,000語を書いている。タイピング40 WPMで計算すると、おおむね10.4時間。仕上げ後の実効値である約110 WPMの音声入力なら、同じ量を3.8時間で書ける。

差は6.5時間。とはいえ、すべてを口述しているわけではない。私の書く量のうち約30%はキーボードに残る(短い返信、コード、正確な入力)。実際に節約できているのは、ならして週2時間ほど。出回っている「週12時間」みたいな主張に比べれば控えめだが、年に換算すれば100時間を超える。

丸3営業日が戻ってくる。一度セットすればコストゼロで続けられる習慣としては悪くない。

1週間だけ、この音声入力ワークフローを試してみる

実験のルールはこうだ。今後の平日5日間、3文より長いメッセージはすべて口述する。メールの返信、Slackの更新、ドキュメントのドラフト、議事録。それより短いものはキーボードのまま。1週間後、「下書きして書き直す」ループがどれだけ減ったかを確認してみよう。

後処理なしで、話した内容がそのまま送れるきれいなテキストになるツールが欲しければ、Macでそれを実現するのがVoicrだ。FNを押し、話し、貼り付け。月の最初の5,000語まで無料、クレジットカードも不要。

ツール選びにコミットする前に習慣のほうを試したいなら、macOS標準のDictationから始めてもいい。ただし、毎回少し余計に編集する時間は覚悟しておこう。大事なのはどのツールを選ぶかではない。声でできる仕事を、わざわざ指にやらせ続けるかどうかだ。