ブログに戻る

Voicr Team · 2026年5月23日

Macの音声入力で執筆スピードが3倍になった話

1ヶ月間、タイピングを音声入力に置き換えてみた。何がうまくいき、何がダメだったか。「3倍」の根拠を正直にまとめます。

Macの音声入力で執筆スピードが3倍になった話

Slackの返信を打っている途中で気づいた。同じ一文を頭の中で12秒間反芻していたのに、指はまだ最初の4語を打ち終えたばかり。脳は完全に手待ち状態だった。

その瞬間、音声入力を本気で試してみることにした。これまで二度ほど「会議メモにちょっと使ってみるか」と中途半端に挑戦して投げ出していたが、今度は違う。1ヶ月間、長文メッセージも、メールも、ドキュメントも、すべて声で。実際に起こったことを書く。

宣伝文句のように聞こえるかもしれないが、数字を見れば話は別だ。一般的な人のタイピング速度は1分あたり約40語。話す速度は130〜150語。スタンフォード大学の研究者が2017年に比較した結果では、タイピングが速い人でも、スマホでの音声入力はタイピングよりおよそ3倍速いと結論づけられた。この比率はMacのキーボードでも大筋で当てはまる。

残酷な数字:40 WPM vs 150 WPM

先に片付けておこう。訓練していない大人のタイピング速度はおおよそ38〜40 WPM。タッチタイピングができる熟練者でも、上限は65 WPMあたり。一方で会話の速度は130〜150 WPMに達する。速いタイピストと比べても2倍以上。平均的な人と比べれば、約3.75倍だ。

ここまでは理論。実際に試すともう少し面白いことが起こる。初めてメールを声とキーボードで時間計測してみると、数字ほどの差は出ない。なぜか。タイピングは一連の動作だが、音声入力は「話す→読み返す→必要なら一文を言い直す→ペースト」と工程が増えるからだ。この「修正コスト」が伸びしろを食い潰す。

解決はツール側にある。古い音声入力は「えー」「あの」「つまり要するに」までそのまま文字に起こす。最近のツールはそれを一発できれいな文章に整える。修正が自動化されたとき、3倍は現実になる。

実際の一日で「3倍速い」とはどう見えるか

切り替える前の、ある普通の火曜日はこうだった。長めのSlackメッセージが6本(各80語くらい)、メールが4通(各120語くらい)、短いドキュメントが2本(各400語くらい)、それに一行返信がいくつか。合計で約1,800語。考える時間を除いて、キーボードに向かっていた時間はだいたい45分。

切り替えた後の同じ量。音声で話し、整形まで含めて14分前後。きっかり3倍だ。驚いたのは時短そのものより、節約した時間の使い道だった。下書きを開いて、席を立って、戻ってきて、結局全部書き直す、というループがなくなった。考えが頭から離れて画面に着地するまで、一発で終わる。

45分のタイピングと、同じ内容を14分で話し終えた様子を並べて比較

音声入力がうまくハマる用途: - 長めのSlackスレッド - 二文以上のメール返信 - 会議中の議事メモ - 何かの初稿 - 頭の中をぶちまけるドキュメント - 後でドキュメントに発展させるボイスメモ

うまくいかない用途: - 短い返信(「了解」「ありがとう」) - コード - 構造のある表 - パスワード - 一語ずつ慎重に考える必要があるもの

最初の1週間はひどかった。何が悪かったか

3日目で挫折しかけた。最初の問題は、そもそもパソコンに向かって話すこと自体だった。妙に演技がかって感じる。話し始めて気後れし、途中でやめて、結局タイプし直すより時間がかかる中途半端な書き起こしが残るだけだった。

二つ目の問題は気合いの入れすぎ。あらたまった手紙を口述するみたいに、ゆっくり丁寧に、一語ずつ発音していた。出てくる文章はロボットじみていて、速度の優位はどこかへ消えた。要するに、口でタイピングしているだけ。しかも下手な。

解決策は予想と正反対だった。ゆっくりではなく、もっと速く話す。同僚に何かを説明するときみたいに、言い淀みも「あ、今のなし、こう言い直すわ」も含めて、そのまま喋る。優秀な整形ツールはそういうのを全部きれいに片付けてくれる。「口述する」のはやめて、ただ「話せ」ばいい。

突破口:いつ音声を使わないかを見極める

「たまに使う実験」から「標準の入力方法」へと音声入力を昇格させたのは、ある思考の枠組みだった。*初稿は声で、編集はキーボードで*。キーボードは正確、声は速い。雑な草案を声で出して、出てきた一語を直すのにキーボードを使う。

振り返れば当たり前の話だが、始めた当初はそう思えなかった。完璧な文章を声で書こうとして、整形された出力が*ちょうど自分の望む形*じゃないと苛立っていた。ようやく救われたのは、声の草案に対するハードルを下げたとき。アイデアを外に出す。キーボードで2秒で直す。次へ進む。

「話しながら整える」ワークフローが効くのもここに理由がある。声で起こして、フィラーを手動で消して、文法を直して、使っているアプリ向けに整形して……とやっていたら、せっかくの速度はゼロだ。整形が自動で走るからこそ意味がある。話し終わった瞬間にはもうペースト可能な文章になっている。VoicrはMacでまさにそれをやる。FNを押しっぱなしで話し、離して、ペースト。整形はバックグラウンドで走る。

定着したワークフロー(Slack、メール、ドキュメント)

1ヶ月経って、3つのワークフローが定着した。それぞれ少しずつセットアップが違う。

Slack、メール、ドキュメントの3つのウィンドウが並び、それぞれにマイクのアイコンと異なる文体ラベルが表示されている

Slackとチャット

ここが一番のブレイクスルーだった。私は長めのSlackメッセージをよく書く。意思決定の説明、振り返り、長いスレッド。以前は10分かかっていたものが、今は3分で済む。一発で話し、ペーストし、誤字をざっと確認して送信。(MacでSlackに音声入力する方法でチャンネルごとのセットアップを解説している。)

メール

メールこそ最大の恩恵が出ると期待していたが、最初は逆に一番ぐちゃぐちゃになった。理由はトーンだ。上司への返信を、同僚向けのSlackと同じ調子で口述するわけにはいかない。解決策はアプリごとに文体を切り替えること。メールはフォーマル、チャットはカジュアル。(Macでメールを音声入力する方法で詳しく解説している。)

ドキュメントとメモ

ドキュメントは一番扱いが難しい。短いメモはとても相性が良い。話してペーストして終わり。長いドキュメントはそうはいかない。思考が構造的になるからだ。文を書くのではなく、セクションを並べ、入れ替え、組み直す作業になる。長文ドキュメントの場合は、段落単位で口述しつつ、構造はキーボードで操作する。

スピード以外に得たもの

3倍は派手な見出しに過ぎない。予想外の恩恵のほうがずっと大きかった。

書きかけの下書きが減った。 タイピングがボトルネックだと、長いメッセージはどれも「あとで仕上げる下書き」として始まる。そのほとんどは下書きフォルダで死んでいく。声は思考と出力の間の溝を埋めてくれる。2日間ほったらかしになっていたような文章を、いま私はちゃんと送るようになった。

手首の負担が減った。 音声入力で手の不調が治ったとまでは言わない。でも6時間タイピングする日と2時間で済む日の差は確かにあって、金曜の夜の手首がそれを教えてくれる。

初稿の質が上がった。 これは意外だった。考えを声で通すと、人がそれを説明するのに近い構造で言葉が出てくる。タイプされた初稿は固くなりがちだ。書かれたから書かれた感じになる。声の草案は人間が話しているように読める。たいていの場合、それこそが望ましい。

誰も警告してくれない落とし穴

本当の弱点が二つある。どちらも回避策はあるが、コミットする前に知っておく価値はある。

オープンオフィスでは使えない。 カフェでも無理。他人が声の届く範囲にいる場所はすべて不可。当然のようだが、思っているより大きな制約になる。職場が共有スペースなら、音声入力は「在宅日限定」ツールになり、その分だけ恩恵が削られる。

良いツールを使っても、修正コストはゼロにはならない。 小さい。1段落につき1箇所くらい。それでもゼロではない。トータルでは圧倒的にプラスだが、「修正は完全にいらない」と思い込むと失望することになる。

3日でやめずに本気で試す方法

初日に誰かに教えてほしかった、いくつかのルール。

全部のアプリでいきなり始めない。一つだけにする。 一番たくさん、しかも気軽に長文を書いているアプリを選ぶ。私の場合はSlackだった。1週間、そのアプリでだけ声を使う。ワークフロー全体を一度に置き換えようとしない。

「疑うのは1週間まで」と決める。 3日目はひどい。5日目はまあまあ。7日目にはタイピングに戻ったときの遅さに気づき始める。3日目でやめた人は、絶対に7日目にたどり着けない。

デフォルトで整形してくれるツールを使う。 これが何より大事だ。生の書き起こししか出さないツールは、修正で稼ぎを全部食い潰す。フィラーを消し、文法を直し、出力を自動で整えるツールでないと、3倍は表に出てこない。

人前では絶対に使わない。 うるさいからではない(全然うるさくない)。気恥ずかしさがスピードを殺すからだ。最初の1ヶ月はプライベートな場所を選ぶこと。

ここから始める

正直なまとめ。音声入力は効く。マーケティングが言うような「すべてを変える」効き方ではなく、「4時には仕事が終わっている」という効き方で。3倍は本物で、修正を自動でやってくれないツールは1週目で人を挫折させる元凶だ。

一番手っ取り早いテストは、次の長めのSlackメッセージをタイピングではなく声で書いてみること。整形まで一発でこなしてほしいなら、つまり話し終わった瞬間にペースト可能な文章になっていて、アプリごとに文体を切り替えてほしいなら、Voicrはまさにそれをする。どこからでもFNを押して30秒話し、離してペースト。明日の朝、メッセージ一本で試してみてほしい。1週間後には、自分にとって3倍が本物かどうか分かるはずだ。