ブログに戻る

Voicr Team · 2026年5月23日

AIで「考え」と「書く」のギャップを埋める方法

頭の中にあることを、ほぼ考える速さでページに落とし込めるようになったAIワークフローを、一人称で振り返ります。

AIで「考え」と「書く」のギャップを埋める方法

ほとんどの朝、私はノートPCを開く時点で、何を書きたいかがはっきりしている。最初のメールは頭の中ですでに下書きされている。ところがキーボードに指が乗る頃には、その半分は消えてしまっている。覚えている部分だけを打ち、画面を見つめて、残りを必死に思い出そうとする。

言いたいことが分かっているのに、それがページに着地するまでの空白。私はそれを「ギャップ」と呼んでいる。長年、これは書くことの一部だと思い込んできた。違う。これはツールが課しているコストだ。私にとって、そのギャップを本当に縮めてくれた最初のものがAIだった。

これはあくまで一人称の話。リスト記事でもツール紹介でもない。この一年で落ち着いた自分のワークフローと、うまくいっている部分、まだうまくいかない部分の話だ。

誰も話さない速度の問題

数字を見るとギャップが存在する理由がわかる。デスクトップでの一般的なタイピング速度はおよそ毎分40語。プロ並みでも60〜70語どまり。会話のスピードは無理せず毎分150語前後ある。文を組み立てるときに頭の中で響く「内なる声」はさらに速く、最大で毎分300語あたりという推定もある。

ざっくり言うと、考えるのは300、話すのは150、打つのは40。タイピングはこの連鎖の中でダントツに遅い行程だ。待たされる時間はすべて摩擦であり、摩擦が起きる場所からアイデアは漏れていく。

私にとって変わったのはタイピングそのものではない。指が速くなったわけではない。変えたのはボトルネックだ。タイピング速度で書こうとするのをやめ、話す速度で書くことを自分に許し、後始末はAIに任せるようにした。

タイピングがあなたを静かに縮ませる理由

タイピングのコストは速度だけではない。ボトルネックに合わせて思考そのものを編集してしまうのが問題だ。短い方の言い方を選び、ニュアンスを切り捨て、例を省く。送信ボタンを押した後、思ったよりも味気ない文章になっていることに、少しだけ後ろめたさを感じる。

Slackで一番これを感じた。丁寧な返信を打ち始め、頭の中で文を書き直しながらカーソルが点滅するのを眺め、結局全部消して3語だけ送る。「了解」「OK」「あとで見ます」。そこで多くの仕事の会話が終わってしまう。付け加えることがなかったからではなく、付け加える労力に見合わなかったからだ。

そういう返信を打つのをやめて声で吹き込むようになってから、メッセージは長く、温かく、明確になった。脳は同じ。出力チャネルだけが違う。

ギャップが埋まると実際にどう感じるか

ある火曜の朝の場面。クライアントから「なぜプロジェクトが遅れているのか」というメールが届く。本当の答えはちゃんとある。一部はこちらのスコープ変更、一部は先方の承認遅れ、一部は祝日週。一行で済む話ではない。婉曲すぎず、それでいて言い訳がましくない3段落が必要だ。

昔の自分なら、返信画面を開き、最初の一文を2回打って消し、15分かけて4段落の妙に丁寧で要領を得ない返事を生み出していた。

今の自分はキーを1つ押しっぱなしにし、90秒ほど話してから手を離す。返信欄にはすでに段落分けされ、フィラーワードも取り除かれた文章が入っている。一度読み、1か所だけ言い回しを直して送信。15分ではなく2分で終わる。しかも自分が言いたかったことに以前より近い。タイピング速度に合わせて思考を圧縮しなくて済んだからだ。

左側の乱雑な吹き出しが、AIによって右側の整った構造化メールへと磨き上げられる様子

初めてこれが機能したとき、少し呆然と座っていた。技術が魔法だったからではない。そんなはずはない。理由はもっと単純で、書くことの一部だと諦めていた摩擦が、ある日突然「省略可能」になっていたからだ。

違いを生んだ2つのAIレイヤー

自分のワークフローに2つのAIレイヤーがあり、両方が働いていることに気づくのに時間がかかった。人はこのどちらかしか語らない。両方を語ることは少ない。

レイヤー1:声を入れて、整った文章を取り出す

1つ目のレイヤーは、AIによる仕上げ付きの音声入力だ。キーを押しっぱなしにして普通に話す(「えー」やつっかえ、半端な言い回しを含めて)。すると、すでに整形された文章がクリップボードに入っている。フィラーは取り除かれ、文法は直され、ダラダラ続いていた文は実際の段落に分けられている。

これは標準の音声入力と同じではない。Apple Dictationは「えー」もそのまま含めた生のトランスクリプトを返してくる。AIによる仕上げは、意図を保ったまま書き直してくれる。録音と下書きほどの差がある。

レイヤー2:文章を入れて、もっと良い文章を取り出す

2つ目のレイヤーは、その場での文章修正だ。すでに書いたもの(段落、一文、メール全体)を選択し、ショートカットを押し、「もっと簡潔に」「トーンを和らげて」のようなプロンプトを選ぶ。すると選択範囲がその場で書き換わる。タブを切り替えない。チャットボットへコピペしない。元の文章が、その上位互換に置き換わる。

音声入力は思考を素早くページに乗せる。その場での修正は、最後の1割の仕上げを担う。この2つを組み合わせると、どちらか片方だけよりも「話す速さで書く」に近づく。

実際に使っている1日のワークフロー

平均的な一日の様子を具体的に。机上の理論ではなく、今の自分の書き方そのままだ。

朝の受信トレイ。 1通ずつ読み、その場で返信を吹き込む。ほとんどは1段落、長くても数段落。打つことはほぼない。以前は最初の1時間をまるごと食いつぶしていたバッチが、今は20分ほどで終わる。

1日中のSlack。 短い返信はそのまま打つ。摩擦が小さく、認知的な負担も軽いからだ。2文を超えるものはすべて声で。Slackでの話し方そのままなので、トーンも自然にカジュアルになる。

ドキュメントとメモ。 初稿はほぼ間違いなく音声で書く。空白のドキュメントを開き、扱いたいテーマについて5〜10分ほど話す。これでもう「直すべき本物の下書き」が手元にある。書き始めるよりも直す方がずっと速いし、考えと書くことのギャップが一番広いのは白紙の段階だからだ。

編集パス。 ここで2つ目のレイヤーが本領を発揮する。引っかかる文を選んで「もっと締まった言い回しに」と頼む。堅すぎる段落を選んで「もう少し柔らかく」と頼む。修正は2秒、その場で完了、アプリの切り替えはなし。

1つ意外だったこと。書く総量は減るどころか増えた。AIは私のアウトプットを置き換えたのではなく、ただの「打鍵税」だった部分を取り除いただけだ。

メールに特化した話はMacでメールを音声入力する方法で深掘りしているので、興味があればそちらを。

これを成立させた、ひとつの設定

最初にこの種のワークフローを試したとき、危うく素通りしかけた設定がある。結果的に、それこそが「実用に耐える」ようにしてくれた要だった。アプリごとの文体だ。

Slackとメールに同じトーンは合わない。フォーマルな送付状とNotionのブレインストームも別物だ。AIの仕上げがすべてを同じ声に均してしまうと、出力は速くなる代わりに質が落ちて、信用できなくなる。

だからこそVoicrにはSmart Rulesがある。Slackにはカジュアルなトーン、Mailにはやや改まったトーン、ターミナルには装飾なしのトーンを設定しておく。Voicrがアクティブなアプリを検出し、何もしなくても適切な文体を当ててくれる。私はどのアプリでも同じように吹き込むだけで、出力の方が合わせてくれる。「大事なメッセージはやっぱりキーボードで」と引き返さずに済むようになったコツがこれだ。

生の音声入力が破綻するポイント(と、仕上げが救う場所)

生の音声入力には、試した人なら誰でも見覚えのある失敗の型がある。1段落分を話す。返ってきたトランスクリプトには「えー」が全部残り、2回言い直したものがそのままつながり、息継ぎなしで40語走り続けた一文が転がっている。

もちろん編集はできる。でも生のトランスクリプトを編集するのはそれ自体が労働で、最初からきれいに打った方が速いことさえある。標準の音声入力を試したほとんどの人が1週間で諦めるのは、これが理由だ。

仕上げが入ると話が変わる。AIがフィラーを取り除き、文法を直し、ひと続きの音声を段落に分けてくれると、出力はそのまま送れる水準になる。音声入力の段階が「ドラフトゼロ」ではなく「ほぼ最終稿」に近づく。

競合記事ではここがしばしばスルーされている。音声がタイピングより速いのは事実だが、後処理で取り返されてしまえば意味がない。

正直に言うトレードオフ

良いことばかりではない。いくつかは今でも打った方が良い。

- 記号やコードを含む技術的な文章。 コード、コマンド名、製品SKU。音声入力は言葉は拾えても、記号までは正確に拾えないことがある。コードは今でも打っている。 - 騒がしい環境。 カフェ、機内、シェアオフィス。静かな部屋でPCに話しかけるのは問題ないが、隣の人が通話中の横ではやれない。 - 周囲に聞かれたくない繊細な話題。 別れのメールやハードなフィードバックは、声に出して読み上げられたくない。打つ方を選ぶ。 - 細かい編集。 文書がほぼ仕上がったら、キーボードでの外科的な微修正の方が好きだ。音声は「ページに乗せる」ためのもので、カンマを動かすためのものではない。

いつキーボードに戻すかを知ること自体がワークフローの一部だ。キーボードがなくなったわけではない。ただ、もうデフォルトではないというだけだ。

実際に何が変わったか

正直に言えば「アウトプットが4倍になった」みたいな話ではない。もっと地味で、もっと奇妙な変化だ。

Slackの返信が長くなった。書くコストが下がったからだ。中途半端なメモが減った。考えを丸ごと吹き込む方が、断片を打つより速いからだ。アイデアが浮かんだその日のうちに初稿を書くようになった。「まとまった時間ができたら」と先送りしなくなった。「アイデアが浮かんでから下書きが手元にある」までの時間が、数日から数分に縮んだ。

これは速度の数字が捉えきれない部分だ。本当の問いは、書くという行為が「ふと思いついた瞬間にやれるくらい安く」なったかどうかだ。まとまった時間を確保できる日まで温めておく必要が、もうない、ということ。

今日から試す方法

自分にも効くかどうかを試すなら、ワークフロー全体を作り直す必要はない。一箇所だけ選ぼう。

1. 次に返すメールのうち、2文より長くなりそうなものを1通選ぶ。 2. 打たずに、音声入力キーを押しっぱなしにして、言いたいことをそのまま話す。台本は用意しない。ただ話す。 3. キーを離して、入力欄に何が入ったかを読む。 4. 言いたかったことに近ければ、ズレている1〜2か所だけ直して送信する。

これを5回やってみよう。初日が終わる頃には、ここで書いた「ギャップ」が自分にもあるかどうかが分かるはずだ。

上のワークフローを自分で組み立てる手間を省きたいなら、私が使っているのはVoicrだ。FNを押して話し、貼り付ける。出力は整形済みで、トーンは今使っているアプリに合わせて変わり、テキストを選んで⌥Spaceを押せば、2パス目用の即時修正がかかる。月5,000語までは無料なので、自分に合うかどうかを試すには十分だ。

キーボードがなくなることはない。ただ、PCで書き始めて20年で初めて、「キーボードがボトルネックである前提で計画を立てる」必要がなくなった。