声に出して一文言ってみてください。「ねえ、手が空いたときに最新の数字を送ってもらえる」。その文がどこへ向かうかで、どんな形になるべきかが決まります。Slackに入れればそのままで十分。クライアント向けのメールなら、あいさつとやわらかい依頼の言い回しが要ります。Jiraのコメントとして残すなら、三語まで縮めるべきです。「最新の数字が必要」。
あなたはその調整を、考えもせずにやっています。脳がその場の空気を読み取り、どのアプリで、相手は誰で、どれくらいフォーマルかを判断して、言葉を出す途中で形を整え直しているのです。コンテキストを理解するAIは、あなたが口述した話し言葉に対して、同じ仕事を自動でこなします。
これが今こそ気にかける価値があるのは、口述入力がようやく実用レベルになったからです。話す速度は毎分150語ほど、ほとんどの人がタイプする毎分40語の3〜4倍に達します。けれども、生の話し言葉はどのアプリが求める書き方にも一致しません。そのギャップを埋めるのが、書き換えのレイヤーです。
一つの文、六つの異なるメッセージ
話し言葉はレジスター(言葉づかいの格式)に対して中立です。話すとき、あなたは形式を選びません。ただ言いたいことを言い、形式はあとから、文がどこに着地するかをあなたが決めたときに後付けされます。
書き言葉はその逆です。あなたが文字を打ち込むどのアプリも、テキストがどう見え、どう響くべきかについて、それぞれ静かな独自のルールを抱えています。
あの「数字を送って」という同じ依頼が、ウィンドウによってどう形を変えるかを見てみましょう。 - Slack:「ねえ、手が空いたら最新の数字を送ってもらえる?」 - メール:「マリアさん、お時間のあるときで構いませんので、最新の数字を送っていただけますか。よろしくお願いします!」 - Jira:「最新の数字が必要。」 - 自分用のメモ:「保留: マリアからの最新の数字。」 - 同僚へのメッセージ:「最新の数字送ってもらえる?」
意図はどれも同じ。五つの場面、五つの異なる正解です。あなたはすでにそのすべてを、求められればその場で生み出しています。やっかいなのは、一つひとつにあなたがほとんど気づかない小さな調整がかかり、それが絶え間なく起きていることです。ハーバード・ビジネス・レビューの調査によると、働く人は1日に約1,200回もアプリを切り替えており、おおよそ24秒に1回の頻度です。その切り替えの多くには、新しい書き方のスタイルが付いて回ります。
文字起こしと、コンテキストを理解する書き換えの違い
ふだん一緒くたにされがちな二つの仕事を、切り離して考えると分かりやすくなります。文字起こしは、音を言葉に変えます。コンテキストを理解する書き換えは、その言葉を、向かう先にふさわしいメッセージへと変えます。
ただの文字起こしは最初の段階で止まります。Apple Dictation、ほとんどの音声テキスト変換ツール、スマホのライブキャプション。これらはあなたが言ったことを、つなぎ言葉や言い直しも含めて、そのまま文字に起こして渡します。
ちょっとした思いつきを生のまま文字起こしすると、実際にはこうなります。 ``` えーっとそうですねやっぱり来週にローンチをずらした方がいいかなと思ってってのもそのそのQAがまだ終わってないんですよね ```
コンテキストを理解する書き換えは、その同じ音声を受け取り、もう一つの問いを立てます。これはどこへ向かうのか、そしてそこではどう響くべきか、と。チームへのSlackメッセージに向かうなら、こう返ってきます。 ``` ローンチを来週にずらしましょう。QAがまだ終わっていません。 ```
入る言葉は同じ、出てくる言葉は違う。向かう先によって形が整えられているのです。最初のものは記録です。二つ目は、実際に送れるものです。この磨き上げの側面について詳しくは、AI音声口述入力の仕組みの解説をご覧ください。

AIにとって「コンテキスト」とは実際に何を指すのか
「コンテキストを理解する」と聞くと曖昧に思えますが、これらのツールが読み取る具体的な手がかりを見れば、その印象は変わります。神秘的なものは何もありません。コンテキストとは、AIが言葉に手をつける前にチェックする、ごく短い信号のリストです。
アクティブなアプリ
もっとも大きな信号は、あなたが話すときにどのアプリがフォーカスされているかです。ツールは、前面にあるのがSlackなのか、Gmailなのか、VS Codeなのかを把握できます。その一つの事実だけで、スタイルはかなり絞り込まれます。チャットは短くくだけた調子を、メールは構成立った丁寧な調子を、コードエディタは簡潔で文字どおりの表現を求めます。
カーソル周辺のテキスト
ツールによっては、これから文字を打とうとしている場所の近くのテキストを少し読み取ります。上のメッセージが「Dear Dr. Katz,」で始まっていれば、AIはフォーマルな調子を保ち、名前も正しく綴ります。スレッドが一行ジョークの山なら、それに合わせます。
ブラウザではなく、ウェブサイトそのもの
アプリの検出は、ブラウザの中ではあいまいになります。Gmail、X、Googleドキュメントが、すべて同じウィンドウの裏に隠れているからです。優れたツールはURLを見てそれらを区別し、GmailのタブにはメールらしいスタイルをXのタブにはキレのある投稿のスタイルを当てはめます。
アプリのカテゴリ
これまで作られたすべてのアプリにルールを持つ代わりに、ほとんどのシステムはアプリをいくつかのバケツに分類します。メール、仕事用チャット、個人のメッセージ、ドキュメント、コード、そしてそれ以外すべてを受け止める受け皿です。それぞれのバケツにスタイルがあります。既知のバケツに収まる新しいアプリは、初日からそのスタイルを受け継ぎます。
これらの信号を積み重ねれば、AIはその場の空気をそこそこ正確に読み取れます。名前のある相手へのフォーマルなメールなのか、それともくだけたスレッドに放り込む使い捨ての一行なのか。その読みこそが、書き換えの基準になります。
あなたの話し言葉が、ふさわしいメッセージになるまで
各パーツを並べてみると、全体はわずか四つの素早いステップにすぎず、あなたが一文を言い終えてからテキストが現れるまでの1〜2秒のあいだに、すべてが起きています。 1. キャプチャ。キーを押しながら話します。手を離すまでツールが録音します。 2. 文字起こし。音声モデルが音声を生のテキストに変えます。あなたが言ったそのままの言葉です。 3. コンテキストの検出。ツールはアクティブなアプリ、カーソル付近のテキスト、そしてそのアプリがどのバケツに入るかを確認します。 4. 書き換え。言語モデルが生の文字起こしとそのコンテキストを受け取り、向かう先に合わせた長さと調子で、最終的なメッセージを書き上げます。
四つ目のステップで、大規模言語モデルが重い仕事を引き受けます。あなたの雑然とした文字起こしと、「これは仕事のメールに入るものだから、それらしく読めるようにして」と要約できる指示を受け取り、ふさわしい長さ、調子、形でテキストを返します。結果はモデルによって変わるので、出力は確定版というよりも、出来のいい初稿として扱いましょう。
これはまさにVoicrがmacOSで動かしているフローです。FNキーを押しながら、どんなアプリからでも話すだけ。Voicrは前面にあるアプリを見抜き、Smart Rulesを通じて合致するスタイルを適用し、磨き上げたテキストをクリップボードに落とします。Slackではカジュアルに、Gmailではプロフェッショナルに、エディタでは簡潔に。調子を選ぶためにメニューを開く必要は一切ありません。こうしたアプリごとのスタイルがどう書かれるのかを知りたい方は、スマートな書き換えルールのガイドで、良いルールに何が含まれるかを順を追って解説しています。

二つのタイプ: 自動検出と、明示的なルール
コンテキスト理解のやり方はどれも同じではありません。ツールは二つの陣営に分かれ、その違いは主に、誰がスタイルを決めるかにあります。
自動タイプは、あなたの代わりに判断します。アプリを読み取り、カテゴリに分類し、組み込みのスタイルをまったく設定なしで適用します。インストールすれば、それだけで動きます。引き換えになるのはコントロールです。それが考える「メールの調子」があなたの感覚と合わないとき、あなたは出力を手で微調整するしかなくなります。
明示的なタイプは、ハンドルをあなたに渡します。アプリごとに、どう響くべきかを平易な言葉で短く書いておきます。前もっての手間は増えますが、味付けはあなたが決めたものなので、出力もあなたの好みに合います。Slack用のルールはこんな具合かもしれません。 ``` カジュアルなSlackメッセージとして書き換える。2〜3文、口語的な縮約形は可、あいさつや締めの言葉は不要。合うときだけ軽く絵文字を。 ```
優れたツールは二つを混ぜ合わせます。すぐに使える気の利いたデフォルトに加え、こだわりたいときに書けるアプリごとのルールです。ほとんど触らないアプリではデフォルトに頼り、自分の書き方が本当に大事になる二つ三つのアプリには明示的なルールを設定します。
うまくやれること、まだつまずくこと
コンテキストを理解する書き換えは本当に便利ですが、出発点であって読心術ではありません。どこでつまずくかを知っておけば、やみくもに信用せずに済みます。
形式は完璧。意図は当て推量。
AIはあなたがメールにいると見抜き、あいさつを添えられます。でも、あなたが本心なのか皮肉なのか、「大丈夫」が本当に大丈夫なのか、それとも内心静かに怒っているのかを、確実に見分けることはできません。同じレジスターの中での調子は、いまだにあなたの仕事です。
あいまいなアプリは混乱させる
受け皿のようなブラウザ、チャットクライアントを動かすターミナル、何にでも使うメモアプリ。これらは弱い信号しか出しません。コンテキストが濁っていると、書き換えはありきたりな仕上げに後退し、あなたが望んだよりフォーマルすぎたり、くだけすぎたりすることがあります。
あなたらしさを削ってしまうこともある
書き換えを強くかけすぎると、あなたのメッセージはみんなと同じ調子になり始めます。なめらかで、そつがなくて、少し生気がない。良いツールは、あなたの声を企業向けのデフォルトに置き換えるのではなく、ふさわしいレジスターへと移します。出力が自分らしく聞こえなくなったら、ルールを少しゆるめましょう。
送る前には、やはり読む
名前が間違って出ることもあります。数字が滑り込むこともあります。送り出す前にざっと結果に目を通しましょう。送信を押す前に自動修正されたメッセージをちらっと確認するのと同じ要領で。
コンテキストを理解する書き換えを実際に使う
今日から試したいですか。まずは、あなたがいちばん多く書く二つのアプリ、たいていはチャットツールとメールから始めましょう。次に送るいくつかのメッセージを、タイプする代わりにそこで口述してみて、あとからどれだけ編集が要らないかを確かめてください。
次に、外したところに注目します。出力が正しくないとき、それは役に立つ情報です。そのアプリのスタイルを調整する必要があるか、あるいは意図をもっとはっきり声に出して言うべきだと教えてくれているのです。これらのツールは、各アプリがどう響くべきかをはっきり伝えるほど、鋭くなっていきます。この同じコツは、分かりやすい二つだけでなく、あなたが書くどんなアプリでも効きます。Macのどのアプリでもキー一つで口述入力するで取り上げたとおりです。
本当の勝ちは速さだけではありません。タイプの3倍速く話せるのは確かに良いスタートですが。実際に変わるのは、形式を頭の中に抱えて持ち歩かなくてよくなることです。思いついたことを考え、一度言えば、どのバージョンがどこに属するかはツールが整理してくれます。
一度話せば、どこにでも届く
昔ながらの習慣は、メッセージと形式を同じ瞬間に書くことです。言葉、調子、あいさつ、締めの言葉、すべてを一気に、どのアプリでも、一日じゅう。コンテキストを理解するAIは、その手間を二つに分けます。あなたは思いを持ち込む。AIは形式を持ち込む。
その違いをいちばん手早く実感する方法は、次のメールをタイプする代わりに口述してみることです。向かう先に合わせてすでに形が整った話し言葉が欲しいなら、VoicrがあなたのMacでそれをやってくれます。FNを押して話せば、テキストはあなたがいるアプリにふさわしい調子で着地します。口から出る一文、そしてどのウィンドウにもふさわしいメッセージ。

