ブログに戻る

Voicr Team · 2026年5月13日

Voicr vs SuperWhisper:徹底比較

2つのAI音声入力アプリ、正反対の思想。一方はチューニング可能なフレームワーク、もう一方は完成された主張の強いワークフロー。どちらが誰に向いているのか。

Voicr vs SuperWhisper:徹底比較

App Storeで「AI 音声入力 Mac」と検索すると、必ず出てくる名前が2つあります。VoicrとSuperWhisperです。スクリーンショットは似ていて、機能リストも重なり、どちらも声を整った文章に変えてくれると謳っています。

両方を10分インストールすれば、違いはすぐ分かります。一方は、Whisperモデルのサイズを選び、カスタムモードを設定し、好きなLLMのAPIキーを貼り付け、プロンプトにXMLタグを付けるよう求めてきます。もう一方は、キーを1つ押し続けて話し始めるよう促すだけです。

どちらのアプローチも間違いではありません。対象とするユーザーが違うだけです。本記事では、VoicrとSuperWhisperがどこで分かれるのか、そしてそれぞれがどんなMacユーザーに合うのかを、正直に比較していきます。

結論を先に

残りを読む時間がない方へ: - SuperWhisperは、モデル、プロンプト、AIプロバイダーを完全にコントロールしたいティンカラー向け。オフライン対応が強力。設定項目は多め。Mac、Windows、iOSに対応。 - Voicrは、整形ルールやアプリごとの挙動が最初から組み込まれていてほしいMacユーザー向け。FNを押して、話して、離して、貼り付け。モデル選択なし、BYOKキーなし。Apple Siliconのみ対応。 - どちらもWhisperで文字起こしし、100言語に対応。違いは「ユーザーにどれだけセットアップを求めるか」です。

SuperWhisperが目指しているもの

SuperWhisperは、設定可能なフレームワークです。文字起こしはローカルのWhisperモデル、後処理はオプションでクラウドのLLM、そして用途ごとの動きを自分で定義できるカスタムモードという仕組みを備えています。

カスタムモードが看板機能です。メール用、議事録用、コードコメント用、Slack用と、用途別にモードを作れます。それぞれのモードに専用のプロンプト、フォーマットルール、AIプロバイダーを設定でき、OpenAI、Anthropic、Google、Mistral、Groq、あるいはローカルのLlamaまで、モードごとに切り替えられます。公式ドキュメントでは、数行を超えるプロンプトにはXMLタグの利用を推奨しています。

ローカル中心の文字起こし。 SuperWhisperはWhisperモデルをローカルに保存します。Tiny、base、small、medium、large-v3、large-v3-turboまで選べ、大きめのモデルはProプランで解放されます。Apple Siliconならlarge-v3-turboがローカルで動き、精度も十分。文字起こしの段階で音声がマシンの外に出ることはありません。SOC 2 Type II認証とHIPAA準拠も取得済みで、企業のセキュリティレビューを通しやすい選択肢です。

マルチプラットフォーム対応。 SuperWhisperは1つのライセンスでmacOS、Windows、iOSすべてで動きます。MacBookとWindowsデスクトップを行き来する人には、これは本物のメリットです。

ライフタイム価格。 一度の支払い(執筆時点で$249.99、ただし2026年に入って価格は変動しています)で永久利用できます。毎日ヘビーに使うなら、2年目以降の総額は多くのサブスクを下回ります。

ただし、この自由度の代償として設定画面はかなり密度が高くなります。複数のレビューでは、初期設定が「サーバーを構築するような感覚」と評されています。モデルサイズの選択、モードごとにどのLLMプロバイダーを使うか、プロンプトの作成、キーバインドのトラブル対応など、いざ整えば強力ですが、整えるまでに週末を使う覚悟は要ります。

Voicrが目指しているもの

Voicrは正反対の方向から出発します。多くの人は、音声入力ツールを自分で組み立てたいわけではありません。インストールした瞬間からそれなりに整った文章が出てきて、開いているアプリに合ったトーンで、しかもキー1つで完結してほしいのです。

macOSのどこからでもFNを押し続けるだけ。Voicrは音声をキャプチャし、Whisper large-v3-turboで文字起こしし、AIによる整形をかけ、その時点で入力していた場所に整った結果を貼り付けます。ウィンドウは開きません。クリップボード経由でもありません。切り替えるアプリもありません。

整形はすでに済んでいます。VoicrはAI周りの配線をあらかじめ済ませてあり、APIキーもプロバイダー選択もプロンプトエンジニアリングも不要です。どのモデルが書き直しているかをユーザーが決めることはありません。腰を据えて丁寧に書いたかのように読める整形スタイルが、最初から組み込まれています。

スマートルールは、モードを自作させずにアプリごとの最適化を実現します。アプリ単位で書き方のスタイルを割り当てるだけ(Slackはカジュアル、Mailはフォーマル、VSCodeはテクニカル、Apple Notesは生メモ)。Voicrがアクティブなアプリを検知し、自動的に適切なルールを適用します。ルールはUIから編集でき、XMLや覚えるべきプロンプト構文はありません。

ピュアディクテーションモードは、AIによる書き直しをオフにして、句読点だけが整った素の文字起こしが欲しいときのワンタッチ切り替えです。引用文、生メモ、忠実なキャプチャに向いています。

言語の自動検出は、100言語の中から話している言語を音声から判別します。出力言語を英語に固定すれば、Voicrは文字起こししながら翻訳します。スペイン語で考えて、英語で書き出す。すべてキー1つで。

代わりに失うものは、SuperWhisperと正反対です。Voicrは主張の強いツールです。整形スタイルはチームが良いと判断したものが提供されます。スマートルールのプロンプトを編集してトーンを微調整できますが、基盤モデルを選んだり、ローカルのLlamaを動かしたりはできません。さらに対応はApple SiliconのMacのみで、WindowsもiOSもありません。

体験が分かれるポイント

3つの場面で比べてみます。

初回セットアップ

SuperWhisper: インストール、Whisperモデルのダウンロード(tiny、base、small、medium、large-v3-turbo、large-v3のどれを選ぶかをハードウェアと精度の要件から判断)、設定を開いてデフォルトモードを選択、クラウドLLM整形を使うかどうか決定、OpenAIまたはAnthropicのAPIキーを貼り付け、カスタムプロンプトを書くかインポート、トリガーキーを設定してテスト。1晩は見ておきましょう。

Voicr: インストール、マイクとアクセシビリティの権限を許可、FNを押して話す。スマートルールは主要なアプリ向けにあらかじめ設定済みです。2分で終わります。

Slackへのメッセージとメールを続けて書く

SuperWhisper: カスタムモードを2つ(Slack用とMail用)作っていれば、別のキーバインドで手動切り替えするか、Super Modeでアプリを検知して自動的に正しいプロンプトを選ばせるかになります。どちらにしても、モードを先に用意しておく必要があります。

Voicr: SlackでFNを押せばカジュアル版、MailでFNを押せばメール版が出てきます。同じキーで違う出力になるのは、スマートルールがすでに開いているアプリを把握しているからです。

出力の整形

SuperWhisper: AIによる整形は、LLMを自分で設定した場合にのみ動きます。ローカルのWhisperモデルはデフォルトで素の文字起こしを返すだけで、書き直しを行うには自前のAPIキーを用意し、LLMプロバイダーに利用ごとに課金される必要があります。複数のユーザーレビューも、ここを能動的に設定しない限り、文字起こしの後に手作業の修正が必要になりがちだと指摘しています。

Voicr: 整形はデフォルトでオン。フィラーワードを削除し、文法を整え、構造を引き締めます。別途APIの請求書が来ることもありません。素の出力が欲しければ、ピュアディクテーションモードに1タッチで切り替えられます。

モデルやプロンプトの設定で埋まったSuperWhisperの設定画面と、FNを押すだけで整形済みの文章が出るVoicrの操作を並べて示したイラスト

もしSuperWhisperで音声入力を使っていて、カスタムモードとAPIキーを設定する時間が取れず、いまだに生の文字起こしのままだとしたら、Voicrが提供する整形は、まさにこれから設定しようとしていた部分です。それがすでに完成しているだけ。FNを押して、話して、離せば、整った文章が入力欄に入っています。

プライバシーとオフラインモード

ここはSuperWhisperが純粋に強い領域で、そこは正直に認める価値があります。

SuperWhisperの文字起こしはローカルのWhisperモデルで動きます。音声がマシンの外に出ることはなく、クラウドLLMによる整形を有効にしなければ、フロー全体がデバイス上で完結します。規制業界、回線が不安定な環境、プライバシーを重視するユーザーにとって、これは実質的な差です。

一方Voicrは、文字起こしも整形もクラウドで行います。音声をサーバーに送り、処理結果が返ってくる流れで、デバイス内完結モードは用意していません。音声をサーバーに送れない、または送りたくない場合は、SuperWhisperの方が安全な選択です。そしてこの一点は、他の比較項目を差し置いてでも、判断の決め手になっていいくらい重要です。

ひとつだけ補足。SuperWhisperはこれまで録音した音声を既定でディスクに保存してきました。これはネットワークに流れるかどうかとは別の、ローカル保存というもう一つのプライバシー軸です。SuperWhisperを使う場合、「オンデバイス」イコール「未記録」とは限らないので、設定画面で現在の挙動を確認しておくのが安全です。

料金の比較

表示価格だけでは全体像は分かりません。SuperWhisperの整形は自前のLLMキー前提なので、合計コストはどのプロバイダーを繋ぐかと、どれだけ音声入力するかで変わってきます。

SuperWhisper

SuperWhisperの無料プランはローカルのWhisperを動かせますが、使えるのは小さめのモデル(tinyとbase)に限られ、カスタムモードも3つまでです。Proは月$8.49または年$84.99で、Whisperモデルのサイズ制限が外れ、モード数の上限がなくなり、クラウドLLMによる後処理も解放されます。ライフタイムは最新の表示で一度払い切りの$249.99。さらにどの料金プランでも、クラウド整形を使うならOpenAI、Anthropic、Google、あるいは選んだプロバイダーへリクエストごとに支払う必要があります。

Voicr

VoicrのFreeプランはすべての機能込みで月5,000語まで、クレジットカード登録も不要です。GOは月$3/moで20,000語。PROは月$10/moで100,000語。整形はどのプランにも含まれているので、AIプロバイダーへの請求書が別に来ることはありません。

ライトユーザーにとっては、どちらも実質無料です。ヘビーに使うなら、計算式は「SuperWhisperのライフタイム代+LLMの従量課金」を選ぶか、「整形込みの定額Voicrサブスク」を選ぶか、好みの問題になります。Voicrの無料プランはフル機能に近い体験を提供します。SuperWhisperの無料プランのようにモデル制限もカスタムモードの上限もなく、整形のためにAIプロバイダーへ別途支払う必要もありません。

VoicrのAI込みの定額月額料金と、Proサブスクに加えてBYOKのLLM費用が積み上がるSuperWhisperの料金構造を比較したイラスト

SuperWhisperが正解になる場面

SuperWhisperの方が明らかに優れている場面は実際に存在します。

WindowsユーザーまたはMacとWindowsを併用している場合。 VoicrはApple SiliconのMac専用です。OSをまたいで1つのアプリで済ませたいなら、SuperWhisperが対応します。

オフライン要件が厳しい場合。 コンプライアンス、機密情報、特定のマシンがネットワークに繋がっていないなど。クラウドLLMを使わないローカルWhisperによる文字起こしは、SuperWhisperが最も得意とする領域です。

自分のモデルを持ち込みたい場合。 整形にローカルのLlamaを動かしたい、タスクごとにGPTとClaudeを切り替えたい、システムプロンプトを書くようにXMLタグ付きでプロンプトを書きたい、といったニーズにはSuperWhisperがフィットします。Voicrはこの方向性ではありません。

ライフタイム価格が好みの場合。 何年もヘビーに使い続けるなら、SuperWhisperのライフタイム+自前のAPI利用料の方が、定額月額より安く済むことがあります。電卓を叩く価値はあります。

Voicrが正解になる場面

日常的に使うMacユーザーの多くはこちらに当てはまります。理由も同じくらい率直に書いておきます。

APIキーを管理したくない。 整形は設定の手順ではなく、最初からオンであってほしい。

どのアプリでも、1つのキーで正しい挙動をしてほしい。 モード切り替えも手動トリガーもなく、ただFNを押せばSlackではSlackらしく、MailではMailらしく仕上がってほしい。

Apple SiliconのMacユーザーで、今後もそのままの予定。 クロスプラットフォームの必要がなく、同じ設定を待っているWindowsマシンも特にない。

5時間ではなく5分で使い始めたい。 インストールして、権限を許可して、FNを押す。デフォルトでそのまま使える品質ですし、トーンを微調整したくなったらスマートルールを後から触ればOKです。

このプロフィールに当てはまるなら、Voicrは「誰かがすでにセットアップを済ませてくれたSuperWhisper」のように感じられるはずです。Whisperによる文字起こしの精度はそのまま、整形はあらかじめ組み込まれ、アプリごとの最適化はカスタムモードを組み立てなくてもコアの一部として備わっています。

正直なテスト方法

本気で迷っているなら、公平なテストは「同じ実物の文章を、両方で音声入力してみる」ことです。一行ではなく、3〜5文程度のもの、たとえばメールやSlackのスレッド返信を選びましょう。普段なら編集で消すフィラーや言い直しもそのまま喋ってみます。

それぞれのアプリで、出力を一切手直しせずに眺めます。質問は2つだけ: 1. そのまま送信できる状態に仕上がっているか? 2. ツールはあなたがどのアプリで使っているかを理解していたか?

SuperWhisperの出力がそのまま送れる状態なのは、週末を使ってカスタムモードとプロンプトを練り上げた成果です。それは本物の価値なので、そのまま使い続けましょう。もしまだ素の文字起こしで、後から手で整える必要があるなら、VoicrとSuperWhisperの違いは大まかに「整形が自動で済む」か「整形をそのうち設定する予定」かの違いに集約されます。

確かめる一番早い方法は、VoicrをインストールしてトリガーにFNを設定し、同じメールをもう一度試してみることです。プロンプトもモデルもすべて自分で握りたいならSuperWhisperの方が良いツールですし、キーを押して整った文章が入力欄に届いていてほしいならVoicrが探していたものです。

同じ問いを別の角度から見たい方は、Apple純正ツールとの比較も用意しています。Voicr vs Apple Dictationの比較記事をどうぞ。