Voicr против SuperWhisper: подробное сравнение

Открываете App Store, вбиваете «ИИ-диктовка для Mac» — и снова видите два имени: Voicr и SuperWhisper. Скриншоты похожи. Списки функций пересекаются. Оба обещают аккуратный текст из вашего голоса.

Поставьте оба на десять минут — и разница станет очевидной. Одно просит выбрать размер модели Whisper, настроить кастомный режим, вставить API-ключ нужной LLM и оформить промпт XML-тегами. Другое просит зажать одну клавишу и начать говорить.

Ни один подход не ошибочен. Они для разных людей. Ниже — честное сравнение, где Voicr и SuperWhisper расходятся и какой из них подойдёт какому маководу.

Если коротко

Если читать дальше нет желания: - SuperWhisper — для тех, кто любит копаться в настройках и хочет полный контроль над моделью, промптом и провайдером ИИ. Сильная офлайн-история. Громоздкая настройка. Доступен на Mac, Windows и iOS. - Voicr — для маководов, которым полировка текста и правила для каждого приложения нужны уже из коробки. Зажал FN, сказал, отпустил, вставил. Никакого выбора моделей. Никаких BYOK-ключей. Только Apple Silicon. - Оба используют Whisper. Оба поддерживают 100 языков. Расходятся они в том, сколько настройки от вас требуют.

Под что заточен SuperWhisper

SuperWhisper — это конструктор. Локальные модели Whisper для распознавания, опциональные облачные LLM для постобработки и система Custom Modes, в которой вы вручную задаёте, как должна работать каждая задача.

Custom Modes — главная фишка. Можно сделать режим для писем, ещё один для заметок со встреч, третий для комментариев в коде, четвёртый для Slack. У каждого режима — свой промпт, свои правила форматирования, свой провайдер ИИ. Можно подключить OpenAI, Anthropic, Google, Mistral, Groq или локальную Llama в зависимости от того, какой режим активен. В их документации рекомендуют использовать XML-теги для любого промпта длиннее нескольких строк.

Локальная транскрипция в первую очередь. SuperWhisper качает модели Whisper на ваше устройство. Доступны tiny, base, small, medium, large-v3 и large-v3-turbo, причём крупные модели прячутся за Pro-тарифом. На Apple Silicon large-v3-turbo работает локально, и точность отличная. Аудио не покидает ноутбук на этапе распознавания. У компании есть сертификация SOC 2 Type II и соответствие HIPAA, что облегчает прохождение корпоративного аудита безопасности.

Кроссплатформенность. SuperWhisper работает на macOS, Windows и iOS по одной лицензии. Если вы делите время между MacBook и Windows-машиной, это реальное преимущество.

Lifetime-лицензия. Один платёж ($249.99 на момент написания, хотя цена менялась в 2026 году) даёт пожизненный доступ. Для тех, кто диктует много и каждый день, эта арифметика бьёт большинство подписок уже на второй год.

Плата за всю эту мощь — плотная панель настроек. Несколько обзоров сравнивают онбординг с «настройкой сервера»: выбрать правильный размер модели, решить, какой LLM-провайдер использовать для какого режима, написать промпты, разобраться с горячими клавишами. Когда всё настроено — это мощный инструмент. Чтобы дойти до этого состояния, нужны выходные.

Под что заточен Voicr

Voicr заходит с другой стороны. Большинство людей не хотят собирать инструмент для диктовки. Они хотят поставить нечто, что сразу хорошо полирует речь, в том тоне, который уместен в конкретном приложении, по одной клавише.

Зажмите FN в любом месте macOS. Voicr запишет аудио, распознает его с помощью Whisper large-v3-turbo, прогонит через ИИ-полировку и вставит готовый текст в то поле ввода, где вы уже находитесь. Никакого окна. Никакого хождения через буфер обмена. Никаких переключений между приложениями.

Полировка уже сделана за вас. У Voicr вся ИИ-обвязка вшита внутрь — никаких API-ключей, никакого выбора провайдера, никакой инженерии промптов. Вы не решаете, какая модель переписывает вашу речь. Это делает приложение, причём в стиле, который читается так, будто вы спокойно сели и сами набрали этот текст.

Smart Rules решают задачу «по приложению» без необходимости вручную собирать режимы. Вы назначаете стиль каждому приложению — неформальный для Slack, деловой для Mail, технический для VSCode, сырые заметки для Apple Notes — и Voicr сам определяет, какое приложение активно, и применяет нужный стиль. Есть UI для редактирования правил. Никакого XML, никакого синтаксиса промптов учить не нужно.

Pure Dictation Mode — переключатель для случаев, когда нужна сырая транскрипция с нормальной пунктуацией, без переписывания ИИ. Цитаты, черновые заметки, дословная фиксация речи.

Автоопределение языка само понимает, на каком языке вы говорите, и поддерживает 100 языков. Поставьте целевой язык — английский, и Voicr будет переводить прямо по ходу распознавания. Думаешь по-русски — пишешь по-английски, одна клавиша.

Компромисс зеркален SuperWhisper. Voicr — приложение со своим мнением. Вы получаете ту полировку, которую команда считает хорошей. Промпты Smart Rules можно подправить, если хочется чуть иной тон, но саму модель вы не выбираете и локальную Llama не запускаете. И только Mac на Apple Silicon — ни Windows, ни iOS.

Где опыт расходится

Три коротких сценария.

Первая настройка

SuperWhisper: установка, скачивание модели Whisper (нужно решить, какой размер — tiny, base, small, medium, large-v3-turbo, large-v3 — исходя из железа и требований к точности), открыть настройки, выбрать режим по умолчанию, решить, нужна ли облачная LLM-полировка, вставить API-ключ OpenAI или Anthropic, написать или импортировать кастомный промпт, настроить горячие клавиши, протестировать. Закладывайте вечер.

Voicr: установка, разрешения на микрофон и универсальный доступ, зажать FN, говорить. Smart Rules уже настроены под популярные приложения. Закладывайте две минуты.

Сообщение в Slack и письмо подряд

SuperWhisper: если вы настроили два кастомных режима (один для Slack, другой для Mail), вы либо переключаете их вручную отдельной горячей клавишей, либо полагаетесь на Super Mode, чтобы он сам определил приложение и подтянул нужный промпт. В любом случае режимы должны существовать заранее.

Voicr: зажали FN в Slack — получите неформальный вариант. Зажали FN в Mail — получите вариант для письма. Одна и та же клавиша, разный результат, потому что Smart Rules уже знают, в каком приложении вы находитесь.

Полировка результата

SuperWhisper: ИИ-полировка включается только если вы настроили LLM. Локальные модели Whisper по умолчанию выдают сырую транскрипцию; чтобы получить перепись, нужно подключить свой API-ключ и платить провайдеру LLM за каждый запрос. В нескольких пользовательских обзорах отмечают, что транскрипция часто всё равно требует ручной правки, пока вы это не настроите.

Voicr: полировка включена по умолчанию. Слова-паразиты убираются, грамматика чинится, структура подтягивается. Отдельного счёта за API нет. Если нужен сырой результат — Pure Dictation Mode включается одним тумблером.

Сравнение бок о бок: панель настроек SuperWhisper, забитая выбором моделей и промптов, против одного жеста удержания FN в Voicr с готовым отполированным текстом

Если вы диктуете в SuperWhisper, а транскрипция всё ещё выходит сырой, потому что руки не дошли настроить Custom Modes и API-ключ, — полировка Voicr и есть та часть, которую вы собирались настраивать. Только она уже работает. Зажали FN, сказали, отпустили — чистая версия уже в поле ввода.

Приватность и офлайн-режим

Это та зона, где SuperWhisper честно выигрывает, и об этом стоит сказать прямо.

Распознавание SuperWhisper работает на локальной модели Whisper. Ваше аудио не покидает компьютер на этапе перевода речи в текст. Если не включать облачную LLM-полировку, весь процесс остаётся на устройстве. Для пользователей из регулируемых отраслей, в сетях с плохой связью или с жёсткими требованиями к приватности это серьёзная разница.

Voicr использует облачное распознавание и облачную полировку. Аудио уходит на сервер, обрабатывается, и результат возвращается обратно. Режима «только на устройстве» нет. Если вы не можете или не хотите отправлять аудио диктовки на сервер, SuperWhisper — более безопасный выбор, и это должно быть решающим фактором, независимо от всего остального в этом сравнении.

Один нюанс: SuperWhisper исторически по умолчанию сохранял каждую запись аудио на диск — это уже другой аспект приватности (локальное хранение, а не сетевая утечка). Если выбираете SuperWhisper, проверьте текущее поведение в настройках, прежде чем считать, что «локально» автоматически значит «нигде не сохраняется».

Сравнение цен

Цены с витрины — не вся картина, потому что полировка SuperWhisper держится на вашем собственном LLM-ключе. Итоговая стоимость зависит от выбранного провайдера и объёма диктовки.

SuperWhisper

SuperWhisper Free запускает локальный Whisper, но ограничивает вас маленькими моделями (tiny и base) и тремя кастомными режимами. Pro стоит $8.49 в месяц или $84.99 в год — открывает все размеры Whisper, снимает лимит режимов и включает облачную LLM-постобработку. Lifetime по последним данным — $249.99 единоразово. Поверх любого тарифа облачная полировка означает оплату OpenAI, Anthropic, Google или другому провайдеру за каждый запрос.

Voicr

Тариф Free у Voicr — 5 000 слов в месяц, все функции включены, без карты. GO — $3/mo за 20 000 слов. PRO — $10/mo за 100 000 слов. Полировка включена на всех тарифах, отдельного счёта за провайдера ИИ сверху нет.

Для лёгких сценариев оба приложения по факту бесплатны. При тяжёлой ежедневной диктовке арифметика зависит от того, что вы предпочитаете: разовый платёж за SuperWhisper Lifetime плюс ежемесячные расходы на LLM-кредиты — или фиксированную месячную подписку Voicr с уже включённой полировкой. Тариф Free у Voicr ближе к полнофункциональному приложению, чем Free у SuperWhisper: нет ограничения по моделям, нет лимита на кастомные режимы и не нужно отдельно платить провайдеру ИИ, чтобы получить полировку.

Иллюстрация: фиксированная месячная цена Voicr с одной встроенной моделью ИИ против стопки расходов SuperWhisper — отдельная Pro-подписка плюс расходы на BYOK-LLM

Когда SuperWhisper — правильный выбор

Есть реальные сценарии, где SuperWhisper объективно лучше, и тут даже не близко.

Вы на Windows или работаете между Mac и Windows. Voicr — только для Mac на Apple Silicon. Если нужен один инструмент на разных ОС, SuperWhisper закрывает эту задачу.

У вас жёсткое требование к офлайну. Комплаенс, чувствительный контент, конкретная машина без сети. Локальное распознавание Whisper без облачной LLM — самая сильная сторона SuperWhisper.

Вы хотите подключать свою модель. Запускать локальную Llama для полировки, переключаться между GPT и Claude в зависимости от задачи, писать промпты с XML-тегами, как системные промпты. SuperWhisper для этого и сделан. Voicr — нет.

Вам нужна lifetime-цена. Если вы много лет диктуете в больших объёмах, SuperWhisper Lifetime плюс расходы на свой API могут в сумме выйти дешевле фиксированной ежемесячной подписки. Посчитайте.

Когда правильный выбор — Voicr

Сюда попадает большинство обычных маководов, и об этом стоит сказать так же прямо.

Вы не хотите возиться с API-ключами. Хотите, чтобы полировка работала по умолчанию, а не была отдельным шагом настройки.

Хотите одну клавишу, которая делает правильную вещь в каждом приложении. Без переключения режимов, без ручных триггеров — просто FN: в Slack это звучит как Slack, в Mail — как Mail.

Вы на Mac с Apple Silicon и переезжать никуда не собираетесь. Кроссплатформенность не нужна, Windows-машина не ждёт такой же настройки.

Хотите начать за пять минут, а не за пять часов. Установка, разрешения, зажать FN. Дефолтных настроек уже хватает, чтобы пользоваться, а Smart Rules можно подкрутить позже, если захочется поправить тон.

Если этот портрет про вас, Voicr ощущается как версия SuperWhisper, которую кто-то уже настроил за вас. Тот же Whisper, то же качество распознавания. Полировка уже вшита. Понимание контекста приложения встроено в ядро, а не собрано из кастомных режимов.

Честная проверка

Если вы действительно мечетесь между этими двумя, честный тест — продиктовать в обоих один и тот же реальный кусок текста. Не однострочник: возьмите что-то на три-пять предложений, например письмо или ответ в Slack-треде. Говорите естественно — со словами-паразитами и фальстартами, которые обычно правите.

Посмотрите на результат в каждом приложении до того, как что-то трогать. Два вопроса: 1. Текст уже в таком виде, в каком вы бы его отправили? 2. Инструмент понял, в каком приложении вы находитесь?

Если SuperWhisper выдаёт готовый к отправке текст, потому что вы провели выходные, отлаживая кастомные режимы и промпты, — это честный результат, продолжайте им пользоваться. Если же это всё ещё сырая транскрипция, которую надо чистить руками, разница между Voicr и SuperWhisper сводится к разнице между «полировка происходит сама» и «полировку вы когда-нибудь настроите».

Самый быстрый способ это проверить — поставить Voicr, назначить FN как триггер и попробовать то же письмо ещё раз. Если хочется управлять каждым промптом и каждой моделью самостоятельно — берите SuperWhisper. Если хочется зажать клавишу и получить отполированную версию прямо в поле ввода — Voicr ровно об этом.

Другой угол на тот же вопрос — как Voicr смотрится против встроенного инструмента Apple — в разборе Voicr против Apple Dictation.