Назад к блогу

Voicr Team · 23 мая 2026 г.

Как переводить и расшифровывать речь в реальном времени на Mac

Живые субтитры, перевод на устройстве и диктовка одной клавишей на 100 языках. Подбираем инструмент под реальный сценарий.

Как переводить и расшифровывать речь в реальном времени на Mac

Вы на Zoom-созвоне с поставщиком из Сан-Паулу, который то и дело переходит на португальский. Или смотрите японскую презентацию продукта, а автосубтитры безнадёжно отстают. Или думаете по-русски, но клиент ждёт писем на английском.

Три совершенно разные задачи. Все три скопом валят в "перевод речи в реальном времени на Mac", и именно поэтому большинство гайдов на эту тему сбивают с толку. Правильный инструмент зависит от того, какую именно задачу вы пытаетесь решить.

Apple выпустила Live Translation в macOS 26 прошлой осенью. У Whisper появилась модель Turbo, которая работает на MacBook Air без перегрева. Инструменты диктовки, которые раньше были любительским месивом, теперь действительно хороши. В этом гайде разберём, что есть на рынке, когда каждый вариант реально подходит и как его настроить, не попавшись в ловушку демо-роликов.

Что на самом деле значит "реальное время"

Прежде чем выбирать инструмент, назовите сценарий. На Mac есть три разных вкуса "реального времени", и под каждый нужен свой софт:

Живые субтитры — говорит кто-то другой, а вам нужны субтитры, возможно с переводом, прямо по ходу речи. Звонки, встречи, лекции, стримы. Задержка критична. 4 секунды раздражают; 10 секунд бесполезны.

Диктовка — говорите вы сами, и вам нужен чистый текст на другом языке в конце. Письма, сообщения в Slack, документы. Расшифровка и перевод происходят одним махом, когда вы заканчиваете говорить. Важнее, чтобы отклик был мгновенным после остановки, а не чтобы слова бежали по экрану в процессе.

Расшифровка файлов — у вас есть запись (экспорт из Zoom, голосовая заметка, подкаст), и вам нужна переведённая расшифровка. На самом деле это не реальное время. Скармливаете самой точной модели, какую найдёте, и ждёте пару минут.

Путаница между этими тремя — причина, по которой люди пишут короткие письма через инструмент для расшифровки встреч или пытаются субтитровать YouTube приложением для диктовки. Сначала выберите категорию, потом инструмент.

Встроенные возможности macOS

Если у вас macOS 26 на Mac с Apple Silicon, Apple даёт два встроенных инструмента — и один важный пробел.

Live Translation (macOS 26)

Live Translation работает в Messages, FaceTime и новом приложении Phone для Mac. Движок — Apple Intelligence, всё крутится на устройстве, так что ничего не уходит наружу. В звонке FaceTime жмёте кнопку меню, выбираете Live Captions, и переведённая расшифровка появляется у верхнего края экрана.

Загвоздка — в списке языков. Для Live Translation в FaceTime и Phone Apple поддерживает английский, французский, немецкий, португальский (Бразилия) и испанский (Испания), а мандаринский, итальянский, японский и корейский постепенно подключаются. В Messages список шире и включает датский, нидерландский, норвежский, шведский, турецкий и вьетнамский.

Бесплатно, приватно, задержка приятная. И работает только внутри собственных приложений Apple. Zoom, Google Meet, голосовые в Slack, YouTube — ничего из этого через Live Translation не идёт.

Live Captions

Включите Live Captions в System Settings → Accessibility → Live Captions, и получите плавающее окно, которое расшифровывает любой звук, до которого дотягивается Mac — системный звук, микрофон или оба сразу. Работает в любом приложении: Zoom, YouTube, подкаст, коллега рядом с вами.

Live Captions расшифровывают, но не переводят. И на момент написания работают только с английским. Если встреча на английском и вам просто нужен текст для опоры, это решение. Если встреча на португальском, Live Captions не помогут.

Сравнение трёх сценариев перевода речи в реальном времени на Mac: живые субтитры для встреч, диктовка для письма и расшифровка файлов

Живые субтитры и перевод для звонков и видео

Когда встроенные инструменты Apple не покрывают ваш звонок, пробел закрывает небольшая группа сторонних приложений. Они подключаются к системному звуку (тому, что играет через динамики Mac) или микрофону, расшифровывают локальной моделью Whisper и при необходимости переводят. Все три ниже работают на устройстве, что важно, если вы на конфиденциальном звонке.

MacWhisper — одно из старейших Mac-приложений в этой нише. Живые субтитры с переводом, под капотом Whisper и Nvidia Parakeet, поддерживает захват системного звука для любого инструмента видеосвязи. Надёжно с Zoom, Meet, Teams. Pro-версия — единоразовая покупка.

Superwhisper — сочетает живую расшифровку с диктовкой на основе Whisper. Поддерживает 100+ языков и умеет переводить любой из них на английский. Старается быть и инструментом субтитров, и инструментом диктовки одновременно — годится, если хочется одно приложение на оба сценария, но диктовочная часть тяжеловеснее, чем у специализированного решения.

Transcrybe — поновее, легче, заточен именно под перевод в реальном времени. Только на устройстве. Интерфейс построен вокруг идеи "кто-то говорит на языке, которого я не знаю — покажи мне, о чём речь". Подходит для путешествий, звонков в поддержку, просмотра контента на иностранных языках.

Выбирайте по тому, как часто вы попадаете в такой сценарий. Если живёте в международных звонках, MacWhisper или Superwhisper заслужат место в строке меню. Если нужно лишь изредка, Apple Live Translation в FaceTime может оказаться достаточно.

Диктовать на одном языке, писать на другом

Самая частая потребность в "переводе реального времени" не имеет отношения к чужой речи. Речь о *вас* — вы думаете на родном языке, а на странице нужен английский, потому что этого ждёт работа.

Если вы русскоязычный, испаноязычный или польскоязычный специалист, который много пишет по-английски, вы знаете этот налог. Сначала собираете фразу в голове на своём языке, мысленно переводите, потом печатаете перевод. Каждое письмо — два черновика: один в голове, другой на пальцах.

Подходящий инструмент здесь устроен иначе, чем для живых субтитров. Стриминговые подписи не нужны. Нужно: зажать одну клавишу, спокойно говорить на своём языке, отпустить — и в буфере оказывается чистый текст на целевом языке, готовый к вставке куда угодно (Gmail, Slack, Notion, тикет в Jira).

Именно этот пробел закрывает Voicr. Зажимаете FN, говорите на любом из 100 языков, ставите английский целевым — и вставляется чистый английский, а не сырая расшифровка, прогнанная через отдельный переводчик. Расшифровка и перевод происходят одним шагом вместо цепочки речь → расшифровка → копирование → переводчик → вставка. Уходит примерно столько же времени, сколько на саму речь.

Есть и режим Auto-detect, который сам определяет язык речи по аудио — так что если вы переключаетесь, скажем, между испанским в личном Slack и английским в письмах клиентам, не нужно лезть в переключатель. Мелочь, которую легко проглядеть в списке функций. Подробный разбор — в Voice-to-Text in 100 Languages on Mac.

Расшифровка готовых записей

Если у вас уже есть файл (запись Zoom, голосовая заметка, интервью, подкаст), "реальное время" — неподходящая рамка. Скармливайте файл инструменту на базе Whisper на полном качестве и дайте ему пару минут. Здесь важна точность.

MacWhisper и Whisper Transcription оба отлично с этим справляются. Как и OpenAI API напрямую, если вам комфортно со скриптами. По переводу нюанс: встроенный перевод Whisper работает только в одну сторону — любой язык → английский. Если нужно в обратную (например, английский → японский), прогоняйте расшифровку через отдельную переводческую модель — Claude, GPT или DeepL.

Пропустите этот раздел, если у вас всё всегда вживую. Но если вы записываете интервью или достаёте расшифровки со старых встреч, офлайн-сценарий остаётся дешевле, точнее и проще в правке, чем стриминг.

Подбираем связку под свой сценарий

Короткое дерево решений:

1. Нужны субтитры в разговоре по FaceTime или Messages → Apple Live Translation. Бесплатно, встроено, на устройстве. 2. Нужны субтитры в звонке Zoom/Meet/Teams на языке, которого вы не знаете → MacWhisper, Superwhisper или Transcrybe. Выберите одно. 3. Хочу диктовать на родном языке и получать английский текст для вставки куда угодно → инструмент диктовки с одной клавишей вроде Voicr. Это рабочий сценарий двуязычных профессионалов. 4. Нужно расшифровать запись на другом языке и получить английский → MacWhisper или любое настольное приложение на базе Whisper. Офлайн, полноразмерная модель, ожидание пару минут.

У большинства в итоге оказывается не один инструмент, а два: один для живых субтитров, когда надо (изредка), и второй для ежедневной диктовки (постоянно). Такое разделение нормально. Инструмент субтитров и инструмент диктовки оптимизированы под разное, и попытка заставить один тянуть оба обычно означает, что оба тянутся хуже.

Реалистичные ожидания

Несколько вещей, о которых демо-ролики молчат, но знать стоит до того, как вкладываться:

Задержка реальна. Даже Whisper на устройстве даёт 1–3 секунды задержки на живых субтитрах. Облачные инструменты добавляют ещё 1–2 секунды. Закладывайте это. Не пытайтесь сопровождать живыми субтитрами быстрые политические дебаты, отстанете.

Качество перевода падает за пределами топ-10 языков. Whisper отлично справляется с английским, испанским, французским, немецким, португальским, итальянским, мандаринским и японским. Заметно слабее на тайском, кантонском, вьетнамском и большинстве африканских языков. Если ваш язык на длинном хвосте, проверьте, прежде чем на него полагаться.

Захвату системного звука нужно разрешение. По умолчанию macOS не пускает приложение к системному звуку. Любой инструмент из категории живых субтитров проведёт вас через выдачу разрешения Screen Recording или аудио-loopback при первом запуске. Это нормально. Это же причина, по которой некоторые приложения требуют разово установить виртуальное аудио-устройство.

Приватность бывает разной. Инструменты Apple и большинство приложений на базе Whisper работают полностью на устройстве. Всё, что отправляет аудио в облачный API (часть "AI-помощников встреч"), делает другой компромисс. Если вы в юриспруденции, медицине или другой регулируемой сфере, проверьте всё до того, как включить инструмент в звонке с клиентом.

Двуязычный специалист говорит на родном языке, а в черновике письма на Mac появляется чистый английский текст

С чего начать на практике

Проще всего, какова бы ни была конечная цель, выбрать один сценарий, в который вы попадаете чаще всего на этой неделе. Не редкий. Ежедневный.

Если у вас много международных встреч, поставьте один инструмент живых субтитров, оставьте в строке меню и пользуйтесь две недели, прежде чем решать. Если много пишете по-английски, думая на другом языке, попробуйте заменить ближайшие десять писем, которые обычно бы напечатали, диктовкой на родном языке — а инструмент пусть выдаёт английский.

Voicr закрывает именно сценарий диктовки. Зажимаете FN, говорите на своём языке, ставите английский целевым, вставляете куда угодно. Есть Free-тариф (5 000 слов в месяц, без карты), которого хватит, чтобы понять, ложится ли подход на вашу манеру писать. Для сценария живых субтитров у MacWhisper есть бесплатная версия с базовой моделью Whisper — достаточно, чтобы попробовать, прежде чем платить.

Технология перестала быть узким местом уже давно. Интересный вопрос теперь — какой именно сценарий вы реально настроите и в который реально втянетесь, и сводится он к подбору правильного инструмента под конкретное трение, в которое вы постоянно упираетесь. Подробнее о стороне диктовки — в How Voice Dictation on Mac Actually Works, где разбирается, что происходит между вашим голосом и отполированным текстом в буфере обмена.