Voltar ao blog

Voicr Team · 23 de maio de 2026

Como traduzir e transcrever fala em tempo real no Mac

Legendas ao vivo, tradução no dispositivo e ditado com uma tecla em 100 idiomas. Escolha a ferramenta certa para o fluxo de trabalho que você realmente tem.

Como traduzir e transcrever fala em tempo real no Mac

Você está em uma chamada do Zoom com um fornecedor de São Paulo que toda hora escorrega para o português. Ou está assistindo a um keynote de produto japonês e as legendas automáticas não acompanham. Ou pensa em espanhol, mas seu cliente espera e-mails em inglês.

Três problemas completamente diferentes. Todos os três acabam jogados no mesmo balaio de "tradução de fala em tempo real no Mac", e é por isso que a maioria dos guias sobre o tema é confusa. A ferramenta certa depende de qual deles você está tentando resolver de fato.

A Apple lançou o Live Translation no macOS 26 no outono passado. O Whisper ganhou um modelo Turbo que roda em um MacBook Air sem derreter a máquina. As ferramentas de ditado, que antes eram uma bagunça para entusiastas, hoje são realmente boas. Este guia mostra o que está disponível, quando cada opção faz sentido na prática e como configurá-las sem cair na armadilha do vídeo de demonstração.

O que "tempo real" significa de verdade

Antes de escolher a ferramenta, defina o fluxo de trabalho. Existem três sabores distintos de "tempo real" no Mac, e cada um pede um software diferente:

Legendagem ao vivo — outra pessoa está falando e você quer legendas, possivelmente traduzidas, enquanto ela fala. Chamadas, reuniões, aulas, transmissões ao vivo. A latência importa. Um atraso de 4 segundos é incômodo; um atraso de 10 segundos é inútil.

Ditado — você é quem está falando e quer texto limpo em outro idioma no final. E-mails, mensagens no Slack, documentos. A transcrição e a tradução acontecem de uma só vez quando você para de falar. Uma resposta abaixo de um segundo após terminar importa mais do que ver palavras aparecerem em streaming enquanto você fala.

Transcrição de arquivo — você tem uma gravação (exportação do Zoom, memo de voz, podcast) e quer um transcript traduzido. Isso não é exatamente tempo real. Jogue no modelo de maior precisão que encontrar e espere dois minutos.

Confundir os três é como as pessoas acabam usando uma ferramenta de transcrição de reunião para escrever e-mails rápidos, ou tentando legendar um vídeo do YouTube com um app de ditado. Escolha a categoria certa primeiro, depois escolha a ferramenta.

As opções nativas do macOS

Se você está no macOS 26 com um Mac Apple Silicon, a Apple oferece duas ferramentas nativas, além de uma lacuna importante.

Live Translation (macOS 26)

O Live Translation funciona pelo Mensagens, FaceTime e o novo app Telefone para Mac. Ele é movido pela Apple Intelligence e roda no dispositivo, ou seja, nada sai da sua máquina. Em uma chamada do FaceTime, você clica no botão de menu, escolhe Legendas ao Vivo e um transcript traduzido aparece perto do topo da tela.

O porém é a lista de idiomas. Para o Live Translation no FaceTime e no Telefone, a Apple suporta inglês, francês, alemão, português (Brasil) e espanhol (Espanha), com mandarim, italiano, japonês e coreano sendo liberados aos poucos. O Mensagens cobre um conjunto maior, incluindo dinamarquês, holandês, norueguês, sueco, turco e vietnamita.

É gratuito, privado e a latência é boa. Mas só funciona dentro dos próprios apps da Apple. Zoom, Google Meet, huddles do Slack, YouTube — nenhum desses passa pelo Live Translation.

Legendas ao Vivo

Ative as Legendas ao Vivo em Ajustes do Sistema → Acessibilidade → Legendas ao Vivo e você ganha uma janela flutuante que transcreve qualquer áudio que o Mac capte — áudio do sistema, microfone ou ambos. Funciona em qualquer app: Zoom, YouTube, um podcast, um colega falando ao seu lado.

As Legendas ao Vivo transcrevem, mas não traduzem. Também são apenas em inglês até o momento. Se sua reunião é em inglês e você só precisa do texto para acompanhar, essa é a resposta. Se a reunião é em português, as Legendas ao Vivo não ajudam.

Comparação de três fluxos de tradução de fala em tempo real no Mac: legendas ao vivo para reuniões, ditado para escrever e transcrição de arquivos

Legendas e tradução ao vivo para chamadas e vídeos

Quando as ferramentas nativas da Apple não cobrem sua chamada, um pequeno grupo de apps de terceiros preenche a lacuna. Eles capturam o áudio do sistema (o que está tocando pelos alto-falantes do Mac) ou o microfone, transcrevem com um modelo Whisper local e, opcionalmente, traduzem. Os três a seguir rodam no dispositivo, o que importa se você está em uma chamada confidencial.

MacWhisper — Um dos apps mais antigos do Mac nessa área. Legendagem ao vivo com tradução, roda em Whisper e Nvidia Parakeet, suporta captura de áudio do sistema para qualquer ferramenta de reunião. Sólido para Zoom, Meet, Teams. A versão Pro é uma compra única.

Superwhisper — Combina transcrição ao vivo com um fluxo de ditado baseado em Whisper. Suporta mais de 100 idiomas e pode traduzir qualquer um deles para o inglês. Tenta ser tanto uma ferramenta de legendagem quanto de ditado, o que funciona se você quer um único app para os dois, mas significa que o lado do ditado é mais pesado do que o de uma ferramenta dedicada.

Transcrybe — Mais novo, mais enxuto, focado especificamente em tradução em tempo real. Só no dispositivo. A interface é construída em torno de "alguém está falando um idioma que não conheço — me mostre o que ele está dizendo". Bom para viagens, chamadas de suporte e consumo de conteúdo em outro idioma.

Escolha com base em quão frequente é esse cenário. Se você vive em chamadas internacionais, MacWhisper ou Superwhisper merecem um lugar na sua barra de menus. Se só precisa ocasionalmente, o Live Translation da Apple dentro do FaceTime pode ser o suficiente.

Ditar em um idioma e escrever em outro

A necessidade mais comum de "tradução em tempo real" não tem nada a ver com outras pessoas falando. Tem a ver com *você*, pensando no seu idioma nativo, mas precisando do inglês na tela porque é isso que o trabalho exige.

Se você é brasileiro, espanhol, francês ou polonês e escreve muito em inglês no trabalho, conhece o imposto. Você monta a frase na cabeça no seu idioma, traduz mentalmente e digita a tradução. Cada e-mail são dois rascunhos: o que você escreveu na cabeça e o que os seus dedos produziram.

O formato da ferramenta certa aqui é diferente da legendagem ao vivo. Você não precisa de legendas em streaming. Você precisa: segurar uma tecla, falar naturalmente no seu idioma, soltar, e ter um texto polido no idioma de destino caindo na sua área de transferência, pronto para colar em qualquer lugar (Gmail, Slack, Notion, um ticket no Jira).

Essa é a lacuna que o Voicr preenche. Segure FN, fale em qualquer um dos 100 idiomas, defina inglês como destino, e o que é colado é inglês limpo, não a sua transcrição bruta passada por um tradutor separado. A transcrição e a tradução acontecem em um único passo, em vez de fala → transcript → copiar → tradutor → colar. O processo todo leva basicamente o tempo que você leva para falar.

Também existe um modo de detecção automática que identifica o idioma falado pelo próprio áudio, então, se você alterna entre, digamos, português para o Slack pessoal e inglês para o e-mail do cliente, não precisa abrir um seletor. Detalhe pequeno, fácil de passar despercebido numa lista de recursos. A análise mais longa está em Voz para texto em 100 idiomas no Mac.

Transcrever áudio pré-gravado

Se você tem um arquivo (uma gravação do Zoom, um memo de voz, uma entrevista, um podcast), "tempo real" não é o enquadramento certo. Jogue o arquivo em uma ferramenta baseada em Whisper que rode em qualidade máxima e deixe levar dois minutos. O que importa é a precisão.

MacWhisper e Whisper Transcription dão conta disso muito bem. A própria API da OpenAI também, se você está confortável com um script. Para tradução especificamente, vale notar que a tradução nativa do Whisper só vai em uma direção: qualquer idioma → inglês. Se você precisa do caminho contrário (inglês → japonês, por exemplo), rode o transcript em um modelo de tradução separado depois, como Claude, GPT ou DeepL.

Pule esta seção se sua entrada é sempre ao vivo. Mas, se você grava entrevistas ou puxa transcrições de reuniões antigas, o fluxo offline continua mais barato, mais preciso e mais fácil de corrigir do que o streaming.

Como escolher a configuração certa para o seu fluxo

Uma árvore de decisão rápida:

1. Quero legendas durante uma conversa no FaceTime ou no Mensagens → Apple Live Translation. Grátis, nativo, no dispositivo. 2. Quero legendas durante uma chamada de Zoom/Meet/Teams em um idioma que não falo → MacWhisper, Superwhisper ou Transcrybe. Escolha um. 3. Quero ditar no meu idioma nativo e receber o texto em inglês para colar em qualquer lugar → Uma ferramenta de ditado de uma tecla, como o Voicr. Esse é o caso do dia a dia para profissionais bilíngues. 4. Quero transcrever um arquivo gravado em outro idioma e receber em inglês → MacWhisper ou qualquer app de desktop baseado em Whisper. Offline, modelo de qualidade máxima, dois minutos de espera.

A maioria das pessoas termina com duas ferramentas, não uma: algo para legendas ao vivo quando precisa (ocasionalmente) e algo para o ditado do dia a dia (o tempo todo). Essa divisão é normal. Uma ferramenta de legendagem e uma de ditado otimizam coisas diferentes, e tentar fazer uma só dar conta das duas geralmente significa fazer as duas pior.

Ajustando as expectativas

Alguns pontos que todo vídeo de demonstração passa por cima, e que vale conhecer antes de se comprometer:

A latência é real. Mesmo o Whisper no dispositivo tem 1 a 3 segundos de atraso para legendas ao vivo. Ferramentas na nuvem somam mais 1 a 2 segundos. Conte com isso. Não tente usar legendagem ao vivo para acompanhar um debate político acelerado, você vai ficar para trás.

A qualidade da tradução cai fora dos 10 principais idiomas. O próprio Whisper é excelente para inglês, espanhol, francês, alemão, português, italiano, mandarim e japonês. Fica visivelmente mais fraco em tailandês, cantonês, vietnamita e na maioria das línguas africanas. Se o seu idioma está na cauda longa, teste antes de depender dele.

A captura de áudio do sistema exige permissão. O macOS não deixa um app ouvir o áudio do sistema por padrão. Toda ferramenta na categoria de legendagem ao vivo vai te guiar para conceder a permissão de Gravação de Tela ou de loopback de áudio na primeira vez. Isso é normal. É também por isso que alguns apps exigem a instalação única de um dispositivo de áudio virtual.

A privacidade varia. As ferramentas da Apple e a maior parte dos apps baseados em Whisper rodam totalmente no dispositivo. Qualquer coisa que mande áudio para uma API na nuvem (algumas ferramentas de "assistente de reunião com IA") está fazendo uma troca diferente. Se você atua em jurídico, saúde ou qualquer área regulada, confira antes de ligar uma ferramenta em uma chamada com cliente.

Um profissional bilíngue falando no idioma nativo enquanto um texto limpo em inglês aparece no rascunho de um e-mail no Mac

Um ponto de partida prático

O lugar mais fácil para começar, qualquer que seja o seu objetivo final, é escolher o único caso de uso que você mais encontra nesta semana. Não o raro. O do dia a dia.

Se você passa por muitas reuniões internacionais, instale uma ferramenta de legendagem ao vivo, deixe-a na barra de menus e use por duas semanas antes de decidir. Se você escreve muito em inglês enquanto pensa em outro idioma, tente substituir os próximos dez e-mails que normalmente digitaria por ditado no seu idioma nativo e deixe a ferramenta produzir o inglês.

O Voicr cuida especificamente do caso do ditado. Segure FN, fale no seu idioma, defina inglês como destino, cole onde quiser. Existe um plano Free (5.000 palavras por mês, sem cartão de crédito) suficiente para descobrir se o fluxo realmente combina com a forma como você escreve. Para o caso da legendagem ao vivo, o MacWhisper tem uma versão grátis com o modelo Whisper básico, suficiente para testar a experiência antes de pagar.

A tecnologia deixou de ser o gargalo há um bom tempo. A pergunta interessante agora é qual fluxo você de fato configura e usa, e isso passa por escolher a ferramenta certa para o atrito específico que você continua encontrando. Para mais sobre o lado do ditado, Como o ditado por voz no Mac realmente funciona percorre o que acontece entre a sua voz e o texto polido na sua área de transferência.