Voltar ao blog

Voicr Team · 13 de maio de 2026

Voicr vs SuperWhisper: comparativo lado a lado

Dois apps de ditado por IA, duas filosofias opostas. Um entrega um framework configurável. O outro entrega um fluxo já definido. Veja qual combina com cada perfil.

Voicr vs SuperWhisper: comparativo lado a lado

Você abre a App Store, pesquisa "ditado por IA para Mac" e os dois nomes que insistem em aparecer são Voicr e SuperWhisper. Os screenshots são parecidos. As listas de recursos se sobrepõem. Os dois prometem texto bem acabado a partir da sua voz.

Instale os dois por dez minutos e a diferença salta aos olhos. Um pede que você escolha o tamanho do modelo Whisper, configure um modo personalizado, cole uma chave de API do seu LLM preferido e marque o prompt com XML. O outro só pede que você segure uma tecla e comece a falar.

Nenhuma das abordagens está errada. Cada uma foi pensada para um tipo de pessoa. Aqui vai um comparativo honesto, lado a lado, mostrando onde Voicr e SuperWhisper se separam e qual deles cai bem para cada perfil de usuário de Mac.

A versão curta

Se você não quiser ler o resto: - SuperWhisper é para quem gosta de ajustar tudo: controle total sobre o modelo, o prompt e o provedor de IA. Boa história offline. Superfície de configuração íngreme. Disponível em Mac, Windows e iOS. - Voicr é para quem usa Mac e quer o polimento e as regras por app já entregues prontos. Segure FN, fale, solte, cole. Sem seletor de modelo. Sem chaves BYOK. Só Apple Silicon. - Os dois transcrevem com Whisper. Os dois suportam 100 idiomas. A diferença está em quanta configuração eles esperam de você.

Para que o SuperWhisper foi feito

O SuperWhisper é um framework configurável. Modelos Whisper locais para a transcrição, LLMs na nuvem opcionais para o pós-processamento e um sistema de Custom Modes em que você define exatamente como cada tarefa deve funcionar.

Os Custom Modes são o recurso principal. Você pode criar um modo para e-mails, outro para notas de reunião, outro para comentários de código e um quarto para o Slack. Cada modo tem prompt próprio, regras de formatação próprias e um provedor de IA próprio. Dá para conectar OpenAI, Anthropic, Google, Mistral, Groq ou um Llama local, dependendo do modo que está rodando. A documentação deles recomenda tags XML para qualquer prompt com mais de algumas linhas.

Transcrição local-first. O SuperWhisper baixa os modelos Whisper para a sua máquina. Tiny, base, small, medium, large-v3 e large-v3-turbo estão todos disponíveis, com os maiores trancados no plano Pro. Em Apple Silicon, o large-v3-turbo roda localmente com acurácia excelente. O áudio não sai do laptop na etapa de transcrição. A empresa é certificada SOC 2 Type II e compatível com HIPAA, o que facilita a vida em revisões de segurança corporativas.

Multiplataforma. O SuperWhisper roda em macOS, Windows e iOS com uma única licença. Se você divide o dia entre um MacBook e um desktop Windows, isso é uma vantagem real.

Preço vitalício. Um pagamento único ($249.99 no momento desta publicação, embora o preço tenha oscilado em 2026) garante acesso para sempre. Para quem dita pesado todo dia, essa conta supera a maioria das assinaturas a partir do segundo ano.

O custo de todo esse poder é que a tela de configurações é densa. Várias resenhas comparam o onboarding a "configurar um servidor" — escolher o tamanho certo do modelo, decidir qual provedor de LLM usar em cada modo, escrever os prompts, ajustar os atalhos de teclado. Depois de afinado, fica poderoso. Afinar leva um fim de semana.

Para que o Voicr foi feito

O Voicr parte do extremo oposto. A maior parte das pessoas não quer montar a própria ferramenta de ditado. Quer instalar algo que já entregue um texto bem polido, no tom que o app daquele momento exige, com uma única tecla.

Segure FN em qualquer lugar do macOS. O Voicr captura o áudio, transcreve com Whisper large-v3-turbo, passa por uma camada de polimento por IA e cola o resultado já tratado no campo em que você já estava digitando. Nenhuma janela abre. Nenhum pulo pelo clipboard. Nenhum app para alternar.

O polimento já vem feito. O Voicr chega com toda a fiação de IA pronta — sem chaves de API, sem escolha de provedor, sem engenharia de prompt. Você não decide qual modelo reescreve sua fala. O app decide, com um estilo de polimento pensado para soar como se você tivesse sentado e digitado com calma.

As Smart Rules resolvem o problema do "texto certo para cada app" sem te obrigar a montar modos na mão. Você atribui um estilo de escrita a cada app — informal para Slack, formal para Mail, técnico para o VSCode, notas cruas para o Apple Notes — e o Voicr detecta qual app está ativo e aplica o estilo certo automaticamente. Há uma interface para editar as regras. Não há XML, nem sintaxe de prompt para aprender.

O Pure Dictation Mode é uma alternativa de um clique para quando você quer transcrição crua, com pontuação correta e sem reescrita por IA. Citações, anotações cruas, captura literal.

A detecção automática de idioma identifica a língua falada no seu áudio entre 100 idiomas. Defina o idioma de saída como inglês e o Voicr traduz enquanto transcreve. Pense em espanhol, escreva em inglês, em um único toque.

O trade-off é o inverso do SuperWhisper. O Voicr é opinativo. Você recebe o polimento que o time considera bom. Dá para editar os prompts das Smart Rules se quiser ajustar o tom, mas você não escolhe o modelo por baixo nem roda um Llama local. E ele é exclusivo de Mac com Apple Silicon — sem Windows, sem iOS.

Onde a experiência se separa

Três cenários rápidos.

Primeira configuração

SuperWhisper: instalar, baixar um modelo Whisper (decidir o tamanho — tiny, base, small, medium, large-v3-turbo, large-v3 — conforme seu hardware e a acurácia desejada), abrir as configurações, escolher um modo padrão, decidir se quer polimento via LLM na nuvem, colar uma chave de API da OpenAI ou da Anthropic, escrever ou importar um prompt personalizado, configurar as teclas de atalho e testar. Reserve uma noite.

Voicr: instalar, conceder permissões de microfone e acessibilidade, segurar FN e falar. As Smart Rules já vêm pré-configuradas para os apps mais comuns. Reserve dois minutos.

Mandar uma mensagem no Slack e um e-mail em sequência

SuperWhisper: se você criou dois custom modes (um para Slack, outro para Mail), ou alterna entre eles manualmente com atalhos diferentes, ou conta com o Super Mode para detectar o app e escolher o prompt certo. De qualquer jeito, os modos precisaram existir antes.

Voicr: segure FN no Slack e receba a versão informal. Segure FN no Mail e receba a versão de e-mail. Mesma tecla, saídas diferentes, porque as Smart Rules já sabem em qual app você está.

Polir o resultado

SuperWhisper: o passo de polimento por IA só roda se você tiver configurado um LLM. Os modelos Whisper locais entregam uma transcrição crua por padrão; reescrever exige trazer sua própria chave de API e pagar o provedor de LLM por uso. Várias resenhas de usuários apontam que as transcrições ainda precisam de limpeza manual, a menos que você se dê ao trabalho de montar essa parte.

Voicr: o polimento já vem ligado. Vícios de linguagem removidos, gramática corrigida, estrutura mais enxuta. Você não paga uma conta de API separada. Se preferir saída crua, o Pure Dictation Mode está a um toque de distância.

Ilustração lado a lado do painel de configurações do SuperWhisper cheio de opções de modelo e prompt versus o gesto único de segurar FN do Voicr com o resultado já polido

Se você vem ditando no SuperWhisper e suas transcrições ainda saem cruas porque você não chegou a configurar Custom Modes e uma chave de API, o polimento do Voicr é justamente a parte que você ia configurar mais tarde. Só que já está pronta. Segure FN, fale, solte — a versão limpa aparece no campo.

Privacidade e modo offline

Essa é a área em que o SuperWhisper ganha de verdade, e vale ser honesto sobre isso.

A transcrição do SuperWhisper roda em um modelo Whisper local. O seu áudio não sai da máquina no passo de speech-to-text. Se você não ativar o polimento por LLM na nuvem, o fluxo inteiro fica no dispositivo. Para quem está em setores regulados, em redes instáveis ou com preferências de privacidade rígidas, isso faz uma diferença real.

O Voicr usa transcrição na nuvem e polimento na nuvem. O áudio é enviado a um servidor, processado, e o resultado volta. Não existe um modo só local. Se você não pode, ou não quer, mandar áudio de ditado para um servidor, o SuperWhisper é a escolha mais segura — e isso deveria ser o fator decisivo, independentemente de qualquer outro ponto desta comparação.

Uma observação: o SuperWhisper historicamente salva todas as gravações de áudio em disco por padrão, o que é um eixo de privacidade diferente (persistência local em vez de exposição à rede). Se for pelo caminho do SuperWhisper, vale conferir o comportamento atual nas configurações antes de assumir que "on-device" significa "não gravado".

Comparando os preços

O preço de tabela não conta a história inteira aqui, porque o polimento do SuperWhisper depende de você trazer a sua própria chave de LLM. O custo total depende do provedor que você conectar e do quanto você dita.

SuperWhisper

O SuperWhisper Free roda o Whisper local, mas te limita aos modelos pequenos (tiny e base) e a três custom modes. O Pro custa $8.49/month ou $84.99/year, desbloqueia todos os tamanhos de modelo Whisper, remove o teto de modos e libera o pós-processamento por LLM na nuvem. O vitalício está em $249.99 em pagamento único, segundo a listagem mais recente. Em cima de qualquer plano, o polimento na nuvem implica pagar OpenAI, Anthropic, Google ou o provedor que você conectar, por requisição.

Voicr

O plano Free do Voicr oferece 5.000 palavras/mês com todas as funcionalidades inclusas e sem cartão de crédito. O GO é $3/mo por 20.000 palavras. O PRO é $10/mo por 100.000 palavras. O polimento está incluso em todos os planos, então não há uma conta separada de provedor de IA por cima.

Para uso leve, os dois apps são, na prática, gratuitos. Para ditado pesado no dia a dia, a conta depende de você preferir pagar uma vez pelo SuperWhisper Lifetime mais os créditos contínuos do LLM, ou uma assinatura mensal fixa do Voicr com o polimento já incluído. O Free do Voicr está mais perto do app completo do que o Free do SuperWhisper — sem trancar modelos, sem teto de custom modes e sem precisar pagar um provedor de IA à parte para ter polimento.

Ilustração comparando o preço mensal único do Voicr com IA inclusa ao stack de preços do SuperWhisper, com assinatura Pro separada e custos de LLM BYOK

Quando o SuperWhisper é a escolha certa

Há cenários reais em que o SuperWhisper é a ferramenta melhor, e nem está perto.

Você usa Windows ou divide o dia entre Mac e Windows. O Voicr só roda em Mac com Apple Silicon. Se você precisa de um app único cruzando sistemas operacionais, o SuperWhisper cobre isso.

Você tem uma exigência dura de offline. Compliance, conteúdo sensível, máquina sem rede. Transcrição com Whisper local e sem LLM na nuvem é o ponto mais forte do SuperWhisper.

Você quer trazer o seu próprio modelo. Rodar um Llama local para polir, alternar entre GPT e Claude por tarefa, escrever prompts com tags XML do jeito que você escreveria um system prompt. O SuperWhisper foi feito para isso. O Voicr, não.

Você prefere pagamento vitalício. Se você dita pesado por anos, o SuperWhisper Lifetime mais o seu gasto de API podem sair mais baratos do que uma assinatura mensal fixa. Vale fazer a conta.

Quando o Voicr é a escolha certa

A maior parte dos usuários de Mac no dia a dia cai aqui, e vale ser igualmente direto sobre o porquê.

Você não quer gerenciar chaves de API. Você quer que o polimento já venha ligado, e não como um passo de configuração.

Você quer uma única tecla que faça a coisa certa em cada app. Sem trocar de modo, sem disparo manual — só FN: no Slack soa como Slack, no Mail soa como Mail.

Você está num Mac com Apple Silicon e vai continuar lá. Sem demanda multiplataforma, sem máquina Windows esperando a mesma configuração.

Você quer começar em cinco minutos, não em cinco horas. Instalar, conceder permissões, segurar FN. Os defaults já estão bons para usar de imediato, e você pode afinar as Smart Rules depois se quiser ajustar o tom.

Se esse perfil bate, o Voicr vai parecer a versão do SuperWhisper que alguém já configurou para você. Mesma qualidade de transcrição com Whisper. Polimento já ligado. Consciência por app embutida no núcleo, sem precisar montar custom modes.

O teste honesto

Se você está genuinamente dividido entre os dois, o teste justo é ditar a mesma peça de escrita real nos dois apps. Nada de uma frase só — escolha algo com três a cinco frases, como um e-mail ou uma resposta de thread no Slack. Fale naturalmente, com os vícios de linguagem e os falsos começos que você normalmente editaria.

Olhe o resultado em cada app antes de mexer em qualquer coisa. Duas perguntas: 1. O texto já está num estado em que você enviaria? 2. A ferramenta sabia em qual app você estava?

Se o resultado do SuperWhisper já está pronto para enviar porque você passou um fim de semana afinando custom modes e prompts, isso é um desfecho real — siga usando. Se ainda for uma transcrição crua para limpar, a diferença entre Voicr e SuperWhisper é, no fundo, a diferença entre "o polimento acontece sozinho" e "em algum momento você vai configurar o polimento".

O jeito mais rápido de descobrir é instalar o Voicr, definir FN como gatilho e tentar o mesmo e-mail de novo. Se você prefere controlar cada prompt e cada modelo, o SuperWhisper é a ferramenta melhor. Se prefere segurar uma tecla e ver a versão polida cair direto no campo, o Voicr é o que você veio buscar.

Para um ângulo diferente da mesma questão — como o Voicr se compara à ferramenta nativa da Apple — veja o comparativo Voicr vs Apple Dictation.