Voltar ao blog

Voicr Team · 23 de maio de 2026

Voz para texto em 100 idiomas no Mac: guia completo

Como funciona o ditado multilíngue no Mac em 2026, o panorama das 100 línguas, detecção automática vs. seletor manual e fluxos bilíngues reais.

Voz para texto em 100 idiomas no Mac: guia completo

Você começa um e-mail em inglês, troca para espanhol para mandar um recado rápido a um colega em Madri e depois responde no Slack em francês. Três apps, três idiomas, dez minutos. Metade do tempo são seus dedos; a outra metade é o menu de idiomas do ditado do Mac.

Se você fala mais de um idioma, o ditado integrado da Apple parece feito para quem só fala um. Você escolhe o idioma, dita e depois mergulha nos Ajustes do Sistema ou clica num menuzinho perto do cursor para trocar. Se errar a troca, seu francês vira uma bagunça em inglês.

Alguma coisa mudou silenciosamente no último ano. Um punhado de apps para Mac agora transcreve e refina sua fala em cerca de 100 idiomas, com detecção automática que descobre o que você está falando sem você encostar em um menu. Este guia explica exatamente o que isso significa em 2026, quais idiomas estão realmente cobertos, onde a ferramenta da Apple deixa de servir e como montar um fluxo de ditado multilíngue que não quebra toda vez que você muda de língua.

O que "100 idiomas no Mac" significa de verdade em 2026

O número de 100 idiomas que você vê nos sites desses apps não é jogada de marketing. Vem de um modelo específico: o Whisper, da OpenAI, treinado com cerca de 680.000 horas de áudio multilíngue. A variante atual mais usada, a large-v3-turbo, suporta 99 idiomas, número que a maioria dos apps arredonda para "100".

Aqui vai uma lista resumida do que está coberto. Todo o conjunto europeu, incluindo nórdicos e eslavos. Os principais idiomas asiáticos: mandarim, japonês, coreano, vietnamita, tailandês, indonésio, tagalo, malaio. Sul-asiáticos: hindi, bengali, tâmil, urdu, marata, nepali. Do Oriente Médio: árabe, hebraico, persa, turco, azerbaijano. Africanos: suaíli, africâner. E menos óbvios como galês, maori, bielorrusso, macedônio, cazaque e birmanês.

A qualidade não é igual em toda a lista. Inglês, espanhol, francês, alemão, italiano, português, holandês, japonês e mandarim ficam no topo: taxas de erro por palavra de cerca de 4–8% em áudio limpo. Idiomas menos comuns e com poucos dados de treino, como galês ou maori, podem chegar a 15–25%. Ainda útil, só não tão tolerante.

A mudança maior: tudo isso agora roda em um Mac comum. O Apple Silicon chegou ao ponto em que o modelo grande do Whisper transcreve um trecho de 30 segundos em menos de dois segundos, localmente, sem ida e volta para a nuvem. É por isso que tantos apps para Mac de repente parecem iguais. Todos são construídos sobre o mesmo modelo.

Onde o ditado integrado da Apple bate no teto

O Apple Dictation existe desde 2012 e é gratuito. Para um idioma só, em um app só, dá conta. Para trabalho multilíngue, três coisas atrapalham o fluxo.

Quantidade de idiomas. A Apple suporta algo entre 50 e 60 idiomas e dialetos, dependendo da versão do macOS. Razoável para os grandes mercados europeus e asiáticos, mas você pode ficar na mão se precisar de ucraniano, tagalo ou galês, ou quiser dialetos mais específicos além dos poucos que a Apple oferece.

Sem detecção automática de idioma. O Apple Dictation usa o último idioma que você selecionou. Esqueça de trocar e seu francês passa pelo modelo de inglês e sai como um amontoado sem sentido que mais ou menos rima com o que você falou. Para mudar de idioma, você clica no indicador minúsculo perto do cursor e escolhe na lista. Cada troca é um passo manual.

Transcrição crua, sem polimento. O que você fala é o que sai, incluindo "hum", "tipo", recomeços e a frase pela metade que você começou antes de mudar de ideia. É chato em um idioma só, e pior no trabalho multilíngue, em que você tende a falar com mais cautela para manter o modelo na linha.

Se você só dita em inglês e não se importa de arrumar depois, a ferramenta da Apple resolve. Na hora em que precisa de um segundo idioma, ou quer um texto que possa colar sem reler, já passou do limite dela.

Como o Whisper lida com 100 idiomas por baixo do capô

Ajuda saber, mesmo que por cima, o que acontece quando você segura uma tecla e fala, porque isso explica por que algumas coisas funcionam e outras não.

O Whisper é uma única rede neural treinada com áudio em 99 idiomas. Em vez de rodar um modelo diferente para cada idioma, ele aprendeu a reconhecer todos de uma vez. Esse treino compartilhado faz algo útil: uma frase em italiano e uma em português compartilham características acústicas suficientes para que aprender uma ajude com a outra. A contrapartida é que todos os idiomas competem pela mesma capacidade do modelo, então os mais raros saem mais fracos.

Ilustração da fala em diferentes idiomas entrando em um único modelo de transcrição e saindo como texto refinado

Quando o áudio entra, o modelo faz três coisas em uma única passagem: 1. Prevê o idioma a partir dos primeiros segundos de áudio. 2. Transcreve as palavras. 3. Adiciona pontuação e capitalização.

A detecção de idioma é o que torna o modo automático possível. O modelo aprendeu a reconhecer qual idioma soa como qual. Em geral, ele acerta em um ou dois segundos depois que você começa a falar. Onde tropeça: enunciados muito curtos (uma ou duas palavras), idiomas que dividem muito vocabulário (espanhol e italiano, norueguês e sueco) e troca no meio da frase. O Whisper foi feito para detectar um idioma por trecho, não para acompanhar você pulando entre dois.

Se quiser entender a mecânica completa de como a fala bruta vira texto limpo, o pipeline de ditado por voz com IA percorre cada etapa.

Detecção automática vs. seletor manual: quando cada um ganha

Os apps modernos de ditado multilíngue te dão dois modos. Saber quando usar cada um é a diferença entre fluido e frustrante.

Use detecção automática quando:

Você troca de idioma várias vezes ao longo do dia, mas mantém um idioma por gravação. É um dev em Berlim que escreve comentários de código em inglês e mensagens no Slack em alemão. É um jornalista trabalhando com fontes em inglês e japonês. Atende tíquetes de suporte em quatro idiomas. Em todos esses casos, cada gravação individual é em um idioma; o que muda é qual. A detecção automática te poupa a caça ao menu toda vez.

Use a escolha manual de idioma quando:

Você trabalha com idiomas menos comuns, em que a detecção é mais instável (galês, maori, bielorrusso). Está ditando em ambiente barulhento, em que o primeiro segundo de áudio pode ser som ambiente em vez de fala. Está ditando enunciados curtos sem áudio suficiente para detecção. Ou está usando um idioma que se sobrepõe a outro que o modelo conhece bem (às vezes ele chuta português quando você quis galego, por exemplo).

O que ainda não funciona bem:

Alternância de código no meio da frase. Se você começa em espanhol e solta um nome de marca em inglês no meio, o modelo dá conta. Se você começa uma frase em espanhol e termina em inglês, vai acabar pegando um dos dois transcrito como bobagem no outro idioma. A saída honesta: encerrar a gravação na fronteira entre os idiomas e iniciar outra.

Traduzindo enquanto você fala: o fluxo "falo X, sai em inglês"

Um dos recursos mais subestimados do ditado moderno no Mac é o falar e traduzir. Você fala no seu idioma nativo e o texto que aparece já está em outro idioma. Quase sempre o destino é o inglês.

Dois métodos por baixo dos panos fazem isso funcionar. Primeiro, as variantes multilíngues mais antigas do Whisper já incluem uma tarefa de tradução embutida: você fala em qualquer um dos 99 idiomas e o modelo devolve inglês direto. A nova variante turbo não traz isso, então a maioria dos apps usa hoje uma abordagem diferente: o Whisper transcreve no idioma de origem e, em seguida, um modelo de linguagem traduz o texto. O segundo método tem qualidade maior e cuida do polimento ao mesmo tempo, e por isso virou o padrão.

Isso encurta um fluxo real que antes levava três passos. Jeito antigo: ditar no idioma nativo, copiar o texto, colar num tradutor, copiar o resultado, colar no e-mail. Cerca de 30 segundos e quatro trocas de contexto. Jeito novo: segure uma tecla, fale no idioma nativo, o texto em inglês refinado aparece no cursor. Cerca de 4 segundos.

Se você passa parte do dia escrevendo em inglês no trabalho mas pensa mais rápido em outro idioma, esse recurso sozinho já justifica configurar o ditado moderno. O Voicr faz isso com um único atalho: deixe Auto como idioma de entrada e inglês como saída polida, e toda gravação cai como um texto em inglês pronto para enviar, independentemente do idioma em que você falou.

Fluxos multilíngues reais no Mac

Teoria é fácil. Estes são os padrões que de fato economizam tempo para pessoas reais.

Anotações e diário bilíngues

Se você anota no seu idioma nativo, mas trabalha em um ambiente de língua inglesa, o ditado te dá o melhor dos dois mundos. Configure o idioma de origem como o seu nativo e a saída como o mesmo (sem tradução), e você simplesmente deixa de digitar. Para anotações de reunião em que quer o original e uma versão em inglês, dite duas vezes com configurações de saída diferentes.

Código com comentários no idioma local

Devs em times de língua não inglesa costumam manter o código em inglês, mas comentar no idioma do time. A detecção automática cuida disso sem você pensar quando você alterna entre ditar no editor (descrições de código em inglês, nomes de funções) e ditar comentários no seu idioma. Cada gravação é um idioma; o modelo escolhe o certo a cada vez.

Suporte ao cliente em quatro fusos horários

Agentes de suporte que atendem tíquetes em inglês, espanhol, francês e alemão normalmente ficam alternando entre perfis de idioma em suas ferramentas. Com ditado multilíngue, você lê o tíquete e responde no idioma dele, depois vai para o próximo. Sem troca de perfil, sem menu. O passo de polimento também conta aqui: respostas de suporte precisam de um tom profissional consistente em todos os idiomas, não de uma transcrição crua.

Estudantes e professores de idiomas

Se você está aprendendo um idioma, ditar nele te obriga a melhorar pronúncia e ritmo. Se o modelo não te entende, isso é feedback. Se você ensina um idioma, ditar frases de exemplo poupa o trabalho de digitar acentos, caracteres especiais e diacríticos. O modelo coloca tudo certinho. Para os dois lados, o fluxo de falar e traduzir vira compreensão instantânea: fale no idioma que está aprendendo e veja se o inglês corresponde ao que você quis dizer.

Escritores e jornalistas internacionais

Quem escreve textos longos pensando em um idioma e publicando em outro tende a fazer a tradução de cabeça enquanto digita. É exaustivo. Fale o primeiro rascunho no idioma em que pensa, deixe a ferramenta produzir inglês e depois edite. O primeiro rascunho sai 3 a 4 vezes mais rápido, e sua cabeça de edição chega mais descansada porque não passou o rascunho inteiro traduzindo.

Como configurar ditado multilíngue no Mac

Há dois caminhos: a ferramenta integrada da Apple para o caso mais simples e um app de terceiros para tudo o mais.

Configurando o Apple Dictation para vários idiomas

Abra os Ajustes do Sistema, vá em Teclado e clique em Ditado. Ative. Clique no menu suspenso de Idiomas e adicione os que quiser. Dá para incluir até cerca de seis. A partir daí, ao iniciar o ditado, uma bandeirinha ou código de idioma aparece perto do cursor. Clique nela para trocar de idioma. Limitações: - Sem detecção automática. Cada troca é um clique. - Apenas cerca de 50–60 idiomas. - Transcrição crua, sem polimento e sem formatação específica por app. - Corte do ditado em 60 segundos em versões mais antigas do macOS.

Configurando um app multilíngue de terceiros

A maioria dos apps modernos de ditado no Mac é um utilitário na barra de menus que funciona em qualquer campo de texto de qualquer app. A configuração é assim: 1. Instale o app e conceda permissões de microfone e acessibilidade. 2. Defina ou aceite o atalho (em geral FN ou Option+Space, segure para gravar). 3. Escolha o idioma de entrada. Para trabalho multilíngue, deixe em Auto. 4. Escolha o idioma de saída. Igual ao de entrada significa só transcrição; escolha inglês (ou outro) para ter tradução. 5. Opcionalmente, defina um prompt de polimento ("profissional", "casual", "manter cru") para a saída sair do jeito que você quer ler. A partir daí, onde der para digitar, dá para ditar. Segure a tecla, fale, solte e o texto aparece no cursor.

Se você escreve para apps diferentes com tons diferentes (e-mail formal, Slack casual, documentação técnica), é aí que entram as Smart Rules: um estilo de escrita por app, aplicado automaticamente conforme o app ativo. Você define a regra uma vez e para de pensar nela. O mesmo modelo multilíngue cuida de todos.

Conclusões práticas

Três coisas que vale guardar enquanto você configura ditado multilíngue no seu Mac:

Um idioma por gravação é a regra. O modelo dá conta de 100 idiomas, mas escolhe um por trecho. Encerre a gravação na fronteira entre idiomas em vez de tentar trocar no meio da frase.

A detecção automática é o padrão para o dia a dia multilíngue. A seleção manual só vale a pena para enunciados curtos, idiomas raros ou ambientes barulhentos em que a detecção pode falhar.

Tradução enquanto você fala não é uma ferramenta separada. Se o idioma de saída estiver em inglês e o de entrada no seu idioma nativo, toda gravação já é uma tradução. Sem passo extra, sem segundo app, sem copia e cola.

Uma tecla, qualquer idioma

Se você leu até aqui, a resposta para "como dito em 100 idiomas no meu Mac em 2026" é curta: instale um app de terceiros baseado em Whisper, deixe o idioma de entrada em Auto, segure uma tecla e fale. O sistema cuida da detecção de idioma, da transcrição, do polimento e (opcionalmente) da tradução em uma ida e volta.

O Voicr faz isso com um único atalho a partir de qualquer app no seu Mac. Segure FN, fale em qualquer um dos 100 idiomas, solte, e o texto refinado aparece no cursor. Defina o idioma de saída para traduzir enquanto fala, ou mantenha o de entrada para uma transcrição limpa. Há um plano Free com 5.000 palavras por mês, então o jeito mais barato de descobrir se o ditado multilíngue cabe no seu fluxo é experimentar no primeiro e-mail de amanhã.

Se quiser ver como o ditado moderno no Mac se compara, lado a lado, com o que já está na sua máquina, o comparativo Voicr vs. Apple Dictation cobre as diferenças funcionalidade por funcionalidade.