Eu estava no meio de uma resposta no Slack quando me dei conta. Fazia doze segundos que eu tinha a mesma frase na cabeça enquanto meus dedos ainda lutavam com as quatro primeiras palavras. Meu cérebro estava ocioso, esperando minhas mãos alcançarem o pensamento.
Foi aí que dei uma chance de verdade ao ditado por voz. Não a tentativa meia-boca de "vou usar só para uma nota de reunião" que eu já tinha abandonado duas vezes. Um mês inteiro, toda mensagem longa, todo e-mail, todo documento. Aqui vai o que realmente aconteceu.
A promessa parece marketing barato até você ver os números. Uma pessoa comum digita por volta de 40 palavras por minuto. A mesma pessoa fala entre 130 e 150. Pesquisadores de Stanford fizeram essa comparação lá em 2017 e cravaram que a entrada por voz é cerca de 3x mais rápida do que digitar no celular, mesmo para quem digita rápido. A mesma proporção, no geral, vale no teclado do Mac.
A matemática é cruel: 40 PPM vs 150 PPM
Vamos tirar essa parte do caminho. A maioria dos adultos sem treino digita entre 38 e 40 PPM. Digitadores treinados, os que nunca olham para o teclado, chegam perto de 65. Uma conversa em português fica entre 130 e 150 PPM. Mesmo contra um digitador rápido, isso é mais de 2x. Contra a pessoa média, fica perto de 3,75x.
Essa é a teoria. A prática é mais interessante. Da primeira vez que você cronometra ditar um e-mail versus digitá-lo, a diferença não é tão grande quanto a matemática sugere. Por quê? Porque digitar é um movimento só. Ditar é falar, depois revisar, depois talvez reditar uma frase, depois colar. O imposto do retoque come parte do ganho.
A solução está na ferramenta. O ditado antigo entrega uma transcrição crua com cada "hum", cada "é", cada "então tipo, o que eu quero dizer é". As ferramentas novas transformam isso em texto limpo num passo só. Quando o retoque é automático, o 3x é real.
Como "3x mais rápido" se parece num dia de trabalho real
Aqui vai uma terça-feira normal pra mim antes da mudança. Seis mensagens mais longas no Slack (~80 palavras cada), quatro e-mails (~120 palavras cada), dois documentos curtos (~400 palavras), um punhado de respostas de uma linha. Produção total digitada: cerca de 1.800 palavras. Tempo no teclado, ignorando tempo de pensar: aproximadamente 45 minutos.
Mesmo volume depois da mudança. Produção total falada, com retoque, ficou em torno de 14 minutos. Quase exatamente 3x. A parte que me surpreendeu não foi o tempo economizado. Foi para onde o tempo foi. Parei de abrir um rascunho, levantar, voltar e reescrever tudo de novo. O pensamento saía da minha cabeça e ia parar na tela numa passada só.

Onde ditar funciona bem para mim: - Threads longas no Slack - Respostas de e-mail com mais de duas frases - Anotações durante a reunião - Primeiros rascunhos de qualquer coisa - Documentos de brain dump - Notas de voz que viram documentos depois
Onde não ajuda: - Respostas curtas ("beleza", "valeu") - Código - Tabelas estruturadas - Senhas - Qualquer coisa em que você precisa pesar cada palavra
A primeira semana foi ruim. Veja o que deu errado.
Quase desisti no terceiro dia. O primeiro problema era falar com o computador, ponto. Parecia performático. Eu começava uma frase, perdia a coragem, parava, e acabava com um pensamento pela metade que dava mais trabalho consertar do que digitar.
O segundo problema foi me esforçar demais. Eu falava como se estivesse ditando uma carta formal, devagar, com cuidado, articulando cada palavra. O resultado vinha robótico e a vantagem de velocidade sumia. Eu estava só digitando com a boca, e mal.
A solução acabou sendo o oposto do que eu esperava. Fale mais rápido, não mais devagar. Fale do jeito que você explicaria algo para um colega, incluindo as enroladas e o "não, espera, deixa eu refazer". Uma boa ferramenta de polimento limpa essas coisas. Pare de tentar ditar. Só fale.
A virada de chave: saber a hora de não ditar
O que tirou o ditado por voz do "experimento ocasional" e o transformou em "método de entrada padrão" foi um modelo mental: voz para *primeiros rascunhos*, teclado para *edições*. O teclado é preciso. A voz é rápida. Fale a versão bagunçada, depois use o teclado para corrigir aquela palavra que saiu errada.
Parece óbvio em retrospecto. Não era óbvio quando comecei. Eu insistia em tentar ditar uma prosa perfeita e ficava frustrado quando o texto polido não era *exatamente* o que eu queria. O que finalmente ajudou foi baixar as expectativas para o rascunho ditado. Solte a ideia. Conserte em dois segundos com o teclado. Siga em frente.
Também é por isso que o fluxo de polir enquanto você fala importa tanto. Se você precisa ditar, depois limpar os vícios de linguagem na mão, depois corrigir a gramática, depois formatar para o app em que está, a vantagem de velocidade evapora. O ponto é que o retoque acontece sozinho. Quando você para de falar, o texto já está pronto para colar. O Voicr faz exatamente isso no Mac: segure FN, fale, solte, cole. O retoque roda em segundo plano.
O fluxo que pegou (Slack, e-mail, documentos)
Depois de um mês, três fluxos tinham se encaixado. Cada um precisava de um ajuste levemente diferente.

Slack e chat
Esse foi o maior destrave. Eu escrevo muita mensagem longa no Slack: explicações de decisão, post-mortems, threads compridas. Antes levavam dez minutos. Agora levam três. Eu dito a mensagem inteira de uma vez, colo, dou uma olhada pra ver se tem erro, envio. (O Voz para texto no Slack no Mac detalha a configuração por canal.)
E-mail era onde eu esperava o maior ganho e onde recebi o resultado mais bagunçado no começo. O problema: e-mail tem tom. Você não pode ditar uma resposta para o chefe do mesmo jeito que ditaria uma mensagem no Slack para um colega de time. A solução foi usar um estilo por app. Formal para e-mail, casual para chat. (O Como ditar e-mails no Mac entra nesse detalhe.)
Documentos e notas
Documentos são o caso mais estranho. Notas curtas funcionam muito bem. Ditar, colar, pronto. Documentos longos não, porque o pensamento é estrutural. Você não está escrevendo frases. Está esboçando seções, movendo coisas, reestruturando. Para documentos longos, eu dito parágrafo por parágrafo e mantenho a estrutura no teclado.
O que eu ganhei além de velocidade
O 3x é a manchete. Os ganhos inesperados são maiores.
Menos rascunhos pela metade. Quando digitar é o gargalo, toda mensagem longa começa como um rascunho que você pretende terminar depois. A maioria morre na pasta de rascunhos. A voz fecha a distância entre o pensamento e a saída. Hoje eu envio coisas que antes ficariam dois dias sem enviar.
Menos dor no pulso. Não vou dizer que o ditado por voz curou minhas mãos. Mas a diferença entre 6 horas de digitação e 2 horas de digitação é real, e meus pulsos sentem na sexta à noite.
Primeiros rascunhos melhores. Esse foi uma surpresa. Quando você fala uma ideia, naturalmente estrutura como uma pessoa explicaria. Primeiros rascunhos digitados tendem a ser mais duros. Soam como se tivessem sido escritos, porque foram. Rascunhos ditados soam como uma pessoa falando, que é geralmente o que você quer.
O detalhe que ninguém te avisa
Duas desvantagens reais. As duas têm contornos, mas vale conhecer antes de mergulhar.
Você não consegue ditar num escritório aberto. Nem numa cafeteria. Nem em qualquer lugar com outra pessoa por perto. Parece óbvio, mas é uma restrição maior do que parece. Se seu ambiente de trabalho é compartilhado, o ditado por voz vira ferramenta de "dia em casa", e isso limita o ganho de produtividade.
Ainda existe um imposto de retoque, mesmo com boas ferramentas. É pequeno. Talvez uma correção por parágrafo em vez de uma por frase. Mas não é zero. A matemática continua jogando muito a seu favor, mas fingir que o retoque é zero só vai te preparar para a decepção.
Como testar de verdade sem desistir em três dias
Algumas regras que eu queria que alguém tivesse me dado no primeiro dia.
Comece com um app, não com todos. Escolha o app em que você escreve mais texto longo e de baixo risco. Pra mim, Slack. Use voz nesse app, e só nele, por uma semana. Não tente converter o fluxo inteiro de uma vez.
Defina um limite de ceticismo de uma semana. O terceiro dia vai ser ruim. O quinto vai ser ok. No sétimo, você vai começar a sentir a diferença quando voltar a digitar. Se você desistir no terceiro dia, nunca chega ao sétimo.
Use uma ferramenta que já entrega o texto polido. Esse é o fator mais importante. Ferramentas de transcrição crua jogam seu ganho fora no retoque. Uma ferramenta que remove vícios de linguagem, corrige a gramática e estrutura o texto automaticamente é o único tipo em que o 3x realmente aparece.
Não dite na frente de outras pessoas, nunca. Não porque é barulhento (não é). Porque a vergonha vai matar sua velocidade. Escolha um lugar reservado para o primeiro mês.
Por onde começar
Resumo honesto: ditado por voz funciona. Não no sentido de "isso muda tudo" que o marketing promete. No sentido de "eu termino o dia às 16h agora". O 3x é real, e qualquer ferramenta que não cuida do retoque pra você é o motivo de as pessoas desistirem do ditado já na primeira semana.
O jeito mais rápido de testar isso por conta própria é ditar a sua próxima mensagem longa no Slack em vez de digitar. Se você quer o retoque automático, com a fala polida em texto pronto para colar num passo só e um estilo por app, é isso que o Voicr faz no Mac. Segure FN de qualquer lugar, fale por trinta segundos, solte, cole. Tente em uma mensagem amanhã de manhã. Até o fim da semana você já vai saber se o 3x é real pra você.

