Na maioria das manhãs abro o notebook com uma ideia clara do que quero escrever. O primeiro e-mail já está rascunhado na minha cabeça. Quando meus dedos encontram o teclado, metade já se perdeu. Digito a parte de que ainda lembro, encaro a tela e tento resgatar o resto.
Esse espaço entre saber o que você quer dizer e conseguir colocar isso na página é o que estou chamando de abismo. Por anos tratei isso como parte da escrita. Não é. É o custo da ferramenta. A IA foi a primeira coisa que de fato encolheu esse abismo para mim.
Este é um relato em primeira pessoa. Não é um listicle nem um apanhado de ferramentas. É só o fluxo que adotei no último ano, as partes que funcionam e as que ainda não funcionam.
O problema de velocidade de que ninguém fala
Os números explicam por que o abismo existe. Um digitador comum de desktop fica em torno de 40 palavras por minuto. Profissionais experientes chegam a 60 ou 70. A fala em conversa fica em cerca de 150 ppm sem esforço. A fala interna, aquela voz verbal na sua cabeça quando você compõe uma frase, é ainda mais rápida, com estimativas chegando a 300 ppm no limite superior.
Ou seja, a proporção aproximada é: pensar a 300, falar a 150, digitar a 40. Digitar é, de longe, a etapa mais lenta da cadeia. Tudo pelo que você precisa esperar é fricção, e fricção é onde as ideias vazam.
O que mudou para mim não foi a digitação. Não fiquei mais rápido no teclado. A mudança foi trocar o gargalo. Parei de tentar escrever na velocidade da digitação e passei a me permitir escrever na velocidade da fala, deixando a IA cuidar da limpeza nos bastidores.
Por que digitar silenciosamente te encolhe
O custo de digitar não é só velocidade. É que você começa a editar o pensamento para caber no gargalo. Escreve a versão mais curta. Pula a nuance. Corta o exemplo. Aperta enviar com aquela leve sensação de desonestidade por quão sem graça ficou a mensagem.
Notei isso principalmente no Slack. Eu começava a digitar uma resposta cuidadosa, ficava olhando o cursor enquanto reescrevia a frase mentalmente, apagava tudo e mandava três palavras no lugar. "Tá bom." "Entendi." "Pode deixar." Muita conversa de trabalho morria ali, não porque eu não tivesse o que acrescentar, mas porque acrescentar custava mais do que valia.
Quando parei de digitar essas respostas e comecei a falá-las, as mensagens ficaram mais longas, mais calorosas e mais claras. O mesmo cérebro. Outro canal de saída.
Como é, na prática, fechar o abismo
Aqui vai uma cena de uma terça pela manhã. Um cliente manda um e-mail perguntando por que um projeto está atrasado. Existe uma resposta de verdade: parte por mudanças de escopo nossas, parte pela aprovação atrasada dele, parte por uma semana de feriado. Não é resposta de uma linha. São três parágrafos que precisam ser diplomáticos sem soarem evasivos.
A versão antiga de mim abria a resposta, digitava a primeira frase duas vezes, apagava, e passava quinze minutos produzindo quatro parágrafos educados que não diziam exatamente o que eu queria.
A versão atual segura uma tecla, fala por noventa segundos e solta. A resposta está ali no e-mail, já parafrafada, já limpa, sem as palavras de preenchimento. Eu leio uma vez, ajusto uma frase, mando. O e-mail levou dois minutos em vez de quinze, e está mais próximo do que eu realmente queria dizer, porque nunca tive que comprimir o pensamento até a velocidade da digitação.

Na primeira vez que funcionou, fiquei meio atônito. Não porque a tecnologia fosse mágica. Não é. O motivo era mais simples: a fricção que eu aceitava como parte da escrita de repente era opcional.
As duas camadas de IA que fizeram a diferença
Demorei para perceber que meu fluxo tem duas camadas de IA, e que as duas estão trabalhando. As pessoas falam de uma ou de outra; raramente das duas.
Camada 1: voz entra, texto limpo sai
A primeira camada é o ditado por voz com polimento por IA. Eu seguro uma tecla, falo normalmente (com os "é", as recomeçadas e as meias-frases), e o texto que cai na minha área de transferência já chega limpo. Sem palavras de preenchimento. Gramática ajustada. Frases intermináveis quebradas em parágrafos de verdade.
Isso não é a mesma coisa que o ditado nativo. O Apple Dictation entrega a transcrição crua, com os "é" e tudo. O polimento por IA reescreve a transcrição preservando o que você quis dizer. A diferença é a mesma entre uma gravação e um rascunho.
Camada 2: texto entra, texto melhor sai
A segunda camada é a correção de texto no lugar. Eu seleciono algo que já escrevi (um parágrafo, uma frase, um e-mail inteiro), aperto um atalho, escolho um prompt como "deixe mais conciso" ou "suavize o tom", e a seleção é reescrita ali mesmo. Sem trocar de aba. Sem copiar e colar em um chatbot. O texto que eu tinha é substituído por uma versão melhor dele mesmo.
O ditado por voz coloca o pensamento na página rapidamente. A correção no lugar cuida dos últimos 10% de polimento. Juntos, eles chegam mais perto de escrever-na-velocidade-da-fala do que qualquer um sozinho.
O fluxo diário que eu de fato uso
Veja como é um dia comum, na prática. Nada disso é teoria. É o formato real da minha escrita hoje.
Caixa de entrada matinal. Leio cada e-mail e dito a resposta. A maioria sai em um parágrafo. Alguns são mais longos. Quase nenhum é digitado. O bolo todo que antes consumia a primeira hora hoje leva uns vinte minutos.
Slack ao longo do dia. Respostas curtas ainda são digitadas, porque a fricção é baixa e o esforço cognitivo é pequeno. Qualquer coisa que precise de mais de duas frases é falada. O tom sai automaticamente informal, porque é assim que falo no Slack.
Documentos e anotações. Os primeiros rascunhos são quase sempre ditados. Abro um documento em branco, falo por cinco ou dez minutos sobre o que quero abordar, e aí já tenho um rascunho real para trabalhar. Editar um rascunho é muito mais rápido do que começar um, e o abismo entre pensar e escrever é maior justamente no estágio da página em branco.
Rodada de edição. É onde a segunda camada faz por merecer. Seleciono frases que estão duras e peço uma versão mais enxuta. Seleciono parágrafos que soam rígidos demais e peço algo mais caloroso. Cada correção leva dois segundos, ali mesmo, sem trocar de aplicativo.
Uma coisa que me surpreendeu: hoje escrevo mais palavras no total, não menos. A IA não substituiu o que eu produzo. Tirou a parte do trabalho que era só imposto de tecla.
Se quiser um olhar mais aprofundado sobre o lado dos e-mails, fui mais a fundo em Dite e-mails no Mac.
A única configuração que fez tudo funcionar
Existe uma configuração que quase passei batido quando experimentei esse tipo de fluxo pela primeira vez, e acabou sendo a coisa que deixou tudo viável: estilos de escrita por aplicativo.
O Slack e o e-mail não querem o mesmo tom. Uma carta de apresentação formal não quer o mesmo tom de um brainstorm no Notion. Se o polimento da IA achata tudo na mesma voz, a saída fica mais rápida e pior, e você para de confiar nela.
É exatamente por isso que o Voicr tem as Smart Rules. Você define um tom informal para o Slack, um mais formal para o Mail e um direto ao ponto para o terminal. O Voicr detecta o aplicativo ativo e aplica o estilo certo sem que você precise fazer nada. Dito da mesma forma em todos os apps; o resultado se adapta. Foi o truque que me fez parar de voltar para o teclado nas mensagens "importantes".
Onde o ditado cru desmorona (e o polimento te salva)
O ditado cru tem um modo de falha bem específico que qualquer um que já tentou vai reconhecer. Você fala um parágrafo. A transcrição volta com cada "é" preservado, suas duas recomeçadas emendadas, e uma frase que correu por quarenta palavras porque você não pausou.
Dá para editar. Mas editar uma transcrição crua é um trabalho por si só, e pode ser mais lento do que simplesmente digitar a coisa limpa de primeira. É por isso que a maioria das pessoas que tenta o ditado nativo desiste depois de uma semana.
O polimento muda a equação. Quando a IA remove as palavras de preenchimento, ajusta a gramática e quebra a parede de fala em parágrafos, o resultado é algo que eu enviaria sem reescrever. A etapa do ditado deixa de ser rascunho zero e passa a ser algo próximo de um rascunho final.
Essa é a parte que os artigos concorrentes costumam ignorar. A vantagem de velocidade da voz sobre a digitação é real, mas só é útil se você não devolver tudo em tempo de limpeza.
Trade-offs honestos
Não é só vantagem limpa. Algumas coisas ainda são melhores digitadas:
- Texto altamente técnico com código, nomes de comando ou SKUs de produto. O ditado acerta as palavras; nem sempre acerta os símbolos. Código eu continuo digitando. - Ambientes barulhentos. Cafés, aviões, escritórios compartilhados. Falar com o notebook em uma sala silenciosa, tudo bem. Fazer isso ao lado de alguém em uma call, não. - Assuntos sensíveis perto de outras pessoas. Um e-mail de término ou um feedback duro eu prefiro digitar a falar em voz alta onde alguém pode ouvir. - Edição profunda. Quando o documento já está quase pronto, prefiro fazer pequenos ajustes cirúrgicos no teclado. A voz serve para colocar as coisas na página, não para mexer vírgulas.
Saber a hora de voltar para o teclado é parte do fluxo. O teclado não sumiu. Só deixou de ser o padrão.
O que isso de fato mudou para mim
A resposta honesta não é "produzo 4× mais conteúdo". É algo menor e mais estranho do que isso.
Mando respostas mais longas no Slack porque o custo de escrevê-las caiu. Faço menos anotações pela metade porque ditar um pensamento inteiro é mais rápido do que digitar um fragmento. Escrevo os primeiros rascunhos no mesmo dia em que a ideia aparece, em vez de guardá-los para um bloco focado de tempo que muitas vezes não chega. O abismo entre ter uma ideia e ter um rascunho dela encolheu de dias para minutos.
É o que os números de velocidade não capturam. A pergunta de verdade é se o ato de escrever ficou barato a ponto de você fazê-lo sempre que quer, em vez de guardar para aquele bloco focado de tempo que muitas vezes não vem.
Como testar isso hoje
Se quiser ver se isso funciona para você, não tente redesenhar o fluxo inteiro. Escolha um único slot.
1. Pegue a próxima resposta de e-mail que precisar de mais de duas frases. 2. Em vez de digitar, segure a tecla de ditado e fale o que quer dizer. Não roteirize antes. Só fale. 3. Solte a tecla e leia o que apareceu no campo. 4. Se estiver perto do que você quis dizer, ajuste uma ou duas frases que não estão e envie.
Faça isso cinco vezes. Ao fim do primeiro dia, você vai saber se o abismo que descrevi também é o seu.
Se quiser o fluxo acima sem precisar montar tudo na mão, o Voicr é o app que eu uso. Segura FN, fala, cola. A saída sai polida, o tom se adapta ao app em que você está, e selecionar um texto e apertar ⌥Space te dá as correções no lugar para a segunda rodada. Cinco mil palavras por mês são gratuitas, caso você só queira ver se a coisa pega.
O teclado não vai a lugar nenhum. Mas, pela primeira vez em vinte anos escrevendo em computadores, ele não é o gargalo em torno do qual eu tenho que planejar.

