Jeg var midt i et Slack-svar da det slo meg. Jeg hadde tenkt på den samme setningen i tolv sekunder mens fingrene knotet seg gjennom de fire første ordene. Hjernen min gikk på tomgang og ventet på at hendene skulle ta igjen.
Det var i det øyeblikket jeg ga taledikteringen en skikkelig sjanse. Ikke det halvhjertede «jeg prøver det til et møtenotat»-forsøket jeg allerede hadde gitt opp to ganger. En hel måned, hver lange melding, hver e-post, hvert dokument. Her er hva som faktisk skjedde.
Påstanden høres ut som markedsføringssvada helt til du ser tallene. En gjennomsnittlig person taster rundt 40 ord i minuttet. Den samme personen snakker i 130 til 150. Forskere ved Stanford gjorde sammenligningen tilbake i 2017 og fant at stemmeinput var omtrent 3x raskere enn tasting på en telefon, selv for folk som taster fort. Det samme forholdet holder stort sett også på et Mac-tastatur.
Regnestykket er brutalt: 40 WPM mot 150 WPM
La oss få denne biten unna først. De fleste utrente voksne taster rundt 38 til 40 ord i minuttet. Trente tastere, de som aldri ser ned på tastaturet, ligger på rundt 65. Vanlig engelsk samtale ligger på 130 til 150 ord i minuttet. Selv mot en rask taster er det mer enn 2x. Mot en gjennomsnittsperson er det nærmere 3,75x.
Det er teorien. Praksisen er mer interessant. Første gang du faktisk tar tiden på å diktere en e-post kontra å taste den, er ikke gapet så stort som regnestykket antyder. Hvorfor ikke? Fordi tasting er én bevegelse. Diktering er snakk, så korrektur, så kanskje diktere en setning på nytt, så lime inn. Oppryddingsskatten spiser opp gevinsten.
Løsningen ligger i verktøyet. Gammel diktering gir deg en rå transkripsjon med hver «eh», hver «øh», hvert «altså, det jeg egentlig prøver å si er». Nyere verktøy pusser det opp til ren tekst i ett steg. Når oppryddingen skjer automatisk, blir 3x-en reell.
Slik ser «3x raskere» faktisk ut i en vanlig arbeidsdag
Her er en helt vanlig tirsdag for meg før jeg byttet. Seks lengre Slack-meldinger (~80 ord hver), fire e-poster (~120 ord hver), to korte dokumenter (~400 ord), en håndfull enlinje-svar. Total tastet produksjon: rundt 1 800 ord. Tid på tastaturet, uten å regne tenketid: omtrent 45 minutter.
Samme volum etter byttet. Total muntlig produksjon, inkludert opprydding, landet på rundt 14 minutter. Nesten nøyaktig 3x. Det som overrasket meg, var ikke tiden jeg sparte. Det var hvor tiden ble av. Jeg sluttet å åpne et utkast, gå fra det, komme tilbake og skrive om hele greia. Tanken forlot hodet og landet på skjermen i én bevegelse.

Der diktering funker bra for meg: - Lange Slack-tråder - E-postsvar over to setninger - Møtenotater under selve møtet - Førsteutkast av hva som helst - Brain-dump-dokumenter - Stemmenotater som senere blir til dokumenter
Der det ikke hjelper: - Korte svar («skjønner», «takk») - Kode - Strukturerte tabeller - Passord - Alt der du må tenke ord for ord
Uke én var ille. Her er hva som gikk galt.
Jeg holdt på å gi opp på dag tre. Det første problemet var rett og slett å snakke til datamaskinen. Det føltes oppstilt. Jeg startet på en setning, mistet motet, stoppet og endte opp med en halvtranskribert tanke som tok lengre tid å fikse enn å taste.
Det andre problemet var at jeg overdrev. Jeg snakket som om jeg dikterte et formelt brev, sakte og forsiktig, med tydelig uttale av hvert ord. Resultatet ble robotaktig og fartsfordelen forsvant. Jeg holdt egentlig bare på å taste med munnen, og det dårlig.
Løsningen viste seg å være det motsatte av hva jeg trodde. Snakk fortere, ikke saktere. Snakk slik du ville forklart noe til en kollega, inkludert de feilstartene og «nei, glem det, la meg si det på en annen måte». Et godt poleringsverktøy fjerner det. Slutt å diktere. Bare snakk.
Gjennombruddet: å vite når man ikke skal diktere
Det som flyttet taledikteringen fra «av og til-eksperiment» til «standard inndatametode» var en mental modell: stemme for *førsteutkast*, tastatur for *redigering*. Tastaturet er presist. Stemmen er rask. Snakk den rotete versjonen, så bruker du tastaturet til å fikse det ene ordet som ble feil.
Dette høres opplagt ut i ettertid. Det var ikke opplagt da jeg startet. Jeg prøvde hele tiden å diktere perfekt prosa og ble irritert når den polerte teksten ikke var *akkurat* det jeg ville ha. Det som til slutt hjalp, var å senke kravene til selve det dikterte utkastet. Få tanken ut. Fiks den på to sekunder med tastaturet. Gå videre.
Det er også derfor polering-underveis-flyten betyr så mye. Hvis du må diktere, så manuelt fjerne fyllord, så fikse grammatikken, så formatere det for appen du er i, da er fartsfordelen borte. Hele poenget er at oppryddingen skjer automatisk. Idet du slutter å snakke, ligger teksten klar til å limes inn. Voicr gjør akkurat dette på Mac: hold FN, snakk, slipp, lim inn. Oppryddingen kjører i bakgrunnen.
Arbeidsflyten som ble værende (Slack, e-post, dokumenter)
Etter en måned hadde tre arbeidsflyter satt seg. Hver av dem trengte et litt annet oppsett.

Slack og chat
Dette var den største frigjøringen. Jeg skriver mange lange Slack-meldinger: forklaringer på avgjørelser, post mortems, lange tråder. Disse pleide å ta meg ti minutter. Nå tar de tre. Jeg dikterer meldingen i én slengs, limer inn, sjekker raskt for skrivefeil, sender. (Tale til tekst i Slack på Mac bryter ned oppsettet kanal for kanal.)
E-post
E-post var der jeg ventet størst gevinst, og fikk det rotete resultatet til å begynne med. Problemet: e-post har en tone. Du kan ikke diktere et svar til sjefen på samme måte som en Slack-melding til en kollega. Løsningen var å bruke en stil per app. Formell for e-post, uformell for chat. (Slik dikterer du e-post på Mac går grundig gjennom dette.)
Dokumenter og notater
Dokumenter er det rareste tilfellet. Korte notater funker veldig bra. Diktér, lim inn, ferdig. Lange dokumenter funker ikke like godt, fordi tenkningen er strukturell. Du skriver ikke setninger. Du skisserer seksjoner, flytter ting rundt, restrukturerer. For lange dokumenter dikterer jeg avsnitt for avsnitt og holder strukturen på tastaturet.
Det jeg vant som ikke var tid
3x-en er overskriften. De uventede gevinstene er større.
Færre halvferdige utkast. Når tastingen er flaskehalsen, starter hver lang melding som et utkast du har tenkt å fullføre senere. De fleste av dem dør i utkastmappen. Stemmen lukker gapet mellom tanke og produksjon. Jeg sender nå ting som tidligere ble liggende usendt i to dager.
Mindre belastning på håndleddene. Jeg skal ikke påstå at taledikteringen kurerte hendene mine. Men forskjellen mellom 6 timer med tasting og 2 timer med tasting er reell, og håndleddene mine kjenner den på fredagskvelden.
Bedre førsteutkast. Dette var en overraskelse. Når du snakker en tanke ut, strukturerer du den naturlig slik en person ville forklart den. Tastede førsteutkast har en tendens til å bli stivere. De leses som om de var skrevet, fordi de var det. Dikterte utkast høres ut som et menneske, som vanligvis er det du vil ha.
Haken ingen advarer deg om
To reelle ulemper. Begge har omveier, men det er verdt å vite om dem før du gir deg i kast med det.
Du kan ikke diktere i åpent kontorlandskap. Eller på kafé. Eller noe sted med en annen person innen hørevidde. Dette høres opplagt ut, men det er en større begrensning enn det virker. Hvis arbeidsmiljøet ditt er delt, er taledikteringen et «kun hjemmekontordager»-verktøy, noe som demper produktivitetsgevinsten.
Det er fortsatt en oppryddingsskatt, selv med gode verktøy. Den er liten. Kanskje én rettelse per avsnitt i stedet for én per setning. Men den er ikke null. Regnestykket går fortsatt i din favør med god margin, men det å late som om oppryddingen er null, setter deg opp for skuffelse.
Slik prøver du det skikkelig uten å gi opp etter tre dager
Et par regler jeg skulle ønske noen ga meg på dag én.
Start med én app, ikke alle på en gang. Velg appen der du skriver mest langform med lav innsats. For meg, Slack. Bruk stemmen for den ene appen og bare den i en uke. Ikke prøv å legge om hele arbeidsflyten på en gang.
Sett en skepsisgrense på én uke. Dag tre blir ille. Dag fem blir greit. Dag sju begynner du å kjenne gapet når du går tilbake til tasting. Hvis du gir opp på dag tre, kommer du aldri til dag sju.
Bruk et verktøy som polerer som standard. Dette er den enkelt viktigste faktoren. Rå transkripsjonsverktøy spiser opp gevinsten i opprydding. Et verktøy som fjerner fyllord, retter grammatikk og strukturerer teksten automatisk, er den eneste typen der 3x-en faktisk dukker opp.
Aldri diktér foran andre mennesker. Ikke fordi det er høyt (det er det ikke). Fordi selvbevisstheten dreper farten din. Finn et privat sted den første måneden.
Hvor du starter
Ærlig oppsummert: taledikteringen funker. Ikke i den «dette forandrer alt»-betydningen som markedsføringstekstene lover. I den «jeg er ferdig klokka 16»-betydningen. 3x-en er reell, og ethvert verktøy som ikke håndterer oppryddingen for deg, er grunnen til at folk gir opp diktering i løpet av første uken.
Den raskeste måten å teste det selv på, er å diktere den neste lange Slack-meldingen din i stedet for å taste den. Hvis du vil at oppryddingen skal håndteres automatisk, med tale polert til lim-inn-klar tekst i ett steg og en egen stil per app, er det det Voicr gjør på Mac. Hold FN fra hvor som helst, snakk i tretti sekunder, slipp, lim inn. Prøv det på én melding i morgen tidlig. Innen uka er omme, vet du om 3x-en er reell for deg.

