Ik was halverwege een Slack-bericht toen het me opviel. Ik had dezelfde zin al twaalf seconden in mijn hoofd terwijl mijn vingers nog aan de eerste vier woorden bezig waren. Mijn brein stond stationair, wachtend tot mijn handen het zouden bijbenen.
Dat was het moment dat ik spraakdictatie een echte kans gaf. Niet die halfslachtige "ik probeer het voor één vergadernotitie"-poging die ik al twee keer had opgegeven. Een hele maand, elk lang bericht, elke e-mail, elk document. Dit is wat er echt gebeurde.
Het verhaal klinkt als marketinggebabbel tot je de cijfers ziet. De gemiddelde persoon typt rond de 40 woorden per minuut. Diezelfde persoon spreekt 130 tot 150. Onderzoekers van Stanford maakten de vergelijking al in 2017 en kwamen uit op ongeveer 3x sneller dan typen op een telefoon, zelfs voor mensen die snel typen. Diezelfde verhouding klopt grotendeels ook op een Mac-toetsenbord.
De rekensom is meedogenloos: 40 WPM vs 150 WPM
Laten we dit deel even afhandelen. De meeste ongetrainde volwassenen typen rond de 38 tot 40 WPM. Getrainde typisten, degenen die nooit naar het toetsenbord kijken, komen rond de 65 uit. Een normaal gesprek loopt op 130 tot 150 WPM. Zelfs tegen een snelle typist is dat meer dan 2x. Tegen een gemiddeld persoon zit je dichter bij 3,75x.
Dat is de theorie. De praktijk is interessanter. De eerste keer dat je jezelf echt klokt terwijl je een e-mail dicteert in plaats van typt, is het gat niet zo groot als de wiskunde belooft. Hoe komt dat? Omdat typen één beweging is. Dicteren is praten, dan nalezen, dan misschien een zin opnieuw inspreken, dan plakken. De opschoonbelasting eet aan je winst.
De oplossing zit in het gereedschap. Ouderwetse dictatie geeft je een rauwe transcriptie met elke "eh," elke "uhm," elke "dus eigenlijk wat ik bedoel is." Nieuwere tools poetsen dat in één stap op tot schone tekst. Als de opschoning automatisch gebeurt, is de 3x echt.
Hoe "3x sneller" er in een echte werkdag uitziet
Dit was een normale dinsdag voor mij, vóór de overstap. Zes langere Slack-berichten (~80 woorden elk), vier e-mails (~120 woorden elk), twee korte documenten (~400 woorden), een handvol eenregelige antwoorden. Totale getypte output: ongeveer 1.800 woorden. Tijd aan het toetsenbord, zonder denktijd: ruwweg 45 minuten.
Hetzelfde volume na de overstap. De gesproken output, inclusief opschoning, kwam uit op zo'n 14 minuten. Vrijwel exact 3x. Wat me verraste was niet de bespaarde tijd. Het was waar die tijd naartoe ging. Ik stopte met een concept openen, weglopen, terugkomen en het hele ding herschrijven. De gedachte verliet mijn hoofd en landde in één keer op het scherm.

Waar dicteren goed werkt voor mij: - Lange Slack-threads - E-mailreacties van meer dan twee zinnen - Vergadernotities tijdens de vergadering - Eerste versies van wat dan ook - Brain-dump documenten - Spraaknotities die later documenten worden
Waar het niet helpt: - Korte antwoorden ("oké," "bedankt") - Code - Gestructureerde tabellen - Wachtwoorden - Alles waar je woord voor woord goed over moet nadenken
Week één was slecht. Dit ging er mis.
Ik gaf het bijna op, dag drie. Het eerste probleem was sowieso tegen mijn computer praten. Het voelde aanstellerig. Ik begon een zin, verloor mijn moed, stopte, en eindigde met een halfafgemaakte gedachte die langer kostte om te repareren dan om gewoon te typen.
Het tweede probleem was overdrijven. Ik sprak alsof ik een formele brief dicteerde, langzaam en voorzichtig, elk woord articulerend. De output kwam er robotachtig uit en het snelheidsvoordeel verdween. Ik was gewoon aan het typen met mijn mond, en nog slecht ook.
De oplossing bleek het tegenovergestelde van wat ik verwachtte. Praat sneller, niet langzamer. Praat zoals je iets aan een collega zou uitleggen, inclusief de valse starts en het "eigenlijk, schrap dat, laat me het anders zeggen." Een goede polijst-tool ruimt dat soort dingen op. Stop met dicteren. Praat gewoon.
De doorbraak: weten wanneer je níét moet dicteren
Wat spraakdictatie veranderde van "af en toe experiment" in "standaard invoermethode" was een mentaal model: stem voor *eerste versies*, toetsenbord voor *bewerkingen*. Het toetsenbord is precies. De stem is snel. Spreek de rommelige versie in, gebruik dan het toetsenbord om dat ene woord te fixen dat er verkeerd uit kwam.
Achteraf klinkt dit voor de hand liggend. Dat was het niet toen ik begon. Ik probeerde steeds perfect proza te dicteren en raakte gefrustreerd als de gepolijste output niet *precies* was wat ik wilde. Wat uiteindelijk hielp was mijn eisen voor het gedicteerde concept verlagen. Krijg het idee eruit. Repareer het in twee seconden met het toetsenbord. Door.
Daarom maakt de polijst-tijdens-het-praten workflow zo'n verschil. Als je moet dicteren, daarna handmatig de stopwoorden weghalen, dan de grammatica corrigeren, dan opmaken voor de app waar je in zit, is het snelheidsvoordeel verdwenen. Het hele punt is dat de opschoning automatisch gebeurt. Tegen de tijd dat je stopt met praten, staat de tekst klaar om te plakken. Voicr doet precies dat op de Mac: FN ingedrukt houden, praten, loslaten, plakken. De opschoning loopt op de achtergrond.
De workflow die bleef hangen (Slack, e-mail, documenten)
Een maand later waren er drie workflows die zich hadden gevestigd. Elk vroeg om net even een andere setup.

Slack en chat
Dit was de grootste ontgrendeling. Ik schrijf veel lange Slack-berichten: uitleg over beslissingen, post-mortems, lange threads. Die kostten me vroeger tien minuten. Nu drie. Ik dicteer het bericht in één keer, plak het, scan op typfouten, verstuur. (Spraak naar tekst in Slack op de Mac gaat in op de instellingen per kanaal.)
E-mail was waar ik de grootste winst verwachtte en in het begin de rommeligste resultaten kreeg. Het probleem: e-mail heeft een toon. Je kunt geen antwoord aan je baas dicteren op dezelfde manier als een Slack-bericht aan een teamgenoot. De oplossing was een stijl per app. Formeel voor e-mail, casual voor chat. (Hoe je e-mails dicteert op de Mac behandelt dit in detail.)
Documenten en notities
Documenten zijn het meest eigenaardige geval. Korte notities werken geweldig. Dicteren, plakken, klaar. Lange documenten niet, want het denken is structureel. Je schrijft geen zinnen. Je deelt secties in, schuift dingen rond, herstructureert. Voor lange documenten dicteer ik paragraaf voor paragraaf en houd ik de structuur op het toetsenbord.
Wat ik won, en dat geen snelheid was
De 3x is de kop. De onverwachte winsten zijn groter.
Minder halfafgemaakte concepten. Als typen de bottleneck is, begint elk lang bericht als een concept dat je "later" af wil maken. De meeste sterven in je conceptenmap. Stem dicht het gat tussen gedachte en output. Ik verstuur nu dingen die vroeger twee dagen onverstuurd bleven liggen.
Minder polsklachten. Ik ga niet beweren dat spraakdictatie mijn handen heeft genezen. Maar het verschil tussen 6 uur typen en 2 uur typen is reëel, en mijn polsen voelen het op vrijdagavond.
Betere eerste versies. Deze was een verrassing. Als je een gedachte uitspreekt, structureer je hem vanzelf zoals iemand het zou uitleggen. Getypte eerste versies zijn vaak stijver. Ze lezen alsof ze geschreven zijn, want dat zijn ze ook. Gedicteerde versies klinken als een persoon, en dat is meestal wat je wilt.
De adder waar niemand je voor waarschuwt
Twee echte nadelen. Beide hebben workarounds, maar het is goed om ze te weten voor je je vastlegt.
Je kunt niet dicteren in een open kantoor. Of een koffietent. Of waar dan ook met iemand binnen gehoorsafstand. Dit klinkt voor de hand liggend maar het is een grotere beperking dan het lijkt. Als je werkomgeving gedeeld is, wordt spraakdictatie een "alleen op thuiswerkdagen"-tool, en dat begrenst je productiviteitswinst.
Er blijft een opschoonbelasting, zelfs met goede tools. Klein. Misschien één correctie per paragraaf in plaats van één per zin. Maar niet nul. De wiskunde blijft enorm in je voordeel, maar doen alsof de opschoning niets is, leidt tot teleurstelling.
Hoe je dit echt probeert zonder na drie dagen op te geven
Een paar regels die ik op dag één had willen hebben.
Begin met één app, niet allemaal. Kies de app waar je het meest laagdrempelige lange-vorm tekst schrijft. Voor mij Slack. Gebruik stem voor die app en alleen die app, een week lang. Probeer niet je hele workflow tegelijk om te gooien.
Stel een limiet van één week voor je scepsis. Dag drie wordt slecht. Dag vijf wordt oké. Op dag zeven begin je het gat te voelen wanneer je teruggaat naar typen. Als je op dag drie stopt, kom je nooit bij dag zeven.
Gebruik een tool die standaard polijst. Dit is verreweg de belangrijkste factor. Kale transcriptietools verspillen je winst aan opschoning. Een tool die stopwoorden verwijdert, grammatica fixt en de output automatisch structureert is het enige type waarbij de 3x ook echt zichtbaar wordt.
Dicteer nooit waar andere mensen bij zijn. Niet omdat het luid is (dat is het niet). Omdat de zelfbewustheid je snelheid om zeep helpt. Kies een privéplek voor de eerste maand.
Waar te beginnen
Eerlijke samenvatting: spraakdictatie werkt. Niet in de "dit verandert alles"-zin die de marketingteksten beloven. In de "ik ben om 16:00 klaar"-zin. De 3x is reëel, en elke tool die de opschoning niet voor je doet is de reden dat mensen na week één afhaken.
De snelste manier om dit zelf te testen is je volgende lange Slack-bericht dicteren in plaats van typen. Wil je de opschoning automatisch geregeld hebben, met spraak die in één stap wordt gepolijst tot plak-klare tekst en een stijl per app, dan doet Voicr precies dat op de Mac. Houd FN ingedrukt vanuit elke app, praat dertig seconden, laat los, plak. Probeer het morgenochtend op één bericht. Aan het einde van de week weet je of de 3x voor jou reëel is.

