Powrót do bloga

Voicr Team · 23 maja 2026

Jak piszę 3x szybciej dzięki dyktowaniu głosowemu na Macu

Spędziłem miesiąc, zastępując pisanie mówieniem. Oto szczere podsumowanie — co zadziałało, co nie, i matematyka stojąca za tym 3x.

Jak piszę 3x szybciej dzięki dyktowaniu głosowemu na Macu

Byłem w połowie odpowiedzi na Slacku, kiedy to do mnie dotarło. Od dwunastu sekund myślałem to samo zdanie, a moje palce ledwo dobrnęły do czwartego słowa. Mój mózg się nudził, czekając, aż dłonie nadrobią zaległości.

To była chwila, w której naprawdę dałem szansę dyktowaniu głosowemu. Nie była to kolejna połowiczna próba „spróbuję tego do notatek ze spotkania”, którą porzuciłem już dwa razy. Cały miesiąc, każda dłuższa wiadomość, każdy mail, każdy dokument. Oto co naprawdę się wydarzyło.

Obietnica brzmi jak marketingowa ściema, dopóki nie zobaczysz liczb. Przeciętna osoba pisze na klawiaturze około 40 słów na minutę. Ta sama osoba mówi z prędkością 130 do 150. Naukowcy z Stanforda porównali to jeszcze w 2017 roku i ustalili, że głos jest około 3x szybszy od pisania na telefonie, nawet u osób, które piszą szybko. Na klawiaturze Maca proporcje są w zasadzie takie same.

Matematyka jest bezlitosna: 40 WPM kontra 150 WPM

Załatwmy tę część od razu. Większość nieprzeszkolonych dorosłych pisze z prędkością 38–40 WPM. Wprawni typiści, ci, którzy nigdy nie patrzą na klawiaturę, dobijają do 65. Mowa potoczna to 130–150 WPM. Nawet w starciu z szybkim typistą daje to ponad 2x. W porównaniu z przeciętną osobą — bliżej 3,75x.

Tyle teoria. Praktyka jest ciekawsza. Kiedy po raz pierwszy faktycznie zmierzysz sobie czas dyktowania maila i porównasz go z pisaniem, różnica nie jest aż tak duża, jak sugeruje matematyka. Dlaczego? Bo pisanie to jedna czynność. Dyktowanie to mów, potem sprawdź, potem może przedyktuj zdanie jeszcze raz, potem wklej. Podatek od poprawek zjada twoje zyski.

Rozwiązanie tkwi w narzędziu. Stare dyktowanie zwraca surowy zapis z każdym „yyy”, każdym „eee”, każdym „no więc tak naprawdę chciałem powiedzieć”. Nowsze narzędzia polerują to do czystego tekstu w jednym kroku. Kiedy poprawki dzieją się automatycznie, te 3x są jak najbardziej realne.

Jak naprawdę wygląda „3x szybciej” w prawdziwym dniu pracy

Oto normalny wtorek u mnie przed zmianą. Sześć dłuższych wiadomości na Slacku (po ~80 słów), cztery maile (po ~120 słów), dwa krótkie dokumenty (po ~400 słów), garść jednolinijkowych odpowiedzi. Łączna produkcja: około 1800 słów. Czas przy klawiaturze, pomijając czas myślenia: jakieś 45 minut.

Ta sama objętość po zmianie. Łączna mówiona produkcja, razem z poprawkami, wyszła około 14 minut. Niemal dokładnie 3x. To, co mnie zaskoczyło, nie był to zaoszczędzony czas. Zaskoczyło mnie, gdzie ten czas się podział. Przestałem otwierać szkic, odchodzić od komputera, wracać i przepisywać wszystko od nowa. Myśl wychodziła mi z głowy i lądowała na ekranie za jednym razem.

Porównanie obok siebie: 45 minut pisania na klawiaturze i 14 minut mówienia tej samej treści

Gdzie dyktowanie sprawdza mi się dobrze: - Długie wątki na Slacku - Odpowiedzi mailowe dłuższe niż dwa zdania - Notatki ze spotkania w trakcie spotkania - Pierwsze szkice czegokolwiek - Dokumenty typu brain dump - Notatki głosowe, które później stają się dokumentami

Gdzie nie pomaga: - Krótkie odpowiedzi („ok”, „dzięki”) - Kod - Strukturalne tabele - Hasła - Wszystko, nad czym trzeba się głęboko zastanawiać słowo po słowie

Pierwszy tydzień był słaby. Oto co poszło nie tak.

Trzeciego dnia prawie się poddałem. Pierwszym problemem było samo mówienie do komputera. Czułem się jak na pokaz. Zaczynałem zdanie, traciłem rezon, milkłem i kończyłem z półdotranskrybowaną myślą, której poprawienie trwało dłużej niż przepisanie.

Drugim problemem było przesadzanie. Mówiłem tak, jakbym dyktował oficjalne pismo — powoli i ostrożnie, wymawiając każde słowo. Tekst na wyjściu wychodził mechaniczny, a przewaga prędkości znikała. Po prostu pisałem ustami, tyle że źle.

Rozwiązanie okazało się odwrotne do tego, czego się spodziewałem. Mów szybciej, nie wolniej. Mów tak, jakbyś tłumaczył coś koledze z pracy, łącznie z falstartami i „a w sumie, wytnij to, powiem inaczej”. Dobre narzędzie do polerowania to wyczyści. Przestań próbować dyktować. Po prostu mów.

Przełom: wiedzieć, kiedy nie dyktować

Tym, co przerzuciło dyktowanie głosowe z „okazjonalnego eksperymentu” w „domyślną metodę pisania”, był pewien model myślenia: głos do *pierwszych szkiców*, klawiatura do *poprawek*. Klawiatura jest precyzyjna. Głos jest szybki. Powiedz wersję na brudno, a potem klawiaturą popraw to jedno słowo, które wyszło źle.

Z perspektywy czasu brzmi to oczywiście. Na początku oczywiste nie było. Ciągle próbowałem dyktować idealną prozę i frustrowałem się, kiedy wypolerowany tekst nie był *dokładnie* tym, czego chciałem. Tym, co w końcu pomogło, było obniżenie standardów dla dyktowanego szkicu. Wyrzuć z siebie myśl. Popraw ją w dwie sekundy klawiaturą. Idź dalej.

Dlatego właśnie workflow „polerowanie w locie” ma takie znaczenie. Jeśli musisz najpierw podyktować, potem ręcznie wyczyścić wypełniacze, potem poprawić gramatykę, a na końcu sformatować to pod aplikację, w której jesteś, to przewaga prędkości znika. Cały sens polega na tym, że poprawki dzieją się automatycznie. Zanim skończysz mówić, tekst jest już gotowy do wklejenia. Voicr robi dokładnie to na Macu: trzymasz FN, mówisz, puszczasz, wklejasz. Polerowanie idzie w tle.

Workflow, który się przyjął (Slack, mail, dokumenty)

Po miesiącu osiadły mi trzy schematy pracy. Każdy potrzebował lekko innego ustawienia.

Trzy okna aplikacji (Slack, mail, dokument), każde z ikoną mikrofonu i inną etykietą stylu pisania

Slack i czat

To była największa zmiana. Piszę dużo długich wiadomości na Slacku: tłumaczenia decyzji, post mortemy, długie wątki. Kiedyś zajmowały mi po dziesięć minut. Teraz trzy. Dyktuję wiadomość za jednym podejściem, wklejam, zerkam pod kątem literówek, wysyłam. (Zamiana mowy na tekst w Slacku na Macu szczegółowo omawia konfigurację per kanał.)

Mail

To w mailu spodziewałem się największych zysków, a na początku dostałem najwięcej bałaganu. Problem: mail ma swój ton. Nie podyktujesz odpowiedzi do szefa w taki sam sposób, w jaki dyktowałbyś wiadomość na Slacku do kolegi z zespołu. Rozwiązaniem okazał się styl per aplikacja. Formalny do maila, swobodny do czatu. (Jak dyktować maile na Macu opisuje to ze szczegółami.)

Dokumenty i notatki

Z dokumentami jest najdziwniej. Krótkie notatki działają świetnie. Podyktuj, wklej, gotowe. Długie dokumenty już nie, bo myślenie jest tu strukturalne. Nie piszesz zdań. Wyznaczasz sekcje, przesuwasz fragmenty, restrukturyzujesz. W długich dokumentach dyktuję akapit po akapicie, a strukturę trzymam na klawiaturze.

Co zyskałem poza prędkością

3x to nagłówek. Niespodziewane wygrane są większe.

Mniej niedokończonych szkiców. Kiedy wąskim gardłem jest pisanie, każda dłuższa wiadomość zaczyna się jako szkic, który niby kiedyś dokończysz. Większość z nich umiera w folderze ze szkicami. Głos zamyka lukę między myślą a wysłaniem. Wysyłam teraz rzeczy, które kiedyś leżały niewysłane po dwa dni.

Mniejsze obciążenie nadgarstków. Nie będę twierdził, że dyktowanie głosowe wyleczyło mi ręce. Ale różnica między 6 godzinami pisania a 2 godzinami pisania jest realna, i moje nadgarstki czują to w piątkowy wieczór.

Lepsze pierwsze szkice. Tu się zdziwiłem. Kiedy przegadasz myśl, naturalnie układasz ją tak, jak żywy człowiek by ją wytłumaczył. Pisane pierwsze szkice są zwykle sztywniejsze. Czyta się je jak coś napisanego, bo takie właśnie są. Dyktowane szkice brzmią jak człowiek, a tego zwykle chcesz.

Haczyk, o którym nikt cię nie uprzedza

Dwa realne minusy. Oba mają obejścia, ale warto je znać przed startem.

Nie podyktujesz w open spasie. Ani w kawiarni. Ani nigdzie, gdzie ktoś inny jest w zasięgu słuchu. Brzmi oczywiście, ale to większe ograniczenie, niż się wydaje. Jeśli pracujesz w przestrzeni współdzielonej, dyktowanie głosowe staje się narzędziem „tylko na dni z domu”, co ogranicza zysk produktywności.

Nawet z dobrymi narzędziami zostaje podatek od poprawek. Jest mały. Może jedna poprawka na akapit zamiast jednej na zdanie. Ale nie zerowy. Matematyka i tak działa na twoją korzyść z ogromnym zapasem, ale udawanie, że poprawek nie ma w ogóle, kończy się rozczarowaniem.

Jak rzeczywiście to przetestować, nie odpadając po trzech dniach

Kilka zasad, które ktoś powinien był mi dać pierwszego dnia.

Zacznij od jednej aplikacji, nie od wszystkich naraz. Wybierz tę, w której piszesz najwięcej mało zobowiązującego, dłuższego tekstu. U mnie był to Slack. Używaj głosu w tej jednej aplikacji i nigdzie indziej przez tydzień. Nie próbuj przestawić całego workflow naraz.

Daj sobie tydzień na sceptycyzm. Trzeci dzień będzie słaby. Piąty będzie znośny. Siódmego dnia zaczniesz czuć lukę, kiedy wrócisz do pisania na klawiaturze. Jeśli odpadniesz na trzecim, nigdy nie dotrzesz do siódmego.

Używaj narzędzia, które domyślnie poleruje tekst. To pojedynczy najważniejszy czynnik. Surowe narzędzia do transkrypcji marnują twoje zyski na sprzątaniu. Narzędzie, które samo wyrzuca wypełniacze, poprawia gramatykę i strukturyzuje tekst, to jedyne, w którym te 3x rzeczywiście się ujawniają.

Nigdy nie dyktuj przy innych ludziach. Nie dlatego, że to głośne (nie jest). Dlatego, że skrępowanie zabije ci prędkość. Przez pierwszy miesiąc znajdź sobie spokojne miejsce.

Od czego zacząć

Szczere podsumowanie: dyktowanie głosowe działa. Nie w sensie „to zmienia wszystko”, jak obiecują reklamy. W sensie „jestem gotowy o 16”. Te 3x są realne, a każde narzędzie, które nie bierze na siebie poprawek, to powód, dla którego ludzie odpadają od dyktowania już w pierwszym tygodniu.

Najszybszy sposób, żeby sprawdzić to na sobie, to podyktować jutro następną długą wiadomość na Slacku zamiast ją napisać. Jeśli chcesz, żeby polerowanie szło automatycznie — mowa zamieniana w gotowy do wklejenia tekst w jednym kroku, ze stylem dobranym pod aplikację — to właśnie robi Voicr na Macu. Naciśnij i przytrzymaj FN z dowolnego miejsca, mów przez trzydzieści sekund, puść, wklej. Spróbuj jutro rano przy jednej wiadomości. Do końca tygodnia będziesz wiedzieć, czy te 3x są realne także u ciebie.