Я був на півдорозі до відповіді в Slack, коли мене осяяло. Я тримав одне й те саме речення в голові вже дванадцять секунд, поки пальці добивали перші чотири слова. Мій мозок простоював, чекаючи, доки руки наздоженуть.
Саме тоді я нарешті дав голосовому введенню чесний шанс. Не оту мляву спробу «ну добре, продиктую одну нотатку з зустрічі», яку я вже двічі кидав. А цілий місяць — кожне довге повідомлення, кожен лист, кожен документ. Ось що насправді сталося.
Звучить як рекламний шум, поки не подивишся на цифри. Середня людина друкує близько 40 слів за хвилину. Та сама людина говорить зі швидкістю 130–150. Стенфордські дослідники зробили це порівняння ще у 2017 році і виявили, що голосове введення приблизно у 3 рази швидше за друк на телефоні — навіть для тих, хто друкує швидко. На клавіатурі Mac пропорція переважно зберігається.
Математика безжальна: 40 WPM проти 150 WPM
Спочатку відкинемо очевидне. Більшість дорослих без спеціальної підготовки друкують десь 38–40 слів за хвилину. Натреновані друкарки, ті, що ніколи не дивляться на клавіатуру, виходять на 65. Розмовна англійська — це 130–150 WPM. Навіть проти швидкого друкарки це більше ніж 2x. Проти середньостатистичної людини — ближче до 3,75x.
Це теорія. Практика цікавіша. Коли вперше реально замірюєш, скільки часу йде на лист, надиктований голосом проти набраного, розрив виявляється не таким великим, як обіцяє арифметика. Чому? Бо друк — це один рух. А диктування — це сказати, потім перечитати, потім, можливо, передиктувати речення, потім вставити. Податок на правку з'їдає виграш.
Розв'язання — у самому інструменті. Старе диктування віддає тобі сирий транскрипт із кожним «е-е-е», «ну», «коротше, я хочу сказати». Новіші інструменти за один крок відшліфовують це до чистого тексту. Коли правка стається автоматично, трикратна різниця стає реальною.
Як «у 3 рази швидше» виглядає у звичайному робочому дні
Ось мій звичайний вівторок до переходу. Шість довших повідомлень у Slack (≈80 слів кожне), чотири листи (≈120 слів кожен), два короткі документи (≈400 слів), купка односкладових відповідей. Сумарний обсяг друку: близько 1800 слів. Час за клавіатурою, не рахуючи обмірковування: десь 45 хвилин.
Той самий обсяг після переходу. Сумарне голосове введення з правкою — близько 14 хвилин. Майже точно у 3 рази менше. Здивував мене не сам зекономлений час. А те, куди він подівся. Я перестав відкривати чернетку, відходити, повертатися й переписувати все наново. Думка вилітала з голови й приземлялася на екран за один прохід.

Де диктування мені справді працює: - Довгі гілки в Slack - Відповіді на листи довші за два речення - Нотатки прямо під час зустрічі - Перші чернетки чого завгодно - Документи-«вивантаження мозку» - Голосові нотатки, які пізніше стають документами
Де не допомагає: - Короткі відповіді («ок», «дякую») - Код - Структуровані таблиці - Паролі - Будь-що, де треба думати над кожним словом окремо
Перший тиждень був провальним. Ось що пішло не так.
На третій день я мало не кинув. Перша проблема — взагалі говорити до комп'ютера. Це здавалося якоюсь виставою. Я починав речення, втрачав запал, зупинявся й отримував напівтранскрибовану думку, яку довше було виправляти, ніж набрати з нуля.
Друга проблема — я надто старався. Говорив так, ніби диктую офіційного листа: повільно, обережно, виартикульовуючи кожне слово. На виході виходило роботизоване, і перевага у швидкості зникала. Я просто друкував ротом, ще й погано.
Розв'язанням виявилося протилежне до того, що я очікував. Говори швидше, а не повільніше. Говори так, як пояснював би щось колезі — з фальстартами, з «стоп, забудь, давай я скажу інакше». Хороший інструмент для шліфування все це почистить. Перестань диктувати. Просто говори.
Прорив: розуміння, коли не диктувати
З «епізодичного експерименту» в «основний спосіб введення» голосове диктування перейшло, коли я засвоїв одну ментальну модель: голос — для *перших чернеток*, клавіатура — для *правок*. Клавіатура точна. Голос швидкий. Промов сирий варіант, а потім клавіатурою виправ те єдине слово, яке вилетіло не так.
Заднім числом це звучить очевидно. На старті очевидним не було. Я знову й знову намагався надиктувати ідеальний текст і дратувався, коли відполірований результат не був *саме тим*, що я хотів. Допомогло знизити вимоги до надиктованої чернетки. Витягни ідею назовні. Дві секунди клавіатурою — і вперед.
Саме тому критичний робочий процес із автоматичним шліфуванням «на льоту» так важливий. Якщо доводиться спочатку надиктувати, потім вручну прибрати слова-паразити, потім виправити граматику, потім підлаштувати формат під застосунок, у якому ти зараз, — переваги у швидкості більше немає. Сенс у тому, що правка робиться автоматично. До моменту, коли ти замовкаєш, текст уже готовий до вставки. Voicr на Mac робить рівно це: затиснув FN, поговорив, відпустив, вставив. Чистка йде у фоні.
Робочий процес, який прижився (Slack, пошта, документи)
Через місяць у мене склалися три сценарії. Кожен потребував трохи інакшого налаштування.

Slack і чати
Тут вийшов найбільший виграш. Я пишу багато довгих повідомлень у Slack: пояснення рішень, пост-мортеми, довгі гілки. Раніше вони забирали десять хвилин. Тепер — три. Я надиктовую повідомлення за один присіст, вставляю, побіжно вичитую на одруківки, надсилаю. (Голос у текст у Slack на Mac розбирає налаштування за каналами.)
Електронна пошта
Від пошти я чекав найбільшого виграшу — і спочатку отримав найбільший безлад. Проблема: у листа є тон. Не можна диктувати відповідь керівнику так само, як повідомлення колезі у Slack. Розв'язання — стиль на кожен застосунок окремо. Офіційний для пошти, неформальний для чату. (Як диктувати листи на Mac це детально розписує.)
Документи й нотатки
Документи — найхимерніший випадок. Короткі нотатки чудово. Надиктував, вставив, готово. Довгі документи — ні, бо там думання структурне. Ти не пишеш речення. Ти будуєш розділи, переставляєш блоки, перебудовуєш каркас. Для довгих документів я диктую абзац за абзацом, а структуру тримаю на клавіатурі.
Що я отримав, крім швидкості
Триразова різниця — це заголовок. Несподівані виграші більші.
Менше напівдочерпних чернеток. Коли вузьке місце — друк, кожне довге повідомлення починається як чернетка, яку «допишу потім». Більшість із них умирає в папці чернеток. Голос закриває розрив між думкою і вихідним текстом. Тепер я надсилаю те, що раніше лежало невідправленим по два дні.
Менше навантаження на зап'ястя. Не стверджую, що голосове введення вилікувало мені руки. Але різниця між 6 годинами друку й 2 годинами друку реальна, і зап'ястя це відчувають у п'ятницю ввечері.
Кращі перші чернетки. Ось це здивувало. Коли проговорюєш думку, ти природно структуруєш її так, як людина пояснювала б її іншій людині. Друковані перші чернетки виходять скутішими. Вони звучать так, ніби їх написали, — бо їх і написали. Надиктовані чернетки звучать як жива людина, а саме цього зазвичай і треба.
Підводний камінь, про який ніхто не попереджає
Два реальні мінуси. В обох є обхідні шляхи, але про них варто знати ще до того, як занурюватися.
Не можна диктувати в опенспейсі. Або в кав'ярні. Або де ще одна людина чує тебе на відстані. Звучить очевидно, але це обмеження більше, ніж здається. Якщо твоє робоче середовище спільне, голосове диктування стає інструментом «лише для домашніх днів», а це звужує виграш у продуктивності.
Податок на правку лишається навіть із хорошими інструментами. Він невеликий. Можливо, одна правка на абзац замість однієї на речення. Але він не нульовий. Математика й далі грає на твою користь із величезним запасом, але якщо очікувати нульової чистки, розчарування неминуче.
Як спробувати це й не кинути за три дні
Кілька правил, які я хотів би почути першого дня.
Почни з одного застосунку, а не з усіх одразу. Вибери той, де ти пишеш найбільше довгого тексту з низькими ставками. У мене це був Slack. Тиждень — лише цей застосунок і нічого більше. Не намагайся перевести весь процес на голос за раз.
Постав собі тиждень скепсису. Третій день буде поганим. П'ятий — нічого так. На сьомий ти почнеш фізично відчувати розрив, коли повертаєшся до друку. Якщо кинеш на третій, до сьомого вже не дійдеш.
Бери інструмент, який шліфує за замовчуванням. Це найважливіший фактор. Сирі транскриптори зливають увесь виграш у правку. Лише той інструмент, що сам прибирає слова-паразити, виправляє граматику й структурує вихід, дає реальну трикратну різницю.
Ніколи не диктуй при інших людях. Не тому, що це гучно (це не гучно). Бо самосвідомість уб'є тобі швидкість. Перший місяць — лише в тихому місці на самоті.
З чого почати
Чесний підсумок: голосове введення працює. Не в сенсі «це все змінить», як обіцяє маркетинг. А в сенсі «я вже закінчую о 16:00». Триразова різниця реальна, а будь-який інструмент, який не бере на себе правку, — і є та причина, через яку люди кидають диктування на першому тижні.
Найшвидший спосіб перевірити це на собі — надиктувати своє наступне довге повідомлення в Slack замість того, щоб його набирати. Якщо хочеш, щоб правка йшла автоматично, а мовлення за один крок перетворювалося на готовий до вставки текст із власним стилем для кожного застосунку, — саме це Voicr і робить на Mac. Затисни FN звідки завгодно, говори тридцять секунд, відпусти, вставляй. Спробуй завтра вранці на одному повідомленні. До кінця тижня вже знатимеш, чи спрацьовує трикратна різниця особисто в тебе.

