Tôi đang viết dở một câu trả lời trên Slack thì chợt nhận ra. Tôi đã nghĩ cùng một câu trong đầu suốt mười hai giây, trong khi các ngón tay mới gõ xong bốn từ đầu. Não tôi đang chờ không, đợi đôi tay đuổi theo.
Đó là khoảnh khắc tôi quyết định thử nghiêm túc việc đọc chính tả bằng giọng nói. Không phải kiểu nửa vời "để tôi thử ghi chú một cuộc họp" mà tôi đã bỏ cuộc hai lần. Cả một tháng trời, mọi tin nhắn dài, mọi email, mọi tài liệu. Và đây là chuyện thực sự đã xảy ra.
Lời quảng cáo nghe như thổi phồng cho đến khi bạn nhìn vào con số. Một người trung bình gõ khoảng 40 từ mỗi phút. Cũng người đó nói được 130 đến 150 từ mỗi phút. Các nhà nghiên cứu ở Stanford đã so sánh từ năm 2017 và kết luận rằng nói nhanh gấp khoảng 3 lần so với gõ trên điện thoại, kể cả với những người gõ nhanh. Tỉ lệ này về cơ bản vẫn đúng trên bàn phím Mac.
Phép tính khắc nghiệt: 40 WPM so với 150 WPM
Nói thẳng phần này luôn. Hầu hết người lớn không được đào tạo gõ khoảng 38 đến 40 từ mỗi phút. Người gõ thành thạo, kiểu không cần nhìn bàn phím, đạt đỉnh quanh 65. Tiếng Anh hội thoại rơi vào 130 đến 150 từ mỗi phút. Ngay cả khi so với người gõ nhanh, vẫn nhanh hơn 2 lần. So với người trung bình, gần 3,75 lần.
Đó là lý thuyết. Thực tế thú vị hơn. Lần đầu bạn thực sự bấm giờ đọc một email so với gõ nó, khoảng cách không rộng như phép tính gợi ý. Vì sao? Vì gõ là một động tác liên tục. Còn đọc chính tả là nói, rồi đọc soát, rồi có thể đọc lại một câu, rồi dán. Phần dọn dẹp ăn mất phần lợi của bạn.
Giải pháp nằm ở công cụ. Đọc chính tả kiểu cũ cho bạn một bản phiên âm thô với từng tiếng "ờ," từng tiếng "ừm," từng câu "thực ra ý tôi là." Công cụ mới mài giũa thứ đó thành văn bản sạch chỉ trong một bước. Khi việc dọn dẹp diễn ra tự động, con số 3 lần là có thật.
Thực tế "nhanh gấp 3" trông như thế nào trong một ngày làm việc
Đây là một thứ Ba bình thường của tôi trước khi chuyển. Sáu tin Slack dài (khoảng 80 từ mỗi tin), bốn email (khoảng 120 từ mỗi email), hai tài liệu ngắn (khoảng 400 từ), và một loạt trả lời một dòng. Tổng đầu ra đã gõ: khoảng 1.800 từ. Thời gian ngồi bàn phím, không tính thời gian suy nghĩ: khoảng 45 phút.
Cùng khối lượng đó sau khi chuyển. Tổng đầu ra bằng giọng nói, đã qua dọn dẹp, mất khoảng 14 phút. Gần như đúng 3 lần. Điều khiến tôi bất ngờ không phải là thời gian tiết kiệm được. Mà là thời gian đó đi đâu. Tôi không còn mở một bản nháp, đứng dậy, quay lại, rồi viết lại từ đầu nữa. Suy nghĩ rời khỏi đầu và hạ cánh xuống màn hình trong một lần duy nhất.

Những lúc đọc chính tả hợp với tôi: - Các luồng Slack dài - Trả lời email dài hơn hai câu - Ghi chú trong lúc họp - Bản nháp đầu tiên của mọi thứ - Tài liệu kiểu "xả não" - Ghi âm giọng nói rồi biến thành tài liệu sau
Những lúc nó không giúp được: - Trả lời ngắn ("ok," "cảm ơn nhé") - Code - Bảng có cấu trúc - Mật khẩu - Mọi thứ bạn cần cân nhắc kỹ từng từ
Tuần đầu tệ. Đây là lý do.
Tôi suýt bỏ cuộc vào ngày thứ ba. Vấn đề đầu tiên là chuyện nói với máy tính. Cảm giác như đang diễn. Tôi bắt đầu một câu, mất tự tin, dừng lại, và kết quả là một dòng phiên âm dở dang mà sửa còn lâu hơn gõ.
Vấn đề thứ hai là cố quá. Tôi nói cứ như đang đọc cho ai chép một bức thư trang trọng, chậm rãi và cẩn thận, phát âm rõ từng chữ. Đầu ra trả về nghe như robot và lợi thế tốc độ biến mất. Tôi chỉ đang gõ bằng miệng, mà còn gõ tệ.
Cách khắc phục hóa ra ngược hẳn với điều tôi tưởng. Hãy nói nhanh hơn, đừng chậm lại. Nói theo cách bạn giải thích cho một đồng nghiệp, bao gồm cả những lần lỡ lời và những câu kiểu "khoan, bỏ đoạn đó đi, để tôi nói lại theo cách khác." Một công cụ mài giũa tốt sẽ dọn sạch những thứ đó. Đừng cố đọc chính tả. Cứ nói tự nhiên.
Bước ngoặt: biết khi nào không nên đọc chính tả
Thứ biến đọc chính tả từ "trò thử nghiệm thi thoảng" thành "phương thức nhập mặc định" là một mô hình tư duy: nói cho *bản nháp đầu*, gõ cho *chỉnh sửa*. Bàn phím chính xác. Giọng nói nhanh. Hãy nói ra phiên bản lộn xộn, rồi dùng bàn phím để sửa cái từ duy nhất bị nhầm.
Nghe có vẻ hiển nhiên khi nhìn lại. Lúc bắt đầu thì chẳng hiển nhiên chút nào. Tôi cứ cố đọc cho ra văn xuôi hoàn hảo rồi bực mình khi đầu ra đã mài giũa lại không *đúng y như* tôi muốn. Thứ cuối cùng giúp được là hạ tiêu chuẩn cho bản nháp đọc. Cứ tống ý tưởng ra đã. Sửa trong hai giây bằng bàn phím. Đi tiếp.
Cũng vì thế mà quy trình mài-giũa-song-song mới quan trọng đến vậy. Nếu bạn phải đọc, rồi tự dọn các từ đệm, rồi sửa ngữ pháp, rồi định dạng lại cho hợp ứng dụng đang dùng, thì lợi thế tốc độ biến mất. Cốt lõi là việc dọn dẹp phải diễn ra tự động. Đến lúc bạn ngừng nói, văn bản đã sẵn sàng để dán. Voicr làm đúng việc đó trên Mac: giữ FN, nói, thả ra, dán. Phần dọn dẹp chạy ngầm.
Quy trình tôi giữ lại được (Slack, email, tài liệu)
Sau một tháng, ba quy trình đã định hình. Mỗi quy trình cần một thiết lập hơi khác.

Slack và chat
Đây là cú mở khóa lớn nhất. Tôi viết rất nhiều tin Slack dài: giải thích quyết định, đánh giá sau sự cố, các luồng thảo luận dài. Trước đây những tin này tốn của tôi mười phút. Giờ chỉ ba phút. Tôi đọc cả tin trong một lần, dán, lướt xem có lỗi không, gửi. (Voice-to-text trên Slack cho Mac phân tích kỹ phần thiết lập theo từng kênh.)
Email là nơi tôi kỳ vọng lợi ích lớn nhất nhưng ban đầu lại nhận về kết quả lộn xộn nhất. Vấn đề: email có sắc thái riêng. Bạn không thể đọc một câu trả lời cho sếp giống như đọc một tin Slack cho đồng nghiệp. Cách khắc phục là dùng phong cách riêng cho từng ứng dụng. Trang trọng cho email, thoải mái cho chat. (Cách đọc chính tả email trên Mac nói chi tiết về việc này.)
Tài liệu và ghi chú
Tài liệu là trường hợp kỳ lạ nhất. Ghi chú ngắn thì hợp lắm. Đọc, dán, xong. Tài liệu dài thì không, vì việc suy nghĩ ở đây mang tính cấu trúc. Bạn không viết câu nữa. Bạn đang phác mục, di chuyển các đoạn, tái cấu trúc. Với tài liệu dài, tôi đọc từng đoạn một và giữ phần cấu trúc trên bàn phím.
Những thứ tôi nhận được ngoài tốc độ
Con số 3 lần là tít báo. Còn những phần thưởng bất ngờ mới là cái lớn hơn.
Ít bản nháp dở dang hơn. Khi việc gõ là nút thắt, mọi tin nhắn dài đều bắt đầu dưới dạng bản nháp mà bạn định hoàn thiện sau. Phần lớn chúng chết trong thư mục nháp. Giọng nói rút ngắn khoảng cách giữa suy nghĩ và đầu ra. Giờ tôi gửi đi nhiều thứ mà trước kia có thể nằm chưa gửi suốt hai ngày.
Đỡ mỏi cổ tay. Tôi sẽ không nói rằng đọc chính tả chữa cho đôi tay của tôi. Nhưng khác biệt giữa 6 tiếng gõ phím và 2 tiếng gõ phím là có thật, và cổ tay tôi cảm nhận được vào tối thứ Sáu.
Bản nháp đầu tốt hơn. Cái này thì bất ngờ. Khi bạn nói ra một suy nghĩ, bạn tự nhiên cấu trúc nó theo cách một người sẽ giải thích cho người khác. Bản nháp đã gõ thường cứng hơn. Đọc lên cứ như được viết, vì đúng là được viết. Bản nháp đọc nghe giống người nói, mà đó thường là cái bạn muốn.
Điểm trừ mà chẳng ai cảnh báo bạn
Hai nhược điểm có thật. Cả hai đều có cách khắc phục, nhưng đáng biết trước khi bạn dấn thân.
Không thể đọc chính tả ở văn phòng mở. Hay ở quán cà phê. Hay ở bất cứ chỗ nào có người khác trong tầm tai. Nghe thì hiển nhiên nhưng đây là một giới hạn lớn hơn vẻ ngoài của nó. Nếu môi trường làm việc của bạn là không gian chung, đọc chính tả chỉ là công cụ "dùng ngày làm ở nhà," và điều đó giới hạn lợi ích về năng suất.
Vẫn có phần "thuế dọn dẹp," kể cả với công cụ tốt. Nó nhỏ thôi. Có thể một chỗ sửa cho mỗi đoạn thay vì một chỗ cho mỗi câu. Nhưng vẫn khác không. Phép tính vẫn nghiêng về phía bạn với khoảng cách rất lớn, nhưng nếu coi việc dọn dẹp bằng không thì kiểu gì bạn cũng thất vọng.
Cách thử nghiêm túc mà không bỏ cuộc sau ba ngày
Vài quy tắc mà tôi ước có ai nói cho mình từ ngày một.
Bắt đầu với một ứng dụng, không phải tất cả. Chọn ứng dụng mà bạn viết nhiều văn bản dài, ít rủi ro nhất. Với tôi là Slack. Dùng giọng nói cho riêng ứng dụng đó trong một tuần. Đừng cố chuyển cả quy trình cùng một lúc.
Đặt thời hạn nghi ngờ là một tuần. Ngày thứ ba sẽ tệ. Ngày thứ năm sẽ ổn. Ngày thứ bảy bạn bắt đầu cảm thấy khoảng cách mỗi khi quay lại gõ phím. Nếu bỏ cuộc vào ngày thứ ba, bạn không bao giờ chạm tới ngày thứ bảy.
Dùng công cụ tự mài giũa mặc định. Đây là yếu tố quan trọng nhất. Công cụ phiên âm thô vứt hết lợi ích vào khâu dọn dẹp. Một công cụ tự loại từ đệm, sửa ngữ pháp và sắp xếp đầu ra mới là loại duy nhất khiến con số 3 lần thực sự hiện ra.
Đừng bao giờ đọc chính tả trước mặt người khác. Không phải vì nó ồn (nó không ồn). Mà vì sự ngại ngùng sẽ giết chết tốc độ. Hãy chọn một chỗ riêng tư trong tháng đầu.
Bắt đầu từ đâu
Tóm tắt thành thật: đọc chính tả bằng giọng nói có hiệu quả. Không theo kiểu "thay đổi mọi thứ" mà lời quảng cáo hứa hẹn. Mà theo kiểu "giờ tôi xong việc lúc 4 giờ chiều." Con số 3 lần là có thật, và bất kỳ công cụ nào không xử lý hộ bạn phần dọn dẹp đều là lý do người ta bỏ cuộc với đọc chính tả ngay trong tuần đầu.
Cách nhanh nhất để tự kiểm chứng là đọc tin Slack dài tiếp theo của bạn thay vì gõ. Nếu bạn muốn phần dọn dẹp được lo tự động, với phần nói được mài thành văn bản sẵn-sàng-để-dán trong một bước và phong cách riêng theo từng ứng dụng, thì đó là việc Voicr làm trên Mac. Giữ FN từ bất cứ đâu, nói trong ba mươi giây, thả ra, dán. Thử trên một tin nhắn vào sáng mai. Cuối tuần bạn sẽ biết con số 3 lần có thật với mình hay không.

