Quay lại Blog

Voicr Team · 23 tháng 5, 2026

Cách tôi dùng AI để xóa khoảng cách giữa suy nghĩ và viết

Góc nhìn cá nhân về quy trình AI cuối cùng đã giúp những gì trong đầu tôi xuất hiện trên trang giấy ở tốc độ gần bằng tốc độ suy nghĩ.

Cách tôi dùng AI để xóa khoảng cách giữa suy nghĩ và viết

Phần lớn các buổi sáng, tôi mở laptop với ý tưởng rõ ràng về điều mình muốn viết. Email đầu tiên đã được soạn sẵn trong đầu. Nhưng đến lúc các ngón tay chạm bàn phím, một nửa ý tưởng đã trôi mất. Tôi gõ phần còn nhớ được, nhìn chằm chằm vào màn hình, rồi cố lục lại phần còn lại.

Khoảng cách giữa việc biết mình muốn nói gì và việc đưa được nó lên trang giấy chính là điều tôi gọi là khoảng cách đó. Trong nhiều năm tôi đã coi nó như một phần của việc viết. Thực ra không phải. Nó là cái giá phải trả cho công cụ. AI là thứ đầu tiên thực sự thu hẹp được nó cho tôi.

Đây là góc nhìn ngôi thứ nhất. Không phải bài liệt kê, không phải bài điểm danh công cụ. Chỉ là quy trình tôi đã định hình trong năm qua, những phần hoạt động tốt, và những phần vẫn chưa ổn.

Vấn đề tốc độ chẳng ai nói tới

Các con số giải thích vì sao khoảng cách này tồn tại. Một người gõ máy tính bàn bình thường đạt khoảng 40 từ mỗi phút. Người chuyên nghiệp giỏi đạt 60 hoặc 70. Tốc độ nói chuyện thông thường rơi vào khoảng 150 wpm mà không cần cố gắng. Lời nói nội tâm, tức giọng nói trong đầu khi bạn dựng một câu, còn nhanh hơn nữa, với các ước tính lên tới khoảng 300 wpm ở mức cao.

Vậy tỷ lệ thô là: suy nghĩ ở mức 300, nói ở mức 150, gõ ở mức 40. Gõ phím là khâu chậm nhất trong chuỗi, chậm cách biệt. Mọi thứ bạn phải chờ đều là ma sát, và ma sát là nơi ý tưởng rò rỉ ra ngoài.

Điều thay đổi với tôi không phải tốc độ gõ. Tôi không gõ nhanh hơn. Thay đổi là chuyển nút thắt cổ chai. Tôi ngừng cố viết ở tốc độ gõ và bắt đầu cho phép mình viết ở tốc độ nói, để AI dọn dẹp ở phía sau.

Vì sao gõ phím âm thầm thu hẹp bạn lại

Cái giá của việc gõ không chỉ là tốc độ. Vấn đề là bạn bắt đầu cắt gọt suy nghĩ để vừa với nút thắt. Bạn viết phiên bản ngắn hơn. Bạn bỏ qua sắc thái. Bạn bỏ ví dụ. Bạn nhấn gửi và thấy hơi áy náy vì nội dung thành ra nhạt nhẽo thế nào.

Tôi thấy điều này rõ nhất trên Slack. Tôi bắt đầu gõ một câu trả lời chỉn chu, nhìn con trỏ đứng yên trong khi viết lại câu đó trong đầu, rồi xóa hết và gửi đúng ba từ. "Ổn nhé." "Hiểu rồi." "Đang làm." Rất nhiều cuộc trao đổi công việc kết thúc ở đó, không phải vì tôi không có gì để nói thêm, mà vì việc thêm vào tốn nhiều hơn giá trị nó mang lại.

Khi tôi ngừng gõ những câu trả lời đó và bắt đầu nói chúng ra, tin nhắn trở nên dài hơn, ấm áp hơn và rõ ràng hơn. Vẫn là bộ não đó. Chỉ khác kênh xuất ra.

Cảm giác thực sự khi khoảng cách được xóa bỏ

Đây là một cảnh sáng thứ Ba. Một khách hàng gửi email hỏi tại sao dự án bị chậm. Có một câu trả lời thật: một phần do thay đổi phạm vi từ phía chúng tôi, một phần do họ phê duyệt muộn, một phần do tuần nghỉ lễ. Đó không phải câu trả lời một dòng. Đó là ba đoạn văn cần khéo léo mà không vòng vo.

Phiên bản tôi trước kia sẽ mở thư trả lời, gõ câu đầu tiên hai lần, xóa đi, rồi mất mười lăm phút để cho ra bốn đoạn văn lịch sự nhưng không nói đúng điều mình muốn.

Phiên bản tôi hiện tại giữ một phím, nói trong chín mươi giây rồi thả ra. Câu trả lời đã nằm sẵn trong email, đã được chia đoạn, đã được dọn sạch các từ thừa. Tôi đọc lại một lần, sửa một câu, gửi đi. Email mất hai phút thay vì mười lăm, và gần với điều tôi thực sự muốn nói hơn, vì tôi không bao giờ phải nén suy nghĩ xuống tốc độ gõ.

Một bong bóng thoại lộn xộn ở bên trái đang được AI mài giũa thành một email có cấu trúc gọn gàng ở bên phải

Lần đầu tiên nó hoạt động, tôi ngồi đó hơi sững người. Không phải vì công nghệ quá kỳ diệu. Không hề. Lý do đơn giản hơn: ma sát mà tôi vẫn chấp nhận như một phần của việc viết bỗng dưng trở thành tùy chọn.

Hai lớp AI tạo nên sự khác biệt

Tôi mất một thời gian mới nhận ra quy trình của mình có hai lớp AI, và cả hai đều đang làm việc. Mọi người thường nói về lớp này hoặc lớp kia, hiếm khi cả hai.

Lớp 1: vào bằng giọng nói, ra bằng văn bản sạch

Lớp đầu tiên là chính tả bằng giọng nói có AI tinh chỉnh. Tôi giữ một phím, nói bình thường (với các tiếng "ờ", các lần nói lại và những câu dở dang), và đoạn văn xuất hiện trong clipboard đã được dọn sạch sẵn. Từ thừa bị bỏ. Ngữ pháp được sửa. Những câu lan man được chia thành đoạn thực sự.

Đây không giống với chính tả tích hợp sẵn. Chính tả của Apple cho bạn bản ghi thô với cả tiếng "ờ" còn nguyên. AI tinh chỉnh viết lại bản ghi đó trong khi vẫn giữ được điều bạn muốn nói. Khác biệt giữa hai thứ là khác biệt giữa một bản thu âm và một bản nháp.

Lớp 2: vào bằng văn bản, ra bằng văn bản tốt hơn

Lớp thứ hai là chỉnh sửa văn bản tại chỗ. Tôi chọn một đoạn đã viết (một đoạn văn, một câu, hay cả một email), nhấn một phím tắt, chọn một lệnh như "súc tích hơn" hoặc "giọng văn mềm hơn", và phần được chọn sẽ được viết lại ngay tại chỗ. Không cần chuyển tab. Không cần copy-paste sang chatbot. Đoạn văn cũ được thay bằng phiên bản tốt hơn của chính nó.

Chính tả bằng giọng nói đưa suy nghĩ lên trang giấy thật nhanh. Chỉnh sửa tại chỗ lo nốt 10 phần trăm cuối để hoàn thiện. Kết hợp lại, chúng đưa bạn gần với tốc độ viết bằng tốc độ nói hơn bất kỳ lớp riêng lẻ nào.

Quy trình hằng ngày tôi thực sự dùng

Đây là hình dung về một ngày trung bình trong thực tế. Không có gì lý thuyết ở đây. Đó là hình dạng thật của việc viết của tôi bây giờ.

Hộp thư buổi sáng. Tôi đọc từng email, rồi đọc to câu trả lời. Phần lớn chỉ một đoạn. Một vài cái dài hơn. Gần như không cái nào được gõ. Cả mớ email từng ngốn cả tiếng đồng hồ đầu tiên nay chỉ mất khoảng hai mươi phút.

Slack suốt cả ngày. Trả lời ngắn vẫn được gõ, vì ma sát thấp và công sức tinh thần nhỏ. Bất cứ thứ gì cần hơn hai câu sẽ được nói. Giọng văn tự nhiên thành ra thân mật, vì đó là cách tôi nói trên Slack.

Tài liệu và ghi chú. Bản nháp đầu hầu như luôn được đọc ra. Tôi mở một tài liệu trắng, nói trong năm đến mười phút về bất cứ điều gì muốn trình bày, rồi đã có một bản nháp thật sự để làm việc. Chỉnh sửa một bản nháp nhanh hơn nhiều so với bắt đầu một bản nháp, và khoảng cách giữa suy nghĩ và viết rộng nhất chính ở giai đoạn trang giấy trắng.

Lượt chỉnh sửa. Đây là lúc lớp thứ hai phát huy giá trị. Tôi chọn những câu đọc lên thấy thô và yêu cầu phiên bản gọn hơn. Tôi chọn những đoạn nghe quá cứng và yêu cầu giọng văn ấm hơn. Mỗi lần chỉnh sửa mất hai giây, tại chỗ, không phải chuyển ứng dụng.

Có một điều khiến tôi bất ngờ: tổng số từ tôi viết ra giờ nhiều hơn chứ không ít hơn. AI không thay thế sản lượng của tôi. Nó chỉ bỏ đi phần công việc vốn chỉ là thuế gõ phím.

Nếu bạn muốn xem kỹ hơn phần dành riêng cho email của quy trình này, tôi đã đi sâu vào nó trong bài Đọc chính tả email trên Mac.

Cài đặt duy nhất khiến mọi thứ hoạt động

Có một cài đặt tôi suýt bỏ qua khi mới thử kiểu quy trình này, và hóa ra nó là thứ khiến tất cả trở nên dùng được: phong cách viết theo từng ứng dụng.

Slack và email không cần cùng một giọng văn. Một thư xin việc trang trọng không cần cùng giọng với một buổi động não trên Notion. Nếu AI tinh chỉnh làm phẳng mọi thứ về cùng một giọng, đầu ra nhanh hơn nhưng tệ hơn, và bạn sẽ thôi tin tưởng nó.

Đây chính là lý do Voicr có Smart Rules. Bạn đặt giọng thân mật cho Slack, giọng trang trọng hơn cho Mail, và giọng tối giản cho terminal. Voicr phát hiện ứng dụng đang hoạt động và áp dụng đúng phong cách mà bạn không phải làm gì. Tôi đọc chính tả y hệt nhau trong mọi ứng dụng; đầu ra thì tự điều chỉnh. Đó là mẹo khiến tôi thôi quay về bàn phím cho những tin nhắn "quan trọng".

Nơi chính tả thô sụp đổ (và tinh chỉnh cứu bạn)

Chính tả thô có một kiểu thất bại đặc trưng mà ai đã thử đều sẽ nhận ra. Bạn nói một đoạn văn. Bản ghi trả về với mọi tiếng "ờ" còn nguyên, hai lần nói lại của bạn được ghép vào nhau, và một câu kéo dài bốn mươi từ vì bạn không ngắt nghỉ.

Bạn có thể chỉnh sửa nó. Nhưng chỉnh sửa một bản ghi thô lại là một loại công việc riêng, và có khi còn chậm hơn việc gõ luôn cho gọn ngay từ đầu. Đó là lý do hầu hết những ai thử chính tả tích hợp sẵn đều bỏ cuộc sau một tuần.

Tinh chỉnh làm thay đổi bài toán. Khi AI bỏ đi các từ thừa, sửa ngữ pháp, và chia bức tường lời nói thành các đoạn, đầu ra là thứ tôi có thể gửi đi mà không cần viết lại. Bước chính tả thôi là bản nháp số không và bắt đầu gần với một bản nháp hoàn chỉnh.

Đây là phần các bài viết cạnh tranh thường lướt qua. Lợi thế tốc độ của giọng nói so với gõ là có thật, nhưng nó chỉ có giá trị nếu bạn không phải trả lại bằng thời gian dọn dẹp.

Đánh đổi thẳng thắn

Không phải tất cả đều thắng đẹp. Một vài thứ vẫn tốt hơn khi gõ:

- Văn bản nặng tính kỹ thuật có code, tên lệnh hoặc mã SKU sản phẩm. Chính tả nhận được từ ngữ; không phải lúc nào cũng nhận đúng ký hiệu. Tôi vẫn gõ code. - Môi trường ồn ào. Quán cà phê, máy bay, văn phòng chung. Nói với laptop trong phòng yên tĩnh thì ổn. Làm điều đó cạnh ai đó đang gọi điện thì không. - Chủ đề nhạy cảm khi có người khác xung quanh. Một email chia tay hay một ghi chú góp ý thẳng là thứ tôi thà gõ còn hơn nói thành tiếng để người khác nghe thấy. - Chỉnh sửa sâu. Khi tài liệu gần như đã xong, tôi thích thực hiện các chỉnh sửa nhỏ và chính xác bằng bàn phím. Giọng nói dùng để đưa nội dung lên trang, không phải để dịch chuyển dấu phẩy.

Biết lúc nào nên quay về bàn phím cũng là một phần của quy trình. Bàn phím không biến mất. Nó chỉ không còn là lựa chọn mặc định.

Điều này đã thực sự thay đổi gì với tôi

Câu trả lời thẳng thật không phải là "Tôi tạo ra nội dung gấp 4 lần". Nó nhỏ hơn và lạ lẫm hơn thế.

Tôi gửi các trả lời Slack dài hơn vì chi phí viết chúng đã giảm. Tôi để lại ít ghi chú dở dang hơn vì đọc ra một suy nghĩ trọn vẹn nhanh hơn gõ một mảnh ghép. Tôi viết bản nháp đầu ngay trong ngày ý tưởng xuất hiện, thay vì để dành cho một khoảng thời gian tập trung mà thường chẳng bao giờ đến. Khoảng cách giữa lúc có ý tưởng và lúc có bản nháp của nó đã rút từ vài ngày xuống vài phút.

Đó là thứ các con số tốc độ không nắm bắt được. Câu hỏi thực sự là liệu hành động viết đã trở nên rẻ đủ để bạn làm bất cứ khi nào muốn, thay vì dành dụm cho một khoảng thời gian tập trung mà thường chẳng bao giờ đến.

Cách thử ngay hôm nay

Nếu bạn muốn kiểm tra liệu cách này có hợp với mình không, đừng cố thiết kế lại toàn bộ quy trình. Chọn một thời điểm.

1. Chọn email phản hồi tiếp theo cần hơn hai câu. 2. Thay vì gõ, hãy giữ phím chính tả và nói điều bạn muốn nói. Đừng soạn trước. Cứ nói thôi. 3. Thả phím và đọc lại nội dung vừa xuất hiện trong khung. 4. Nếu nó gần với điều bạn muốn nói, sửa một hai câu chưa ổn rồi gửi đi.

Làm điều này năm lần. Đến cuối ngày đầu tiên, bạn sẽ biết liệu khoảng cách tôi đang nói có phải là khoảng cách của bạn hay không.

Nếu bạn muốn có sẵn quy trình bên trên mà không phải tự ghép từng mảnh, Voicr là ứng dụng tôi đang dùng. Giữ FN, nói, dán. Đầu ra đã được tinh chỉnh, giọng văn thích ứng theo từng ứng dụng bạn đang dùng, và chọn văn bản rồi nhấn ⌥Space sẽ cho bạn chỉnh sửa tại chỗ cho lượt thứ hai. Năm nghìn từ mỗi tháng là miễn phí nếu bạn chỉ muốn xem liệu nó có gắn bó được với mình không.

Bàn phím sẽ không đi đâu cả. Nhưng lần đầu tiên trong hai mươi năm viết trên máy tính, nó không còn là nút thắt cổ chai mà tôi phải vạch kế hoạch để né tránh.