Bạn bắt đầu viết một email bằng tiếng Anh, chuyển sang tiếng Tây Ban Nha để gửi nhanh một tin nhắn cho đồng nghiệp ở Madrid, rồi trả lời Slack bằng tiếng Pháp. Ba ứng dụng, ba ngôn ngữ, mười phút. Một nửa thời gian dành cho ngón tay, nửa còn lại dành cho menu ngôn ngữ trong tính năng đọc chính tả của Mac.
Nếu bạn nói nhiều hơn một ngôn ngữ, tính năng đọc chính tả tích hợp sẵn của Apple có cảm giác như được thiết kế cho người chỉ biết một thứ tiếng. Bạn chọn ngôn ngữ, đọc chính tả, rồi lại lục vào System Settings hoặc bấm vào một menu nhỏ xíu gần con trỏ để đổi. Quên đổi một lần là tiếng Pháp của bạn hiện ra dưới dạng tiếng Anh vô nghĩa.
Có thứ gì đó đã âm thầm thay đổi trong năm qua. Một vài ứng dụng Mac giờ có thể phiên âm và biên tập lời nói của bạn trên khoảng 100 ngôn ngữ, với khả năng tự động phát hiện ngôn ngữ mà không cần bạn động tay vào menu nào. Bài hướng dẫn này sẽ phân tích chính xác điều đó có nghĩa là gì vào năm 2026, ngôn ngữ nào thực sự được hỗ trợ, đâu là giới hạn của công cụ Apple, và cách thiết lập một quy trình đọc chính tả đa ngôn ngữ không bị hỏng mỗi lần bạn chuyển tiếng.
"100 ngôn ngữ trên Mac" thực sự có nghĩa là gì vào năm 2026
Con số 100 ngôn ngữ mà bạn thấy trên website của các ứng dụng không phải là chiêu tiếp thị. Nó đến từ một mô hình cụ thể: Whisper của OpenAI, được huấn luyện trên khoảng 680.000 giờ âm thanh đa ngôn ngữ. Phiên bản phổ biến hiện nay, large-v3-turbo, hỗ trợ 99 ngôn ngữ, và phần lớn các ứng dụng làm tròn thành "100".
Đây là danh sách sơ bộ những gì được hỗ trợ. Trọn bộ ngôn ngữ châu Âu, bao gồm cả nhóm Bắc Âu và Slav. Các ngôn ngữ châu Á chính: Quan Thoại, Nhật, Hàn, Việt, Thái, Indonesia, Tagalog, Mã Lai. Nam Á: Hindi, Bengal, Tamil, Urdu, Marathi, Nepal. Trung Đông: Ả Rập, Do Thái, Ba Tư, Thổ Nhĩ Kỳ, Azerbaijan. Châu Phi: Swahili, Afrikaans. Cộng thêm những ngôn ngữ ít ngờ tới như Welsh, Maori, Belarus, Macedonia, Kazakh và Miến Điện.
Chất lượng không đồng đều trên toàn bộ danh sách đó. Tiếng Anh, Tây Ban Nha, Pháp, Đức, Ý, Bồ Đào Nha, Hà Lan, Nhật và Quan Thoại đứng đầu: tỷ lệ lỗi từ khoảng 4–8% trên âm thanh sạch. Những ngôn ngữ ít phổ biến hơn và có dữ liệu huấn luyện ít ỏi, như Welsh hay Maori, có thể chạm 15–25%. Vẫn dùng được, chỉ là kém khoan dung hơn.
Bước chuyển lớn hơn: tất cả những thứ này giờ chạy được trên một chiếc Mac bình thường. Apple Silicon đạt đến mức mà mô hình large của Whisper có thể phiên âm một đoạn 30 giây trong chưa đầy hai giây ngay trên máy, không cần gửi lên đám mây. Đó là lý do nhiều ứng dụng Mac bỗng trông giống nhau. Tất cả đều dựa trên cùng một mô hình.
Nơi tính năng đọc chính tả tích hợp của Apple chạm trần
Apple Dictation đã có từ năm 2012, và nó miễn phí. Với một ngôn ngữ duy nhất, trong một ứng dụng duy nhất, nó ổn. Với công việc đa ngôn ngữ, có ba thứ làm gãy nhịp.
Số lượng ngôn ngữ. Apple hỗ trợ khoảng 50–60 ngôn ngữ và phương ngữ, tùy phiên bản macOS. Đủ tốt cho các thị trường châu Âu và châu Á lớn, nhưng bạn có thể bó tay nếu cần tiếng Ukraine, Tagalog hay Welsh, hoặc nếu muốn phương ngữ chi tiết hơn vài lựa chọn Apple cung cấp.
Không có tự động phát hiện ngôn ngữ. Apple Dictation dùng ngôn ngữ bạn chọn lần cuối. Quên đổi là tiếng Pháp của bạn đi qua mô hình tiếng Anh và biến thành thứ rác na ná âm vần với những gì bạn vừa nói. Để đổi ngôn ngữ, bạn bấm vào chỉ báo ngôn ngữ tí hon gần con trỏ và chọn từ một danh sách. Mỗi lần chuyển là một bước thủ công.
Bản phiên âm thô, không biên tập. Bạn nói gì là ra y nguyên, gồm cả "ờ," "kiểu," những lần ngập ngừng, và cả câu nói dở dang trước khi bạn đổi ý. Đó đã là vấn đề ngay cả với một ngôn ngữ, và càng tệ hơn trong công việc đa ngôn ngữ, khi bạn thường nói rón rén hơn để giữ cho mô hình không lạc.
Nếu bạn chỉ đọc chính tả bằng tiếng Anh và không ngại dọn dẹp sau đó, công cụ của Apple đủ dùng. Nhưng vừa cần đến ngôn ngữ thứ hai, hoặc muốn đầu ra dán đi được mà không phải đọc lại, bạn đã vượt khỏi tầm của nó.
Cách Whisper xử lý 100 ngôn ngữ phía sau hậu trường
Hiểu sơ sơ điều gì đang diễn ra khi bạn giữ một phím và nói cũng có ích, vì nó giải thích vì sao có chỗ chạy mượt và có chỗ không.
Whisper là một mạng nơ-ron duy nhất được huấn luyện trên âm thanh từ 99 ngôn ngữ. Thay vì chạy một mô hình riêng cho mỗi ngôn ngữ, nó học cách nhận diện tất cả cùng lúc. Việc huấn luyện chung mang lại một điều hữu ích: một câu tiếng Ý và một câu tiếng Bồ Đào Nha chia sẻ đủ đặc trưng âm học để học cái này giúp ích cho cái kia. Mặt trái là mọi ngôn ngữ phải cạnh tranh cùng một dung lượng mô hình, nên những ngôn ngữ hiếm hơn yếu hơn.

Khi âm thanh đi vào, mô hình làm ba việc trong một lượt: 1. Dự đoán ngôn ngữ từ vài giây đầu tiên của âm thanh. 2. Phiên âm các từ. 3. Thêm dấu câu và viết hoa.
Phần phát hiện ngôn ngữ chính là thứ giúp chế độ tự động khả thi. Mô hình đã học cách nhận ra ngôn ngữ nào nghe ra ngôn ngữ nào. Nó thường đoán đúng trong một hai giây sau khi bạn bắt đầu nói. Chỗ nó vấp: lời nói rất ngắn (một hai từ), những ngôn ngữ chia sẻ nhiều từ vựng (Tây Ban Nha và Ý, Na Uy và Thụy Điển), và việc chuyển ngôn ngữ giữa câu. Whisper được dựng để phát hiện một ngôn ngữ mỗi đoạn, không phải để theo bạn nhảy qua nhảy lại giữa hai thứ tiếng.
Nếu bạn muốn hiểu trọn cơ chế biến lời nói thô thành văn bản sạch, bài quy trình đọc chính tả AI trên Mac đi qua từng bước.
Tự động phát hiện so với chọn ngôn ngữ thủ công: khi nào dùng cái nào
Các ứng dụng đọc chính tả đa ngôn ngữ hiện đại đều cho bạn hai chế độ. Biết khi nào dùng cái nào tạo nên ranh giới giữa mượt và bực.
Dùng tự động phát hiện khi:
Bạn đổi ngôn ngữ liên tục trong ngày nhưng mỗi lần đọc chính tả chỉ dùng một ngôn ngữ. Bạn là lập trình viên ở Berlin, viết comment code bằng tiếng Anh và tin nhắn Slack bằng tiếng Đức. Bạn là nhà báo làm việc trên các nguồn tiếng Anh và tiếng Nhật. Bạn xử lý ticket hỗ trợ qua bốn ngôn ngữ. Trong tất cả các trường hợp đó, mỗi bản ghi là một ngôn ngữ; thứ thay đổi là ngôn ngữ nào. Tự động phát hiện giúp bạn khỏi phải lục menu mỗi lần.
Dùng chọn ngôn ngữ thủ công khi:
Bạn làm việc với những ngôn ngữ ít phổ biến nơi việc phát hiện không vững (Welsh, Maori, Belarus). Bạn đọc chính tả trong môi trường ồn nơi giây đầu tiên của âm thanh có thể là tạp âm thay vì lời nói. Bạn đọc những câu rất ngắn không đủ âm thanh để phát hiện. Hoặc bạn dùng một ngôn ngữ chồng lấn với ngôn ngữ khác mà mô hình biết rõ hơn (đôi khi nó đoán là Bồ Đào Nha trong khi bạn đang nói Galician, chẳng hạn).
Điều vẫn chưa chạy tốt:
Chuyển ngôn ngữ giữa câu. Nếu bạn bắt đầu bằng tiếng Tây Ban Nha và chèn một tên thương hiệu tiếng Anh ở giữa, mô hình xử lý được. Nếu bạn mở đầu câu bằng tiếng Tây Ban Nha và kết thúc bằng tiếng Anh, bạn thường sẽ thấy một trong hai bị phiên âm thành thứ vô nghĩa trong ngôn ngữ kia. Cách lách trung thực: kết thúc bản ghi tại ranh giới ngôn ngữ và bắt đầu một bản mới.
Vừa nói vừa dịch: quy trình "nói X, ra tiếng Anh"
Một trong những tính năng dễ bị bỏ qua nhất của tính năng đọc chính tả hiện đại trên Mac là nói-và-dịch. Bạn nói bằng tiếng mẹ đẻ, và văn bản hiện ra đã là một ngôn ngữ khác. Phần lớn trường hợp, ngôn ngữ đích đó là tiếng Anh.
Hai cách tiếp cận nền tảng làm điều này khả thi. Thứ nhất, các phiên bản đa ngôn ngữ cũ hơn của Whisper có sẵn tác vụ dịch: bạn nói trong bất kỳ ngôn ngữ nào trong số 99 và mô hình xuất thẳng ra tiếng Anh. Phiên bản turbo mới không có sẵn cái đó, nên phần lớn ứng dụng giờ dùng cách khác: Whisper phiên âm ở ngôn ngữ gốc, rồi một mô hình ngôn ngữ dịch văn bản. Cách thứ hai có chất lượng cao hơn và biên tập luôn cùng lúc, đó là lý do nó trở thành tiêu chuẩn.
Việc này gói gọn một quy trình thực tế từng phải mất ba bước. Cách cũ: đọc chính tả bằng tiếng mẹ đẻ, sao chép văn bản, dán vào trình dịch, sao chép kết quả, dán vào email. Khoảng 30 giây và bốn lần chuyển ngữ cảnh. Cách mới: giữ một phím, nói bằng tiếng mẹ đẻ, văn bản tiếng Anh đã chỉn chu xuất hiện ngay tại con trỏ. Khoảng 4 giây.
Nếu bạn dành một phần ngày để viết tiếng Anh trong công việc nhưng nghĩ nhanh hơn bằng ngôn ngữ khác, riêng tính năng này thôi đã đủ là lý do để thiết lập đọc chính tả hiện đại. Voicr làm điều này bằng một phím tắt: đặt Auto cho ngôn ngữ đầu vào và English cho đầu ra đã được biên tập, thì mọi bản ghi đều hạ cánh dưới dạng tiếng Anh sẵn-gửi bất kể bạn nói gì.
Quy trình đa ngôn ngữ thực tế trên Mac
Lý thuyết thì rẻ. Đây là những mô hình thực sự tiết kiệm thời gian cho người dùng thật.
Ghi chú và viết nhật ký song ngữ
Nếu bạn ghi chú bằng tiếng mẹ đẻ nhưng làm việc trong môi trường tiếng Anh, đọc chính tả cho bạn cả hai. Đặt ngôn ngữ nguồn là tiếng mẹ đẻ và đầu ra cũng là tiếng mẹ đẻ (không dịch), và bạn ngừng gõ phím hoàn toàn. Với ghi chú họp khi bạn muốn cả bản gốc và bản tiếng Anh, đọc chính tả hai lần với cài đặt đầu ra khác nhau.
Lập trình với comment bằng tiếng mẹ đẻ
Các lập trình viên trong đội ngũ không nói tiếng Anh thường giữ code bằng tiếng Anh nhưng viết comment bằng tiếng của đội. Tự động phát hiện xử lý chuyện này khỏi cần nghĩ khi bạn chuyển giữa đọc chính tả vào editor (mô tả code, tên hàm bằng tiếng Anh) và đọc comment bằng tiếng của bạn. Mỗi bản ghi là một ngôn ngữ; mô hình chọn đúng cái mỗi lần.
Hỗ trợ khách hàng qua bốn múi giờ
Nhân viên hỗ trợ xử lý ticket bằng tiếng Anh, Tây Ban Nha, Pháp và Đức thường phải nhảy giữa các hồ sơ ngôn ngữ trong công cụ. Với đọc chính tả đa ngôn ngữ, bạn đọc ticket và trả lời ngay bằng ngôn ngữ của nó, rồi chuyển sang ticket tiếp theo. Không phải đổi hồ sơ, không phải mở menu. Bước biên tập cũng quan trọng ở đây: trả lời hỗ trợ cần một giọng văn chuyên nghiệp nhất quán qua mọi ngôn ngữ, không phải bản phiên âm thô.
Người học và người dạy ngoại ngữ
Nếu bạn đang học một ngôn ngữ, việc đọc chính tả bằng ngôn ngữ đó buộc bạn phải phát âm và giữ nhịp. Nếu mô hình không hiểu bạn, đó chính là phản hồi. Nếu bạn đang dạy ngoại ngữ, đọc chính tả các câu ví dụ tiết kiệm việc gõ dấu, ký tự đặc biệt và dấu phụ. Mô hình thêm chúng đúng chỗ. Với cả hai, quy trình nói-và-dịch nhân đôi thành kiểm tra hiểu nghĩa tức thì: nói bằng ngôn ngữ bạn đang học, xem bản tiếng Anh có khớp với ý bạn muốn không.
Cây bút và nhà báo quốc tế
Những người viết dài hơi nghĩ bằng một ngôn ngữ rồi xuất bản ra ngôn ngữ khác thường tự dịch trong đầu trong lúc gõ. Việc đó đuối sức. Hãy nói bản nháp đầu tiên bằng ngôn ngữ bạn nghĩ, để công cụ cho ra tiếng Anh, rồi mới biên tập. Bản nháp đầu tiên xuất hiện nhanh hơn 3–4 lần, và đầu óc biên tập của bạn cũng tỉnh táo hơn vì nó không phải gánh việc dịch trong lúc viết bản nháp.
Cách thiết lập đọc chính tả đa ngôn ngữ trên Mac
Có hai hướng: công cụ tích hợp của Apple cho trường hợp đơn giản nhất, và ứng dụng bên thứ ba cho mọi thứ khác.
Thiết lập Apple Dictation cho nhiều ngôn ngữ
Mở System Settings, vào Keyboard, rồi bấm Dictation. Bật nó lên. Bấm vào dropdown Languages và thêm những ngôn ngữ bạn muốn. Bạn có thể thêm tối đa khoảng sáu. Từ giờ trở đi, khi bạn bắt đầu đọc chính tả, một lá cờ nhỏ hoặc mã ngôn ngữ sẽ xuất hiện gần con trỏ. Bấm vào đó để chuyển ngôn ngữ. Hạn chế: - Không có phát hiện tự động. Mỗi lần đổi là một cú bấm. - Chỉ khoảng 50–60 ngôn ngữ. - Bản phiên âm thô, không biên tập, không có định dạng theo ứng dụng. - Cắt ở 60 giây trên các phiên bản macOS cũ hơn.
Thiết lập một ứng dụng đa ngôn ngữ bên thứ ba
Các ứng dụng đọc chính tả Mac hiện đại phần lớn là tiện ích ở menu bar, chạy được trong mọi ô văn bản, trên mọi ứng dụng. Quy trình cài đặt như sau: 1. Cài ứng dụng và cấp quyền micro + accessibility. 2. Đặt hoặc chấp nhận phím tắt (thường là FN hoặc Option+Space, giữ để ghi). 3. Chọn ngôn ngữ đầu vào. Với công việc đa ngôn ngữ, đặt thành Auto. 4. Chọn ngôn ngữ đầu ra. Trùng với đầu vào nghĩa là chỉ phiên âm; chọn English (hoặc ngôn ngữ khác) để có bản dịch. 5. Tùy chọn, đặt prompt biên tập ("chuyên nghiệp", "thoải mái", "giữ nguyên thô") để đầu ra khớp với cách bạn muốn nó đọc lên. Kể từ đó, ở đâu gõ được, ở đó bạn đọc chính tả được. Giữ phím, nói, thả ra, văn bản hiện ra ngay tại con trỏ.
Nếu bạn viết vào các ứng dụng khác nhau với giọng văn khác nhau (email trang trọng, Slack thoải mái, tài liệu kỹ thuật), đây là chỗ Smart Rules phát huy tác dụng: một phong cách viết theo từng ứng dụng được áp dụng tự động dựa trên ứng dụng nào đang hoạt động. Bạn đặt quy tắc một lần và ngừng nghĩ về nó. Cùng một mô hình đa ngôn ngữ xử lý tất cả.
Vài điều rút ra trong thực tế
Ba điều đáng nhớ khi bạn thiết lập đọc chính tả đa ngôn ngữ trên Mac:
Một ngôn ngữ mỗi bản ghi là quy tắc. Mô hình xử lý được 100 ngôn ngữ, nhưng nó chọn một ngôn ngữ mỗi đoạn. Hãy kết thúc bản ghi tại ranh giới ngôn ngữ thay vì cố đổi giữa câu.
Tự động phát hiện là mặc định cho công việc đa ngôn ngữ hằng ngày. Chỉ nên chọn thủ công cho câu nói rất ngắn, ngôn ngữ hiếm, hoặc môi trường ồn nơi việc phát hiện có thể trượt.
Dịch khi nói không phải là công cụ riêng. Nếu ngôn ngữ đầu ra của bạn được đặt là tiếng Anh và đầu vào là tiếng mẹ đẻ, mọi bản ghi đều là một bản dịch. Không có bước phụ, không có ứng dụng thứ hai, không có sao chép dán.
Một phím, mọi ngôn ngữ
Nếu bạn đọc đến đây, câu trả lời cho "làm sao để đọc chính tả 100 ngôn ngữ trên Mac của tôi vào năm 2026" rất ngắn: cài một ứng dụng bên thứ ba dựng trên Whisper, đặt ngôn ngữ đầu vào là Auto, giữ một phím, và nói. Hệ thống lo phần phát hiện ngôn ngữ, phiên âm, biên tập, và (nếu muốn) dịch, tất cả trong một lượt.
Voicr làm điều này với một phím tắt từ bất kỳ ứng dụng nào trên Mac. Giữ FN, nói bằng bất kỳ ngôn ngữ nào trong số 100, thả ra, và văn bản đã được biên tập hạ cánh ngay tại con trỏ. Đặt ngôn ngữ đầu ra để dịch khi nói, hoặc để nguyên ngôn ngữ nguồn nếu chỉ muốn phiên âm sạch. Có một bậc miễn phí với 5.000 từ mỗi tháng, nên cách rẻ nhất để biết đọc chính tả đa ngôn ngữ có hợp với quy trình của bạn hay không là thử ngay trên email đầu tiên của ngày mai.
Nếu bạn muốn xem đọc chính tả Mac hiện đại đối đầu trực tiếp với thứ đang có sẵn trên máy ngay lúc này, bài Voicr so với Apple Dictation so sánh khác biệt theo từng tính năng.

