Kembali ke Blog

Voicr Team · 23 Mei 2026

Cara Menerjemahkan dan Mentranskripsi Ucapan Secara Real-Time di Mac

Teks langsung, terjemahan di perangkat, dan dikte satu tombol untuk 100 bahasa. Pilih alat yang tepat untuk alur kerja yang benar-benar Anda butuhkan.

Cara Menerjemahkan dan Mentranskripsi Ucapan Secara Real-Time di Mac

Anda sedang panggilan Zoom dengan pemasok di São Paulo yang terus beralih ke bahasa Portugis. Atau Anda menonton keynote produk Jepang dan subjudul otomatisnya belum mengejar. Atau Anda berpikir dalam bahasa Spanyol tetapi klien Anda mengharapkan email dalam bahasa Inggris.

Tiga masalah yang sama sekali berbeda. Ketiganya disatukan dalam istilah "terjemahan ucapan real-time di Mac," dan itulah sebabnya sebagian besar panduan tentang topik ini membingungkan. Alat yang tepat bergantung pada masalah mana yang sebenarnya ingin Anda selesaikan.

Apple merilis Live Translation di macOS 26 musim gugur lalu. Whisper mendapat model Turbo yang berjalan di MacBook Air tanpa membuatnya meleleh. Alat dikte yang dulu hanya mainan kini sudah benar-benar bagus. Panduan ini menjelaskan apa yang tersedia, kapan setiap opsi benar-benar cocok, dan cara mengaturnya tanpa terjebak dalam tipuan video demo.

Apa Arti "Real-Time" Sebenarnya

Sebelum memilih alat, tentukan alur kerjanya. Ada tiga jenis "real-time" yang berbeda di Mac, dan masing-masing membutuhkan perangkat lunak yang berbeda:

Teks langsung (live captioning) — orang lain berbicara dan Anda ingin subjudul, mungkin diterjemahkan, sementara mereka berbicara. Panggilan, rapat, kuliah, livestream. Latensi itu penting. Penundaan 4 detik mengganggu; penundaan 10 detik tidak berguna.

Dikte — Andalah yang berbicara, dan Anda ingin teks yang rapi dalam bahasa lain di akhir. Email, pesan Slack, dokumen. Transkrip dan terjemahan terjadi sekaligus saat Anda selesai berbicara. Respons di bawah satu detik setelah Anda selesai jauh lebih penting daripada streaming kata satu per satu.

Transkripsi file — Anda memiliki rekaman (ekspor Zoom, memo suara, podcast) dan menginginkan transkrip terjemahan. Sebenarnya bukan real-time. Lemparkan ke model paling akurat yang bisa Anda temukan dan tunggu dua menit.

Mencampuradukkan ketiganya adalah penyebab orang akhirnya memakai alat transkripsi rapat untuk menulis email singkat, atau mencoba membuat teks video YouTube dengan aplikasi dikte. Pilih kategori yang tepat dulu, baru pilih alatnya.

Opsi bawaan macOS

Jika Anda menggunakan macOS 26 dengan Mac Apple Silicon, Apple memberi Anda dua alat bawaan, plus satu celah penting.

Live Translation (macOS 26)

Live Translation berjalan melalui Messages, FaceTime, dan aplikasi Phone baru untuk Mac. Fitur ini ditenagai Apple Intelligence dan berjalan di perangkat, jadi tidak ada yang keluar dari komputer Anda. Pada panggilan FaceTime, Anda klik tombol menu, pilih Live Captions, dan transkrip terjemahan muncul di dekat bagian atas layar.

Tangkapannya ada di daftar bahasa. Untuk Live Translation di FaceTime dan Phone, Apple mendukung bahasa Inggris, Prancis, Jerman, Portugis (Brasil), dan Spanyol (Spanyol), dengan Mandarin, Italia, Jepang, dan Korea sedang diluncurkan. Messages mencakup rangkaian yang lebih luas termasuk Denmark, Belanda, Norwegia, Swedia, Turki, dan Vietnam.

Gratis, privat, dan latensinya bagus. Tapi hanya berfungsi di dalam aplikasi Apple sendiri. Zoom, Google Meet, huddle Slack, YouTube — tidak ada yang melalui Live Translation.

Live Captions

Aktifkan Live Captions di System Settings → Accessibility → Live Captions dan Anda mendapat jendela mengambang yang mentranskripsi audio apa pun yang ditangkap Mac Anda — audio sistem, mikrofon, atau keduanya. Berfungsi di aplikasi apa pun: Zoom, YouTube, podcast, atau rekan kerja yang berbicara di samping Anda.

Live Captions mentranskripsi tapi tidak menerjemahkan. Saat tulisan ini dibuat, fitur ini juga hanya tersedia dalam bahasa Inggris. Jika rapat Anda dalam bahasa Inggris dan Anda hanya butuh teks untuk mengikuti, inilah jawabannya. Jika rapat dalam bahasa Portugis, Live Captions tidak akan membantu.

Perbandingan tiga alur kerja terjemahan ucapan real-time di Mac: teks langsung untuk rapat, dikte untuk menulis, dan transkripsi file

Teks langsung dan terjemahan untuk panggilan dan video

Ketika alat bawaan Apple tidak menjangkau panggilan Anda, ada beberapa aplikasi pihak ketiga yang mengisi celahnya. Mereka mengambil audio sistem (apa pun yang diputar melalui speaker Mac Anda) atau mikrofon Anda, mentranskripsinya dengan model Whisper lokal, dan secara opsional menerjemahkannya. Ketiganya di bawah ini berjalan di perangkat, yang penting jika Anda dalam panggilan rahasia.

MacWhisper — Salah satu aplikasi Mac terlama di bidang ini. Teks langsung dengan terjemahan, berjalan di Whisper dan Nvidia Parakeet, mendukung penangkapan audio sistem untuk alat rapat apa pun. Solid untuk Zoom, Meet, Teams. Versi Pro dibeli sekali bayar.

Superwhisper — Menggabungkan transkripsi langsung dengan alur dikte berbasis Whisper. Mendukung 100+ bahasa dan bisa menerjemahkan semuanya ke bahasa Inggris. Berusaha menjadi alat teks dan alat dikte sekaligus, yang cocok jika Anda ingin satu aplikasi untuk keduanya, tapi berarti sisi diktenya lebih berat dibanding alat khusus.

Transcrybe — Lebih baru, lebih ringkas, dan fokus khusus pada terjemahan real-time. Hanya di perangkat. Antarmukanya dirancang untuk "seseorang berbicara bahasa yang tidak saya pahami — tunjukkan apa yang mereka katakan." Bagus untuk traveling, panggilan dukungan, atau menonton konten bahasa asing.

Pilih berdasarkan seberapa sering Anda berada dalam skenario ini. Jika Anda hidup di panggilan internasional, MacWhisper atau Superwhisper layak menempati menu bar Anda. Jika Anda hanya butuh sesekali, Live Translation Apple di dalam FaceTime mungkin sudah cukup.

Mendikte dalam satu bahasa, menulis dalam bahasa lain

Kebutuhan "terjemahan real-time" yang paling umum sebenarnya tidak ada hubungannya dengan orang lain yang berbicara. Ini tentang *Anda*, berpikir dalam bahasa ibu Anda tapi butuh bahasa Inggris di halaman karena itu yang diharapkan pekerjaan.

Jika Anda orang Spanyol, Prancis, atau Polandia dan banyak menulis dalam bahasa Inggris di tempat kerja, Anda tahu pajak mental itu. Anda menyusun kalimat di kepala dalam bahasa Anda sendiri, menerjemahkannya secara mental, lalu mengetik terjemahannya. Setiap email adalah dua draf: satu yang Anda tulis di kepala, dan satu yang dihasilkan jari Anda.

Bentuk alat yang tepat di sini berbeda dari teks langsung. Anda tidak butuh subjudul streaming. Anda butuh: tahan satu tombol, bicara natural dalam bahasa Anda, lepas, dan teks yang dipoles dalam bahasa target mendarat di clipboard, siap ditempel di mana saja (Gmail, Slack, Notion, tiket Jira).

Inilah celah yang diisi Voicr. Tahan FN, bicara dalam salah satu dari 100 bahasa, atur bahasa Inggris sebagai target, dan yang ditempelkan adalah bahasa Inggris yang rapi, bukan transkrip mentah yang dilewatkan ke penerjemah terpisah. Transkripsi dan terjemahan terjadi dalam satu langkah, bukan ucapan → transkrip → salin → penerjemah → tempel. Seluruh prosesnya memakan waktu kira-kira selama Anda berbicara.

Ada juga mode deteksi otomatis yang mengenali bahasa yang diucapkan dari audionya sendiri, jadi jika Anda beralih antara, katakanlah, Spanyol untuk Slack pribadi dan Inggris untuk email klien, Anda tidak perlu buka pilihan. Detail kecil, mudah terlewat dalam daftar fitur. Penjelasan lebih panjangnya ada di Voice-to-Text dalam 100 Bahasa di Mac.

Mentranskripsi audio yang sudah direkam

Jika Anda punya file (rekaman Zoom, memo suara, wawancara, podcast), "real-time" bukan kerangka yang tepat. Lemparkan file itu ke alat berbasis Whisper yang berjalan dengan kualitas penuh dan biarkan selama dua menit. Yang penting adalah akurasi.

MacWhisper dan Whisper Transcription keduanya menangani ini dengan baik. Begitu juga OpenAI API langsung jika Anda nyaman dengan skrip. Khusus untuk terjemahan, perhatikan bahwa terjemahan bawaan Whisper hanya berjalan satu arah: bahasa apa pun → bahasa Inggris. Jika Anda butuh arah lain (Inggris → Jepang, misalnya), jalankan transkripnya melalui model terjemahan terpisah setelahnya, seperti Claude, GPT, atau DeepL.

Lewati bagian ini jika input Anda selalu langsung. Tapi jika Anda merekam wawancara atau menarik transkrip dari rapat lama, alur kerja offline tetap lebih murah, lebih akurat, dan lebih mudah diperbaiki dibanding streaming.

Memilih pengaturan yang tepat untuk alur kerja Anda

Pohon keputusan singkat:

1. Saya ingin subjudul selama percakapan FaceTime atau Messages → Apple Live Translation. Gratis, bawaan, di perangkat. 2. Saya ingin subjudul selama panggilan Zoom/Meet/Teams dalam bahasa yang tidak saya pahami → MacWhisper, Superwhisper, atau Transcrybe. Pilih salah satu. 3. Saya ingin mendikte dalam bahasa ibu dan mendapatkan teks bahasa Inggris untuk ditempel di mana saja → Alat dikte satu tombol seperti Voicr. Inilah kasus harian untuk profesional bilingual. 4. Saya ingin mentranskripsi file rekaman dalam bahasa lain dan mendapatkan bahasa Inggris → MacWhisper atau aplikasi desktop berbasis Whisper apa pun. Offline, model kualitas penuh, tunggu dua menit.

Kebanyakan orang akhirnya pakai dua alat, bukan satu: satu untuk teks langsung saat dibutuhkan (kadang-kadang), dan satu untuk dikte harian (terus-menerus). Pembagian itu normal. Alat teks dan alat dikte dioptimalkan untuk hal yang berbeda, dan mencoba membuat satu melakukan keduanya biasanya berarti keduanya jadi lebih buruk.

Menetapkan ekspektasi yang realistis

Beberapa hal yang dilewatkan setiap video demo, layak diketahui sebelum Anda berkomitmen:

Latensi itu nyata. Bahkan Whisper di perangkat memiliki penundaan 1–3 detik untuk teks langsung. Alat berbasis cloud menambah 1–2 detik lagi. Rencanakan itu. Jangan coba pakai teks langsung untuk mengikuti debat politik yang cepat, Anda akan tertinggal.

Kualitas terjemahan turun di luar ~10 bahasa teratas. Whisper sendiri sangat baik untuk Inggris, Spanyol, Prancis, Jerman, Portugis, Italia, Mandarin, Jepang. Kualitasnya terasa melemah di Thailand, Kantonis, Vietnam, dan sebagian besar bahasa Afrika. Jika bahasa Anda di ekor panjang, uji dulu sebelum mengandalkannya.

Penangkapan audio sistem butuh izin. macOS tidak mengizinkan aplikasi mendengar audio sistem secara default. Setiap alat di kategori teks langsung akan memandu Anda memberikan izin Screen Recording atau audio loopback pertama kali. Ini normal. Itu juga alasan beberapa aplikasi butuh instalasi perangkat audio virtual sekali pasang.

Privasi bervariasi. Alat Apple dan sebagian besar aplikasi berbasis Whisper berjalan sepenuhnya di perangkat. Apa pun yang mengirim audio ke API cloud (beberapa alat "AI meeting assistant") membuat pertukaran yang berbeda. Jika Anda di bidang hukum, kesehatan, atau apa pun yang diatur, periksa dulu sebelum menyalakan alat di panggilan klien.

Seorang profesional bilingual berbicara dalam bahasa ibunya sementara teks bahasa Inggris yang rapi muncul di draf email di Mac

Titik awal yang praktis

Tempat paling mudah untuk memulai, terlepas dari tujuan akhir Anda, adalah memilih satu kasus penggunaan yang paling sering Anda hadapi minggu ini. Bukan yang langka. Yang harian.

Jika Anda banyak di rapat internasional, pasang satu alat teks langsung, biarkan di menu bar, dan pakai selama dua minggu sebelum memutuskan. Jika Anda banyak menulis bahasa Inggris sambil berpikir dalam bahasa lain, coba ganti sepuluh email berikutnya yang biasa Anda ketik dengan dikte dalam bahasa ibu Anda dan biarkan alat menghasilkan bahasa Inggrisnya.

Voicr menangani kasus dikte secara khusus. Tahan FN, bicara dalam bahasa Anda, atur bahasa Inggris sebagai target, tempel di mana saja. Ada tier Free (5.000 kata per bulan, tanpa kartu kredit) yang cukup untuk melihat apakah alur kerjanya benar-benar cocok dengan cara Anda menulis. Untuk kasus teks langsung, MacWhisper punya versi gratis dengan model Whisper dasar yang cukup untuk menguji pengalamannya sebelum membayar.

Teknologi sudah berhenti jadi penghambat sejak lama. Pertanyaan menarik sekarang adalah alur kerja mana yang sebenarnya Anda atur dan gunakan, dan itu kembali ke pemilihan alat yang tepat untuk friksi spesifik yang terus Anda hadapi. Untuk lebih lanjut tentang sisi dikte, Cara Kerja Dikte Suara di Mac menjelaskan apa yang terjadi antara suara Anda dan teks yang rapi di clipboard.