Estás en una videollamada de Zoom con un proveedor de São Paulo que no deja de pasarse al portugués. O estás viendo la keynote de un producto japonés y los subtítulos automáticos no llegan a tiempo. O piensas en español pero tu cliente espera correos en inglés.
Tres problemas completamente distintos. Los tres se meten en el mismo saco de la "traducción de voz en tiempo real en Mac", y por eso la mayoría de guías sobre el tema lían más que aclaran. La herramienta adecuada depende de cuál estés intentando resolver.
Apple lanzó Live Translation en macOS 26 el otoño pasado. Whisper estrenó un modelo Turbo que funciona en un MacBook Air sin fundirlo. Las herramientas de dictado que antes eran un caos para entusiastas hoy son realmente buenas. Esta guía repasa qué hay disponible, cuándo encaja cada opción y cómo configurarlas sin caer en la trampa del vídeo de demostración.
Qué significa realmente "tiempo real"
Antes de elegir una herramienta, pon nombre al flujo de trabajo. Hay tres tipos distintos de "tiempo real" en un Mac, y cada uno necesita software diferente:
Subtítulos en vivo — alguien está hablando y quieres subtítulos, posiblemente traducidos, mientras habla. Llamadas, reuniones, clases, directos. La latencia importa. Un retraso de 4 segundos es molesto; uno de 10 segundos es inservible.
Dictado — el que habla eres tú y quieres texto limpio en otro idioma al terminar. Correos, mensajes de Slack, documentos. La transcripción y la traducción ocurren de una sola vez cuando dejas de hablar. Importa más que la respuesta sea inmediata al terminar que ver las palabras aparecer en streaming.
Transcripción de archivos — tienes una grabación (exportación de Zoom, una nota de voz, un pódcast) y quieres una transcripción traducida. Esto no es realmente tiempo real. Pásalo por el modelo más preciso que encuentres y espera dos minutos.
Confundir estos casos es lo que lleva a la gente a usar una herramienta de transcripción de reuniones para escribir correos rápidos, o intentar subtitular un vídeo de YouTube con una app de dictado. Elige primero la categoría correcta y después la herramienta.
Las opciones integradas en macOS
Si tienes macOS 26 con un Mac con Apple Silicon, Apple te da dos herramientas integradas, más una carencia importante.
Live Translation (macOS 26)
Live Translation funciona en Mensajes, FaceTime y la nueva app Teléfono para Mac. Está impulsada por Apple Intelligence y se ejecuta en el dispositivo, así que nada sale de tu equipo. En una llamada de FaceTime tocas el botón de menú, eliges Subtítulos en vivo y aparece una transcripción traducida cerca de la parte superior de la pantalla.
El problema es la lista de idiomas. Para Live Translation en FaceTime y Teléfono, Apple admite inglés, francés, alemán, portugués (Brasil) y español (España), con mandarín, italiano, japonés y coreano en camino. Mensajes cubre más idiomas, incluidos danés, neerlandés, noruego, sueco, turco y vietnamita.
Es gratis, privado y tiene buena latencia. También funciona solo dentro de las apps de Apple. Zoom, Google Meet, los huddles de Slack, YouTube... ninguno de esos pasa por Live Translation.
Subtítulos en vivo
Activa los Subtítulos en vivo en Ajustes del Sistema → Accesibilidad → Subtítulos en vivo y aparece una ventana flotante que transcribe cualquier audio que capte tu Mac: audio del sistema, micrófono o ambos. Funciona en cualquier app: Zoom, YouTube, un pódcast o un compañero hablando a tu lado.
Los Subtítulos en vivo transcriben pero no traducen. Además, de momento solo funcionan en inglés. Si tu reunión es en inglés y solo necesitas texto para seguirla, esta es la respuesta. Si la reunión es en portugués, los Subtítulos en vivo no te servirán.

Subtítulos y traducción en vivo para llamadas y vídeos
Cuando las herramientas integradas de Apple no cubren tu llamada, un pequeño grupo de apps de terceros cubre el hueco. Capturan el audio del sistema (lo que está sonando por los altavoces del Mac) o tu micrófono, lo transcriben con un modelo Whisper local y, opcionalmente, lo traducen. Las tres que siguen funcionan en el dispositivo, lo cual importa si estás en una llamada confidencial.
MacWhisper — Una de las apps más veteranas para Mac en este terreno. Subtitulado en vivo con traducción, funciona con Whisper y Nvidia Parakeet, y soporta captura de audio del sistema para cualquier herramienta de reuniones. Sólida para Zoom, Meet y Teams. La versión Pro es un pago único.
Superwhisper — Combina la transcripción en vivo con un flujo de dictado basado en Whisper. Admite más de 100 idiomas y puede traducirlos todos al inglés. Intenta ser a la vez herramienta de subtitulado y de dictado, lo cual está bien si quieres una sola app para ambas cosas, pero hace que la parte de dictado pese más que en una herramienta dedicada.
Transcrybe — Más reciente, más ligera y centrada específicamente en la traducción en tiempo real. Solo en el dispositivo. La interfaz gira en torno a la idea de "alguien está hablando un idioma que no entiendo: muéstrame lo que dice". Útil para viajar, llamadas de soporte o ver contenido en otros idiomas.
Elige según la frecuencia con la que te encuentres en esta situación. Si vives en llamadas internacionales, MacWhisper o Superwhisper se ganan su sitio en la barra de menús. Si solo lo necesitas de vez en cuando, puede bastarte con Live Translation de Apple dentro de FaceTime.
Dictar en un idioma y escribir en otro
La necesidad de "traducción en tiempo real" más habitual no tiene nada que ver con que otros hablen. Tiene que ver con *tú*, pensando en tu lengua materna pero teniendo que poner inglés en la página porque es lo que pide el trabajo.
Si eres español, francés o polaco y escribes mucho en inglés en el trabajo, conoces el impuesto. Compones la frase en tu cabeza en tu idioma, la traduces mentalmente y luego tecleas la traducción. Cada correo son dos borradores: el que escribiste en tu cabeza y el que han producido tus dedos.
La forma de la herramienta correcta aquí es distinta a la de los subtítulos en vivo. No necesitas subtítulos en streaming. Necesitas: mantener pulsada una tecla, hablar con naturalidad en tu idioma, soltar y que en el portapapeles aparezca un texto pulido en el idioma de destino, listo para pegar donde sea (Gmail, Slack, Notion, un ticket de Jira).
Este es el hueco que cubre Voicr. Mantén pulsado FN, habla en cualquiera de los 100 idiomas, marca el inglés como destino y lo que se pega es inglés limpio, no tu transcripción cruda pasada después por un traductor aparte. La transcripción y la traducción ocurren en un solo paso, en lugar de voz → transcripción → copiar → traductor → pegar. Tarda más o menos lo que tardas en hablar.
También hay un modo de detección automática que adivina el idioma hablado a partir del propio audio, así que si alternas, por ejemplo, español para el Slack personal e inglés para los correos a clientes, no tienes que abrir ningún selector. Un detalle pequeño, fácil de pasar por alto en una lista de funciones. Lo desglosamos con más detalle en Voz a texto en 100 idiomas en Mac.
Transcribir audio pregrabado
Si tienes un archivo (una grabación de Zoom, una nota de voz, una entrevista, un pódcast), el "tiempo real" no es el marco adecuado. Pásale el archivo a una herramienta basada en Whisper a máxima calidad y deja que tarde dos minutos. Lo que importa es la precisión.
MacWhisper y Whisper Transcription gestionan bien este caso. También la API de OpenAI directamente si te manejas con un script. En cuanto a la traducción, ten presente que la traducción integrada de Whisper solo va en un sentido: cualquier idioma → inglés. Si necesitas la dirección contraria (inglés → japonés, por ejemplo), pasa la transcripción por otro modelo de traducción después, como Claude, GPT o DeepL.
Sáltate esta sección si tu entrada es siempre en directo. Pero si grabas entrevistas o sacas transcripciones de reuniones antiguas, el flujo sin conexión sigue siendo más barato, más preciso y más fácil de corregir que el streaming.
Elegir el montaje adecuado para tu flujo de trabajo
Un árbol de decisión rápido:
1. Quiero subtítulos durante una conversación de FaceTime o Mensajes → Live Translation de Apple. Gratis, integrada y en el dispositivo. 2. Quiero subtítulos durante una llamada de Zoom/Meet/Teams en un idioma que no hablo → MacWhisper, Superwhisper o Transcrybe. Elige una. 3. Quiero dictar en mi lengua materna y obtener texto en inglés para pegarlo donde sea → Una herramienta de dictado con una sola tecla como Voicr. Es el caso del día a día para profesionales bilingües. 4. Quiero transcribir un archivo grabado en otro idioma y obtenerlo en inglés → MacWhisper o cualquier app de escritorio basada en Whisper. Sin conexión, modelo a máxima calidad, dos minutos de espera.
La mayoría de la gente acaba con dos herramientas, no una: algo para los subtítulos en vivo cuando hacen falta (de vez en cuando) y algo para el dictado diario (constante). Esa división es normal. Una herramienta de subtitulado y una de dictado se optimizan para cosas distintas, y querer que una haga las dos suele acabar haciendo ambas peor.
Ajustar las expectativas
Algunas cosas que todos los vídeos de demostración pasan por alto y conviene saber antes de comprometerte:
La latencia existe. Incluso Whisper en el dispositivo tiene un retraso de 1 a 3 segundos en los subtítulos en vivo. Las herramientas en la nube añaden otros 1 o 2 segundos. Cuenta con ello. No intentes seguir un debate político rápido con subtítulos en vivo, te quedarás atrás.
La calidad de la traducción baja fuera del top 10 de idiomas. Whisper en sí es excelente para inglés, español, francés, alemán, portugués, italiano, mandarín y japonés. Es notablemente más débil con tailandés, cantonés, vietnamita y la mayoría de lenguas africanas. Si tu idioma está en la cola larga, pruébalo antes de depender de él.
Capturar el audio del sistema requiere permiso. macOS no deja que una app escuche el audio del sistema por defecto. Cualquier herramienta de la categoría de subtitulado en vivo te guiará la primera vez para conceder el permiso de Grabación de pantalla o de loopback de audio. Es lo normal. También por eso algunas apps requieren instalar un dispositivo de audio virtual una sola vez.
La privacidad varía. Las herramientas de Apple y la mayoría de apps basadas en Whisper funcionan totalmente en el dispositivo. Cualquier cosa que envíe audio a una API en la nube (algunas herramientas de "asistente de reuniones con IA") plantea un equilibrio distinto. Si trabajas en derecho, sanidad o cualquier ámbito regulado, comprueba antes de encender una herramienta en una llamada con un cliente.

Un punto de partida práctico
Sea cual sea tu objetivo final, lo más fácil para empezar es elegir el único caso de uso que más veces te toque esta semana. No el raro. El diario.
Si tienes muchas reuniones internacionales, instala una herramienta de subtitulado en vivo, déjala en la barra de menús y úsala durante dos semanas antes de decidir. Si escribes mucho en inglés mientras piensas en otro idioma, prueba a sustituir los próximos diez correos que normalmente teclearías por dictado en tu lengua materna y deja que la herramienta produzca el inglés.
Voicr cubre concretamente el caso del dictado. Mantén pulsado FN, habla en tu idioma, marca el inglés como destino y pega donde sea. Hay un plan gratuito (5.000 palabras al mes, sin tarjeta) suficiente para ver si el flujo encaja con tu forma de escribir. Para el caso de los subtítulos en vivo, MacWhisper tiene una versión gratuita con el modelo básico de Whisper que basta para probar la experiencia antes de pagar.
La tecnología dejó de ser el cuello de botella hace tiempo. La pregunta interesante ahora es qué flujo de trabajo montas de verdad y usas, y eso se reduce a elegir la herramienta adecuada para la fricción concreta que sigues encontrándote. Para profundizar en la parte del dictado, Cómo funciona realmente el dictado por voz en Mac repasa qué ocurre entre tu voz y el texto pulido en tu portapapeles.

