Empiezas un correo en inglés, cambias al español para una nota rápida a un compañero en Madrid y luego respondes en Slack en francés. Tres apps, tres idiomas, diez minutos. La mitad de ese tiempo son tus dedos; la otra mitad, el menú de idiomas del dictado de Mac.
Si hablas más de un idioma, el dictado integrado de Apple parece pensado para alguien que no lo hace. Eliges un idioma, dictas y luego tienes que entrar en Ajustes del Sistema o hacer clic en un menú diminuto junto al cursor para cambiar. Si te olvidas, tu francés aparece como un sinsentido en inglés.
Algo cambió sin hacer ruido el año pasado. Un puñado de apps para Mac ya transcribe y pule lo que dices en unos 100 idiomas, con detección automática que averigua qué estás hablando sin que toques ningún menú. Esta guía explica qué significa eso exactamente en 2026, qué idiomas están realmente cubiertos, dónde se queda corta la herramienta de Apple y cómo montar un flujo de dictado multilingüe que no se rompa cada vez que cambias de lengua.
Qué significa de verdad "100 idiomas en Mac" en 2026
La cifra de 100 idiomas que ves en las webs de las apps no es marketing. Viene de un modelo concreto: Whisper de OpenAI, entrenado con unas 680.000 horas de audio multilingüe. La variante actual más extendida, large-v3-turbo, soporta 99 idiomas, que la mayoría de las apps redondea a "100".
Esta es la lista aproximada de lo que cubre. Todo el conjunto europeo, incluidos los grupos nórdico y eslavo. Los grandes idiomas asiáticos: mandarín, japonés, coreano, vietnamita, tailandés, indonesio, tagalo, malayo. Sur de Asia: hindi, bengalí, tamil, urdu, maratí, nepalí. Oriente Medio: árabe, hebreo, persa, turco, azerí. Africanos: suajili, afrikáans. Y otros menos obvios como galés, maorí, bielorruso, macedonio, kazajo o birmano.
La calidad no es uniforme en toda esa lista. Inglés, español, francés, alemán, italiano, portugués, neerlandés, japonés y mandarín están arriba: tasas de error de palabra del 4–8 % con audio limpio. Idiomas menos comunes o con poco corpus de entrenamiento, como el galés o el maorí, pueden subir al 15–25 %. Sigue siendo útil, solo que menos indulgente.
El cambio más grande: todo esto ahora corre en un Mac normal. Apple Silicon llega justo al punto en el que el modelo grande de Whisper transcribe un clip de 30 segundos en menos de dos segundos en local, sin ir a la nube. Por eso tantas apps de Mac se parecen tanto de repente. Todas están construidas sobre el mismo modelo.
Dónde toca techo el dictado integrado de Apple
Apple Dictation existe desde 2012 y es gratis. Para un solo idioma, en una sola app, va bien. Para trabajo multilingüe, tres cosas rompen el flujo.
Número de idiomas. Apple soporta alrededor de 50–60 idiomas y dialectos, según la versión de macOS. Decente para los grandes mercados europeos y asiáticos, pero puedes quedarte fuera si necesitas ucraniano, tagalo o galés, o si quieres dialectos detallados más allá de los pocos que envía Apple.
Sin detección automática de idioma. Apple Dictation usa el último idioma que seleccionaste. Si olvidas cambiar, tu francés pasa por el modelo inglés y sale como un galimatías que más o menos rima con lo que dijiste. Para cambiar de idioma, haces clic en el diminuto indicador junto al cursor y eliges de una lista. Cada cambio es un paso manual.
Transcripción en bruto, sin pulir. Lo que dices es lo que obtienes, incluidos "eh", "o sea", reinicios y la frase a medio acabar que empezaste antes de cambiar de idea. Es un problema en un idioma y peor en trabajo multilingüe, donde tiendes a hablar con más cautela para que el modelo no se descarríe.
Si solo dictas en inglés y no te importa limpiar después, la herramienta de Apple te sirve. En cuanto necesitas un segundo idioma, o quieres un resultado que puedas pegar sin releer, te has quedado pequeño.
Cómo gestiona Whisper 100 idiomas por debajo
Ayuda saber, a grandes rasgos, qué pasa cuando mantienes una tecla y hablas, porque explica por qué algunas cosas funcionan y otras no.
Whisper es una única red neuronal entrenada con audio de 99 idiomas. En vez de ejecutar un modelo distinto por idioma, aprendió a reconocerlos todos a la vez. Ese entrenamiento compartido tiene una ventaja: una frase en italiano y una en portugués comparten suficientes rasgos acústicos para que aprender uno ayude con el otro. La contrapartida es que todos los idiomas compiten por la misma capacidad del modelo, así que los más raros salen más débiles.

Cuando entra el audio, el modelo hace tres cosas en una sola pasada: 1. Predice el idioma a partir de los primeros segundos. 2. Transcribe las palabras. 3. Añade puntuación y mayúsculas.
Esa detección de idioma es lo que hace posible el modo automático. El modelo ha aprendido a reconocer qué idioma suena a qué. Suele acertar en uno o dos segundos desde que empiezas a hablar. Dónde tropieza: enunciados muy cortos (una o dos palabras), idiomas que comparten mucho vocabulario (español e italiano, noruego y sueco) y el cambio en mitad de la frase. Whisper está pensado para detectar un idioma por clip, no para seguirte saltando entre dos.
Si quieres todo el funcionamiento de cómo el habla en bruto se convierte en texto limpio, el pipeline de dictado por voz con IA repasa cada paso.
Detección automática o selector manual: cuándo gana cada uno
Las apps modernas de dictado multilingüe te dan dos modos. Saber cuándo usar cada uno marca la diferencia entre fluidez y frustración.
Usa detección automática cuando:
Cambias de idioma a menudo a lo largo del día pero te ciñes a un idioma por grabación. Eres una desarrolladora en Berlín que escribe comentarios de código en inglés y mensajes de Slack en alemán. Eres periodista trabajando con fuentes en inglés y japonés. Gestionas tickets de soporte en cuatro idiomas. En todos esos casos, cada grabación individual está en un idioma; lo que cambia es cuál. La detección automática te ahorra la búsqueda en el menú cada vez.
Usa selección manual cuando:
Trabajas con idiomas menos comunes donde la detección es más inestable (galés, maorí, bielorruso). Dictas en un entorno ruidoso donde el primer segundo de audio puede ser ruido ambiente en vez de habla. Dictas enunciados cortos donde no hay audio suficiente para detectar. O usas un idioma que se solapa con otro que el modelo conoce bien (a veces acierta a portugués cuando querías gallego, por ejemplo).
Lo que aún no funciona bien:
El cambio de código en mitad de la frase. Si empiezas en español y sueltas el nombre de una marca en inglés en medio, el modelo lo encaja. Si empiezas una frase en español y la acabas en inglés, lo normal es que uno de los dos salga como un sinsentido en el otro idioma. La solución honesta: cortar la grabación en la frontera de idioma y empezar otra.
Traducir mientras hablas: el flujo "habla X, sale inglés"
Una de las funciones más desaprovechadas del dictado moderno en Mac es hablar y traducir. Hablas en tu lengua materna y el texto que aparece ya está en otro idioma. La mayoría de las veces ese destino es el inglés.
Hay dos métodos detrás. Primero, las variantes multilingües más antiguas de Whisper incluyen una tarea de traducción integrada: hablas en cualquiera de los 99 idiomas y el modelo saca directamente inglés. La variante turbo más reciente no lo incluye, así que casi todas las apps usan ahora otro enfoque: Whisper transcribe en el idioma de origen y un modelo de lenguaje traduce el texto. El segundo método tiene más calidad y pule a la vez, por eso se ha convertido en el estándar.
Esto comprime un flujo real que antes eran tres pasos. Antes: dictas en tu lengua materna, copias el texto, lo pegas en un traductor, copias el resultado, lo pegas en tu correo. Unos 30 segundos y cuatro cambios de contexto. Ahora: mantienes una tecla, hablas en tu lengua materna y el inglés pulido aparece en el cursor. Unos 4 segundos.
Si pasas parte del día escribiendo en inglés en el trabajo pero piensas más rápido en otro idioma, esta función por sí sola es razón suficiente para configurar el dictado moderno. Voicr lo hace con un solo atajo: pones Automático como idioma de entrada e inglés como salida pulida, y cada grabación cae lista para enviar en inglés, independientemente de en qué hayas hablado.
Flujos multilingües reales en Mac
La teoría es barata. Estos son los patrones que de verdad ahorran tiempo a gente real.
Notas y diarios bilingües
Si tomas notas en tu lengua materna pero vives en un entorno laboral en inglés, el dictado te da lo mejor de los dos mundos. Pones el idioma de origen en el tuyo y la salida también en el tuyo (sin traducción), y dejas de teclear. Para notas de reunión en las que quieras tanto la versión original como una en inglés, dicta dos veces con ajustes de salida distintos.
Programar con comentarios en tu idioma
Quienes programan en equipos no anglófonos suelen mantener el código en inglés y escribir los comentarios en el idioma del equipo. La detección automática lo resuelve sin pensar cuando alternas entre dictar al editor (descripciones de código y nombres de función en inglés) y dictar comentarios en tu idioma. Cada grabación es un idioma; el modelo elige el correcto cada vez.
Atención al cliente en cuatro husos horarios
Los agentes de soporte que llevan tickets en inglés, español, francés y alemán suelen ir cambiando entre perfiles de idioma en sus herramientas. Con dictado multilingüe, lees el ticket y respondes en el idioma en el que está, y pasas al siguiente. Sin cambio de perfil, sin menús. El paso de pulido también importa aquí: las respuestas de soporte necesitan un tono profesional coherente en todos los idiomas, no una transcripción en bruto.
Personas que aprenden o enseñan idiomas
Si estás aprendiendo un idioma, dictarlo te obliga a cuidar pronunciación y ritmo. Si el modelo no te entiende, eso ya es feedback. Si lo enseñas, dictar frases de ejemplo te ahorra escribir tildes, caracteres especiales y diacríticos. El modelo los pone bien. Para ambos, el flujo de hablar y traducir hace de comprensión instantánea: habla en el idioma que estás aprendiendo y mira si el inglés coincide con lo que querías decir.
Escritores y periodistas internacionales
Quien escribe textos largos pensando en un idioma y publicando en otro suele hacer la traducción mental mientras teclea. Eso agota. Habla el primer borrador en el idioma en el que piensas, deja que la herramienta produzca el inglés y luego edita. El primer borrador sale 3–4 veces más rápido, y tu cerebro de edición llega más fresco porque no estuvo haciendo de traductor durante el borrado.
Cómo configurar el dictado multilingüe en Mac
Hay dos rutas: la herramienta integrada de Apple para el caso más sencillo y una app de terceros para todo lo demás.
Configurar Apple Dictation para varios idiomas
Abre Ajustes del Sistema, ve a Teclado y haz clic en Dictado. Actívalo. Pulsa el desplegable de Idiomas y añade los que quieras. Puedes añadir hasta unos seis. A partir de ahí, cuando inicies el dictado, aparecerá una banderita o un código de idioma junto al cursor. Haz clic para cambiar de idioma. Limitaciones: - Sin detección automática. Cada cambio es un clic. - Solo ~50–60 idiomas. - Transcripción en bruto, sin pulido ni formato adaptado a la app. - Corte a 60 segundos en versiones antiguas de macOS.
Configurar una app multilingüe de terceros
Las apps modernas de dictado en Mac suelen ser utilidades de la barra de menús que funcionan en cualquier campo de texto en cualquier app. La configuración va así: 1. Instala la app y concede permisos de micrófono y accesibilidad. 2. Define o acepta el atajo (suele ser FN o Option+Space, mantén pulsado para grabar). 3. Elige el idioma de entrada. Para trabajo multilingüe, ponlo en Automático. 4. Elige el idioma de salida. El mismo que el de entrada es solo transcripción; elige inglés (o cualquier otro) para traducir. 5. Opcionalmente, define un prompt de pulido ("profesional", "informal", "sin retocar") para que la salida lea como tú quieres. Desde ese momento, en cualquier sitio en el que puedas escribir, puedes dictar. Mantén la tecla, habla, suelta y el texto aparece en el cursor.
Si escribes en apps distintas con tonos distintos (correo formal, Slack informal, documentación técnica), aquí entran las Smart Rules: un estilo de escritura por app que se aplica automáticamente según cuál esté activa. Defines la regla una vez y dejas de pensarlo. El mismo modelo multilingüe se encarga de todas.
Conclusiones prácticas
Tres cosas a recordar al montar el dictado multilingüe en tu Mac:
Un idioma por grabación, esa es la regla. El modelo soporta 100 idiomas, pero elige uno por clip. Corta la grabación en la frontera de idioma en vez de intentar cambiar a mitad de frase.
La detección automática es el modo por defecto para el día a día multilingüe. La selección manual solo merece la pena para enunciados cortos, idiomas raros o entornos ruidosos donde la detección pueda fallar.
Traducir mientras hablas no es otra herramienta aparte. Si tu idioma de salida está en inglés y el de entrada en tu lengua materna, cada grabación es una traducción. Sin paso extra, sin segunda app, sin copiar y pegar.
Una tecla, cualquier idioma
Si has llegado hasta aquí, la respuesta a "¿cómo dicto en 100 idiomas en mi Mac en 2026?" es corta: instala una app de terceros basada en Whisper, pon el idioma de entrada en Automático, mantén una tecla y habla. El sistema se ocupa de la detección de idioma, la transcripción, el pulido y, si quieres, la traducción, todo en el mismo viaje.
Voicr lo hace con un solo atajo desde cualquier app en tu Mac. Mantén FN, habla en cualquiera de los 100 idiomas, suelta y el texto pulido cae en el cursor. Pon el idioma de salida para traducir mientras hablas, o déjalo igual al de origen para transcribir limpio. Hay un plan gratuito con 5.000 palabras al mes, así que la forma más barata de ver si el dictado multilingüe encaja en tu flujo es probarlo mañana en el primer correo del día.
Si quieres ver cómo se mide el dictado moderno en Mac contra lo que tienes ahora mismo en la máquina, el análisis Voicr vs Apple Dictation cubre las diferencias función a función.

