Voicr vs SuperWhisper: comparativa cara a cara

Abres la App Store, buscas "dictado por IA Mac" y los dos nombres que aparecen una y otra vez son Voicr y SuperWhisper. Las capturas se parecen. Las listas de funciones se solapan. Las dos prometen texto pulido a partir de tu voz.

Instala las dos durante diez minutos y la diferencia salta a la vista. Una te pide elegir el tamaño de un modelo Whisper, configurar un modo personalizado, pegar una clave API para tu LLM favorito y etiquetar el prompt con XML. La otra te pide mantener pulsada una tecla y empezar a hablar.

Ninguno de los dos enfoques es incorrecto. Están pensados para personas distintas. Aquí tienes una comparativa cara a cara, sin rodeos, de en qué se separan Voicr y SuperWhisper y para qué tipo de usuario de Mac es cada uno.

La versión corta

Si no quieres leer el resto: - SuperWhisper es para trasteadores que quieren control total sobre el modelo, el prompt y el proveedor de IA. Muy buena historia offline. Superficie de configuración exigente. Disponible en Mac, Windows e iOS. - Voicr es para quienes usan Mac y quieren que el pulido y las reglas por app vengan ya cableadas. Mantén FN, habla, suelta, pega. Sin selector de modelo. Sin claves BYOK. Solo Apple Silicon. - Ambas transcriben con Whisper. Ambas soportan 100 idiomas. Donde se separan es en cuánta configuración esperan de ti.

Para qué está pensado SuperWhisper

SuperWhisper es un framework configurable. Modelos Whisper locales para la transcripción, LLMs en la nube opcionales para el post-procesado y un sistema de Custom Modes donde defines exactamente cómo debe funcionar cada tarea.

Los Custom Modes son la función estrella. Puedes crear un modo para correos, otro para notas de reuniones, otro para comentarios de código y un cuarto para Slack. Cada modo tiene su propio prompt, sus propias reglas de formato y su propio proveedor de IA. Puedes enchufar OpenAI, Anthropic, Google, Mistral, Groq o un Llama local, según el modo que esté activo. Su documentación recomienda etiquetas XML para cualquier prompt que pase de unas pocas líneas.

Transcripción local-first. SuperWhisper descarga los modelos Whisper a tu máquina. Tiny, base, small, medium, large-v3 y large-v3-turbo están disponibles, con los más grandes detrás de la capa Pro. En Apple Silicon, large-v3-turbo se ejecuta en local y la precisión es excelente. El audio no sale de tu portátil para el paso de transcripción. La empresa tiene certificación SOC 2 Type II y cumple con HIPAA, lo que la convierte en la opción más fácil de aprobar en una revisión de seguridad corporativa.

Multiplataforma. SuperWhisper funciona en macOS, Windows e iOS con una sola licencia. Si repartes tu tiempo entre un MacBook y un PC con Windows, eso es una ventaja real.

Precio de por vida. Un pago único (249,99 $ al cierre de este artículo, aunque el precio se ha movido en 2026) te da acceso para siempre. Para quien dicta a diario, esa cuenta supera a la mayoría de suscripciones a partir del segundo año.

El precio de toda esa potencia es que la superficie de ajustes es densa. Varias reseñas comparan la puesta a punto con "configurar un servidor": elegir el tamaño de modelo adecuado, decidir qué proveedor de LLM usar en cada modo, escribir los prompts, depurar las combinaciones de teclas. Una vez afinado, es potente. Afinarlo lleva un fin de semana.

Para qué está pensado Voicr

Voicr parte del extremo opuesto. La mayoría de la gente no quiere ensamblar su herramienta de dictado. Quiere instalar algo que ya pula bien su voz, en el tono que pide la app en la que está, con una sola tecla.

Mantén FN desde cualquier punto de macOS. Voicr captura el audio, lo transcribe con Whisper large-v3-turbo, lo pasa por una capa de pulido con IA y pega el resultado limpio en el campo donde ya estabas escribiendo. No se abre ninguna ventana. No hay salto al portapapeles. No hay app a la que cambiar.

El pulido viene hecho. Voicr trae la fontanería de IA ya cableada: sin claves API, sin elegir proveedor, sin ingeniería de prompts. Tú no decides qué modelo reescribe tu voz. Lo hace la app, con un estilo de pulido pensado para que se lea como si lo hubieras tecleado con calma.

Las Smart Rules resuelven el problema de adaptarse a cada app sin obligarte a montar modos a mano. Asignas un estilo de escritura a cada app —informal para Slack, formal para Mail, técnico para VSCode, notas en crudo para Apple Notes— y Voicr detecta qué app está activa y aplica el estilo correspondiente. Hay una UI para editar las reglas. No hay XML, no hay sintaxis de prompts que aprender.

El Modo Dictado Puro es una alternativa de un solo interruptor para cuando quieres la transcripción tal cual, con puntuación correcta y sin reescritura de IA. Citas, notas en bruto, captura literal.

La detección automática de idioma identifica la lengua hablada en tu audio entre 100 idiomas. Pon el idioma de destino en inglés y Voicr traduce mientras transcribe. Piensa en español, escribe en inglés, una sola pulsación.

El compromiso es el inverso al de SuperWhisper. Voicr tiene opinión. Recibes el pulido que el equipo considera bueno. Puedes editar los prompts de las Smart Rules si quieres ajustar el tono, pero no eliges el modelo subyacente ni ejecutas un Llama local. Y es solo para Mac con Apple Silicon: sin Windows, sin iOS.

En qué se separa la experiencia

Tres escenarios rápidos.

Primera puesta en marcha

SuperWhisper: instalas, descargas un modelo Whisper (decides el tamaño —tiny, base, small, medium, large-v3-turbo, large-v3— según tu hardware y tus necesidades de precisión), abres ajustes, eliges un modo por defecto, decides si quieres pulido con LLM en la nube, pegas una clave API de OpenAI o Anthropic, escribes o importas un prompt personalizado, configuras tus teclas de activación y pruebas. Reserva una tarde.

Voicr: instalas, concedes permisos de micrófono y accesibilidad, mantienes FN, hablas. Las Smart Rules vienen preconfiguradas para las apps habituales. Reserva dos minutos.

Escribir un mensaje de Slack y un correo seguidos

SuperWhisper: si has montado dos modos personalizados (uno para Slack, otro para Mail), o cambias de modo manualmente con otro atajo de teclado, o confías en el Super Mode para que detecte la app y elija el prompt adecuado. En cualquier caso, los modos tenían que existir antes.

Voicr: mantén FN en Slack y obtienes la versión informal. Mantén FN en Mail y obtienes la versión de correo. Misma tecla, distinta salida, porque las Smart Rules ya saben en qué app estás.

Pulir la salida

SuperWhisper: el paso de pulido por IA solo se ejecuta si has configurado un LLM. Los modelos Whisper locales te dan una transcripción en bruto por defecto; reescribir exige aportar tu propia clave API y pagar al proveedor del LLM por uso. Varias reseñas de usuarios apuntan que las transcripciones suelen necesitar limpieza manual a menos que cablees todo esto.

Voicr: el pulido va activado por defecto. Muletillas fuera, gramática corregida, estructura más limpia. No pagas una factura aparte de API. Si lo que quieres es la salida en bruto, el Modo Dictado Puro está a un interruptor de distancia.

Ilustración lado a lado del panel de ajustes de SuperWhisper lleno de opciones de modelo y prompt frente al gesto único de mantener FN en Voicr con la salida ya pulida

Si vienes dictando en SuperWhisper y tus transcripciones siguen saliendo en crudo porque no has llegado a montar los Custom Modes y la clave API, el pulido de Voicr es justo la parte que ibas a configurar tarde o temprano. La diferencia es que ya está hecha. Mantén FN, habla, suelta: la versión limpia aterriza en el campo.

Privacidad y modo offline

Esta es el área donde SuperWhisper gana de verdad, y conviene decirlo sin medias tintas.

La transcripción de SuperWhisper se ejecuta sobre un modelo Whisper local. Tu audio no sale de la máquina para el paso de voz a texto. Si no activas el pulido con LLM en la nube, el flujo completo se queda en el dispositivo. Para usuarios en sectores regulados, en redes inestables o con preferencias estrictas de privacidad, esa diferencia importa.

Voicr usa transcripción y pulido en la nube. El audio se envía a un servidor, se procesa y vuelve el resultado. No hay un modo solo on-device. Si no puedes —o no quieres— enviar el audio del dictado a un servidor, SuperWhisper es la opción más segura, y eso debería bastar para decidir, al margen de cualquier otra cosa de esta comparativa.

Un matiz: SuperWhisper ha guardado históricamente cada grabación de audio en disco por defecto, que es otro eje de privacidad (persistencia local en lugar de exposición de red). Si te decides por SuperWhisper, conviene revisar el comportamiento actual en sus ajustes antes de dar por hecho que "on-device" significa "sin grabar".

Precios cara a cara

El precio de etiqueta no cuenta toda la historia, porque el pulido de SuperWhisper depende de que aportes tu propia clave de LLM. El coste total depende del proveedor que enchufes y de cuánto dictes.

SuperWhisper

SuperWhisper Free ejecuta Whisper en local, pero te limita a los modelos pequeños (tiny y base) y a tres modos personalizados. Pro cuesta 8,49 $/mes u 84,99 $/año, lo que desbloquea todos los tamaños de modelo Whisper, elimina el tope de modos y activa el post-procesado con LLM en la nube. Lifetime se queda en 249,99 $ pago único según el último listado. Por encima de cualquier capa, el pulido en la nube implica pagar a OpenAI, Anthropic, Google o al proveedor que enchufes, por petición.

Voicr

El plan Free de Voicr da 5.000 palabras al mes con todas las funciones incluidas y sin tarjeta. GO cuesta $3/mo por 20.000 palabras. PRO cuesta $10/mo por 100.000 palabras. El pulido va incluido en todas las capas, así que no hay factura aparte de proveedor de IA.

Para uso ligero, las dos apps son básicamente gratis. Para dictado intensivo a diario, la cuenta depende de si prefieres pagar una vez por SuperWhisper Lifetime más créditos de LLM en curso, o una suscripción mensual plana a Voicr con el pulido incluido. La capa Free de Voicr se acerca más a la app completa que la de SuperWhisper: sin restricción de modelos, sin tope de modos personalizados y sin necesidad de pagar también a un proveedor de IA para tener pulido.

Ilustración que compara el precio mensual plano de Voicr con una sola IA incluida frente al apilado de costes de SuperWhisper con suscripción Pro y gastos de LLM BYOK aparte

Cuándo SuperWhisper es la elección correcta

Hay escenarios reales en los que SuperWhisper es la mejor herramienta, y no por poco.

Estás en Windows o repartes tu tiempo entre Mac y Windows. Voicr es solo Mac con Apple Silicon. Si necesitas una sola app entre sistemas operativos, SuperWhisper cubre ese terreno.

Tienes un requisito offline estricto. Cumplimiento normativo, contenido sensible, máquinas sin red. Transcripción local con Whisper sin LLM en la nube es el punto fuerte de SuperWhisper.

Quieres traer tu propio modelo. Ejecutar un Llama local para el pulido, alternar entre ChatGPT y Claude por tarea, escribir prompts con etiquetas XML como si fueran un system prompt. SuperWhisper está construido para esto. Voicr no.

Quieres precio de por vida. Si dictas mucho durante años, SuperWhisper Lifetime más el gasto de tu propia API puede salir más barato que una suscripción mensual plana. Vale la pena hacer cuentas.

Cuándo Voicr es la elección correcta

La mayoría de usuarios cotidianos de Mac aterrizan aquí, y también conviene ser igual de directos con el porqué.

No quieres gestionar claves API. Quieres que el pulido esté activado por defecto, no que sea un paso de configuración.

Quieres que una sola tecla haga lo correcto en cada app. Sin cambios de modo, sin disparos manuales: solo FN; en Slack suena a Slack y en Mail suena a Mail.

Estás en un Mac con Apple Silicon y vas a seguir ahí. Sin necesidad multiplataforma, sin un equipo Windows esperando la misma puesta a punto.

Quieres empezar en cinco minutos, no en cinco horas. Instalas, concedes permisos, mantienes FN. Los valores por defecto son lo bastante buenos para usar el día uno, y luego puedes afinar las Smart Rules para ajustar el tono.

Si ese perfil encaja, Voicr te va a parecer la versión de SuperWhisper que alguien ya dejó montada por ti. Misma calidad de transcripción con Whisper. Pulido ya cableado. Conciencia por app de serie, no ensamblada a base de modos personalizados.

La prueba honesta

Si estás de verdad indeciso, la prueba justa es dictar el mismo texto real en las dos apps. No una sola frase: elige algo con tres a cinco oraciones, como un correo o una respuesta larga en un hilo de Slack. Habla con naturalidad, con las muletillas y los falsos arranques que normalmente eliminarías al editar.

Mira la salida de cada app antes de tocarla. Dos preguntas: 1. ¿El texto está ya en un estado en el que lo enviarías? 2. ¿La herramienta sabía en qué app estabas?

Si la salida de SuperWhisper está lista para enviar porque te has pasado un fin de semana afinando modos personalizados y prompts, ese es un resultado real: sigue con ello. Si todavía es una transcripción en bruto que tienes que limpiar, la diferencia entre Voicr y SuperWhisper es básicamente la diferencia entre "el pulido se hace solo" y "vas a configurar el pulido en algún momento".

La forma más rápida de salir de dudas es instalar Voicr, dejar FN como disparador y probar el mismo correo otra vez. Si prefieres controlar cada prompt y cada modelo a mano, SuperWhisper es la mejor herramienta. Si prefieres mantener una tecla y que la versión pulida aterrice en el campo, Voicr es lo que buscas.

Para una mirada desde otro ángulo a la misma pregunta —cómo se mide Voicr frente a la herramienta integrada de Apple— echa un vistazo a la comparativa Voicr vs Apple Dictation.