Zurück zum Blog

Voicr Team · 23. Mai 2026

Sprache auf dem Mac in Echtzeit übersetzen und transkribieren

Live-Untertitel, Übersetzung direkt auf dem Gerät und Diktieren per Tastendruck in 100 Sprachen. Wähle das richtige Werkzeug für deinen tatsächlichen Workflow.

Sprache auf dem Mac in Echtzeit übersetzen und transkribieren

Du sitzt in einem Zoom-Call mit einem Zulieferer aus São Paulo, der immer wieder ins Portugiesische rutscht. Oder du schaust eine japanische Produkt-Keynote, und die automatischen Untertitel kommen nicht hinterher. Oder du denkst auf Spanisch, aber dein Kunde erwartet E-Mails auf Englisch.

Drei völlig unterschiedliche Probleme. Alle drei werden unter „Sprachübersetzung in Echtzeit auf dem Mac“ zusammengeworfen, und genau deshalb sind die meisten Anleitungen zu diesem Thema verwirrend. Das richtige Werkzeug hängt davon ab, welches Problem du tatsächlich lösen willst.

Apple hat letzten Herbst mit macOS 26 die Live-Übersetzung ausgeliefert. Whisper hat ein Turbo-Modell bekommen, das auf einem MacBook Air läuft, ohne dass es zu glühen anfängt. Die Diktier-Tools, die früher ein Hobbyisten-Chaos waren, sind inzwischen wirklich gut. Dieser Guide zeigt, was es gibt, wann welche Option wirklich passt und wie du sie einrichtest, ohne in die Demo-Video-Falle zu tappen.

Was „Echtzeit“ wirklich bedeutet

Bevor du dich für ein Tool entscheidest, benenne den Workflow. Es gibt auf dem Mac drei klar unterscheidbare Spielarten von „Echtzeit“, und jede braucht andere Software:

Live-Untertitel — jemand anders spricht, und du willst Untertitel, möglichst übersetzt, während die Person spricht. Anrufe, Meetings, Vorlesungen, Livestreams. Latenz ist entscheidend. Vier Sekunden Verzögerung sind nervig, zehn Sekunden machen alles unbrauchbar.

Diktieren — du sprichst selbst und willst am Ende sauberen Text in einer anderen Sprache. E-Mails, Slack-Nachrichten, Dokumente. Transkript und Übersetzung passieren in einem Schritt, sobald du aufhörst zu reden. Wichtiger als wortweises Streamen ist, dass die Antwort kommt, sobald du fertig bist.

Datei-Transkription — du hast eine Aufnahme (Zoom-Export, Sprachmemo, Podcast) und willst ein übersetztes Transkript. Eigentlich keine Echtzeit. Gib es dem genauesten Modell, das du findest, und warte zwei Minuten.

Wer diese drei vermischt, landet am Ende damit, ein Meeting-Transkriptions-Tool für schnelle E-Mails zu missbrauchen oder zu versuchen, ein YouTube-Video mit einer Diktier-App zu untertiteln. Wähl zuerst die richtige Kategorie, dann das Werkzeug.

Die eingebauten macOS-Optionen

Wenn du macOS 26 auf einem Mac mit Apple Silicon nutzt, gibt Apple dir zwei eingebaute Tools an die Hand — plus eine wichtige Lücke.

Live-Übersetzung (macOS 26)

Die Live-Übersetzung läuft in Nachrichten, FaceTime und der neuen Telefon-App für den Mac. Sie nutzt Apple Intelligence und arbeitet direkt auf dem Gerät, es verlässt also nichts deinen Rechner. In einem FaceTime-Call klickst du auf das Menü-Symbol, wählst Live-Untertitel und ein übersetztes Transkript erscheint oben am Bildschirmrand.

Der Haken ist die Sprachliste. Für die Live-Übersetzung in FaceTime und Telefon unterstützt Apple Englisch, Französisch, Deutsch, Portugiesisch (Brasilien) und Spanisch (Spanien), mit Mandarin, Italienisch, Japanisch und Koreanisch im Rollout. Nachrichten deckt einen größeren Kreis ab, unter anderem Dänisch, Niederländisch, Norwegisch, Schwedisch, Türkisch und Vietnamesisch.

Das Ganze ist kostenlos, privat und die Latenz ist gut. Es funktioniert aber nur in Apples eigenen Apps. Zoom, Google Meet, Slack-Huddles, YouTube — nichts davon läuft über die Live-Übersetzung.

Live-Untertitel

Aktiviere die Live-Untertitel unter Systemeinstellungen → Bedienungshilfen → Live-Untertitel, und du bekommst ein schwebendes Fenster, das jedes Audio transkribiert, das dein Mac aufnimmt — System-Audio, Mikrofon oder beides. Das funktioniert in jeder App: Zoom, YouTube, Podcasts, ein Kollege, der neben dir spricht.

Live-Untertitel transkribieren, übersetzen aber nicht. Aktuell sind sie außerdem nur auf Englisch verfügbar. Wenn dein Meeting auf Englisch läuft und du einfach Text mitlesen willst, ist das die Antwort. Wenn das Meeting auf Portugiesisch ist, helfen Live-Untertitel nicht.

Vergleich von drei Echtzeit-Sprachübersetzungs-Workflows auf dem Mac: Live-Untertitel für Meetings, Diktieren zum Schreiben und Datei-Transkription

Live-Untertitel und Übersetzung für Anrufe und Videos

Wenn Apples eingebaute Tools deinen Call nicht abdecken, springt eine kleine Gruppe von Drittanbieter-Apps ein. Sie greifen das System-Audio (alles, was über die Mac-Lautsprecher läuft) oder dein Mikrofon ab, transkribieren es mit einem lokalen Whisper-Modell und übersetzen es bei Bedarf. Alle drei unten laufen auf dem Gerät, was zählt, wenn du in einem vertraulichen Gespräch sitzt.

MacWhisper — eine der ältesten Mac-Apps in diesem Bereich. Live-Untertitel mit Übersetzung, läuft auf Whisper und Nvidia Parakeet, unterstützt System-Audio für jedes Meeting-Tool. Solide für Zoom, Meet, Teams. Die Pro-Version ist eine Einmalzahlung.

Superwhisper — kombiniert Live-Transkription mit einem Whisper-basierten Diktier-Flow. Unterstützt über 100 Sprachen und kann jede davon ins Englische übersetzen. Versucht, Untertitel-Tool und Diktier-Tool in einem zu sein — funktioniert, wenn du beides in einer App willst, macht die Diktier-Seite aber schwerer als ein dediziertes Tool.

Transcrybe — neuer, schlanker, konzentriert auf Echtzeit-Übersetzung. Läuft ausschließlich auf dem Gerät. Die Oberfläche ist gebaut für den Fall „jemand spricht eine Sprache, die ich nicht verstehe — zeig mir, was sie sagen“. Gut für Reisen, Support-Calls und fremdsprachige Inhalte.

Entscheide nach Häufigkeit. Wenn du dauerhaft in internationalen Calls steckst, verdienen MacWhisper oder Superwhisper ihren Platz in der Menüleiste. Wenn du das nur gelegentlich brauchst, reicht eventuell schon Apples Live-Übersetzung in FaceTime.

In einer Sprache diktieren, in einer anderen schreiben

Der häufigste Anwendungsfall für „Echtzeit-Übersetzung“ hat gar nichts damit zu tun, dass andere Leute reden. Es geht um *dich* — du denkst in deiner Muttersprache, aber auf der Seite muss Englisch stehen, weil die Arbeit das so erwartet.

Wenn du Spanisch, Französisch oder Polnisch sprichst und im Job viel auf Englisch schreibst, kennst du den Aufwand. Du formulierst den Satz im Kopf in deiner Sprache, übersetzt ihn mental und tippst dann die Übersetzung. Jede E-Mail ist zweimal geschrieben: einmal im Kopf, einmal mit den Fingern.

Das richtige Werkzeug dafür hat eine andere Form als ein Live-Untertitel-Tool. Du brauchst keine fließenden Untertitel. Du brauchst: eine Taste halten, in deiner Sprache natürlich sprechen, loslassen — und dann liegt sauberer Text in der Zielsprache in der Zwischenablage, bereit zum Einfügen, egal wo (Gmail, Slack, Notion, ein Jira-Ticket).

Genau diese Lücke füllt Voicr. Halte FN, sprich in einer von 100 Sprachen, stelle Englisch als Ziel ein — eingefügt wird sauberes Englisch, nicht dein rohes Transkript, das du anschließend durch einen separaten Übersetzer jagst. Transkription und Übersetzung passieren in einem Schritt statt in der Kette Sprechen → Transkript → Kopieren → Übersetzer → Einfügen. Das Ganze dauert etwa so lange, wie du zum Reden brauchst.

Es gibt außerdem einen Auto-Erkennungs-Modus, der die gesprochene Sprache aus dem Audio selbst erkennt. Wenn du also etwa zwischen Spanisch für private Slack-Chats und Englisch für Kunden-Mails wechselst, brauchst du keinen Sprachwähler zu öffnen. Klingt nach einer Kleinigkeit, ist in der Feature-Liste leicht zu übersehen. Die längere Erklärung steht in Sprache-zu-Text in 100 Sprachen auf dem Mac.

Vorhandene Aufnahmen transkribieren

Wenn du eine Datei hast (eine Zoom-Aufnahme, ein Sprachmemo, ein Interview, einen Podcast), ist „Echtzeit“ der falsche Rahmen. Schick die Datei einem Whisper-basierten Tool in voller Qualität und gib ihm zwei Minuten. Genauigkeit zählt.

MacWhisper und Whisper Transcription machen das beide gut. Genauso die OpenAI-API direkt, wenn du dich mit einem Skript wohlfühlst. Speziell zur Übersetzung: Whispers eingebaute Übersetzung geht nur in eine Richtung — beliebige Sprache → Englisch. Wenn du die andere Richtung brauchst (Englisch → Japanisch zum Beispiel), schick das Transkript danach durch ein separates Übersetzungsmodell, etwa Claude, GPT oder DeepL.

Überspring diesen Abschnitt, wenn dein Input immer live ist. Aber wenn du Interviews aufnimmst oder Transkripte aus alten Meetings ziehst, bleibt der Offline-Workflow günstiger, genauer und einfacher zu korrigieren als das Streaming.

Das richtige Setup für deinen Workflow

Ein kurzer Entscheidungsbaum:

1. Ich will Untertitel in einem FaceTime- oder Nachrichten-Gespräch → Apple Live-Übersetzung. Kostenlos, eingebaut, auf dem Gerät. 2. Ich will Untertitel in einem Zoom-/Meet-/Teams-Call in einer Sprache, die ich nicht spreche → MacWhisper, Superwhisper oder Transcrybe. Such dir eines aus. 3. Ich will in meiner Muttersprache diktieren und englischen Text bekommen, den ich überall einfügen kann → ein Diktier-Tool mit einer Taste wie Voicr. Das ist der Alltagsfall für mehrsprachige Profis. 4. Ich will eine Aufnahme in einer anderen Sprache transkribieren und englischen Text bekommen → MacWhisper oder eine andere Whisper-basierte Desktop-App. Offline, volles Modell, zwei Minuten Wartezeit.

Die meisten landen am Ende bei zwei Tools, nicht einem: etwas für Live-Untertitel, wenn sie sie brauchen (selten), und etwas fürs tägliche Diktieren (ständig). Diese Aufteilung ist normal. Ein Untertitel-Tool und ein Diktier-Tool sind auf unterschiedliche Dinge optimiert, und der Versuch, eines beides erledigen zu lassen, macht meistens beides schlechter.

Realistische Erwartungen setzen

Ein paar Dinge, die jedes Demo-Video unter den Tisch fallen lässt — gut zu wissen, bevor du dich festlegst:

Latenz ist real. Selbst Whisper auf dem Gerät hat 1–3 Sekunden Verzögerung für Live-Untertitel. Cloud-Tools legen nochmal 1–2 Sekunden drauf. Rechne damit. Versuch nicht, einer schnellen politischen Debatte über Live-Untertitel zu folgen — du wirst zurückfallen.

Die Übersetzungsqualität fällt außerhalb der Top-10-Sprachen ab. Whisper selbst ist exzellent für Englisch, Spanisch, Französisch, Deutsch, Portugiesisch, Italienisch, Mandarin und Japanisch. Bei Thai, Kantonesisch, Vietnamesisch und den meisten afrikanischen Sprachen wird es spürbar schwächer. Wenn deine Sprache am langen Ende sitzt, teste, bevor du dich darauf verlässt.

System-Audio braucht eine Berechtigung. macOS lässt eine App das System-Audio standardmäßig nicht abhören. Jedes Tool aus der Live-Untertitel-Kategorie führt dich beim ersten Mal durch die Freigabe von Bildschirmaufzeichnung oder Audio-Loopback. Das ist normal. Es ist auch der Grund, warum manche Apps einmalig ein virtuelles Audiogerät installieren.

Privatsphäre ist nicht gleich Privatsphäre. Apples Tools und die meisten Whisper-basierten Apps laufen vollständig auf dem Gerät. Alles, was Audio an eine Cloud-API schickt (manche „KI-Meeting-Assistenten“), macht einen anderen Kompromiss. Wenn du in Bereichen wie Recht, Gesundheit oder anderen regulierten Branchen arbeitest, prüfe das, bevor du ein Tool in einem Kunden-Call einschaltest.

Ein mehrsprachiger Profi spricht in seiner Muttersprache, während sauberer englischer Text in einem E-Mail-Entwurf auf einem Mac erscheint

Ein praktischer Startpunkt

Egal, wohin du am Ende willst — am einfachsten ist es, den einen Anwendungsfall zu nehmen, den du diese Woche am häufigsten triffst. Nicht den seltenen. Den täglichen.

Wenn du in vielen internationalen Meetings sitzt, installier ein Live-Untertitel-Tool, lass es in der Menüleiste laufen und benutze es zwei Wochen lang, bevor du dich entscheidest. Wenn du viel Englisch schreibst, während du in einer anderen Sprache denkst, ersetz die nächsten zehn E-Mails, die du normalerweise tippen würdest, durch Diktieren in deiner Muttersprache und lass das Tool das Englische produzieren.

Voicr deckt genau den Diktier-Fall ab. Halte FN, sprich in deiner Sprache, stelle Englisch als Ziel ein, füge überall ein. Es gibt eine kostenlose Stufe (5.000 Wörter pro Monat, ohne Kreditkarte), die ausreicht, um zu sehen, ob der Workflow zu deinem Schreiben passt. Für den Live-Untertitel-Fall hat MacWhisper eine kostenlose Version mit dem Basis-Whisper-Modell, mit der du die Erfahrung testen kannst, bevor du zahlst.

Die Technologie ist schon eine Weile nicht mehr der Flaschenhals. Die spannende Frage ist heute, welchen Workflow du tatsächlich einrichtest und benutzt — und das läuft darauf hinaus, das richtige Werkzeug für die konkrete Reibung zu wählen, an die du immer wieder stößt. Mehr zur Diktier-Seite gibt es in Wie Sprachdiktat auf dem Mac wirklich funktioniert — dort wird beschrieben, was zwischen deiner Stimme und dem polierten Text in deiner Zwischenablage passiert.