Du beginnst eine E-Mail auf Englisch, wechselst kurz ins Spanische für eine Nachricht an einen Kollegen in Madrid und antwortest dann auf Slack auf Französisch. Drei Apps, drei Sprachen, zehn Minuten. Die Hälfte der Zeit gehört deinen Fingern, die andere Hälfte dem Sprachmenü der Mac-Diktierfunktion.
Wer mehrere Sprachen spricht, hat das Gefühl, dass Apples eingebaute Diktierfunktion für jemanden gebaut wurde, der genau das nicht tut. Du wählst eine Sprache, diktierst, gräbst dich dann durch die Systemeinstellungen oder klickst auf ein winziges Menü neben dem Cursor, um umzuschalten. Vergisst du den Wechsel, kommt dein Französisch als englischer Unsinn heraus.
Im letzten Jahr hat sich leise etwas verändert. Eine Handvoll Mac-Apps transkribiert und poliert deine Sprache mittlerweile in rund 100 Sprachen, mit automatischer Erkennung, die ohne Menü-Klick herausfindet, was du gerade sprichst. Dieser Leitfaden zeigt dir, was das 2026 konkret bedeutet, welche Sprachen wirklich abgedeckt sind, wo Apples Werkzeug an seine Grenzen stößt und wie du einen mehrsprachigen Diktier-Workflow einrichtest, der bei jedem Sprachwechsel funktioniert.
Was "100 Sprachen auf dem Mac" 2026 tatsächlich heißt
Die Zahl 100, die auf vielen App-Websites prangt, ist kein Marketing-Gag. Sie stammt von einem konkreten Modell: OpenAIs Whisper, trainiert auf rund 680.000 Stunden mehrsprachigem Audio. Die aktuell weit verbreitete Variante large-v3-turbo unterstützt 99 Sprachen, was die meisten Apps auf "100" aufrunden.
Hier die grobe Liste dessen, was abgedeckt ist. Komplettes europäisches Spektrum, inklusive der nordischen und slawischen Gruppen. Die wichtigsten asiatischen Sprachen: Mandarin, Japanisch, Koreanisch, Vietnamesisch, Thai, Indonesisch, Tagalog, Malaiisch. Südasien: Hindi, Bengalisch, Tamil, Urdu, Marathi, Nepali. Naher Osten: Arabisch, Hebräisch, Persisch, Türkisch, Aserbaidschanisch. Afrika: Swahili, Afrikaans. Dazu weniger offensichtliche Sprachen wie Walisisch, Maori, Belarussisch, Mazedonisch, Kasachisch und Birmanisch.
Die Qualität ist auf dieser Liste nicht gleichmäßig. Englisch, Spanisch, Französisch, Deutsch, Italienisch, Portugiesisch, Niederländisch, Japanisch und Mandarin liegen an der Spitze: Wortfehlerraten von etwa 4 bis 8 Prozent bei sauberem Audio. Seltenere Sprachen und solche mit wenig Trainingsdaten, etwa Walisisch oder Maori, kommen auf 15 bis 25 Prozent. Immer noch brauchbar, aber weniger nachsichtig.
Der größere Sprung: All das läuft jetzt auf einem normalen Mac. Apple Silicon erreicht den Punkt, an dem Whispers großes Modell einen 30-Sekunden-Clip lokal in unter zwei Sekunden transkribiert, ohne den Umweg in die Cloud. Deshalb sehen plötzlich so viele Mac-Apps gleich aus. Sie bauen alle auf demselben Modell auf.
Wo Apples eingebaute Diktierfunktion an ihre Grenzen stößt
Apple Dictation gibt es seit 2012, und es ist kostenlos. Für eine einzelne Sprache in einer einzelnen App ist es in Ordnung. Bei mehrsprachiger Arbeit brechen drei Dinge den Flow.
Sprachanzahl. Apple unterstützt je nach macOS-Version etwa 50 bis 60 Sprachen und Dialekte. Solide für die großen europäischen und asiatischen Märkte, aber du stehst auf verlorenem Posten, sobald du Ukrainisch, Tagalog oder Walisisch brauchst oder feinere Dialekte willst, die Apple nicht ausliefert.
Keine automatische Spracherkennung. Apple Dictation nimmt die zuletzt gewählte Sprache. Vergisst du den Wechsel, läuft dein Französisch durchs englische Modell und kommt als Kauderwelsch heraus, das sich vage nach dem anhört, was du gesagt hast. Zum Wechseln klickst du auf die winzige Sprachanzeige neben dem Cursor und wählst aus einer Liste. Jeder Wechsel ist ein manueller Schritt.
Roher Transkript, ohne Politur. Was du sagst, ist was du bekommst, inklusive "ähm", "sozusagen", Neuansätze und der halben Satz, den du angefangen und dann verworfen hast. In einer Sprache schon nervig, in mehrsprachiger Arbeit noch schlimmer, weil du dort tendenziell vorsichtiger sprichst, um das Modell auf Kurs zu halten.
Wenn du nur auf Englisch diktierst und hinterher gern noch aufräumst, reicht Apples Werkzeug. Sobald du eine zweite Sprache brauchst oder Output willst, den du ohne zweites Lesen einfügen kannst, bist du da herausgewachsen.
Wie Whisper 100 Sprachen unter der Haube bewältigt
Es lohnt sich, grob zu wissen, was passiert, wenn du eine Taste hältst und sprichst, denn das erklärt, warum manches funktioniert und anderes nicht.
Whisper ist ein einziges neuronales Netz, trainiert auf Audio aus 99 Sprachen. Statt für jede Sprache ein eigenes Modell zu fahren, hat es gelernt, alle gleichzeitig zu erkennen. Das gemeinsame Training bringt etwas Nützliches: Ein Satz auf Italienisch und ein Satz auf Portugiesisch teilen genug akustische Merkmale, dass das Lernen der einen Sprache der anderen hilft. Der Nachteil: Alle Sprachen konkurrieren um dieselbe Modellkapazität, also sind die selteneren schwächer.

Wenn Audio reinkommt, macht das Modell drei Dinge in einem Durchgang: 1. Es sagt die Sprache aus den ersten Sekunden Audio voraus. 2. Es transkribiert die Wörter. 3. Es fügt Zeichensetzung und Groß-/Kleinschreibung hinzu.
Die Spracherkennung ist das, was den Auto-Modus möglich macht. Das Modell hat gelernt, welche Sprache nach welcher klingt. Meistens liegt es ein bis zwei Sekunden nach dem Beginn richtig. Wo es ins Straucheln gerät: sehr kurze Äußerungen (ein, zwei Wörter), Sprachen mit viel gemeinsamem Wortschatz (Spanisch und Italienisch, Norwegisch und Schwedisch) und Wechsel mitten im Satz. Whisper ist darauf ausgelegt, eine Sprache pro Clip zu erkennen, nicht dir zwischen zweien hinterherzuhüpfen.
Wenn du die komplette Mechanik sehen willst, wie aus roher Sprache sauberer Text wird, geht die KI-Sprachdiktier-Pipeline jeden Schritt durch.
Automatische Erkennung vs. manuelle Sprachauswahl: Wann was gewinnt
Moderne mehrsprachige Diktier-Apps bieten dir zwei Modi. Zu wissen, wann du welchen nutzt, entscheidet zwischen flüssig und frustrierend.
Nutze die automatische Erkennung, wenn:
Du tagsüber oft die Sprache wechselst, aber bei einer Diktiersession bei einer Sprache bleibst. Du bist Entwicklerin in Berlin, schreibst englische Codekommentare und deutsche Slack-Nachrichten. Du bist Journalistin, die mit englischen und japanischen Quellen arbeitet. Du beantwortest Support-Tickets in vier Sprachen. In all diesen Fällen ist jede einzelne Aufnahme einsprachig; was sich ändert, ist welche Sprache. Auto-Erkennung erspart dir die Menüsuche bei jedem Mal.
Nutze die manuelle Auswahl, wenn:
Du in selteneren Sprachen arbeitest, in denen die Erkennung wackelig ist (Walisisch, Maori, Belarussisch). Du in einer lauten Umgebung diktierst, in der die erste Sekunde Audio Hintergrundgeräusche statt Sprache enthält. Du kurze Äußerungen diktierst, bei denen es nicht genug Audio zum Erkennen gibt. Oder du eine Sprache nutzt, die sich mit einer anderen überlappt, die das Modell gut kennt (es rät zum Beispiel manchmal Portugiesisch, obwohl du Galicisch meinst).
Was nach wie vor nicht gut funktioniert:
Code-Switching mitten im Satz. Wenn du auf Spanisch anfängst und mittendrin einen englischen Markennamen einwirfst, kommt das Modell klar. Wenn du einen Satz auf Spanisch beginnst und auf Englisch beendest, bekommst du oft eines von beiden als Unsinn in der anderen Sprache zurück. Der ehrliche Workaround: die Aufnahme an der Sprachgrenze beenden und eine neue starten.
Beim Sprechen übersetzen: Der "X sprechen, Englisch ausgeben"-Workflow
Eine der am meisten unterschätzten Funktionen moderner Mac-Diktierfunktion ist Sprechen-und-Übersetzen. Du sprichst in deiner Muttersprache, und der Text, der erscheint, ist bereits in einer anderen Sprache. Meistens ist das Ziel Englisch.
Zwei Methoden stecken dahinter. Erstens enthalten Whispers ältere mehrsprachige Varianten eine eingebaute Übersetzungsaufgabe: Du sprichst in einer der 99 Sprachen, und das Modell gibt direkt Englisch aus. Die neuere Turbo-Variante kann das nicht, deshalb nutzen die meisten Apps inzwischen einen anderen Ansatz: Whisper transkribiert in der Quellsprache, dann übersetzt ein Sprachmodell den Text. Die zweite Methode hat höhere Qualität und erledigt die Politur gleich mit, deshalb ist sie zum Standard geworden.
Das schrumpft einen Workflow, der früher drei Schritte brauchte. Alter Weg: in der Muttersprache diktieren, Text kopieren, in einen Übersetzer einfügen, Ergebnis kopieren, in die E-Mail einfügen. Rund 30 Sekunden und vier Kontextwechsel. Neuer Weg: eine Taste halten, in der Muttersprache sprechen, polierter englischer Text erscheint am Cursor. Rund 4 Sekunden.
Wenn du tagsüber bei der Arbeit Englisch schreibst, aber in einer anderen Sprache schneller denkst, ist diese eine Funktion der Grund, modernes Diktieren einzurichten. Voicr macht das mit einem einzigen Hotkey: Stell Auto als Eingabesprache und Englisch als Polish-Ausgabe ein, und jede Aufnahme landet als versandfertiges Englisch, egal in welcher Sprache du gesprochen hast.
Echte mehrsprachige Workflows auf dem Mac
Theorie ist billig. Hier die Muster, die echten Menschen tatsächlich Zeit sparen.
Zweisprachige Notizen und Journaling
Wenn du Notizen in deiner Muttersprache machst, aber in einem englischsprachigen Arbeitsumfeld lebst, gibt dir Diktieren das Beste aus beiden Welten. Setz die Quellsprache auf deine Muttersprache und die Ausgabe ebenfalls (keine Übersetzung), und du hörst auf zu tippen. Für Meeting-Notizen, bei denen du Original und englische Version willst, diktierst du zweimal mit unterschiedlichen Ausgabeeinstellungen.
Code mit Kommentaren in der Muttersprache
Entwicklerinnen in nicht-englischsprachigen Teams halten Code oft auf Englisch, schreiben Kommentare aber in der Teamsprache. Die Auto-Erkennung kommt damit ohne Nachdenken klar, wenn du zwischen Diktieren in den Editor (englische Codebeschreibungen, Funktionsnamen) und Kommentaren in deiner Sprache wechselst. Jede Aufnahme ist einsprachig; das Modell trifft jedes Mal die richtige Wahl.
Kundensupport über vier Zeitzonen
Support-Mitarbeiterinnen, die Tickets auf Englisch, Spanisch, Französisch und Deutsch bearbeiten, switchen typischerweise zwischen Sprachprofilen in ihren Tools. Mit mehrsprachigem Diktieren liest du das Ticket und antwortest in seiner Sprache, dann geht's zum nächsten. Kein Profilwechsel, kein Menü. Auch der Politur-Schritt ist hier wichtig: Support-Antworten brauchen einen konsistenten professionellen Ton über alle Sprachen hinweg, nicht ein rohes Transkript.
Sprachlernende und Sprachlehrende
Wenn du eine Sprache lernst, zwingt dich das Diktieren in dieser Sprache zu Aussprache und Tempo. Wenn das Modell dich nicht versteht, ist das Feedback. Wenn du eine Sprache unterrichtest, erspart das Diktieren von Beispielsätzen das Tippen von Akzenten, Sonderzeichen und Diakritika. Das Modell setzt sie korrekt. In beiden Fällen verdoppelt sich der Sprechen-und-Übersetzen-Flow als sofortiger Verständnis-Check: Sprich in der Sprache, die du lernst, und sieh, ob das Englisch dem entspricht, was du meintest.
Internationale Autorinnen und Journalistinnen
Langform-Autorinnen, die in einer Sprache denken und in einer anderen publizieren, übersetzen tendenziell beim Tippen im Kopf. Das ist erschöpfend. Sprich den ersten Entwurf in der Sprache, in der du denkst, lass das Tool Englisch produzieren, und redigiere dann. Der erste Entwurf entsteht 3- bis 4-mal schneller, und dein Redaktionsgehirn ist frischer, weil es während des Entwurfs nicht auch noch übersetzen musste.
So richtest du mehrsprachiges Diktieren auf dem Mac ein
Es gibt zwei Wege: Apples eingebautes Werkzeug für den einfachsten Fall und eine Drittanbieter-App für alles andere.
Apple Dictation für mehrere Sprachen einrichten
Öffne die Systemeinstellungen, gehe zu Tastatur und klicke auf Diktat. Schalte es ein. Klicke auf das Dropdown für Sprachen und füge die gewünschten Sprachen hinzu. Du kannst bis zu etwa sechs hinzufügen. Ab jetzt erscheint, wenn du das Diktat startest, eine kleine Flagge oder ein Sprachkürzel neben dem Cursor. Klick darauf, um die Sprache zu wechseln. Einschränkungen: - Keine automatische Erkennung. Jeder Wechsel ist ein Klick. - Nur rund 50 bis 60 Sprachen. - Rohes Transkript, keine Politur, keine app-spezifische Formatierung. - 60-Sekunden-Limit fürs Diktat in älteren macOS-Versionen.
Eine mehrsprachige Drittanbieter-App einrichten
Moderne Mac-Diktier-Apps sehen meistens wie Menüleisten-Tools aus, die in jedem Textfeld in jeder App funktionieren. Die Einrichtung sieht so aus: 1. App installieren und Berechtigungen für Mikrofon und Bedienungshilfen erteilen. 2. Den Hotkey festlegen oder akzeptieren (meist FN oder ⌥Space, gedrückt halten zum Aufnehmen). 3. Eingabesprache wählen. Für mehrsprachige Arbeit auf Auto stellen. 4. Ausgabesprache wählen. Gleich wie die Eingabe bedeutet reine Transkription; wähle Englisch (oder eine andere), um Übersetzung zu bekommen. 5. Optional einen Polish-Prompt setzen ("professionell", "locker", "roh lassen"), damit der Output so klingt, wie du ihn lesen willst. Von da an kannst du überall diktieren, wo du tippen kannst. Taste halten, sprechen, loslassen, der Text erscheint am Cursor.
Wenn du in unterschiedliche Apps mit unterschiedlichen Tonlagen schreibst (förmliche E-Mail, lockerer Slack, technische Doku), kommen hier Smart Rules ins Spiel: ein Schreibstil pro App, der automatisch nach der aktiven App greift. Du legst die Regel einmal fest und hörst auf, daran zu denken. Dasselbe mehrsprachige Modell bedient alle.
Praktische Mitnahmen
Drei Dinge, die du beim Einrichten von mehrsprachigem Diktieren auf dem Mac im Hinterkopf behalten solltest:
Eine Sprache pro Aufnahme ist die Regel. Das Modell kann 100 Sprachen, sucht sich aber pro Clip eine aus. Beende die Aufnahme an der Sprachgrenze, statt mitten im Satz wechseln zu wollen.
Auto-Erkennung ist der Default für tägliche mehrsprachige Arbeit. Manuelle Auswahl lohnt sich nur bei kurzen Äußerungen, seltenen Sprachen oder lauten Umgebungen, in denen die Erkennung danebengreifen könnte.
Übersetzen beim Sprechen ist kein separates Tool. Steht deine Ausgabesprache auf Englisch und die Eingabe auf deine Muttersprache, ist jede Aufnahme eine Übersetzung. Kein Extraschritt, keine zweite App, kein Copy-Paste.
Eine Taste, jede Sprache
Wenn du bis hierher gelesen hast, ist die Antwort auf "Wie diktiere ich 2026 in 100 Sprachen auf meinem Mac" kurz: Installier eine Drittanbieter-App auf Whisper-Basis, stell die Eingabesprache auf Auto, halt eine Taste und sprich. Das System erledigt Spracherkennung, Transkription, Politur und (optional) Übersetzung in einem Durchgang.
Voicr macht das mit einem einzigen Hotkey aus jeder App auf deinem Mac. Halt FN, sprich in einer von 100 Sprachen, lass los, und polierter Text landet am Cursor. Stell die Ausgabesprache so ein, dass beim Sprechen übersetzt wird, oder lass sie auf der Quellsprache für saubere Transkription. Es gibt eine kostenlose Stufe mit 5.000 Wörtern pro Monat, also ist der günstigste Weg herauszufinden, ob mehrsprachiges Diktieren in deinen Workflow gehört, es morgen an der ersten E-Mail auszuprobieren.
Wenn du sehen willst, wie sich modernes Mac-Diktieren direkt mit dem misst, was gerade auf deinem Rechner läuft, vergleicht der Voicr vs. Apple Dictation Vergleich die Unterschiede Feature für Feature.

