Zurück zum Blog

Voicr Team · 23. Mai 2026

Wie ich mit Sprachdiktat auf dem Mac 3x schneller schreibe

Ich habe einen Monat lang Tippen durch Sprechen ersetzt. Hier ist die ehrliche Bilanz – was funktioniert hat, was nicht und die Rechnung hinter dem 3x.

Wie ich mit Sprachdiktat auf dem Mac 3x schneller schreibe

Mitten in einer Slack-Antwort traf es mich. Ich hatte denselben Satz seit zwölf Sekunden im Kopf, während meine Finger sich gerade durch die ersten vier Wörter quälten. Mein Gehirn lief im Leerlauf und wartete darauf, dass meine Hände aufholen.

Das war der Moment, in dem ich Sprachdiktat eine echte Chance gegeben habe. Nicht der halbherzige „Ich probier's mal für eine Meeting-Notiz“-Versuch, den ich schon zweimal abgebrochen hatte. Ein ganzer Monat, jede längere Nachricht, jede E-Mail, jedes Dokument. Hier ist, was wirklich passiert ist.

Der Pitch klingt nach Marketing-Geschwurbel, bis man die Zahlen sieht. Ein durchschnittlicher Mensch tippt etwa 40 Wörter pro Minute. Dieselbe Person spricht 130 bis 150. Forscher in Stanford haben den Vergleich schon 2017 durchgeführt und Spracheingabe auf dem Handy als rund 3x schneller als Tippen eingeordnet, selbst für Menschen, die schnell tippen. Auf der Mac-Tastatur hält sich das Verhältnis weitgehend.

Die Rechnung ist brutal: 40 WPM vs. 150 WPM

Klären wir das zuerst. Die meisten ungeübten Erwachsenen tippen rund 38 bis 40 WPM. Geübte Tipper, die nie auf die Tastatur schauen, kommen auf etwa 65. Gesprochenes Deutsch liegt bei 130 bis 150 WPM. Selbst gegen einen schnellen Tipper sind das mehr als 2x. Gegen den Durchschnitt eher 3,75x.

So weit die Theorie. Die Praxis ist interessanter. Wenn man sich zum ersten Mal beim Diktieren einer E-Mail mit der Stoppuhr misst, ist der Abstand nicht ganz so groß, wie die Rechnung vermuten lässt. Warum? Weil Tippen eine einzige Bewegung ist. Diktieren heißt sprechen, dann Korrekturlesen, vielleicht einen Satz neu diktieren, dann einfügen. Die Aufräumarbeit frisst einen Teil des Vorsprungs.

Die Lösung steckt im Werkzeug. Altes Diktieren liefert ein rohes Transkript mit jedem „ähm“, jedem „äh“, jedem „also im Grunde will ich sagen“. Neuere Tools polieren das in einem Schritt zu sauberem Text. Wenn das Aufräumen automatisch passiert, ist das 3x real.

Wie „3x schneller“ im echten Arbeitstag aussieht

So sah ein normaler Dienstag bei mir vor dem Wechsel aus. Sechs längere Slack-Nachrichten (~80 Wörter), vier E-Mails (~120 Wörter), zwei kurze Dokumente (~400 Wörter), eine Handvoll Einzeiler-Antworten. Gesamter getippter Output: rund 1.800 Wörter. Reine Tippzeit, ohne Nachdenken: etwa 45 Minuten.

Gleiches Volumen nach dem Wechsel. Gesprochener Gesamtoutput, inklusive Nachbearbeitung, lag bei etwa 14 Minuten. Fast genau 3x. Überrascht hat mich nicht die gesparte Zeit. Sondern wohin sie geflossen ist. Ich habe aufgehört, einen Entwurf zu öffnen, wegzugehen, zurückzukommen und das Ganze neu zu schreiben. Der Gedanke verließ meinen Kopf und landete in einem Durchgang auf dem Bildschirm.

Vergleich nebeneinander: 45 Minuten Tippen gegenüber 14 Minuten, denselben Inhalt zu sprechen

Wo Diktieren für mich gut funktioniert: - Lange Slack-Threads - E-Mail-Antworten über zwei Sätze hinaus - Meeting-Notizen während des Meetings - Erste Entwürfe von allem - Brainstorming-Dokumente - Sprachnotizen, die später zu Dokumenten werden

Wo es nicht hilft: - Kurze Antworten („alles klar“, „danke“) - Code - Strukturierte Tabellen - Passwörter - Alles, bei dem man Wort für Wort scharf nachdenken muss

Woche eins war übel. Hier ist, was schiefging.

An Tag drei hätte ich beinahe hingeschmissen. Das erste Problem war, überhaupt mit dem Rechner zu sprechen. Es fühlte sich gestelzt an. Ich begann einen Satz, verlor den Mut, hörte auf und hatte am Ende einen halb transkribierten Gedanken, dessen Reparatur länger dauerte, als ihn zu tippen.

Das zweite Problem war Übereifer. Ich sprach, als würde ich einen formellen Brief diktieren, langsam und bedacht, jedes Wort sauber artikuliert. Das Ergebnis kam roboterhaft zurück und der Geschwindigkeitsvorteil war weg. Ich tippte einfach nur mit dem Mund, und das schlecht.

Die Lösung war das Gegenteil von dem, was ich erwartet hatte. Schneller sprechen, nicht langsamer. So sprechen, wie man einem Kollegen etwas erklärt, inklusive der Anläufe und des „okay, vergiss das, ich sag's anders“. Ein gutes Polier-Tool räumt das auf. Hör auf zu diktieren. Sprich einfach.

Der Durchbruch: zu wissen, wann man nicht diktieren sollte

Was Sprachdiktat vom „gelegentlichen Experiment“ zur „Standard-Eingabemethode“ gemacht hat, war ein mentales Modell: Stimme für *erste Entwürfe*, Tastatur für *Korrekturen*. Die Tastatur ist präzise. Die Stimme ist schnell. Sprich die rohe Version, dann fixe mit der Tastatur das eine Wort, das falsch rüberkam.

Im Nachhinein klingt das selbstverständlich. Am Anfang war es das nicht. Ich versuchte ständig, perfekte Prosa zu diktieren, und war frustriert, wenn das polierte Ergebnis nicht *exakt* das war, was ich wollte. Was schließlich half, war, meine Ansprüche an den diktierten Entwurf zu senken. Bring den Gedanken raus. Fixe es in zwei Sekunden mit der Tastatur. Weiter.

Genau deshalb ist der Polish-as-you-go-Workflow so entscheidend. Wenn du erst diktieren, dann die Füllwörter manuell wegräumen, dann die Grammatik korrigieren und dann für die App, in der du gerade bist, formatieren musst, ist der Geschwindigkeitsvorteil weg. Der ganze Witz ist, dass das Aufräumen automatisch passiert. In dem Moment, in dem du aufhörst zu reden, ist der Text schon einfügebereit. Voicr macht genau das auf dem Mac: FN halten, sprechen, loslassen, einfügen. Das Aufräumen läuft im Hintergrund.

Der Workflow, der geblieben ist (Slack, E-Mail, Docs)

Nach einem Monat hatten sich drei Workflows eingespielt. Jeder brauchte ein leicht anderes Setup.

Drei App-Fenster (Slack, E-Mail, Dokument), jeweils mit einem Mikrofon-Symbol und einer anderen Schreibstil-Bezeichnung

Slack und Chat

Das war der größte Hebel. Ich schreibe viele längere Slack-Nachrichten: Erklärungen zu Entscheidungen, Post-Mortems, lange Threads. Früher zehn Minuten pro Stück. Heute drei. Ich diktiere die Nachricht in einem Rutsch, füge ein, schaue kurz auf Tippfehler, schicke ab. (Sprache-zu-Text in Slack auf dem Mac zeigt das Setup pro Channel im Detail.)

E-Mail

Bei E-Mails hatte ich den größten Gewinn erwartet und am Anfang das größte Chaos bekommen. Das Problem: E-Mail hat einen Ton. Du kannst die Antwort an deinen Chef nicht so diktieren wie eine Slack-Nachricht an eine Kollegin. Die Lösung war ein App-spezifischer Stil. Förmlich für E-Mail, locker für Chat. (So diktierst du E-Mails auf dem Mac geht da ins Detail.)

Dokumente und Notizen

Dokumente sind der eigenartigste Fall. Kurze Notizen klappen super. Diktieren, einfügen, fertig. Lange Dokumente nicht, weil das Denken strukturell ist. Du schreibst keine Sätze. Du gliederst Abschnitte, schiebst Dinge hin und her, strukturierst um. Bei langen Dokumenten diktiere ich Absatz für Absatz und behalte die Struktur auf der Tastatur.

Was ich gewonnen habe, das nichts mit Geschwindigkeit zu tun hatte

Das 3x ist die Schlagzeile. Die unerwarteten Gewinne sind größer.

Weniger halbfertige Entwürfe. Wenn das Tippen der Flaschenhals ist, startet jede lange Nachricht als Entwurf, den man später beenden will. Die meisten sterben im Entwürfe-Ordner. Sprache schließt die Lücke zwischen Gedanke und Output. Ich schicke heute Dinge raus, die früher zwei Tage ungeschickt herumlagen.

Weniger Belastung der Handgelenke. Ich behaupte nicht, dass Sprachdiktat meine Hände geheilt hat. Aber der Unterschied zwischen 6 Stunden Tippen und 2 Stunden Tippen ist real, und meine Handgelenke spüren ihn am Freitagabend.

Bessere erste Entwürfe. Das war eine Überraschung. Wenn man einen Gedanken durchspricht, strukturiert man ihn ganz natürlich so, wie ein Mensch ihn erklären würde. Getippte erste Entwürfe wirken oft steifer. Sie lesen sich, als wären sie geschrieben worden, weil sie es wurden. Diktierte Entwürfe klingen nach einem Menschen, was meistens genau das ist, was man will.

Der Haken, vor dem dich keiner warnt

Zwei echte Nachteile. Beide haben Workarounds, aber es lohnt sich, sie vor dem Einstieg zu kennen.

Im Großraumbüro kannst du nicht diktieren. Auch nicht im Café. Auch nirgendwo, wo in Hörweite jemand anderes sitzt. Klingt offensichtlich, ist aber eine größere Einschränkung, als es scheint. Wenn dein Arbeitsumfeld geteilt ist, wird Sprachdiktat zum „Nur an Homeoffice-Tagen“-Tool, was den Produktivitätsgewinn deckelt.

Eine Aufräumarbeit bleibt, selbst mit guten Tools. Sie ist klein. Vielleicht eine Korrektur pro Absatz statt eine pro Satz. Aber sie ist nicht null. Die Rechnung geht trotzdem mit großem Vorsprung zu deinen Gunsten auf, aber wer so tut, als gäbe es kein Aufräumen mehr, programmiert Enttäuschung.

Wie du das wirklich ausprobierst, ohne in drei Tagen aufzugeben

Ein paar Regeln, die ich mir an Tag eins gewünscht hätte.

Fang mit einer App an, nicht mit allen. Wähle die App, in der du am meisten unkritischen, längeren Text schreibst. Bei mir: Slack. Nutze die Stimme eine Woche lang nur für diese App. Versuch nicht, deinen kompletten Workflow auf einmal umzustellen.

Setz dir ein Skepsis-Limit von einer Woche. Tag drei wird mies. Tag fünf wird okay. An Tag sieben spürst du die Lücke, wenn du zum Tippen zurückkehrst. Wer an Tag drei aufgibt, erreicht Tag sieben nie.

Nutz ein Tool, das standardmäßig poliert. Das ist der mit Abstand wichtigste Faktor. Reine Transkriptions-Tools verbrennen deinen Gewinn beim Aufräumen. Nur ein Tool, das Füllwörter entfernt, Grammatik korrigiert und den Output automatisch strukturiert, lässt das 3x tatsächlich auftauchen.

Diktiere nie vor anderen Menschen. Nicht weil es laut wäre (ist es nicht). Sondern weil die Selbstbewusstheit deine Geschwindigkeit killt. Such dir für den ersten Monat einen privaten Platz.

Wo du anfängst

Ehrliches Fazit: Sprachdiktat funktioniert. Nicht im „Das verändert alles“-Sinn, den die Marketing-Texte versprechen. Eher im „Ich bin jetzt um 16 Uhr fertig“-Sinn. Das 3x ist real, und jedes Tool, das dir die Aufräumarbeit nicht abnimmt, ist der Grund, warum Leute Diktieren in Woche eins wieder hinwerfen.

Der schnellste Weg, das selbst zu testen, ist, deine nächste lange Slack-Nachricht zu diktieren statt zu tippen. Wenn du willst, dass das Aufräumen automatisch passiert, mit Sprache, die in einem Schritt zu einfügebereitem Text wird, plus App-spezifischem Stil – genau das macht Voicr auf dem Mac. FN von überall halten, dreißig Sekunden sprechen, loslassen, einfügen. Probier's morgen früh an einer Nachricht. Bis zum Wochenende weißt du, ob das 3x für dich real ist.