Zurück zum Blog

Voicr Team · 23. Mai 2026

Wie ich mit KI die Lücke zwischen Denken und Schreiben schließe

Ein persönlicher Blick auf den KI-Workflow, der endlich dafür sorgt, dass das, was in meinem Kopf ist, fast in Denkgeschwindigkeit auf der Seite landet.

Wie ich mit KI die Lücke zwischen Denken und Schreiben schließe

An den meisten Morgen öffne ich meinen Laptop mit einer klaren Vorstellung davon, was ich schreiben will. Die erste E-Mail ist in meinem Kopf bereits verfasst. Bis meine Finger die Tastatur finden, ist die Hälfte davon schon weg. Ich tippe den Teil, an den ich mich noch erinnere, starre auf den Bildschirm und versuche, den Rest abzurufen.

Dieser Raum zwischen dem Wissen, was man sagen will, und dem Aufschreiben ist das, was ich die Lücke nenne. Jahrelang habe ich sie als Teil des Schreibens hingenommen. Ist sie aber nicht. Sie ist der Preis des Werkzeugs. KI ist das Erste, das sie für mich wirklich verkleinert hat.

Das hier ist eine persönliche Sicht. Keine Liste, kein Tool-Vergleich. Nur der Workflow, den ich mir im letzten Jahr eingerichtet habe, die Teile, die funktionieren, und die Teile, die immer noch nicht klappen.

Das Geschwindigkeitsproblem, über das niemand spricht

Die Zahlen erklären, warum die Lücke existiert. Ein normaler Desktop-Tipper schafft etwa 40 Wörter pro Minute. Geübte Profis kommen auf 60 oder 70. Normales Sprechen liegt mühelos bei rund 150 wpm. Die innere Stimme, also die Stimme im Kopf beim Formulieren eines Satzes, liegt noch höher, mit Schätzungen von bis zu 300 wpm am oberen Ende.

Das grobe Verhältnis lautet also: Denken bei 300, Sprechen bei 150, Tippen bei 40. Tippen ist mit Abstand der langsamste Abschnitt in der Kette. Alles, worauf man warten muss, ist Reibung, und an dieser Reibung sickern die Ideen weg.

Was sich für mich geändert hat, war nicht das Tippen. Ich bin auf der Tastatur nicht schneller geworden. Die Veränderung war ein Wechsel des Engpasses. Ich habe aufgehört, in Tippgeschwindigkeit zu schreiben, und mir erlaubt, in Sprechgeschwindigkeit zu schreiben, während die KI im Hintergrund aufräumt.

Warum Tippen einen unmerklich kleiner macht

Der Preis des Tippens ist nicht nur die Geschwindigkeit. Es ist, dass man anfängt, den Gedanken an den Engpass anzupassen. Man schreibt die kürzere Version. Man lässt die Nuance weg. Man streicht das Beispiel. Man drückt Senden und hat ein leicht unaufrichtiges Gefühl, wie flach die Nachricht geworden ist.

Am stärksten ist mir das in Slack aufgefallen. Ich fing an, eine sorgfältige Antwort zu tippen, sah dem Cursor zu, wie er dasaß, während ich den Satz im Kopf umformulierte, löschte dann alles und schickte stattdessen drei Wörter. „Klingt gut.“ „Verstanden.“ „Mach ich.“ Viele Arbeitsgespräche sind genau an dieser Stelle gestorben, nicht weil ich nichts beizutragen hatte, sondern weil das Beitragen mehr gekostet hat, als es wert war.

Sobald ich aufgehört habe, diese Antworten zu tippen, und angefangen habe, sie zu sprechen, wurden die Nachrichten länger, wärmer und klarer. Gleiches Gehirn. Anderer Ausgabekanal.

Wie es sich anfühlt, die Lücke wirklich zu schließen

Hier eine Szene von einem Dienstagmorgen. Ein Kunde schickt eine E-Mail und fragt, warum ein Projekt im Verzug ist. Es gibt eine echte Antwort: teils unsere Scope-Änderungen, teils ihre späte Freigabe, teils eine Feiertagswoche. Das ist kein Einzeiler. Das sind drei Absätze, die diplomatisch sein müssen, ohne auszuweichen.

Die alte Version von mir öffnet die Antwort, tippt den ersten Satz zweimal, löscht ihn und verbringt fünfzehn Minuten damit, vier höfliche Absätze zu produzieren, die nicht ganz das aussagen, was ich meine.

Die aktuelle Version von mir hält eine Taste gedrückt, redet neunzig Sekunden lang und lässt los. Die Antwort steht bereits in der E-Mail, schon in Absätze gegliedert, schon aufgeräumt, Füllwörter sind weg. Ich lese sie einmal, korrigiere eine Formulierung und schicke sie ab. Die E-Mail hat zwei statt fünfzehn Minuten gedauert, und sie ist näher an dem, was ich eigentlich sagen wollte, weil ich den Gedanken nie auf Tippgeschwindigkeit komprimieren musste.

Eine unordentliche Sprechblase links wird von KI in eine saubere, strukturierte E-Mail rechts verwandelt

Beim ersten Mal, als es geklappt hat, saß ich etwas verblüfft da. Nicht weil die Technik magisch wäre. Ist sie nicht. Der Grund war schlichter: Die Reibung, die ich als Teil des Schreibens hingenommen hatte, war plötzlich optional.

Die zwei KI-Schichten, die den Unterschied gemacht haben

Es hat eine Weile gedauert, bis ich gemerkt habe, dass mein Workflow aus zwei KI-Schichten besteht und dass beide arbeiten. Die Leute reden über die eine oder die andere; selten über beide.

Schicht 1: Stimme rein, sauberer Text raus

Die erste Schicht ist Sprachdiktat mit KI-Politur. Ich halte eine Taste, spreche normal (mit den „ähs“, Neuanläufen und halben Sätzen), und der Text, der in meiner Zwischenablage landet, ist schon aufgeräumt. Füllwörter entfernt. Grammatik korrigiert. Endlose Sätze in echte Absätze zerlegt.

Das ist nicht dasselbe wie eingebautes Diktieren. Apple Dictation gibt einem das rohe Transkript, „ähs“ inklusive. KI-Politur schreibt das Transkript um und behält dabei, was gemeint war. Der Unterschied ist der zwischen einer Aufnahme und einem Entwurf.

Schicht 2: Text rein, besserer Text raus

Die zweite Schicht ist die Textkorrektur direkt an Ort und Stelle. Ich markiere etwas, das ich schon geschrieben habe (einen Absatz, einen Satz, eine ganze E-Mail), drücke ein Kürzel, wähle einen Prompt wie „Mach das knapper“ oder „Weicheren Ton“ und die Auswahl wird direkt umgeschrieben. Kein Tab-Wechsel. Kein Copy-Paste in einen Chatbot. Der vorhandene Text wird durch eine bessere Version seiner selbst ersetzt.

Sprachdiktat bringt den Gedanken schnell auf die Seite. Die Korrektur an Ort und Stelle übernimmt die letzten zehn Prozent Politur. Zusammen kommen sie näher an Schreiben in Sprechgeschwindigkeit heran, als es jede für sich allein tut.

Der tägliche Workflow, den ich wirklich nutze

So sieht ein durchschnittlicher Tag in der Praxis aus. Nichts davon ist Theorie. Es ist die tatsächliche Form meines Schreibens jetzt.

Morgendlicher Posteingang. Ich lese jede E-Mail und diktiere dann die Antwort. Die meisten sind ein Absatz. Ein paar sind länger. Fast keine wird getippt. Der ganze Stapel, der früher die erste Stunde gefressen hat, dauert jetzt etwa zwanzig Minuten.

Slack über den Tag verteilt. Kurze Antworten werden weiterhin getippt, weil die Reibung gering und der gedankliche Aufwand klein ist. Alles, was mehr als zwei Sätze braucht, wird gesprochen. Der Ton ist automatisch locker, weil ich in Slack so rede.

Dokumente und Notizen. Erste Entwürfe werden fast immer diktiert. Ich öffne ein leeres Dokument, spreche fünf oder zehn Minuten über das, was ich abdecken will, und habe danach einen echten Entwurf zum Weiterarbeiten. Einen Entwurf zu bearbeiten ist viel schneller, als bei null anzufangen, und die Lücke zwischen Denken und Schreiben ist am leeren Blatt am größten.

Überarbeitungsdurchgang. Hier zahlt sich die zweite Schicht aus. Ich markiere Sätze, die holprig klingen, und bitte um eine straffere Version. Ich markiere Absätze, die zu steif klingen, und bitte um etwas Wärmeres. Jede Korrektur dauert zwei Sekunden, direkt vor Ort, ohne App-Wechsel.

Eines hat mich überrascht: Ich schreibe insgesamt mehr Wörter als vorher, nicht weniger. Die KI hat meinen Output nicht ersetzt. Sie hat den Teil der Arbeit entfernt, der reine Tastendruck-Steuer war.

Wer einen genaueren Blick auf den E-Mail-Teil davon werfen will: Ich bin in E-Mails auf dem Mac diktieren tiefer eingestiegen.

Die eine Einstellung, die alles ans Laufen gebracht hat

Es gibt eine Einstellung, die ich am Anfang fast übersehen hätte, und sie hat sich als das herausgestellt, was das Ganze überhaupt brauchbar macht: Schreibstile pro App.

Slack und E-Mail wollen nicht denselben Ton. Ein formelles Anschreiben will nicht denselben Ton wie ein Notion-Brainstorming. Wenn die KI-Politur alles in dieselbe Stimme presst, ist der Output schneller, aber schlechter, und man fängt an, ihm zu misstrauen.

Genau dafür hat Voicr Smart Rules. Du legst einen lockeren Ton für Slack fest, einen formelleren für Mail und einen nüchternen fürs Terminal. Voicr erkennt die aktive App und wendet den passenden Stil an, ohne dass du etwas tun musst. Ich diktiere in jeder App gleich; der Output passt sich an. Das ist der Trick, der mich aufhören ließ, bei „wichtigen“ Nachrichten zur Tastatur zurückzukehren.

Wo reines Diktieren scheitert (und Politur dich rettet)

Reines Diktieren hat eine bestimmte Schwachstelle, die jeder kennt, der es schon einmal probiert hat. Du sprichst einen Absatz. Das Transkript kommt zurück, jedes „äh“ ist drin, deine zwei Neuanläufe sind zusammengeflickt, und ein Satz zieht sich über vierzig Wörter, weil du nicht Luft geholt hast.

Man kann es bearbeiten. Aber ein rohes Transkript zu redigieren ist eine eigene Art von Arbeit und kann langsamer sein, als das Ganze gleich sauber zu tippen. Deshalb geben die meisten, die das eingebaute Diktieren probieren, nach einer Woche auf.

Politur ändert die Rechnung. Wenn die KI die Füllwörter entfernt, die Grammatik korrigiert und die Sprachmauer in Absätze zerlegt, ist das Ergebnis etwas, das ich ohne weitere Bearbeitung verschicken würde. Der Diktatschritt ist dann nicht mehr Entwurf null, sondern schon nahe an einem fertigen Entwurf.

Diesen Punkt überspringen konkurrierende Artikel oft. Der Geschwindigkeitsvorteil von Sprache gegenüber Tippen ist real, aber er nützt nur, wenn man ihn nicht in Aufräumzeit wieder draufzahlt.

Ehrliche Kompromisse

Nicht alles ist ein sauberer Gewinn. Manches ist nach wie vor besser getippt:

- Stark technische Texte mit Code, Befehlsnamen oder Produkt-SKUs. Diktat trifft die Wörter; bei Symbolen klappt es nicht immer. Code tippe ich weiterhin. - Laute Umgebungen. Cafés, Flugzeuge, Großraumbüros. Mit dem Laptop in einem ruhigen Raum zu sprechen, geht. Neben jemandem, der gerade telefoniert, nicht. - Heikle Themen in Gesellschaft. Eine Trennungsmail oder eine harte Rückmeldung tippe ich lieber, statt sie laut zu sprechen, wo jemand mithören könnte. - Tiefes Redigieren. Wenn ein Dokument fast steht, mache ich kleine, gezielte Korrekturen lieber mit der Tastatur. Stimme ist zum Auf-die-Seite-Bringen da, nicht zum Verschieben von Kommas.

Zu wissen, wann man zurückwechselt, gehört zum Workflow. Die Tastatur ist nicht weg. Sie ist nur nicht mehr die Standardlösung.

Was sich für mich wirklich verändert hat

Die ehrliche Antwort ist nicht „Ich produziere viermal so viel Content“. Sie ist kleiner und merkwürdiger als das.

Ich schicke längere Slack-Antworten, weil der Aufwand fürs Schreiben gesunken ist. Ich mache weniger halbfertige Notizen, weil einen ganzen Gedanken zu diktieren schneller geht, als ein Fragment zu tippen. Ich schreibe erste Entwürfe noch am selben Tag, an dem die Idee auftaucht, statt sie für einen Block fokussierter Zeit aufzuheben, der oft nie kommt. Die Lücke zwischen einer Idee und einem Entwurf davon ist von Tagen auf Minuten geschrumpft.

Das ist das, was die Geschwindigkeitszahlen nicht erfassen. Die eigentliche Frage ist, ob das Schreiben billig genug geworden ist, dass man es macht, wann immer man will, statt es für einen fokussierten Zeitblock aufzusparen, der oft nie kommt.

Wie du das heute ausprobierst

Wenn du testen willst, ob das für dich funktioniert, versuche nicht, deinen ganzen Workflow umzubauen. Such dir ein einziges Zeitfenster.

1. Nimm deine nächste E-Mail-Antwort, die mehr als zwei Sätze braucht. 2. Statt zu tippen, halte die Diktattaste gedrückt und sag, was du sagen willst. Nicht vorher skripten. Einfach sagen. 3. Lass die Taste los und lies, was im Feld gelandet ist. 4. Wenn es nah an dem ist, was du gemeint hast, korrigiere die ein, zwei Formulierungen, die danebenliegen, und schick es ab.

Mach das fünfmal. Am Ende des ersten Tages weißt du, ob die Lücke, die ich beschreibe, auch deine Lücke ist.

Wenn du den oben beschriebenen Workflow haben willst, ohne ihn dir selbst zusammenzusetzen: Voicr ist die App, die ich nutze. FN halten, sprechen, einfügen. Der Output ist poliert, der Ton passt sich der jeweiligen App an, und Text markieren plus ⌥Space gibt dir die direkten Korrekturen für den zweiten Durchgang. Fünftausend Wörter pro Monat sind kostenlos, falls du nur schauen willst, ob es bei dir hängen bleibt.

Die Tastatur verschwindet nicht. Aber zum ersten Mal in zwanzig Jahren Schreiben am Computer ist sie nicht mehr der Engpass, um den ich herumplanen muss.