Vissza a bloghoz

Voicr Team · 2026. május 23.

Hogyan használom az MI-t, hogy bezárjam a szakadékot a gondolkodás és az írás között

Első személyű betekintés abba az MI-s munkafolyamatba, amely végre lehetővé teszi, hogy ami a fejemben van, közel a gondolkodás sebességén kerüljön papírra.

Hogyan használom az MI-t, hogy bezárjam a szakadékot a gondolkodás és az írás között

A legtöbb reggel úgy nyitom ki a laptopomat, hogy pontosan tudom, mit akarok írni. Az első e-mailt már megfogalmaztam a fejemben. Mire az ujjaim megtalálják a billentyűzetet, a fele elillan. Begépelem azt, amire még emlékszem, bámulom a képernyőt, és próbálom előásni a többit.

Ezt a teret, ami aközött van, hogy tudod, mit akarsz mondani, és hogy az tényleg ott legyen a képernyőn, nevezem szakadéknak. Évekig az írás részeként kezeltem. Pedig nem az. Ez az eszköz ára. Az MI az első dolog, ami tényleg lecsökkentette számomra.

Ez egy első személyű leírás. Nem listacikk, nem eszközajánló. Csak az a munkafolyamat, amibe az elmúlt egy évben beleszoktam: ami működik benne, és ami még mindig nem.

A sebességprobléma, amiről senki nem beszél

A számok megmagyarázzák, miért létezik ez a szakadék. Egy átlagos asztali gépelő körülbelül 40 szót ír percenként. A jó profik elérik a 60-at vagy 70-et. A hétköznapi beszéd nagyjából 150 szó/perc sebességen halad, anélkül hogy igyekeznénk. A belső beszéd, az a verbális hang a fejedben, amikor egy mondatot megfogalmazol, még gyorsabb: a felső becslések körülbelül 300 szó/perc körül vannak.

Az arány tehát durván: gondolkodás 300, beszéd 150, gépelés 40. A gépelés messze a leglassabb láncszem. Minden, amire várni kell, súrlódás, és a súrlódásban szivárognak el az ötletek.

Számomra nem a gépelés sebessége változott. Nem lettem gyorsabb a billentyűzeten. Az változott, hogy hol van a szűk keresztmetszet. Abbahagytam, hogy gépelési sebességen próbáljak írni, és megengedtem magamnak, hogy beszédsebességen írjak, miközben az MI a háttérben elvégzi a takarítást.

Miért tesz a gépelés csendben kisebbé

A gépelés ára nem csak a sebesség. Hanem hogy elkezded a gondolatot a szűk keresztmetszethez igazítani. Megírod a rövidebb verziót. Kihagyod a finomságot. Lemondasz a példáról. Megnyomod a Küldés gombot, és kicsit becsapva érzed magad, mert milyen lapossá vált az üzenet.

Ezt leginkább a Slackben vettem észre. Belekezdtem egy gondos válaszba, néztem, ahogy a kurzor villog, miközben a mondatot újraírom a fejemben, aztán letöröltem az egészet, és három szót küldtem helyette. „Rendben.” „Megvan.” „Rajta vagyok.” Sok munkahelyi beszélgetés ott halt el, nem azért, mert nem volt mit hozzátennem, hanem mert többe került volna hozzátenni, mint amennyit ért.

Amint abbahagytam ezeknek a válaszoknak a gépelését, és helyette elkezdtem őket kimondani, az üzenetek hosszabbak, melegebbek és világosabbak lettek. Ugyanaz az agy. Más kimeneti csatorna.

Milyen érzés valójában bezárni a szakadékot

Itt egy keddi reggeli helyzet. Egy ügyfél e-mailben kérdezi, miért csúszik a projekt. Van egy valódi válasz: részben a hatókör-változások miatt, részben a késői jóváhagyás miatt, részben egy ünnepi hét miatt. Ez nem egysoros. Három bekezdés, amit diplomatikusan kell megfogalmazni anélkül, hogy mellébeszélés legyen.

A régi énem megnyitja a választ, kétszer is begépeli az első mondatot, törli, majd tizenöt percet tölt azzal, hogy négy udvarias bekezdést gyártson, ami nem mondja el pontosan, amit gondol.

A mostani énem lenyom egy gombot, beszél kilencven másodpercig, elengedi. A válasz ott áll az e-mailben, már bekezdésekre tagolva, kitisztítva, a töltelékszavak nélkül. Egyszer átolvasom, egy mondatot átírok, küldöm. Az e-mail két percig tartott tizenöt helyett, és közelebb áll ahhoz, amit valójában mondani akartam, mert sosem kellett a gondolatot gépelési sebességre zsugorítanom.

Egy kusza beszédbuborék a bal oldalon, amit az MI tiszta, jól strukturált e-maillé csiszol a jobb oldalon

Amikor először működött, kissé ledermedve ültem. Nem azért, mert a technológia varázslat lenne. Nem az. Az ok egyszerűbb volt: a súrlódás, amit az írás részeként elfogadtam, hirtelen opcionálissá vált.

A két MI-réteg, ami különbséget tett

Beletelt egy időbe, mire rájöttem, hogy a munkafolyamatomnak két MI-rétege van, és mindkettő dolgozik. Az emberek általában csak az egyikről vagy a másikról beszélnek; ritkán mindkettőről.

Első réteg: hang be, tiszta szöveg ki

Az első réteg az MI-vel csiszolt hangdiktálás. Lenyomok egy gombot, természetesen beszélek (az „ööö”-kkel, az újrakezdésekkel és a félmondatokkal együtt), és a szöveg, ami a vágólapra érkezik, már ki van tisztítva. Töltelékszavak eltávolítva. Nyelvtan javítva. A hosszú, összefolyó mondatok valódi bekezdésekre tördelve.

Ez nem ugyanaz, mint a beépített diktálás. Az Apple Dictation a nyers átiratot adja vissza, az „ööö”-kkel együtt. Az MI-csiszolás újraírja az átiratot, miközben megőrzi, mit akartál mondani. A különbség akkora, mint egy hangfelvétel és egy piszkozat között.

Második réteg: szöveg be, jobb szöveg ki

A második réteg a helyben történő szövegjavítás. Kijelölök valamit, amit már megírtam (egy bekezdést, egy mondatot, egy egész e-mailt), megnyomok egy gyorsbillentyűt, kiválasztok egy promptot, például „tedd tömörebbé” vagy „lágyítsd a hangnemet”, és a kijelölés helyben átíródik. Nincs fülváltogatás. Nincs másolás-beillesztés egy chatbotba. A meglévő szöveget egy jobb verzió váltja fel.

A hangdiktálás gyorsan papírra teszi a gondolatot. A helyben javítás elvégzi az utolsó 10 százalék csiszolást. Együtt közelebb kerülnek a beszédsebességű íráshoz, mint külön-külön.

A napi munkafolyamat, amit valójában használok

Így néz ki egy átlagos nap a gyakorlatban. Ebből semmi sem elméleti. Ez az írásom valódi formája most.

Reggeli postaláda. Elolvasok minden e-mailt, aztán diktálom a választ. A legtöbb egy bekezdés. Néhány hosszabb. Szinte egyiket sem gépelem be. Az egész adag, ami régen elvitte az első órát, most körülbelül húsz percet vesz igénybe.

Slack a nap folyamán. A rövid válaszokat még gépelem, mert a súrlódás alacsony és a szellemi teher is kicsi. Bármi, ami két mondatnál többet igényel, kimondva születik. A hangnem automatikusan laza, mert így beszélek a Slackben.

Dokumentumok és jegyzetek. Az első piszkozatokat szinte mindig diktálom. Megnyitok egy üres dokumentumot, öt-tíz percig beszélek arról, amit le akarok fedni, és máris van egy valódi piszkozatom, amivel dolgozhatok. Egy piszkozatot szerkeszteni sokkal gyorsabb, mint elkezdeni egyet, és a gondolkodás és írás közötti szakadék az üres oldal szakaszában a legszélesebb.

Szerkesztési kör. Itt teszi le a második réteg a névjegyét. Kijelölök esetlen mondatokat, és tömörebb verziót kérek. Kijelölök merevnek hangzó bekezdéseket, és kérek valami melegebbet. Minden javítás két másodpercig tart, helyben, alkalmazásváltás nélkül.

Egy dolog meglepett: most több szót írok összesen, nem kevesebbet. Az MI nem helyettesítette a kimenetemet. Eltávolította a munka azon részét, ami csak billentyűütés-adó volt.

Ha közelebbről szeretnél belenézni az e-mailes oldalába, részletesebben írtam róla itt: E-mailek diktálása Macen.

Az egyetlen beállítás, ami az egészet működővé tette

Van egy beállítás, amit majdnem átugrottam, amikor először kipróbáltam ezt a fajta munkafolyamatot, és kiderült, hogy ez tette használhatóvá: alkalmazásonkénti írási stílusok.

A Slack és az e-mail nem ugyanazt a hangnemet kívánja. Egy formális motivációs levél nem ugyanazt, mint egy Notion-os ötletelés. Ha az MI-csiszolás mindent ugyanarra a hangra lapít, az eredmény gyorsabb, de rosszabb, és az ember elveszti benne a bizalmat.

Pontosan ezért van a Voicrben Smart Rules. Beállítasz egy laza hangnemet a Slackhez, egy formálisabbat a Mailhez, és egy semleges, dísztelen verziót a terminálhoz. A Voicr érzékeli az aktív alkalmazást, és anélkül alkalmazza a megfelelő stílust, hogy bármit tenned kellene. Ugyanúgy diktálok minden appban; a kimenet alkalmazkodik. Ez az a trükk, amitől abbahagytam, hogy „fontos” üzeneteknél visszacsússzak a billentyűzethez.

Ahol a nyers diktálás elhasal (és a csiszolás megment)

A nyers diktálásnak van egy jellegzetes hibája, amit bárki felismer, aki próbálta. Elmondasz egy bekezdést. Az átirat minden „ööö”-vel együtt visszajön, a két újrakezdésed összevágva, és egy mondat, ami negyven szóig fut, mert nem álltál meg.

Lehet szerkeszteni. De egy nyers átiratot szerkeszteni külön munka, és lehet, hogy lassabb, mint egyből szépen begépelni az egészet. Ezért adja fel a beépített diktálást a legtöbb ember egy hét után.

A csiszolás megváltoztatja a matekot. Amikor az MI eltávolítja a töltelékszavakat, kijavítja a nyelvtant, és a beszédfolyamot bekezdésekre tördeli, a kimenet olyasmi, amit átírás nélkül elküldenék. A diktálási lépés megszűnik nulladik piszkozat lenni, és valami olyanná válik, ami közel áll a végleges piszkozathoz.

Ezt a részt a versenytárs cikkek gyakran átsiklják. A hang sebességelőnye a gépeléssel szemben valódi, de csak akkor hasznos, ha nem fizeted vissza takarítási időben.

Őszinte kompromisszumok

Nem minden tiszta győzelem. Néhány dolog még mindig jobban megy gépeléssel:

- Erősen technikai szövegek kóddal, parancsnevekkel vagy termékkódokkal. A diktálás megkapja a szavakat; a szimbólumokat nem mindig találja el. A kódot még mindig gépelem. - Zajos környezetek. Kávézók, repülők, közös irodák. Egy csendes szobában a laptophoz beszélni rendben van. Telefonáló kolléga mellett már nem. - Érzékeny témák mások közelében. Egy szakító levelet vagy egy kemény visszajelzést inkább begépelek, mint hangosan kimondom, ahol meghallhatják. - Mély szerkesztés. Amikor egy dokumentum már nagyjából áll, jobban szeretek kis, sebészi pontosságú javításokat tenni billentyűzettel. A hang arra való, hogy a dolgok a papírra kerüljenek, nem arra, hogy vesszőket pakolgassunk.

A munkafolyamat része tudni, mikor érdemes visszaváltani. A billentyűzet nem tűnt el. Csak már nem ez az alapértelmezett.

Mit változtatott ez valójában rajtam

Az őszinte válasz nem az, hogy „négyszer annyi tartalmat termelek”. Kisebb és furcsább ennél.

Hosszabb Slack-válaszokat küldök, mert a megírásuk ára lecsökkent. Kevesebb félbehagyott jegyzetet készítek, mert egy teljes gondolatot lediktálni gyorsabb, mint egy töredéket begépelni. Az első piszkozatot ugyanazon a napon megírom, amikor az ötlet előbukkan, ahelyett, hogy egy fókuszált időszakra hagynám, ami gyakran sosem jön el. Az ötlet és a piszkozata közötti szakadék napokról percekre szűkült.

Ezt a sebességszámok nem tudják megragadni. A valódi kérdés az, hogy az írás aktusa elég olcsóvá vált-e ahhoz, hogy bármikor megtedd, ahelyett hogy egy fókuszált időablakra spórolnád, ami gyakran sosem jön el.

Hogyan próbáld ki ma

Ha tesztelni szeretnéd, hogy működik-e neked, ne próbáld átalakítani az egész munkafolyamatodat. Válassz egy résrést.

1. Válaszd ki a következő e-mail-válaszodat, ami két mondatnál többet igényel. 2. Gépelés helyett tartsd lenyomva a diktálási gombot, és mondd ki, amit mondani akarsz. Ne írd meg előre fejben. Csak mondd. 3. Engedd el a gombot, és olvasd el, ami a mezőbe érkezett. 4. Ha közel áll ahhoz, amit gondoltál, javítsd ki azt az egy-két részt, ami nem stimmel, és küldd el.

Csináld ezt ötször. Az első nap végére tudni fogod, hogy a szakadék, amiről beszélek, a te szakadékod-e.

Ha úgy szeretnéd a fenti munkafolyamatot, hogy ne kelljen darabonként összeraknod, a Voicr az az app, amit használok. Tartsd lenyomva az FN-t, beszélj, illeszd be. A kimenet csiszolt, a hangnem alkalmazkodik ahhoz az apphoz, amiben éppen vagy, és a szöveg kijelölése plusz a ⌥Space megadja a helyben javítást a második körhöz. Havi ötezer szó ingyenes, ha csak meg akarod nézni, megfog-e.

A billentyűzet nem megy sehova. De a számítógépen való írás húsz éve alatt először nem ez a szűk keresztmetszet, ami köré meg kell terveznem a napomat.