Vissza a bloghoz

Voicr Team · 2026. május 23.

Beszéd szöveggé 100 nyelven Macen: teljes útmutató

Hogyan működik a többnyelvű diktálás Macen 2026-ban, a 100 nyelves kínálat, automatikus felismerés vs. kézi nyelvválasztó és valódi kétnyelvű munkafolyamatok.

Beszéd szöveggé 100 nyelven Macen: teljes útmutató

Angolul kezdesz írni egy e-mailt, aztán átváltasz spanyolra egy gyors üzenethez egy madridi kollégának, majd franciául válaszolsz egy Slack-üzenetre. Három alkalmazás, három nyelv, tíz perc. Ennek a felét az ujjaiddal, másik felét a Mac-diktálás nyelvi menüjében töltöd.

Ha egynél több nyelvet beszélsz, az Apple beépített diktálása úgy hat, mintha olyasvalakinek tervezték volna, aki nem. Kiválasztasz egy nyelvet, diktálsz, aztán beleássod magad a Rendszerbeállításokba, vagy egy apró menüre kattintasz a kurzor mellett a váltáshoz. Ha kihagyod a váltást, a franciád angol értelmetlenségként jelenik meg.

Csendben megváltozott valami az elmúlt évben. Egy maréknyi Mac-alkalmazás ma már nagyjából 100 nyelven írja le és csiszolja a beszédedet, automatikus felismeréssel, amely menü érintése nélkül kitalálja, milyen nyelven beszélsz. Ez az útmutató végigveszi, mit jelent ez pontosan 2026-ban, mely nyelvek vannak valójában lefedve, hol akad meg az Apple eszköze, és hogyan állíts be olyan többnyelvű diktálási folyamatot, amely nem törik meg minden nyelvváltásnál.

Mit jelent valójában a "100 nyelv Macen" 2026-ban

A 100 nyelves szám, amit az alkalmazások weboldalain látsz, nem marketing. Egyetlen konkrét modellből származik: az OpenAI Whisper modelljéből, amelyet körülbelül 680 000 órányi többnyelvű hanganyagon tanítottak. A jelenleg széles körben használt változat, a large-v3-turbo, 99 nyelvet támogat, amit a legtöbb alkalmazás "100-ra" kerekít.

Itt a nagyjából lefedett nyelvek listája. Teljes európai paletta, beleértve az északi és szláv csoportokat. A főbb ázsiai nyelvek: mandarin, japán, koreai, vietnámi, thai, indonéz, tagalog, maláj. Dél-ázsiai nyelvek: hindi, bengáli, tamil, urdu, maráthi, nepáli. Közel-keleti nyelvek: arab, héber, perzsa, török, azerbajdzsáni. Afrikai: szuahéli, afrikaans. Plusz a kevésbé kézenfekvőek, mint a walesi, maori, belarusz, macedón, kazah és burmai.

A minőség nem egyenletes ezen a listán. Az angol, spanyol, francia, német, olasz, portugál, holland, japán és mandarin a csúcson áll: a szóhibaarány tiszta hangon 4–8% körül mozog. A ritkábban használt nyelvek és azok, amelyekhez kevés tanítóadat áll rendelkezésre, mint a walesi vagy a maori, 15–25% körül futhatnak. Még mindig használható, csak kevésbé megbocsátó.

A nagyobb változás: mindez most már egy hétköznapi Macen fut. Az Apple Silicon elért arra a pontra, ahol a Whisper nagy modellje két másodperc alatt írja át lokálisan egy 30 másodperces felvételt, felhős oda-vissza út nélkül. Ezért hasonlít hirtelen ennyi Mac-alkalmazás egymásra. Mind ugyanarra a modellre épülnek.

Hol ütközik plafonba az Apple beépített diktálása

Az Apple Dictation 2012 óta létezik, és ingyenes. Egyetlen nyelvhez, egyetlen alkalmazásban rendben van. Többnyelvű munkához három dolog töri meg a folyamatot.

Nyelvszám. Az Apple nagyjából 50–60 nyelvet és dialektust támogat, a macOS-verziótól függően. A nagy európai és ázsiai piacokra elég, de elakadhatsz, ha ukránra, tagalogra vagy walesire van szükséged, vagy ha az Apple által szállítottakon túli részletes dialektusokat akarsz.

Nincs automatikus nyelvfelismerés. Az Apple Dictation az utoljára kiválasztott nyelvet használja. Felejtsd el a váltást, és a franciád az angol modellen megy keresztül, hogy valami olyan ostobaságot kapj eredményül, ami nagyjából rímel arra, amit mondtál. A nyelvváltáshoz a kurzor melletti apró nyelvjelzőre kattintasz, és kiválasztasz egyet a listából. Minden váltás kézi lépés.

Nyers átirat, csiszolás nélkül. Amit mondasz, azt kapod meg, beleértve a "hm"-eket, "szóval"-okat, újrakezdéseket és a félbehagyott mondatot, amit elkezdtél, mielőtt meggondoltad magad. Ez egy nyelven is gond, többnyelvű munkában még rosszabb, ahol hajlamos vagy óvatosabban beszélni, hogy a modellt nyomon tartsd.

Ha mindig csak angolul diktálsz, és nem zavar, hogy utólag tisztáznod kell, az Apple eszköze ezt fedi. Amint szükséged van egy második nyelvre, vagy olyan kimenetet akarsz, amit átolvasás nélkül bemásolhatsz, kinőtted.

Hogyan kezeli a Whisper a 100 nyelvet a háttérben

Segít, ha nagyjából tudod, mi történik, amikor lenyomsz egy billentyűt és beszélsz, mert ez magyarázza, miért működnek bizonyos dolgok és mások miért nem.

A Whisper egyetlen neurális hálózat, amelyet 99 nyelvű hanganyagon tanítottak. Ahelyett, hogy minden nyelvhez külön modellt futtatna, megtanulta egyszerre felismerni mindet. A közös tanítás valami hasznosat eredményez: egy olasz és egy portugál mondat elég akusztikai jellemzőt oszt meg ahhoz, hogy az egyik tanulása segítse a másikat. A hátrány, hogy minden nyelv ugyanazért a modellkapacitásért verseng, így a ritkábbak gyengébbek.

Illusztráció arról, ahogy különböző nyelvű beszéd egyetlen átírási modellbe áramlik, és csiszolt szövegként jön ki

Amikor a hang beérkezik, a modell három dolgot csinál egy menetben: 1. Megjósolja a nyelvet a hang első néhány másodpercéből. 2. Leírja a szavakat. 3. Hozzáadja a központozást és a nagybetűsítést.

A nyelvfelismerés teszi lehetővé az automatikus módot. A modell megtanulta felismerni, melyik nyelv hogyan hangzik. Általában egy-két másodpercen belül eltalálja, miután elkezdtél beszélni. Hol botlik meg: nagyon rövid megszólalásoknál (egy-két szó), olyan nyelveknél, amelyek sok szókincset osztanak meg (spanyol és olasz, norvég és svéd), és mondat közbeni váltásnál. A Whispert úgy építették, hogy egy felvételben egy nyelvet ismerjen fel, nem hogy követhessen, ahogy két nyelv között ugrálsz.

Ha érdekel a teljes mechanikája annak, hogyan lesz a nyers beszédből tiszta szöveg, az MI-alapú hangdiktálási folyamat végigveszi az összes lépést.

Automatikus felismerés vs. kézi nyelvválasztó: mikor melyik nyer

A modern többnyelvű diktálási alkalmazások két módot kínálnak. Ha tudod, melyiket mikor használd, az dönti el, hogy gördülékeny vagy frusztráló lesz-e.

Használd az automatikus felismerést, ha:

Gyakran váltasz nyelvet a nap során, de diktálásonként egyetlen nyelvnél maradsz. Berlini fejlesztő vagy, aki angol kódkommenteket és német Slack-üzeneteket ír. Újságíró vagy, aki angol és japán forrásokkal dolgozik. Ügyfélszolgálati jegyeket kezelsz négy nyelven. Mindegyiknél minden egyes felvétel egy nyelven van; csak az változik, melyiken. Az automatikus felismerés minden alkalommal megspórolja a menüben való keresgélést.

Használj kézi nyelvválasztást, ha:

Kevésbé elterjedt nyelveken dolgozol, ahol a felismerés bizonytalanabb (walesi, maori, belarusz). Zajos környezetbe diktálsz, ahol a hang első másodperce inkább háttérzaj, mint beszéd. Rövid megszólalásokat diktálsz, ahol nincs elég hang a felismeréshez. Vagy olyan nyelvet használsz, amely átfedésben van egy másikkal, amit a modell jobban ismer (például néha portugálra tippel, amikor galíciaira gondoltál).

Ami még mindig nem működik jól:

Mondaton belüli kódváltás. Ha spanyolul kezdesz, és a közepébe beejtesz egy angol márkanevet, a modell elboldogul vele. Ha viszont spanyolul kezdesz egy mondatot, és angolul fejezed be, gyakran kapod a kettő egyikét értelmetlenségként a másik nyelven. Az őszinte megoldás: fejezd be a felvételt a nyelvhatárnál, és kezdj egy újat.

Fordítás beszéd közben: a "beszélj X-en, jöjjön angolul" munkafolyamat

A modern Mac-diktálás egyik legfigyelmen kívül hagyottabb funkciója a beszélj-és-fordíts. Az anyanyelveden beszélsz, és a megjelenő szöveg már egy másik nyelven van. Ez a célnyelv leggyakrabban az angol.

Két alapmódszer teszi ezt lehetővé. Először, a Whisper régebbi többnyelvű változatai beépített fordítási feladattal rendelkeznek: a 99 nyelv bármelyikén beszélsz, és a modell közvetlenül angolul ad ki szöveget. Az újabb turbo változat ezt nem tartalmazza, így a legtöbb alkalmazás most más megközelítést használ: a Whisper a forrásnyelven írja le, majd egy nyelvi modell fordítja le a szöveget. A második módszer jobb minőségű, és egyszerre kezeli a csiszolást is, ezért lett ez a sztenderd.

Ez egy korábban háromlépéses valódi munkafolyamatot zsugorít össze. Régi módszer: diktálj az anyanyelveden, másold ki a szöveget, illeszd be egy fordítóba, másold ki az eredményt, illeszd be az e-mailedbe. Körülbelül 30 másodperc és négy kontextusváltás. Új módszer: tarts lenyomva egy billentyűt, beszélj az anyanyelveden, csiszolt angol szöveg jelenik meg a kurzorodnál. Körülbelül 4 másodperc.

Ha a napod bármelyik részét angolul írod a munkában, de gyorsabban gondolkodsz egy másik nyelven, akkor egyedül ez a funkció elég ok a modern diktálás beüzemeléséhez. A Voicr ezt egyetlen gyorsbillentyűvel intézi: állítsd a bemeneti nyelvet Auto-ra, a kimeneti polírozási nyelvet pedig angolra, és minden felvétel készre csiszolt, küldhető angol szövegként érkezik, akármilyen nyelven beszéltél.

Valódi többnyelvű munkafolyamatok Macen

Az elmélet olcsó. Itt vannak azok a minták, amelyek valódi embereknek valóban időt spórolnak.

Kétnyelvű jegyzetek és naplózás

Ha az anyanyelveden jegyzetelsz, de angol nyelvű munkakörnyezetben élsz, a diktálás megadja a két világ legjavát. Állítsd a forrásnyelvet az anyanyelvedre és a kimenetet ugyancsak az anyanyelvedre (fordítás nélkül), és teljesen lemondhatsz a gépelésről. A megbeszélések jegyzeteinél, ahol szeretnéd az eredetit és egy angol változatot is, diktálj kétszer eltérő kimeneti beállításokkal.

Kód anyanyelvű kommentekkel

A nem angol anyanyelvű csapatokban dolgozó fejlesztők gyakran a kódot angolul tartják, de a kommenteket a csapat nyelvén írják. Az automatikus felismerés ezt gondolkodás nélkül kezeli, amikor váltogatsz a szerkesztőbe diktálás (angol kódleírások, függvénynevek) és a saját nyelveden írt kommentek között. Minden felvétel egy nyelvű; a modell minden alkalommal a megfelelőt választja.

Ügyfélszolgálat négy időzónán át

Az angol, spanyol, francia és német nyelvű jegyeket kezelő ügyfélszolgálati munkatársak jellemzően a nyelvi profilok között váltogatnak az eszközeikben. Többnyelvű diktálással elolvasod a jegyet, válaszolsz azon a nyelven, amin írták, aztán mész tovább a következőre. Nincs profilváltás, nincs menü. A csiszolási lépés is fontos itt: az ügyfélszolgálati válaszoknak minden nyelven egységes, professzionális hangvételűeknek kell lenniük, nem nyers átiratoknak.

Nyelvtanulók és nyelvtanárok

Ha tanulsz egy nyelvet, a diktálás abban a nyelvben rákényszerít a kiejtésre és a tempóra. Ha a modell nem ért meg, az visszajelzés. Ha tanítod, a példamondatok diktálása megspórolja az ékezetek, különleges karakterek és diakritikus jelek begépelését. A modell helyesen hozzáadja őket. Mindkettőhöz a beszélj-és-fordíts folyamat azonnali megértési ellenőrzésként is működik: beszélj azon a nyelven, amelyet tanulsz, és nézd meg, hogy az angol megegyezik-e azzal, amit gondoltál.

Nemzetközi írók és újságírók

Azok a hosszabb szövegekkel dolgozó írók, akik egyik nyelven gondolkodnak és egy másikon publikálnak, hajlamosak gépelés közben a fejükben fordítani. Ez kimerítő. Beszéld el az első piszkozatot azon a nyelven, amelyen gondolkodsz, hadd készítse el az eszköz az angol változatot, és aztán szerkeszd. Az első piszkozat 3–4-szer gyorsabban készül el, és a szerkesztői agyad frissebb, mert a piszkozatkészítés alatt nem fordítóként kellett dolgoznia.

Hogyan állíts be többnyelvű diktálást Macen

Két út van: az Apple beépített eszköze a legegyszerűbb esetekre, és egy harmadik féltől származó alkalmazás minden másra.

Az Apple Dictation beállítása több nyelvhez

Nyisd meg a Rendszerbeállításokat, lépj a Billentyűzethez, majd kattints a Diktálásra. Kapcsold be. Kattints a Nyelvek legördülő menüre, és add hozzá a kívánt nyelveket. Körülbelül hatot tudsz hozzáadni. Innentől, amikor elindítod a diktálást, egy kis zászló vagy nyelvkód jelenik meg a kurzorod mellett. Kattints rá a nyelvváltáshoz. Korlátok: - Nincs automatikus felismerés. Minden váltás egy kattintás. - Csak körülbelül 50–60 nyelv. - Nyers átirat, csiszolás nélkül, alkalmazásra szabott formázás nélkül. - 60 másodperces diktálási vágás a régebbi macOS-verziókban.

Egy harmadik féltől származó többnyelvű alkalmazás beállítása

A modern Mac-diktálási alkalmazások többnyire menüsoros segédeszközöknek tűnnek, amelyek minden alkalmazás minden szövegmezőjében működnek. A beállítás így néz ki: 1. Telepítsd az alkalmazást, és add meg a mikrofon- és kisegítő lehetőségek jogosultságokat. 2. Állítsd be vagy fogadd el a gyorsbillentyűt (általában FN vagy Option+Space, tartsd lenyomva a felvételhez). 3. Válaszd ki a bemeneti nyelvet. Többnyelvű munkához állítsd ezt Auto-ra. 4. Válaszd ki a kimeneti nyelvet. Ha ugyanaz, mint a bemenet, csak átírást kapsz; ha angolt (vagy bármi mást) választasz, fordítást kapsz. 5. Opcionálisan adj meg egy csiszolási promptot ("szakmai", "laza", "hagyd nyersen"), hogy a kimenet úgy olvasódjon, ahogy szeretnéd. Innentől bárhol, ahol gépelni tudsz, diktálhatsz is. Tartsd lenyomva a billentyűt, beszélj, engedd el, és a szöveg megjelenik a kurzorodnál.

Ha különböző alkalmazásokba írsz, eltérő hangnemben (hivatalos e-mail, laza Slack, technikai dokumentáció), ott jönnek be a Smart Rules: alkalmazásonkénti írásstílus, amely automatikusan érvénybe lép aszerint, melyik alkalmazás aktív. Egyszer beállítod a szabályt, és nem kell többé gondolkodnod rajta. Ugyanaz a többnyelvű modell kezeli mindet.

Gyakorlati tanulságok

Három dolog, amit érdemes észben tartani, amikor beállítod a többnyelvű diktálást a Maceden:

Felvételenként egy nyelv a szabály. A modell 100 nyelvet kezel, de felvételenként egyet választ. A nyelvhatáron fejezd be a felvételt, ne próbáld mondat közben váltani.

Az automatikus felismerés az alapértelmezett a napi többnyelvű munkához. A kézi választás csak rövid megszólalásoknál, ritka nyelveknél vagy zajos környezetekben éri meg, ahol a felismerés tévedhet.

A beszéd közbeni fordítás nem külön eszköz. Ha a kimeneti nyelved angolra van állítva, a bemeneti pedig az anyanyelvedre, minden felvétel egy fordítás. Nincs külön lépés, nincs második alkalmazás, nincs másolás-beillesztés.

Egy billentyű, bármelyik nyelv

Ha idáig olvastál, a "hogyan diktáljak 100 nyelven a Macemen 2026-ban" kérdésre a válasz rövid: telepíts egy Whisperre épülő, harmadik féltől származó alkalmazást, állítsd a bemeneti nyelvet Auto-ra, tarts lenyomva egy billentyűt és beszélj. A rendszer egyetlen oda-vissza úton intézi a nyelvfelismerést, az átírást, a csiszolást és (opcionálisan) a fordítást.

A Voicr ezt egyetlen gyorsbillentyűvel intézi a Mac bármely alkalmazásából. Tartsd lenyomva a FN-t, beszélj a 100 nyelv bármelyikén, engedd el, és csiszolt szöveg jelenik meg a kurzorodnál. Állítsd be a kimeneti nyelvet, hogy beszéd közben fordítson, vagy hagyd a forrásnyelven a tiszta átírásért. Van egy ingyenes csomag havi 5000 szóval, így a legolcsóbb módja annak, hogy kiderítsd, helye van-e a többnyelvű diktálásnak a munkafolyamatodban, ha kipróbálod a holnap reggeli első e-mailen.

Ha kíváncsi vagy, hogyan veszi fel a versenyt a modern Mac-diktálás azzal, ami most a gépeden van, a Voicr vs Apple Dictation összehasonlítás funkcióról funkcióra végigveszi a különbségeket.