Vissza a bloghoz

Voicr Team · 2026. május 23.

Hogyan fordíts és írj át beszédet valós időben Macen

Élő feliratok, eszközön futó fordítás és egygombos diktálás 100 nyelven. Válaszd ki a megfelelő eszközt ahhoz a munkafolyamathoz, amit tényleg használsz.

Hogyan fordíts és írj át beszédet valós időben Macen

Épp egy Zoom-híváson vagy egy São Pauló-i beszállítóval, aki folyton portugálra vált. Vagy egy japán termékbemutatót nézel, és az automatikus felirat nem tud lépést tartani. Vagy spanyolul gondolkodsz, de az ügyfeled angol e-maileket vár tőled.

Három teljesen különböző probléma. Mindhármat „valós idejű beszédfordítás Macen” címke alá söprik, és ezért zavarosak a témáról szóló legtöbb útmutatók. A megfelelő eszköz attól függ, hogy valójában melyiket próbálod megoldani.

Az Apple tavaly ősszel hozta el a Live Translationt a macOS 26-ban. A Whisper kapott egy Turbo modellt, ami egy MacBook Airen is elfut anélkül, hogy felolvadna a gép. A diktálóeszközök, amelyek korábban inkább a kísérletezők terepe voltak, ma már komolyan használhatók. Ez az útmutató végigveszi, mi érhető el, mikor melyik megoldás passzol, és hogyan állíthatod be őket úgy, hogy ne ess bele a bemutatóvideók csapdájába.

Mit jelent valójában a „valós idejű”

Mielőtt választasz, nevezd meg a munkafolyamatot. A Macen háromféle „valós idejű” létezik, és mindhez más szoftver kell:

Élő feliratozás – valaki más beszél, és te szeretnéd, hogy feliratok – akár lefordítva – jelenjenek meg, amíg beszél. Hívások, megbeszélések, előadások, élő közvetítések. A késleltetés számít. A 4 másodperces csúszás idegesítő; a 10 másodperces használhatatlan.

Diktálás – te beszélsz, és a végén egy másik nyelven szeretnél tiszta szöveget kapni. E-mailek, Slack-üzenetek, dokumentumok. Az átirat és a fordítás egyszerre keletkezik, amint befejezed a mondatot. Itt az számít, hogy egy másodpercen belül megérkezzen a kész szöveg, nem az, hogy menet közben gördüljenek a szavak.

Fájl-átírás – van egy felvételed (Zoom-export, hangjegyzet, podcast), és lefordított átiratot szeretnél. Ez igazából nem valós idejű. Dobd rá a legpontosabb modellre, amit találsz, és várj két percet.

Ezek összekeverése vezet oda, hogy valaki megbeszélés-átíró eszközzel próbál gyors e-mailt írni, vagy diktálóappal feliratozna egy YouTube-videót. Először a kategóriát válaszd ki, utána az eszközt.

A macOS beépített lehetőségei

Ha macOS 26-on, Apple Silicon Macen vagy, az Apple két beépített eszközt ad – és van egy fontos rés is.

Live Translation (macOS 26)

A Live Translation a Messages, a FaceTime és a Mac új Phone alkalmazásán keresztül működik. Az Apple Intelligence hajtja, és eszközön fut, így semmi nem hagyja el a géped. Egy FaceTime-hívás közben rákattintasz a menü gombra, kiválasztod a Live Captionst, és a képernyő tetejéhez közel megjelenik a fordított átirat.

A bökkenő a nyelvi lista. A Live Translation FaceTime-ban és Phone-ban angolt, franciát, németet, brazil portugált és spanyolországi spanyolt támogat – a mandarin, az olasz, a japán és a koreai bevezetés alatt. A Messages szélesebb kört fed le, beleértve a dánt, hollandot, norvégot, svédet, törököt és vietnamit.

Ingyenes, privát, és a késleltetés is jó. Viszont csak az Apple saját alkalmazásain belül működik. Zoom, Google Meet, Slack huddle, YouTube – ezek közül egyik sem fut át a Live Translationön.

Live Captions

Kapcsold be a Live Captionst a Rendszerbeállítások → Kisegítő lehetőségek → Live Captions útvonalon, és kapsz egy lebegő ablakot, amely bármilyen hangot átír, amit a Mac érzékel – rendszerhangot, mikrofont vagy mindkettőt. Bármelyik appban működik: Zoom, YouTube, podcast vagy egy kolléga, aki melletted beszél.

A Live Captions átír, de nem fordít. Jelenleg ráadásul csak angolul tud. Ha a megbeszélés angol, és csak követni szeretnéd szöveggel, ez a megoldás. Ha a megbeszélés portugálul folyik, a Live Captions nem segít.

A három valós idejű beszédfordítási munkafolyamat összehasonlítása Macen: élő feliratok megbeszélésekhez, diktálás íráshoz és fájl-átírás

Élő feliratok és fordítás hívásokhoz és videókhoz

Amikor az Apple beépített eszközei nem fedik le a hívásodat, egy kis csapatnyi harmadik féltől származó app betölti a rést. Hozzáférnek a rendszerhanghoz (bármi, ami a Mac hangszóróján szól) vagy a mikrofonodhoz, helyi Whisper-modellel átírják, és opcionálisan le is fordítják. Az alábbi három mind eszközön fut, ami akkor számít, ha bizalmas híváson vagy.

MacWhisper – Az egyik legrégebb óta futó Mac-app ezen a területen. Élő feliratozás fordítással, Whisper és Nvidia Parakeet alapon, rendszerhang-rögzítéssel bármilyen meetingeszközhöz. Zoomhoz, Meethez, Teamshez stabil választás. A Pro változat egyszeri vásárlás.

Superwhisper – Élő átírást kombinál egy Whisper-alapú diktálási folyamattal. Több mint 100 nyelvet támogat, és bármelyikről tud angolra fordítani. Megpróbál egyszerre feliratozó és diktálóeszköz lenni – ez akkor működik, ha egyetlen appot szeretnél mindkettőhöz, de azt jelenti, hogy a diktálási oldala nehézkesebb egy célalkalmazásnál.

Transcrybe – Újabb, karcsúbb, kifejezetten valós idejű fordításra fókuszáló app. Csak eszközön fut. A felület arra épül, hogy „valaki olyan nyelven beszél, amit nem értek – mutasd meg, mit mond.” Utazáshoz, ügyfélszolgálati hívásokhoz, idegen nyelvű tartalom nézéséhez jó.

Válassz aszerint, milyen gyakran kerülsz ilyen helyzetbe. Ha napi szinten ülsz nemzetközi hívásokon, a MacWhisper vagy a Superwhisper kiérdemli a helyét a menüsávban. Ha csak alkalmanként van rá szükséged, az Apple Live Translationje a FaceTime-on belül elég lehet.

Diktálás egy nyelven, írás egy másikon

A leggyakoribb „valós idejű fordítás”-igénynek semmi köze ahhoz, hogy más beszél. *Rólad* szól: az anyanyelveden gondolkodsz, de a papírra angolnak kell kerülnie, mert a munka azt várja el.

Ha spanyol, francia vagy lengyel vagy, és sok angolt írsz a munkában, ismered ezt az adót. Megfogalmazod a mondatot fejben az anyanyelveden, fejben lefordítod, aztán begépeled a fordítást. Minden e-mail két változatban készül: az, amit fejben megírtál, és az, amit az ujjaid leírtak.

A jó eszköz alakja itt más, mint élő feliratozásnál. Nincs szükséged streamelt feliratokra. Az kell, hogy lenyomsz egy gombot, természetesen beszélsz az anyanyelveden, elengeded, és a célnyelven megírt, csiszolt szöveg landol a vágólapodon – készen, hogy bárhova beilleszd (Gmail, Slack, Notion, Jira-ticket).

Ezt a rést tölti be a Voicr. Lenyomod az FN-t, beszélsz a 100 nyelv bármelyikén, az angolt állítod be célnyelvként, és tiszta angol szöveg kerül beillesztésre – nem a nyers átirat, amit egy külön fordítón futtatsz át. Az átírás és a fordítás egy lépésben történik, nem beszéd → átirat → másolás → fordító → beillesztés folyamatban. Az egész nagyjából annyi ideig tart, amíg beszélsz.

Van egy Auto-detect mód is, ami magából a hangból ismeri fel a beszélt nyelvet, így ha váltogatsz – mondjuk spanyolul Slackelsz magánban, angolul írsz ügyfél-e-mailt –, nem kell nyelvválasztót nyitogatni. Apróság, könnyű átsiklani fölötte egy funkciólistán. A részletes bontás itt van: Beszédből szöveg 100 nyelven Macen.

Előre rögzített hang átírása

Ha van egy fájlod (Zoom-felvétel, hangjegyzet, interjú, podcast), a „valós idejű” nem jó keret. Dobd a fájlt egy Whisper-alapú eszközre, ami teljes minőségen fut, és hagyd, hogy két percig dolgozzon. Itt a pontosság számít.

A MacWhisper és a Whisper Transcription is jól kezeli ezt. Ahogy az OpenAI API is közvetlenül, ha jól érzed magad egy szkripttel. A fordítást illetően érdemes tudni: a Whisper beépített fordítása csak egy irányba megy: bármilyen nyelv → angol. Ha a másik irány kell (mondjuk angol → japán), futtasd az átiratot utólag egy külön fordítómodellen, mint a Claude, a GPT vagy a DeepL.

Hagyd ki ezt a részt, ha a bemenet mindig élő. De ha interjúkat veszel fel vagy régi megbeszélések átiratait húzod le, az offline munkafolyamat olcsóbb, pontosabb és könnyebben javítható marad, mint a streamelés.

A megfelelő beállítás kiválasztása a munkafolyamatodhoz

Egy gyors döntési fa:

1. Feliratokat akarok egy FaceTime- vagy Messages-beszélgetés közben → Apple Live Translation. Ingyenes, beépített, eszközön fut. 2. Feliratokat akarok egy Zoom/Meet/Teams-híváshoz olyan nyelven, amit nem beszélek → MacWhisper, Superwhisper vagy Transcrybe. Válassz egyet. 3. Az anyanyelvemen szeretnék diktálni, és angol szöveget akarok, hogy bárhova beilleszthessem → Egygombos diktálóeszköz, mint a Voicr. Ez a kétnyelvű szakemberek napi használati esete. 4. Egy másik nyelvű felvett fájlt szeretnék átírni angolra → MacWhisper vagy bármelyik Whisper-alapú asztali alkalmazás. Offline, teljes minőségű modell, kétperces várakozás.

A legtöbben két eszközzel végzik, nem eggyel: egy az élő feliratokhoz, ha kell (alkalmanként), egy másik a napi diktáláshoz (folyamatosan). Ez a szétválás természetes. Egy feliratozó és egy diktálóeszköz más-más célra optimalizál, és ha egyikkel mindkettőt erőlteted, általában mindkettőt rosszabbul csinálja.

Reális elvárások

Néhány dolog, amit minden bemutatóvideó átugrik, és érdemes tudni, mielőtt elköteleződnél:

A késleltetés valós. Még az eszközön futó Whispernél is 1–3 másodperc a csúszás az élő feliratokban. A felhőalapú eszközök még 1–2 másodpercet hozzátesznek. Számolj vele. Ne próbálj élő felirattal követni egy pörgős politikai vitát, lemaradsz.

A fordítási minőség a kb. top 10 nyelven kívül leesik. A Whisper kiváló angolra, spanyolra, franciára, németre, portugálra, olaszra, mandarinra, japánra. Észrevehetően gyengébb thai, kantoni, vietnami és a legtöbb afrikai nyelven. Ha a nyelved a hosszú farkon van, teszteld, mielőtt rá építenél.

A rendszerhang rögzítéséhez engedély kell. A macOS alapból nem engedi, hogy egy app a rendszerhangot hallgassa. A live-captioning kategória minden eszköze végigvezet, hogyan adj képernyőfelvételi vagy audio-loopback engedélyt az első használatkor. Ez normális. Ezért is van, hogy egyes alkalmazásokhoz egyszeri virtuális hangeszköz-telepítés szükséges.

A privát szféra szintje változik. Az Apple eszközei és a Whisper-alapú appok többsége teljesen eszközön fut. Bármi, ami felhő-API-ra küldi a hangot (egyes „AI meeting assistant”-ek), más kompromisszumot vállal. Ha jogi, egészségügyi vagy más szabályozott területen dolgozol, nézz utána, mielőtt egy eszközt élesítenél egy ügyfélhíváson.

Egy kétnyelvű szakember az anyanyelvén beszél, miközben tiszta angol szöveg jelenik meg egy e-mail piszkozatában Macen

Egy gyakorlati kiindulópont

A legkönnyebb hely, ahonnan elindulhatsz – bármi is a végcélod –, az az egyetlen használati eset, amibe ezen a héten a legtöbbször futottál bele. Nem a ritka, hanem a napi.

Ha sok nemzetközi megbeszélésen vagy, telepíts egy élő feliratozó eszközt, hagyd a menüsávban, és két hétig használd, mielőtt eldöntenéd, hogy marad-e. Ha sok angolt írsz, miközben más nyelven gondolkodsz, próbáld meg a következő tíz e-mailt nem begépelni, hanem az anyanyelveden diktálni, és hagyni, hogy az eszköz előállítsa az angolt.

A Voicr kifejezetten a diktálási esetet kezeli. Lenyomod az FN-t, beszélsz a saját nyelveden, az angolt állítod célnak, és bárhova beilleszted. Van egy Free csomag (havi 5000 szó, bankkártya nélkül), ami elég ahhoz, hogy lásd, illik-e a munkafolyamat ahhoz, ahogyan írsz. Az élő feliratozási esethez a MacWhispernek is van egy ingyenes verziója az alap Whisper-modellel, amivel kipróbálhatod az élményt, mielőtt fizetnél.

A technológia már egy ideje nem szűk keresztmetszet. Az érdekes kérdés most az, hogy melyik munkafolyamatot építed fel és használod ténylegesen – és ez azon múlik, hogy a konkrét súrlódáshoz a megfelelő eszközt választod-e. A diktálási oldalról bővebben: Hogyan működik valójában a Mac hangdiktálása végigvezet, mi történik a hangod és a vágólapodra kerülő csiszolt szöveg között.