Épp egy Zoom-híváson vagy egy São Pauló-i beszállítóval, aki folyton portugálra vált. Vagy egy japán termékbemutatót nézel, és az automatikus felirat nem tud lépést tartani. Vagy spanyolul gondolkodsz, de az ügyfeled angol e-maileket vár tőled.
Három teljesen különböző probléma. Mindhármat „valós idejű beszédfordítás Macen” címke alá söprik, és ezért zavarosak a témáról szóló legtöbb útmutatók. A megfelelő eszköz attól függ, hogy valójában melyiket próbálod megoldani.
Az Apple tavaly ősszel hozta el a Live Translationt a macOS 26-ban. A Whisper kapott egy Turbo modellt, ami egy MacBook Airen is elfut anélkül, hogy felolvadna a gép. A diktálóeszközök, amelyek korábban inkább a kísérletezők terepe voltak, ma már komolyan használhatók. Ez az útmutató végigveszi, mi érhető el, mikor melyik megoldás passzol, és hogyan állíthatod be őket úgy, hogy ne ess bele a bemutatóvideók csapdájába.
Mit jelent valójában a „valós idejű”
Mielőtt választasz, nevezd meg a munkafolyamatot. A Macen háromféle „valós idejű” létezik, és mindhez más szoftver kell:
Élő feliratozás – valaki más beszél, és te szeretnéd, hogy feliratok – akár lefordítva – jelenjenek meg, amíg beszél. Hívások, megbeszélések, előadások, élő közvetítések. A késleltetés számít. A 4 másodperces csúszás idegesítő; a 10 másodperces használhatatlan.
Diktálás – te beszélsz, és a végén egy másik nyelven szeretnél tiszta szöveget kapni. E-mailek, Slack-üzenetek, dokumentumok. Az átirat és a fordítás egyszerre keletkezik, amint befejezed a mondatot. Itt az számít, hogy egy másodpercen belül megérkezzen a kész szöveg, nem az, hogy menet közben gördüljenek a szavak.
Fájl-átírás – van egy felvételed (Zoom-export, hangjegyzet, podcast), és lefordított átiratot szeretnél. Ez igazából nem valós idejű. Dobd rá a legpontosabb modellre, amit találsz, és várj két percet.
Ezek összekeverése vezet oda, hogy valaki megbeszélés-átíró eszközzel próbál gyors e-mailt írni, vagy diktálóappal feliratozna egy YouTube-videót. Először a kategóriát válaszd ki, utána az eszközt.
A macOS beépített lehetőségei
Ha macOS 26-on, Apple Silicon Macen vagy, az Apple két beépített eszközt ad – és van egy fontos rés is.
Live Translation (macOS 26)
A Live Translation a Messages, a FaceTime és a Mac új Phone alkalmazásán keresztül működik. Az Apple Intelligence hajtja, és eszközön fut, így semmi nem hagyja el a géped. Egy FaceTime-hívás közben rákattintasz a menü gombra, kiválasztod a Live Captionst, és a képernyő tetejéhez közel megjelenik a fordított átirat.
A bökkenő a nyelvi lista. A Live Translation FaceTime-ban és Phone-ban angolt, franciát, németet, brazil portugált és spanyolországi spanyolt támogat – a mandarin, az olasz, a japán és a koreai bevezetés alatt. A Messages szélesebb kört fed le, beleértve a dánt, hollandot, norvégot, svédet, törököt és vietnamit.
Ingyenes, privát, és a késleltetés is jó. Viszont csak az Apple saját alkalmazásain belül működik. Zoom, Google Meet, Slack huddle, YouTube – ezek közül egyik sem fut át a Live Translationön.
Live Captions
Kapcsold be a Live Captionst a Rendszerbeállítások → Kisegítő lehetőségek → Live Captions útvonalon, és kapsz egy lebegő ablakot, amely bármilyen hangot átír, amit a Mac érzékel – rendszerhangot, mikrofont vagy mindkettőt. Bármelyik appban működik: Zoom, YouTube, podcast vagy egy kolléga, aki melletted beszél.
A Live Captions átír, de nem fordít. Jelenleg ráadásul csak angolul tud. Ha a megbeszélés angol, és csak követni szeretnéd szöveggel, ez a megoldás. Ha a megbeszélés portugálul folyik, a Live Captions nem segít.

Élő feliratok és fordítás hívásokhoz és videókhoz
Amikor az Apple beépített eszközei nem fedik le a hívásodat, egy kis csapatnyi harmadik féltől származó app betölti a rést. Hozzáférnek a rendszerhanghoz (bármi, ami a Mac hangszóróján szól) vagy a mikrofonodhoz, helyi Whisper-modellel átírják, és opcionálisan le is fordítják. Az alábbi három mind eszközön fut, ami akkor számít, ha bizalmas híváson vagy.
MacWhisper – Az egyik legrégebb óta futó Mac-app ezen a területen. Élő feliratozás fordítással, Whisper és Nvidia Parakeet alapon, rendszerhang-rögzítéssel bármilyen meetingeszközhöz. Zoomhoz, Meethez, Teamshez stabil választás. A Pro változat egyszeri vásárlás.
Superwhisper – Élő átírást kombinál egy Whisper-alapú diktálási folyamattal. Több mint 100 nyelvet támogat, és bármelyikről tud angolra fordítani. Megpróbál egyszerre feliratozó és diktálóeszköz lenni – ez akkor működik, ha egyetlen appot szeretnél mindkettőhöz, de azt jelenti, hogy a diktálási oldala nehézkesebb egy célalkalmazásnál.
Transcrybe – Újabb, karcsúbb, kifejezetten valós idejű fordításra fókuszáló app. Csak eszközön fut. A felület arra épül, hogy „valaki olyan nyelven beszél, amit nem értek – mutasd meg, mit mond.” Utazáshoz, ügyfélszolgálati hívásokhoz, idegen nyelvű tartalom nézéséhez jó.
Válassz aszerint, milyen gyakran kerülsz ilyen helyzetbe. Ha napi szinten ülsz nemzetközi hívásokon, a MacWhisper vagy a Superwhisper kiérdemli a helyét a menüsávban. Ha csak alkalmanként van rá szükséged, az Apple Live Translationje a FaceTime-on belül elég lehet.
Diktálás egy nyelven, írás egy másikon
A leggyakoribb „valós idejű fordítás”-igénynek semmi köze ahhoz, hogy más beszél. *Rólad* szól: az anyanyelveden gondolkodsz, de a papírra angolnak kell kerülnie, mert a munka azt várja el.
Ha spanyol, francia vagy lengyel vagy, és sok angolt írsz a munkában, ismered ezt az adót. Megfogalmazod a mondatot fejben az anyanyelveden, fejben lefordítod, aztán begépeled a fordítást. Minden e-mail két változatban készül: az, amit fejben megírtál, és az, amit az ujjaid leírtak.
A jó eszköz alakja itt más, mint élő feliratozásnál. Nincs szükséged streamelt feliratokra. Az kell, hogy lenyomsz egy gombot, természetesen beszélsz az anyanyelveden, elengeded, és a célnyelven megírt, csiszolt szöveg landol a vágólapodon – készen, hogy bárhova beilleszd (Gmail, Slack, Notion, Jira-ticket).
Ezt a rést tölti be a Voicr. Lenyomod az FN-t, beszélsz a 100 nyelv bármelyikén, az angolt állítod be célnyelvként, és tiszta angol szöveg kerül beillesztésre – nem a nyers átirat, amit egy külön fordítón futtatsz át. Az átírás és a fordítás egy lépésben történik, nem beszéd → átirat → másolás → fordító → beillesztés folyamatban. Az egész nagyjából annyi ideig tart, amíg beszélsz.
Van egy Auto-detect mód is, ami magából a hangból ismeri fel a beszélt nyelvet, így ha váltogatsz – mondjuk spanyolul Slackelsz magánban, angolul írsz ügyfél-e-mailt –, nem kell nyelvválasztót nyitogatni. Apróság, könnyű átsiklani fölötte egy funkciólistán. A részletes bontás itt van: Beszédből szöveg 100 nyelven Macen.
Előre rögzített hang átírása
Ha van egy fájlod (Zoom-felvétel, hangjegyzet, interjú, podcast), a „valós idejű” nem jó keret. Dobd a fájlt egy Whisper-alapú eszközre, ami teljes minőségen fut, és hagyd, hogy két percig dolgozzon. Itt a pontosság számít.
A MacWhisper és a Whisper Transcription is jól kezeli ezt. Ahogy az OpenAI API is közvetlenül, ha jól érzed magad egy szkripttel. A fordítást illetően érdemes tudni: a Whisper beépített fordítása csak egy irányba megy: bármilyen nyelv → angol. Ha a másik irány kell (mondjuk angol → japán), futtasd az átiratot utólag egy külön fordítómodellen, mint a Claude, a GPT vagy a DeepL.
Hagyd ki ezt a részt, ha a bemenet mindig élő. De ha interjúkat veszel fel vagy régi megbeszélések átiratait húzod le, az offline munkafolyamat olcsóbb, pontosabb és könnyebben javítható marad, mint a streamelés.
A megfelelő beállítás kiválasztása a munkafolyamatodhoz
Egy gyors döntési fa:
1. Feliratokat akarok egy FaceTime- vagy Messages-beszélgetés közben → Apple Live Translation. Ingyenes, beépített, eszközön fut. 2. Feliratokat akarok egy Zoom/Meet/Teams-híváshoz olyan nyelven, amit nem beszélek → MacWhisper, Superwhisper vagy Transcrybe. Válassz egyet. 3. Az anyanyelvemen szeretnék diktálni, és angol szöveget akarok, hogy bárhova beilleszthessem → Egygombos diktálóeszköz, mint a Voicr. Ez a kétnyelvű szakemberek napi használati esete. 4. Egy másik nyelvű felvett fájlt szeretnék átírni angolra → MacWhisper vagy bármelyik Whisper-alapú asztali alkalmazás. Offline, teljes minőségű modell, kétperces várakozás.
A legtöbben két eszközzel végzik, nem eggyel: egy az élő feliratokhoz, ha kell (alkalmanként), egy másik a napi diktáláshoz (folyamatosan). Ez a szétválás természetes. Egy feliratozó és egy diktálóeszköz más-más célra optimalizál, és ha egyikkel mindkettőt erőlteted, általában mindkettőt rosszabbul csinálja.
Reális elvárások
Néhány dolog, amit minden bemutatóvideó átugrik, és érdemes tudni, mielőtt elköteleződnél:
A késleltetés valós. Még az eszközön futó Whispernél is 1–3 másodperc a csúszás az élő feliratokban. A felhőalapú eszközök még 1–2 másodpercet hozzátesznek. Számolj vele. Ne próbálj élő felirattal követni egy pörgős politikai vitát, lemaradsz.
A fordítási minőség a kb. top 10 nyelven kívül leesik. A Whisper kiváló angolra, spanyolra, franciára, németre, portugálra, olaszra, mandarinra, japánra. Észrevehetően gyengébb thai, kantoni, vietnami és a legtöbb afrikai nyelven. Ha a nyelved a hosszú farkon van, teszteld, mielőtt rá építenél.
A rendszerhang rögzítéséhez engedély kell. A macOS alapból nem engedi, hogy egy app a rendszerhangot hallgassa. A live-captioning kategória minden eszköze végigvezet, hogyan adj képernyőfelvételi vagy audio-loopback engedélyt az első használatkor. Ez normális. Ezért is van, hogy egyes alkalmazásokhoz egyszeri virtuális hangeszköz-telepítés szükséges.
A privát szféra szintje változik. Az Apple eszközei és a Whisper-alapú appok többsége teljesen eszközön fut. Bármi, ami felhő-API-ra küldi a hangot (egyes „AI meeting assistant”-ek), más kompromisszumot vállal. Ha jogi, egészségügyi vagy más szabályozott területen dolgozol, nézz utána, mielőtt egy eszközt élesítenél egy ügyfélhíváson.

Egy gyakorlati kiindulópont
A legkönnyebb hely, ahonnan elindulhatsz – bármi is a végcélod –, az az egyetlen használati eset, amibe ezen a héten a legtöbbször futottál bele. Nem a ritka, hanem a napi.
Ha sok nemzetközi megbeszélésen vagy, telepíts egy élő feliratozó eszközt, hagyd a menüsávban, és két hétig használd, mielőtt eldöntenéd, hogy marad-e. Ha sok angolt írsz, miközben más nyelven gondolkodsz, próbáld meg a következő tíz e-mailt nem begépelni, hanem az anyanyelveden diktálni, és hagyni, hogy az eszköz előállítsa az angolt.
A Voicr kifejezetten a diktálási esetet kezeli. Lenyomod az FN-t, beszélsz a saját nyelveden, az angolt állítod célnak, és bárhova beilleszted. Van egy Free csomag (havi 5000 szó, bankkártya nélkül), ami elég ahhoz, hogy lásd, illik-e a munkafolyamat ahhoz, ahogyan írsz. Az élő feliratozási esethez a MacWhispernek is van egy ingyenes verziója az alap Whisper-modellel, amivel kipróbálhatod az élményt, mielőtt fizetnél.
A technológia már egy ideje nem szűk keresztmetszet. Az érdekes kérdés most az, hogy melyik munkafolyamatot építed fel és használod ténylegesen – és ez azon múlik, hogy a konkrét súrlódáshoz a megfelelő eszközt választod-e. A diktálási oldalról bővebben: Hogyan működik valójában a Mac hangdiktálása végigvezet, mi történik a hangod és a vágólapodra kerülő csiszolt szöveg között.

