Zpět na blog

Voicr Team · 23. května 2026

Hlas na text ve 100 jazycích na Macu: kompletní průvodce

Jak v roce 2026 funguje vícejazyčná diktace na Macu, jaké je pokrytí 100 jazyků, automatická detekce vs ruční výběr a reálné dvojjazyčné workflow.

Hlas na text ve 100 jazycích na Macu: kompletní průvodce

Začnete psát e-mail v angličtině, přepnete do španělštiny, abyste rychle napsali kolegovi v Madridu, a pak hodíte odpověď ve francouzštině do Slacku. Tři aplikace, tři jazyky, deset minut. Polovina toho času jsou vaše prsty, druhá polovina je jazykové menu v diktaci na Macu.

Pokud mluvíte více než jedním jazykem, vestavěná diktace od Applu působí, jako by ji navrhl někdo, kdo žádné jiné jazyky neumí. Vyberete jazyk, nadiktujete, pak se vrtáte v Nastavení systému nebo kliknete na maličké menu vedle kurzoru, abyste přepnuli. Přehlédnete přepnutí a vaše francouzština vyleze jako anglický nesmysl.

Za poslední rok se nepozorovaně něco změnilo. Hrstka aplikací pro Mac teď přepisuje a uhlazuje vaši řeč v zhruba 100 jazycích, s automatickou detekcí, která bez vašeho zásahu pozná, čím se právě bavíte. Tento průvodce přesně rozebírá, co to v roce 2026 znamená, které jazyky jsou skutečně pokryté, kde Apple naráží na strop a jak si nastavit vícejazyčné diktování, které se nerozsype při každém přepnutí.

Co vlastně znamená „100 jazyků na Macu" v roce 2026

Číslo 100 jazyků, které vidíte na webech aplikací, není marketing. Pochází z jednoho konkrétního modelu: Whisper od OpenAI, natrénovaného přibližně na 680 000 hodinách vícejazyčného zvuku. Aktuálně široce používaná varianta large-v3-turbo podporuje 99 jazyků, což většina aplikací zaokrouhluje na „100".

Tady je hrubý přehled pokrytí. Celá evropská sada včetně severských a slovanských jazyků. Hlavní asijské jazyky: mandarínština, japonština, korejština, vietnamština, thajština, indonéština, tagalština, malajština. Jižní Asie: hindština, bengálština, tamilština, urdština, maráthština, nepálština. Blízký východ: arabština, hebrejština, perština, turečtina, ázerbájdžánština. Africké: svahilština, afrikánština. Plus méně samozřejmé jazyky jako velština, maorština, běloruština, makedonština, kazaština a barmština.

Kvalita není napříč seznamem stejná. Angličtina, španělština, francouzština, němčina, italština, portugalština, nizozemština, japonština a mandarínština jsou na vrcholu: chybovost slov se na čistém zvuku pohybuje kolem 4–8 %. Méně rozšířené jazyky a ty s řídkými trénovacími daty, jako velština nebo maorština, mohou jít na 15–25 %. Pořád použitelné, jen méně odpouští.

Důležitější posun: to všechno teď běží na běžném Macu. Apple Silicon se dostal do bodu, kdy velký Whisper přepíše 30sekundový klip lokálně za méně než dvě sekundy, bez cesty do cloudu. Proto teď tolik aplikací na Macu vypadá podobně. Všechny stojí na stejném modelu.

Kde vestavěná diktace od Applu naráží na strop

Apple Dictation je tu od roku 2012 a je zdarma. Pro jeden jazyk v jedné aplikaci je v pohodě. Pro vícejazyčnou práci ji ale rozbíjejí tři věci.

Počet jazyků. Apple podporuje někde mezi 50–60 jazyky a dialekty podle vydání macOS. Pro velké evropské a asijské trhy slušné, ale můžete narazit, pokud potřebujete ukrajinštinu, tagalštinu nebo velštinu, případně jemnější dialekty mimo těch pár, co Apple posílá.

Žádná automatická detekce jazyka. Apple Dictation používá poslední jazyk, který jste zvolili. Zapomenete přepnout a vaše francouzština projde anglickým modelem a vyleze jako blábol, který se vzdáleně rýmuje s tím, co jste řekli. Pro změnu jazyka kliknete na drobný indikátor vedle kurzoru a vyberete ze seznamu. Každé přepnutí je ruční krok.

Holý přepis, žádné uhlazení. Co řeknete, to dostanete, včetně všech „ehm", „takže", restartů a té nedokončené věty, kterou jste začali, než jste si to rozmysleli. Problém v jednom jazyce, a ve vícejazyčné práci ještě horší, protože tam mluvíte opatrněji, abyste model udrželi na stopě.

Pokud diktujete jen v angličtině a nevadí vám pak po sobě uklízet, Applův nástroj to pokryje. Jakmile potřebujete druhý jazyk nebo chcete výstup, který můžete vložit bez čtení po sobě, přerostli jste ho.

Jak Whisper zvládá 100 jazyků pod kapotou

Pomůže, když zhruba víte, co se děje, když držíte klávesu a mluvíte, protože to vysvětluje, proč některé věci fungují a jiné ne.

Whisper je jediná neuronová síť natrénovaná na zvuku z 99 jazyků. Místo aby pro každý jazyk pustil jiný model, naučil se je rozpoznávat všechny najednou. Sdílený trénink má svoji výhodu: věta v italštině a věta v portugalštině sdílejí dost akustických rysů na to, aby učení jednoho pomohlo druhému. Nevýhoda je, že všechny jazyky soupeří o stejnou kapacitu modelu, takže ty vzácnější jsou slabší.

Ilustrace řeči v různých jazycích, která vtéká do jednoho přepisovacího modelu a vystupuje jako uhlazený text

Když přijde zvuk, model udělá v jednom průchodu tři věci: 1. Z prvních pár sekund zvuku odhadne jazyk. 2. Přepíše slova. 3. Doplní interpunkci a velká písmena.

Právě detekce jazyka umožňuje automatický režim. Model se naučil rozpoznávat, který jazyk jak zní. Obvykle to do sekundy či dvou od chvíle, kdy začnete mluvit, trefí. Kde to zaškobrtne: velmi krátké promluvy (jedno či dvě slova), jazyky se silně sdílenou slovní zásobou (španělština a italština, norština a švédština) a přepínání uprostřed věty. Whisper je stavěný na detekci jednoho jazyka na klip, ne na to, aby vás následoval, když lítáte mezi dvěma.

Pokud chcete celou mechaniku toho, jak se ze surové řeči stane čistý text, pipeline AI hlasové diktace projde každý krok.

Automatická detekce vs ruční výběr jazyka: kdy která vyhrává

Moderní vícejazyčné diktovací aplikace nabízejí dva režimy. Když víte, kdy který použít, je rozdíl mezi plynulou prací a vztekem.

Automatickou detekci použijte, když:

Často během dne přepínáte jazyky, ale držíte jeden jazyk na jedno diktování. Jste vývojář v Berlíně, který píše komentáře v kódu anglicky a zprávy na Slacku německy. Jste novinář pracující se zdroji v angličtině a japonštině. Spravujete tikety podpory ve čtyřech jazycích. Ve všech těchto případech je každá nahrávka v jednom jazyce; mění se jen který. Automatická detekce vám pokaždé ušetří lov v menu.

Ruční výběr jazyka použijte, když:

Pracujete v méně rozšířených jazycích, kde je detekce vrtkavější (velština, maorština, běloruština). Diktujete v hlučném prostředí, kde první sekunda zvuku může být spíš okolní hluk než řeč. Diktujete krátké promluvy, kde není dost zvuku k detekci. Nebo používáte jazyk, který se překrývá s jiným, jejž model dobře zná (občas hádá portugalštinu, když jste mysleli galicijštinu).

Co stále nefunguje dobře:

Přepínání kódů uprostřed věty. Pokud začnete španělsky a uprostřed hodíte anglický název značky, model si poradí. Pokud začnete větu španělsky a dokončíte ji anglicky, často dostanete jeden z těch dvou přepsaný jako nesmysl v tom druhém jazyce. Upřímné obejití: ukončete nahrávku na hranici jazyka a začněte novou.

Překlad za chodu: workflow „mluvte X, dostanete angličtinu"

Jednou z nejvíce přehlížených funkcí moderní diktace na Macu je mluvení s překladem. Mluvíte ve svém rodném jazyce a text, který se objeví, je už v jiném jazyce. Nejčastěji je cílem angličtina.

Fungují tu dvě metody pod kapotou. Za prvé, starší vícejazyčné varianty Whisperu mají vestavěnou překladovou úlohu: mluvíte v kterémkoli z 99 jazyků a model rovnou vydá angličtinu. Novější varianta turbo to nemá, takže většina aplikací teď používá jiný přístup: Whisper přepíše ve zdrojovém jazyce a pak jazykový model text přeloží. Druhá metoda má vyšší kvalitu a zároveň zařídí uhlazení, a proto se stala standardem.

To smrští reálné workflow, které dřív mělo tři kroky. Stará cesta: nadiktovat v rodném jazyce, zkopírovat text, vložit do překladače, zkopírovat výsledek, vložit do e-mailu. Asi 30 sekund a čtyři přepnutí kontextu. Nová cesta: podržíte jednu klávesu, mluvíte v rodném jazyce, na pozici kurzoru se objeví uhlazená angličtina. Asi 4 sekundy.

Pokud část dne píšete v práci anglicky, ale rychleji přemýšlíte v jiném jazyce, je tahle jediná funkce důvod, proč si nastavit moderní diktování. Voicr to zvládne jednou klávesou: nastavte Auto pro vstupní jazyk a angličtinu jako uhlazený výstup a každá nahrávka přistane jako anglický text k odeslání, ať jste řekli cokoli.

Reálná vícejazyčná workflow na Macu

Teorie je laciná. Tady jsou vzorce, které reálným lidem skutečně šetří čas.

Dvojjazyčné poznámky a deníky

Pokud si píšete poznámky v rodném jazyce, ale pohybujete se v anglicky mluvícím pracovním prostředí, diktace vám dá to nejlepší z obou. Nastavte zdrojový jazyk na rodný a výstup taky na rodný (bez překladu) a úplně přestanete psát na klávesnici. U poznámek ze schůzek, kde chcete jak originál, tak anglickou verzi, diktujte dvakrát s různým nastavením výstupu.

Kód s komentáři v rodném jazyce

Vývojáři v neanglicky mluvících týmech často drží kód v angličtině, ale komentáře píší v jazyce týmu. Automatická detekce to zvládá bez přemýšlení, když přepínáte mezi diktováním do editoru (anglické popisy kódu, názvy funkcí) a diktováním komentářů ve svém jazyce. Každá nahrávka je v jednom jazyce; model pokaždé vybere ten správný.

Zákaznická podpora napříč čtyřmi časovými pásmy

Agenti podpory, kteří řeší tikety v angličtině, španělštině, francouzštině a němčině, obvykle ve svých nástrojích přepínají mezi jazykovými profily. S vícejazyčným diktováním si přečtete tiket a odpovíte v jazyce, ve kterém přišel, pak pokračujete dalším. Žádné přepínání profilu, žádné menu. Krok uhlazení tu hraje taky roli: odpovědi podpory potřebují konzistentní profesionální tón napříč všemi jazyky, ne syrový přepis.

Studenti a učitelé jazyků

Pokud se učíte jazyk, diktování v něm vás nutí k výslovnosti a tempu. Když vám model nerozumí, je to zpětná vazba. Když ho učíte, diktování příkladových vět vám ušetří psaní přízvuků, speciálních znaků a diakritiky. Model je doplní správně. Pro oba slouží mluvení s překladem zároveň jako okamžitá kontrola porozumění: řekněte něco v jazyce, který se učíte, a podívejte se, jestli anglický překlad odpovídá tomu, co jste mysleli.

Mezinárodní autoři a novináři

Autoři delších textů, kteří přemýšlejí v jednom jazyce a publikují v jiném, většinou překládají v hlavě, zatímco píší. To je vyčerpávající. Nadiktujte první draft v jazyce, ve kterém přemýšlíte, nechte nástroj vyrobit angličtinu a pak ji upravte. První draft vznikne 3–4x rychleji a editorská část mozku je svěžejší, protože při draftu nedělala překladatelskou službu.

Jak si na Macu nastavit vícejazyčné diktování

Cesty jsou dvě: vestavěný Applův nástroj pro nejjednodušší případy a aplikace třetí strany pro všechno ostatní.

Nastavení Apple Dictation pro více jazyků

Otevřete Nastavení systému, přejděte na Klávesnice a klikněte na Diktování. Zapněte ho. Klikněte na rozevírací nabídku Jazyky a přidejte ty, které chcete. Můžete jich přidat asi šest. Od teď se při spuštění diktování objeví u kurzoru malá vlajka nebo kód jazyka. Kliknutím na ni přepnete jazyk. Omezení: - Žádná automatická detekce. Každé přepnutí je klik. - Jen ~50–60 jazyků. - Holý přepis, žádné uhlazení, žádné formátování podle aplikace. - 60sekundové omezení diktování ve starších verzích macOS.

Nastavení vícejazyčné aplikace třetí strany

Moderní diktovací aplikace pro Mac většinou vypadají jako utility v menu baru, které fungují v každém textovém poli v každé aplikaci. Nastavení vypadá takto: 1. Nainstalujte aplikaci a udělte oprávnění k mikrofonu a zpřístupnění. 2. Nastavte nebo přijměte klávesovou zkratku (typicky FN nebo ⌥Space, podržet pro nahrávání). 3. Vyberte vstupní jazyk. Pro vícejazyčnou práci to nastavte na Auto. 4. Vyberte výstupní jazyk. Stejný jako vstup znamená jen přepis; vyberte angličtinu (nebo jakýkoli jiný) pro překlad. 5. Volitelně nastavte styl uhlazení („profesionálně", „neformálně", „zachovat syrové"), aby výstup zněl, jak chcete. Od té chvíle můžete diktovat kamkoli, kam můžete psát. Podržíte klávesu, mluvíte, pustíte ji a text se objeví u kurzoru.

Pokud píšete do různých aplikací různými tóny (formální e-mail, neformální Slack, technická dokumentace), tady přicházejí na řadu Smart Rules: styl psaní na aplikaci, který se použije automaticky podle toho, která aplikace je aktivní. Pravidlo nastavíte jednou a přestanete na ně myslet. Stejný vícejazyčný model zvládne všechny.

Praktické závěry

Tři věci, které se vyplatí mít na paměti, když si na Macu vícejazyčné diktování nastavujete:

Jeden jazyk na nahrávku je pravidlo. Model zvládá 100 jazyků, ale na klip vybírá jeden. Místo přepínání uprostřed věty raději ukončete nahrávku na hranici jazyka.

Pro běžnou vícejazyčnou práci je výchozí volbou automatická detekce. Ruční výběr má smysl jen u krátkých promluv, vzácných jazyků nebo v hlučném prostředí, kde se detekce může seknout.

Překlad za chodu není samostatný nástroj. Pokud máte výstupní jazyk nastavený na angličtinu a vstupní na svůj rodný, každá nahrávka je překlad. Žádný krok navíc, žádná druhá aplikace, žádné kopírování a vkládání.

Jedna klávesa, kterýkoli jazyk

Pokud jste dočetli až sem, odpověď na „jak v roce 2026 diktovat ve 100 jazycích na Macu" je krátká: nainstalujte si aplikaci třetí strany postavenou na Whisperu, nastavte vstupní jazyk na Auto, podržte klávesu a mluvte. Systém se postará o detekci jazyka, přepis, uhlazení a (volitelně) překlad v jednom kole.

Voicr to zvládne jednou klávesou z jakékoli aplikace na vašem Macu. Podržíte FN, mluvíte v kterémkoli ze 100 jazyků, pustíte ji a u kurzoru přistane uhlazený text. Nastavte výstupní jazyk na překlad za chodu, nebo ho nechte stejný jako zdroj pro čistý přepis. Existuje bezplatná úroveň s 5 000 slovy měsíčně, takže nejlevnější způsob, jak zjistit, jestli vícejazyčné diktování patří do vašeho workflow, je vyzkoušet ho na zítřejším prvním e-mailu.

Pokud chcete vidět, jak si moderní diktace na Macu stojí přímo proti tomu, co teď máte v počítači, srovnání Voicr vs Apple Dictation projde rozdíly funkci po funkci.