Powrót do bloga

Voicr Team · 23 maja 2026

Mowa na tekst w 100 językach na Macu: kompletny przewodnik

Jak dyktowanie wielojęzyczne działa na Macu w 2026 roku, krajobraz 100 języków, autowykrywanie kontra ręczny wybór i prawdziwe dwujęzyczne workflowy.

Mowa na tekst w 100 językach na Macu: kompletny przewodnik

Zaczynasz e-mail po angielsku, przełączasz się na hiszpański, żeby szybko napisać do koleżanki w Madrycie, potem wrzucasz odpowiedź po francusku na Slacku. Trzy aplikacje, trzy języki, dziesięć minut. Połowa tego czasu to twoje palce, druga połowa to grzebanie w menu języka w dyktowaniu Maca.

Jeśli mówisz w więcej niż jednym języku, wbudowane dyktowanie Apple sprawia wrażenie zaprojektowanego dla kogoś, kto tego nie robi. Wybierasz język, dyktujesz, a potem klikasz w Ustawienia systemowe albo w malutkie menu obok kursora, żeby zmienić język. Przegapisz przełączenie i twój francuski wychodzi jako angielska bzdura.

W ostatnim roku coś się po cichu zmieniło. Garstka aplikacji na Maca potrafi już transkrybować i dopracowywać mowę w około 100 językach, z automatycznym wykrywaniem, które rozpoznaje, w czym mówisz, bez dotykania menu. Ten przewodnik pokazuje, co to konkretnie oznacza w 2026 roku, które języki są naprawdę obsługiwane, gdzie narzędzie Apple przestaje wystarczać i jak skonfigurować wielojęzyczne dyktowanie, które nie psuje się przy każdej zmianie języka.

Co tak naprawdę oznacza „100 języków na Macu” w 2026 roku

Liczba 100 języków, którą widzisz na stronach aplikacji, to nie marketing. Pochodzi z konkretnego modelu: Whisper od OpenAI, wytrenowanego na około 680 000 godzin wielojęzycznego audio. Obecnie szeroko stosowany wariant, large-v3-turbo, obsługuje 99 języków, co większość aplikacji zaokrągla do „100”.

Oto z grubsza lista tego, co jest pokryte. Pełen zestaw europejski, w tym grupy nordycka i słowiańska. Główne języki azjatyckie: mandaryński, japoński, koreański, wietnamski, tajski, indonezyjski, tagalog, malajski. Południowoazjatyckie: hindi, bengalski, tamilski, urdu, marathi, nepalski. Bliskowschodnie: arabski, hebrajski, perski, turecki, azerbejdżański. Afrykańskie: suahili, afrikaans. Plus mniej oczywiste, jak walijski, maoryski, białoruski, macedoński, kazachski czy birmański.

Jakość nie jest jednolita w całej tej liście. Angielski, hiszpański, francuski, niemiecki, włoski, portugalski, niderlandzki, japoński i mandaryński są na szczycie: poziom błędów słownych wynosi 4–8% na czystym audio. Mniej popularne języki i te ze skąpymi danymi treningowymi, jak walijski czy maoryski, mogą mieć 15–25%. Wciąż użyteczne, tylko mniej wybaczające.

Ważniejsza zmiana: to wszystko działa teraz na zwykłym Macu. Apple Silicon dotarł do momentu, w którym duży model Whispera transkrybuje 30-sekundowy klip w mniej niż dwie sekundy lokalnie, bez podróży do chmury. Dlatego tyle aplikacji na Maca zaczęło wyglądać tak samo. Wszystkie są zbudowane na tym samym modelu.

Gdzie wbudowane dyktowanie Apple uderza w sufit

Apple Dictation istnieje od 2012 roku i jest darmowe. Dla jednego języka i jednej aplikacji jest w porządku. Przy pracy wielojęzycznej trzy rzeczy psują rytm.

Liczba języków. Apple obsługuje gdzieś między 50 a 60 językami i dialektami, w zależności od wersji macOS. Przyzwoicie dla dużych rynków europejskich i azjatyckich, ale możesz mieć pecha, jeśli potrzebujesz ukraińskiego, tagalogu albo walijskiego, albo chcesz precyzyjnych dialektów poza tymi kilkoma, które Apple oferuje.

Brak automatycznego wykrywania języka. Apple Dictation używa ostatnio wybranego języka. Zapomnij przełączyć i twój francuski przechodzi przez angielski model i wychodzi jako bełkot, który mniej więcej rymuje się z tym, co powiedziałeś. Żeby zmienić język, klikasz w mały wskaźnik obok kursora i wybierasz z listy. Każde przełączenie to ręczny krok.

Surowy zapis, bez polerowania. To, co powiesz, dostajesz, włącznie z „yyy”, „no wiesz”, startami od nowa i niedokończonym zdaniem, które porzuciłeś. To problem przy jednym języku, a przy pracy wielojęzycznej jeszcze większy, bo wtedy mówisz ostrożniej, żeby utrzymać model na właściwym torze.

Jeśli dyktujesz wyłącznie po angielsku i nie masz nic przeciwko sprzątaniu po sobie, narzędzie Apple wystarczy. W chwili, gdy potrzebujesz drugiego języka albo chcesz tekstu, który można wkleić bez ponownego czytania, wyrosłeś już z tego.

Jak Whisper obsługuje 100 języków pod maską

Warto wiedzieć z grubsza, co się dzieje, kiedy przytrzymujesz klawisz i mówisz, bo to wyjaśnia, dlaczego pewne rzeczy działają, a inne nie.

Whisper to jedna sieć neuronowa wytrenowana na audio z 99 języków. Zamiast uruchamiać inny model dla każdego języka, nauczył się rozpoznawać je wszystkie naraz. Wspólny trening daje coś użytecznego: zdanie po włosku i zdanie po portugalsku mają na tyle podobne cechy akustyczne, że nauka jednego pomaga drugiemu. Wadą jest to, że wszystkie języki konkurują o tę samą pojemność modelu, więc rzadsze są słabsze.

Ilustracja mowy w różnych językach wpływającej do jednego modelu transkrypcji i wychodzącej jako dopracowany tekst

Kiedy audio trafia do modelu, ten robi trzy rzeczy w jednym przebiegu: 1. Przewiduje język na podstawie pierwszych sekund nagrania. 2. Transkrybuje słowa. 3. Dodaje interpunkcję i wielkie litery.

Wykrywanie języka jest tym, co umożliwia tryb automatyczny. Model nauczył się rozpoznawać, który język brzmi jak który. Zwykle trafia w sekundę lub dwie po tym, jak zaczniesz mówić. Potyka się przy bardzo krótkich wypowiedziach (jedno lub dwa słowa), przy językach dzielących sporo słownictwa (hiszpański i włoski, norweski i szwedzki) oraz przy przełączaniu w połowie zdania. Whisper jest zbudowany tak, by wykryć jeden język na klip, a nie podążać za tobą skaczącym między dwoma.

Jeśli chcesz poznać pełną mechanikę zamiany surowej mowy w czysty tekst, potok dyktowania głosowego z AI prowadzi przez każdy krok.

Autowykrywanie kontra ręczny wybór języka: kiedy które wygrywa

Nowoczesne aplikacje do wielojęzycznego dyktowania dają dwa tryby. Wiedza o tym, kiedy którego użyć, decyduje o tym, czy praca jest płynna, czy frustrująca.

Użyj autowykrywania, gdy:

Często zmieniasz języki w ciągu dnia, ale trzymasz się jednego języka na nagranie. Jesteś programistą w Berlinie, który pisze komentarze w kodzie po angielsku, a wiadomości na Slacku po niemiecku. Jesteś dziennikarką pracującą na materiałach po angielsku i japońsku. Zarządzasz zgłoszeniami wsparcia w czterech językach. We wszystkich tych przypadkach każde pojedyncze nagranie jest w jednym języku; zmienia się to, w którym. Autowykrywanie oszczędza ci za każdym razem polowania w menu.

Użyj ręcznego wyboru języka, gdy:

Pracujesz w mniej popularnych językach, gdzie wykrywanie jest mniej pewne (walijski, maoryski, białoruski). Dyktujesz w hałaśliwym otoczeniu, gdzie pierwsza sekunda nagrania może być dźwiękiem otoczenia, a nie mową. Dyktujesz krótkie wypowiedzi, w których nie ma wystarczająco dużo audio, żeby wykryć język. Albo używasz języka, który nakłada się na inny, dobrze znany modelowi (czasem zgaduje portugalski, kiedy miałeś na myśli galicyjski).

Co wciąż nie działa dobrze:

Przełączanie języków w środku zdania. Jeśli zaczniesz po hiszpańsku i wrzucisz angielską nazwę marki w środku, model sobie poradzi. Jeśli zaczniesz zdanie po hiszpańsku i skończysz po angielsku, często dostaniesz jeden z dwóch przetranskrybowany jako bzdura w drugim języku. Uczciwy obejście: zakończ nagranie na granicy języków i zacznij nowe.

Tłumaczenie w trakcie mówienia: workflow „mów po X, dostań po angielsku”

Jedna z najbardziej niedocenianych funkcji nowoczesnego dyktowania na Macu to mów-i-tłumacz. Mówisz w języku ojczystym, a tekst, który się pojawia, jest już w innym języku. Najczęściej tym docelowym jest angielski.

Działają tu dwie metody. Pierwsza: starsze wielojęzyczne warianty Whispera mają wbudowane zadanie tłumaczenia — mówisz w którymś z 99 języków, a model wypluwa angielski. Nowszy wariant turbo tego nie ma, więc większość aplikacji idzie inną drogą: Whisper transkrybuje w języku źródłowym, a potem model językowy tłumaczy tekst. Druga metoda daje wyższą jakość i przy okazji poleruje, dlatego stała się standardem.

To zwija realny workflow, który kiedyś zajmował trzy kroki. Stara droga: podyktować w języku ojczystym, skopiować tekst, wkleić do tłumacza, skopiować wynik, wkleić w e-mail. Około 30 sekund i cztery przełączenia kontekstu. Nowa droga: przytrzymać jeden klawisz, powiedzieć w języku ojczystym, dopracowany angielski tekst pojawia się przy kursorze. Około 4 sekundy.

Jeśli kawałek dnia spędzasz pisząc po angielsku w pracy, ale myślisz szybciej w innym języku, ta jedna funkcja jest powodem, żeby skonfigurować nowoczesne dyktowanie. Voicr robi to jednym skrótem: ustaw Auto jako język wejścia i angielski jako wyjście, a każde nagranie ląduje jako gotowy do wysłania angielski tekst, niezależnie od tego, w czym mówiłeś.

Prawdziwe wielojęzyczne workflowy na Macu

Teoria jest tania. Oto wzorce, które realnie oszczędzają czas prawdziwym ludziom.

Dwujęzyczne notatki i dziennik

Jeśli notujesz w języku ojczystym, ale pracujesz w środowisku angielskojęzycznym, dyktowanie daje to, co najlepsze z obu światów. Ustaw język źródłowy na ojczysty i wyjście na ojczysty (bez tłumaczenia), a zupełnie przestajesz pisać. Na notatki ze spotkania, gdzie chcesz mieć oryginał i wersję angielską, podyktuj dwa razy z różnymi ustawieniami wyjścia.

Kod z komentarzami w języku ojczystym

Programiści w nieanglojęzycznych zespołach często trzymają kod po angielsku, ale komentarze piszą w języku zespołu. Autowykrywanie ogarnia to bez wysiłku, kiedy przełączasz się między dyktowaniem do edytora (angielskie opisy kodu, nazwy funkcji) a dyktowaniem komentarzy w swoim języku. Każde nagranie jest w jednym języku; model za każdym razem wybiera ten właściwy.

Obsługa klienta w czterech strefach czasowych

Agenci wsparcia obsługujący zgłoszenia po angielsku, hiszpańsku, francusku i niemiecku zwykle przeskakują między profilami języków w swoich narzędziach. Z wielojęzycznym dyktowaniem czytasz zgłoszenie i odpowiadasz w tym języku, w którym jest, a potem przechodzisz do następnego. Bez zmiany profilu, bez menu. Polerowanie też tu ma znaczenie: odpowiedzi wsparcia potrzebują spójnego, profesjonalnego tonu w każdym języku, a nie surowego zapisu.

Osoby uczące się i nauczyciele języków

Jeśli uczysz się języka, dyktowanie w nim wymusza wymowę i tempo. Jeśli model cię nie rozumie, to jest informacja zwrotna. Jeśli uczysz, dyktowanie przykładowych zdań oszczędza wpisywania akcentów, znaków specjalnych i diakrytyków. Model dodaje je poprawnie. Dla obu ról mów-i-tłumacz pełni rolę natychmiastowego sprawdzenia rozumienia: powiedz w języku, którego się uczysz, i zobacz, czy angielski pasuje do tego, co miałeś na myśli.

Międzynarodowi pisarze i dziennikarze

Autorzy długich form, którzy myślą w jednym języku, a publikują w innym, zwykle tłumaczą w głowie w trakcie pisania. To wyczerpujące. Powiedz pierwszą wersję w języku, w którym myślisz, pozwól narzędziu wyprodukować angielski, a potem redaguj. Pierwsza wersja powstaje 3–4 razy szybciej, a twój redakcyjny mózg jest świeższy, bo nie robił tłumaczenia w trakcie pisania.

Jak skonfigurować wielojęzyczne dyktowanie na Macu

Są dwie drogi: wbudowane narzędzie Apple dla najprostszego przypadku i aplikacja zewnętrzna do wszystkiego innego.

Konfiguracja Apple Dictation dla wielu języków

Otwórz Ustawienia systemowe, przejdź do Klawiatury, potem kliknij Dyktowanie. Włącz je. Kliknij listę rozwijaną Języki i dodaj te, których potrzebujesz. Można dodać do około sześciu. Od tej chwili, kiedy uruchomisz dyktowanie, obok kursora pojawi się mała flaga lub kod języka. Kliknij, żeby przełączyć. Ograniczenia: - Brak automatycznego wykrywania. Każda zmiana to klik. - Tylko około 50–60 języków. - Surowy zapis, bez polerowania, bez formatowania dopasowanego do aplikacji. - Limit 60 sekund nagrania w starszych wersjach macOS.

Konfiguracja wielojęzycznej aplikacji zewnętrznej

Nowoczesne aplikacje do dyktowania na Maca to zwykle narzędzia z paska menu, które działają w każdym polu tekstowym w każdej aplikacji. Konfiguracja wygląda tak: 1. Zainstaluj aplikację i daj uprawnienia do mikrofonu i dostępności. 2. Ustaw lub zaakceptuj skrót (zwykle FN albo ⌥Space, przytrzymaj, żeby nagrywać). 3. Wybierz język wejścia. Do pracy wielojęzycznej ustaw na Auto. 4. Wybierz język wyjścia. Taki sam jak wejście oznacza samą transkrypcję; wybierz angielski (albo dowolny inny), żeby dostać tłumaczenie. 5. Opcjonalnie ustaw prompt polerujący („profesjonalnie”, „swobodnie”, „zostaw surowy”), żeby wynik czytał się tak, jak chcesz. Od tego momentu wszędzie, gdzie możesz pisać, możesz dyktować. Przytrzymaj klawisz, powiedz, puść, tekst pojawia się przy kursorze.

Jeśli piszesz w różnych aplikacjach różnym tonem (formalny e-mail, luźny Slack, dokumentacja techniczna), tu wchodzą Smart Rules: styl pisania per aplikacja, który włącza się automatycznie w zależności od tego, która aplikacja jest aktywna. Ustawiasz regułę raz i przestajesz o tym myśleć. Ten sam wielojęzyczny model obsługuje je wszystkie.

Praktyczne wnioski

Trzy rzeczy warte zapamiętania, kiedy konfigurujesz wielojęzyczne dyktowanie na swoim Macu:

Jeden język na nagranie to zasada. Model obsługuje 100 języków, ale wybiera jeden na klip. Zakończ nagranie na granicy języka, zamiast próbować przełączyć się w środku zdania.

Autowykrywanie to domyślny tryb codziennej pracy wielojęzycznej. Ręczny wybór opłaca się tylko przy krótkich wypowiedziach, rzadkich językach albo hałaśliwym otoczeniu, gdzie wykrywanie może się pomylić.

Tłumaczenie w trakcie mówienia to nie osobne narzędzie. Jeśli język wyjścia jest ustawiony na angielski, a wejście na twój ojczysty, każde nagranie jest tłumaczeniem. Bez dodatkowego kroku, bez drugiej aplikacji, bez kopiuj-wklej.

Jeden klawisz, dowolny język

Jeśli doczytałeś do tego miejsca, odpowiedź na pytanie „jak dyktować w 100 językach na Macu w 2026 roku” jest krótka: zainstaluj zewnętrzną aplikację opartą na Whisperze, ustaw język wejścia na Auto, przytrzymaj klawisz i mów. System obsługuje wykrywanie języka, transkrypcję, polerowanie i (opcjonalnie) tłumaczenie w jednej rundzie.

Voicr robi to jednym skrótem z dowolnej aplikacji na Macu. Przytrzymaj FN, mów w którymś ze 100 języków, puść, a dopracowany tekst ląduje przy kursorze. Ustaw język wyjścia, żeby tłumaczyć w trakcie mówienia, albo zostaw go taki sam jak źródłowy, żeby dostać czystą transkrypcję. Jest darmowy plan z 5 000 słów miesięcznie, więc najtańszym sposobem, żeby sprawdzić, czy wielojęzyczne dyktowanie pasuje do twojego workflow, jest spróbowanie go przy pierwszym jutrzejszym mailu.

Jeśli chcesz zobaczyć, jak nowoczesne dyktowanie na Macu wypada w starciu z tym, co masz teraz na komputerze, porównanie Voicr i Apple Dictation omawia różnice funkcja po funkcji.