Du börjar ett mejl på engelska, växlar till spanska för en snabb hälsning till en kollega i Madrid och slänger sedan in ett Slack-svar på franska. Tre appar, tre språk, tio minuter. Hälften av tiden är dina fingrar, den andra hälften är språkmenyn i Mac-diktering.
Om du talar mer än ett språk känns Apples inbyggda diktering som om den vore byggd för någon som inte gör det. Du väljer ett språk, dikterar och får sedan gräva i Systeminställningar eller klicka på en pytteliten meny intill markören för att byta. Missar du bytet kommer din franska ut som engelskt nonsens.
Något har förändrats i tysthet det senaste året. En handfull Mac-appar transkriberar och polerar nu ditt tal på ungefär 100 språk, med automatisk identifiering som listar ut vad du talar utan att du behöver röra en meny. Den här guiden går igenom exakt vad det innebär 2026, vilka språk som faktiskt täcks, var Apples verktyg slutar fungera och hur du sätter upp ett flerspråkigt dikteringsflöde som inte havererar varje gång du byter språk.
Vad "100 språk på Mac" faktiskt betyder 2026
Siffran 100 språk som du ser på app-webbplatser är inte marknadsföring. Den kommer från en specifik modell: OpenAIs Whisper, tränad på ungefär 680 000 timmar flerspråkigt ljud. Den nuvarande, mest använda varianten, large-v3-turbo, stödjer 99 språk, vilket de flesta appar rundar av till "100".
Här är en grov bild av vad som täcks. Hela det europeiska fältet, inklusive de nordiska och slaviska grupperna. De stora asiatiska språken: mandarin, japanska, koreanska, vietnamesiska, thai, indonesiska, tagalog, malajiska. Sydasiatiska: hindi, bengali, tamil, urdu, marathi, nepali. Mellanösternspråk: arabiska, hebreiska, persiska, turkiska, azerbajdzjanska. Afrikanska: swahili, afrikaans. Plus mindre uppenbara språk som walesiska, maori, vitryska, makedonska, kazakiska och burmesiska.
Kvaliteten är inte jämn över hela listan. Engelska, spanska, franska, tyska, italienska, portugisiska, nederländska, japanska och mandarin ligger i topp: ordfelfrekvenser kring 4–8 % på rent ljud. Mindre vanliga språk och sådana med tunna träningsdata, som walesiska eller maori, kan ligga på 15–25 %. Fortfarande användbart, bara inte lika förlåtande.
Den större förändringen: allt detta körs nu på en helt vanlig Mac. Apple Silicon når den punkt där Whispers stora modell transkriberar ett 30-sekundersklipp på under två sekunder lokalt, utan en runda till molnet. Det är därför så många Mac-appar plötsligt ser likadana ut. De är alla byggda på samma modell.
Där Apples inbyggda diktering når sitt tak
Apple Dictation har funnits sedan 2012 och är gratis. För ett enda språk, i en enda app, fungerar den bra. För flerspråkigt arbete bryts flödet på tre punkter.
Antal språk. Apple stödjer ungefär 50–60 språk och dialekter, beroende på macOS-version. Hyfsat för de stora europeiska och asiatiska marknaderna, men du kan stå utan om du behöver ukrainska, tagalog eller walesiska, eller om du vill ha finkorniga dialekter utöver de få Apple levererar.
Ingen automatisk språkidentifiering. Apple Dictation använder det språk du senast valde. Glömmer du att byta åker din franska genom den engelska modellen och kommer ut som dravel som ungefär rimmar på vad du sa. För att byta språk klickar du på den lilla språkindikatorn vid markören och väljer från en lista. Varje byte är ett manuellt steg.
Råtranskript, ingen polering. Det du säger är det du får, inklusive "öh", "liksom", omtagningar och den halvfärdiga meningen du började innan du ändrade dig. Det är ett problem på ett språk och värre i flerspråkigt arbete, där du gärna talar försiktigare för att hålla modellen på rätt spår.
Om du bara dikterar på engelska och inte har något emot att städa efteråt räcker Apples verktyg. I samma stund du behöver ett andra språk, eller vill ha utdata du kan klistra in utan att läsa om, har du vuxit ur det.
Så hanterar Whisper 100 språk under huven
Det hjälper att veta ungefär vad som händer när du håller in en tangent och talar, för det förklarar varför vissa saker fungerar och andra inte.
Whisper är ett enda neuralt nätverk tränat på ljud från 99 språk. Istället för att köra en separat modell för varje språk lärde det sig att känna igen alla samtidigt. Den delade träningen ger en nyttig effekt: en mening på italienska och en på portugisiska delar tillräckligt med akustiska drag för att lärdomar från det ena hjälper det andra. Baksidan är att alla språk konkurrerar om samma modellkapacitet, så de mer sällsynta blir svagare.

När ljudet kommer in gör modellen tre saker i samma omgång: 1. Förutsäger språket utifrån de första sekunderna ljud. 2. Transkriberar orden. 3. Lägger till skiljetecken och versalisering.
Språkidentifieringen är det som gör auto-läget möjligt. Modellen har lärt sig vilket språk som låter som vilket. Den har oftast rätt inom en eller två sekunder från att du börjar tala. Där den snubblar: väldigt korta yttranden (ett eller två ord), språk som delar mycket vokabulär (spanska och italienska, norska och svenska) och byten mitt i en mening. Whisper är byggt för att identifiera ett språk per klipp, inte för att följa dig när du studsar mellan två.
Om du vill ha hela mekaniken bakom hur råtal blir ren text går pipelinen för AI-röstdiktering igenom varje steg.
Automatisk identifiering kontra manuell språkväljare: när vinner vilken
Moderna flerspråkiga dikteringsappar ger dig två lägen. Att veta när man ska använda vilket gör skillnaden mellan smidigt och frustrerande.
Använd automatisk identifiering när:
Du byter språk ofta under dagen men håller dig till ett språk per diktering. Du är en utvecklare i Berlin som skriver engelska kodkommentarer och tyska Slack-meddelanden. Du är journalist som arbetar med engelska och japanska källor. Du hanterar supportärenden på fyra språk. I alla dessa fall är varje enskild inspelning på ett språk; det som ändras är vilket språk. Automatisk identifiering sparar dig menyletandet varje gång.
Använd ett manuellt språkval när:
Du arbetar med mindre vanliga språk där identifieringen är skakigare (walesiska, maori, vitryska). Du dikterar i en bullrig miljö där den första sekunden ljud kan vara omgivningsljud snarare än tal. Du dikterar korta yttranden där det inte finns nog med ljud att gå på. Eller du använder ett språk som överlappar med ett annat modellen kan väl (den gissar ibland på portugisiska när du menade galiciska, till exempel).
Vad som fortfarande inte fungerar bra:
Att växla språk mitt i en mening. Börjar du på spanska och slänger in ett engelskt varumärkesnamn mitt i hanterar modellen det. Börjar du en mening på spanska och avslutar på engelska får du ofta ett av språken transkriberat som nonsens på det andra. Den ärliga lösningen: avsluta inspelningen vid språkgränsen och börja en ny.
Översätt medan du talar: arbetsflödet "tala X, skriv ut engelska"
En av de mest förbisedda funktionerna i modern Mac-diktering är tala-och-översätt. Du talar på ditt modersmål, och texten som dyker upp är redan på ett annat språk. Oftast är målet engelska.
Två underliggande metoder gör det möjligt. För det första har Whispers äldre flerspråkiga varianter en inbyggd översättningsuppgift: du talar på något av de 99 språken och modellen matar ut engelska direkt. Den nyare turbo-varianten har inte med detta, så de flesta appar använder nu ett annat upplägg: Whisper transkriberar på källspråket, och en språkmodell översätter sedan texten. Den andra metoden har högre kvalitet och hanterar polering samtidigt, vilket är skälet till att den har blivit standard.
Det här kortar ner ett verkligt arbetsflöde som tidigare tog tre steg. Gammalt sätt: diktera på modersmålet, kopiera texten, klistra in i en översättare, kopiera resultatet, klistra in i mejlet. Ungefär 30 sekunder och fyra kontextväxlingar. Nytt sätt: håll in en tangent, tala på modersmålet, polerad engelsk text dyker upp vid markören. Ungefär 4 sekunder.
Om du tillbringar någon del av dagen med att skriva engelska på jobbet men tänker snabbare på ett annat språk är den här enda funktionen skälet att ställa in modern diktering. Voicr gör det med en hotkey: sätt Auto som indataspråk och engelska som polerat utdataspråk, så landar varje inspelning som färdig-att-skicka engelska oavsett vad du talade.
Verkliga flerspråkiga arbetsflöden på Mac
Teori är billigt. Här är mönstren som faktiskt sparar tid för riktiga människor.
Tvåspråkiga anteckningar och dagboksskrivande
Om du för anteckningar på modersmålet men lever i en engelskspråkig arbetsmiljö ger diktering dig det bästa av båda. Sätt källspråket till modersmålet och utdataspråket till modersmålet (ingen översättning), så slutar du skriva helt. För mötesanteckningar där du vill ha både originalet och en engelsk version dikterar du två gånger med olika utdatainställningar.
Kod med kommentarer på modersmålet
Utvecklare i icke-engelskspråkiga team håller ofta koden på engelska men skriver kommentarer på teamets språk. Automatisk identifiering hanterar det här utan att tveka när du växlar mellan att diktera i editorn (engelska kodbeskrivningar, funktionsnamn) och att diktera kommentarer på ditt språk. Varje inspelning är på ett språk; modellen plockar rätt språk varje gång.
Kundsupport över fyra tidszoner
Supportagenter som hanterar ärenden på engelska, spanska, franska och tyska brukar växla mellan språkprofiler i sina verktyg. Med flerspråkig diktering läser du ärendet och svarar på det språk det är skrivet på, och går sedan vidare till nästa. Ingen profilväxling, ingen meny. Polersteget spelar roll här också: supportsvar behöver en konsekvent professionell ton på varje språk, inte ett råtranskript.
Språkinlärare och språklärare
Lär du dig ett språk tvingar diktering fram uttal och tempo. Förstår modellen dig inte är det feedback. Lär du ut ett språk sparar du in på att skriva accenter, specialtecken och diakritiska tecken när du dikterar exempelmeningar. Modellen lägger till dem korrekt. För båda fungerar tala-och-översätt-flödet som direkt förståelsetest: tala på språket du lär dig och se om engelskan matchar det du menade.
Internationella skribenter och journalister
Långformsskribenter som tänker på ett språk och publicerar på ett annat brukar översätta i huvudet medan de skriver. Det är utmattande. Tala in första utkastet på språket du tänker på, låt verktyget producera engelska, och redigera sedan. Första utkastet sker 3–4 gånger snabbare, och din redigeringshjärna är fräschare eftersom den inte hade översättningstjänst under skrivandet.
Så sätter du upp flerspråkig diktering på Mac
Det finns två vägar: Apples inbyggda verktyg för det enklaste fallet, och en tredjepartsapp för allt annat.
Sätta upp Apple Dictation för flera språk
Öppna Systeminställningar, gå till Tangentbord och klicka sedan på Diktering. Slå på den. Klicka på rullgardinsmenyn för Språk och lägg till de språk du vill ha. Du kan lägga till ungefär sex. Härefter kommer en liten flagga eller språkkod visas intill markören när du startar diktering. Klicka på den för att byta språk. Begränsningar: - Ingen automatisk identifiering. Varje byte är ett klick. - Bara ungefär 50–60 språk. - Råtranskript, ingen polering, ingen appmedveten formatering. - 60-sekunders gräns för diktering i äldre macOS-versioner.
Sätta upp en flerspråkig tredjepartsapp
Moderna Mac-dikteringsappar ser oftast ut som menyradsverktyg som fungerar i varje textfält i varje app. Upplägget ser ut så här: 1. Installera appen och bevilja behörighet för mikrofon + hjälpmedel. 2. Sätt eller acceptera hotkeyen (oftast FN eller Option+Space, håll inne för att spela in). 3. Välj indataspråk. För flerspråkigt arbete, sätt det till Auto. 4. Välj utdataspråk. Samma som indata betyder bara transkription; välj engelska (eller något annat) för att få översättning. 5. Eventuellt, sätt en polerprompt ("professionell", "avslappnad", "behåll rått") så att utdatat matchar hur du vill att det ska låta. Från och med då kan du diktera överallt där du kan skriva. Håll in tangenten, tala, släpp – texten dyker upp vid markören.
Skriver du till olika appar med olika ton (formellt mejl, avslappnad Slack, teknisk dokumentation) är det här Smart Rules kommer in: en skrivstil per app som tillämpas automatiskt baserat på vilken app som är aktiv. Du ställer in regeln en gång och slutar tänka på den. Samma flerspråkiga modell hanterar dem alla.
Praktiska slutsatser
Tre saker värda att komma ihåg när du sätter upp flerspråkig diktering på din Mac:
Ett språk per inspelning är regeln. Modellen klarar 100 språk men väljer ett per klipp. Avsluta inspelningen vid språkgränsen istället för att försöka byta mitt i en mening.
Automatisk identifiering är standardvalet för dagligt flerspråkigt arbete. Manuellt val är bara värt det för korta yttranden, sällsynta språk eller bullriga miljöer där identifieringen kan slå fel.
Översättning medan du talar är inte ett separat verktyg. Om ditt utdataspråk är satt till engelska och ditt indataspråk är satt till ditt modersmål är varje inspelning en översättning. Inget extra steg, ingen andra app, ingen kopiera-och-klistra.
En tangent, vilket språk som helst
Har du läst så här långt är svaret på "hur dikterar jag på 100 språk på min Mac 2026" kort: installera en tredjepartsapp byggd på Whisper, sätt indataspråket till Auto, håll in en tangent och tala. Systemet sköter språkidentifiering, transkription, polering och (om du vill) översättning i en enda runda.
Voicr gör det här med en hotkey från vilken app som helst på din Mac. Håll FN, tala på något av 100 språk, släpp – och polerad text landar vid markören. Sätt utdataspråket för att översätta medan du talar, eller låt det vara på källspråket för ren transkription. Det finns en Free-nivå med 5 000 ord per månad, så det billigaste sättet att se om flerspråkig diktering hör hemma i ditt arbetsflöde är att testa den på morgondagens första mejl.
Vill du se hur modern Mac-diktering står sig sida vid sida mot det som redan finns på din maskin går Voicr kontra Apple Dictation-genomgången igenom skillnaderna funktion för funktion.

