Du sitter i ett Zoom-möte med en leverantör i São Paulo som hela tiden halkar över till portugisiska. Eller så tittar du på en japansk produktlansering och de automatiska undertexterna hänger inte med. Eller så tänker du på spanska men din kund förväntar sig e-post på engelska.
Tre helt olika problem. Alla tre buntas ihop under "realtidsöversättning av tal på Mac", och det är därför de flesta guider om ämnet är förvirrande. Rätt verktyg beror på vilket problem du faktiskt försöker lösa.
Apple lanserade Live Translation i macOS 26 förra hösten. Whisper fick en Turbo-modell som kör på en MacBook Air utan att smälta den. Dikteringsverktygen som tidigare var ett hobbymässigt virrvarr är nu på riktigt bra. Den här guiden går igenom vad som finns, när varje alternativ faktiskt passar, och hur du sätter upp dem utan att gå i demovideo-fällan.
Vad "realtid" faktiskt betyder
Innan du väljer ett verktyg, sätt ord på arbetsflödet. Det finns tre tydliga varianter av "realtid" på en Mac, och de behöver olika programvara:
Direkttextning — någon annan talar och du vill ha undertexter, eventuellt översatta, medan de pratar. Samtal, möten, föreläsningar, livesändningar. Latensen spelar roll. Fyra sekunders fördröjning är irriterande, tio sekunder är värdelöst.
Diktering — det är du som talar, och du vill ha ren text på ett annat språk när du är klar. E-post, Slack-meddelanden, dokument. Transkriberingen och översättningen sker i ett enda steg när du slutar prata. Respons under en sekund när du är klar är viktigare än att se ord strömma fram medan du pratar.
Filtranskribering — du har en inspelning (en Zoom-export, en röstmemo, en podcast) och du vill ha en översatt transkribering. Inte realtid. Skicka in den i den mest exakta modell du hittar och vänta i två minuter.
Att blanda ihop dessa är så folk hamnar i att använda ett mötestranskriberingsverktyg för att skriva snabba e-postmeddelanden, eller försöker texta en YouTube-video med en dikteringsapp. Välj rätt kategori först, välj sedan verktyg.
De inbyggda macOS-alternativen
Om du har macOS 26 på en Apple Silicon-Mac får du två inbyggda verktyg från Apple, plus en viktig lucka.
Live Translation (macOS 26)
Live Translation fungerar i Meddelanden, FaceTime och den nya Telefon-appen för Mac. Det drivs av Apple Intelligence och körs på enheten, så ingenting lämnar din maskin. I ett FaceTime-samtal klickar du på menyknappen, väljer Live Captions, och en översatt transkribering visas högst upp på skärmen.
Haken är språklistan. För Live Translation i FaceTime och Telefon stöder Apple engelska, franska, tyska, portugisiska (Brasilien) och spanska (Spanien), med mandarin, italienska, japanska och koreanska på väg ut. Meddelanden täcker en bredare uppsättning, inklusive danska, holländska, norska, svenska, turkiska och vietnamesiska.
Det är gratis, privat och latensen är bra. Det funkar också bara i Apples egna appar. Zoom, Google Meet, Slack-huddles, YouTube — inget av det går via Live Translation.
Live Captions
Slå på Live Captions i Systeminställningar → Hjälpmedel → Live Captions så får du ett flytande fönster som transkriberar allt ljud din Mac fångar upp — systemljud, mikrofon eller båda. Det fungerar i vilken app som helst: Zoom, YouTube, en podcast, en kollega som pratar bredvid dig.
Live Captions transkriberar men översätter inte. Det är dessutom bara på engelska i nuläget. Om ditt möte är på engelska och du bara behöver text för att hänga med är det här svaret. Om mötet är på portugisiska hjälper inte Live Captions.

Direkttextning och översättning för samtal och videor
När Apples inbyggda verktyg inte täcker ditt samtal fyller en liten grupp tredjepartsappar luckan. De plockar upp systemljud (det som spelas via Macens högtalare) eller mikrofonen, transkriberar med en lokal Whisper-modell och översätter på begäran. Alla tre nedan körs på enheten, vilket är viktigt om du sitter i ett konfidentiellt samtal.
MacWhisper — En av de äldsta Mac-apparna i området. Direkttextning med översättning, drivs av Whisper och Nvidia Parakeet, stöder systemljudfångst för vilket mötesverktyg som helst. Stabil för Zoom, Meet, Teams. Pro-versionen är ett engångsköp.
Superwhisper — Kombinerar direkttranskribering med ett Whisper-baserat dikteringsflöde. Stöder över 100 språk och kan översätta vilket som helst av dem till engelska. Försöker vara både ett textningsverktyg och ett dikteringsverktyg, vilket funkar om du vill ha en app för båda men innebär att dikteringssidan är tyngre än ett dedikerat verktyg.
Transcrybe — Nyare, smalare, specifikt inriktad på realtidsöversättning. Endast på enheten. Gränssnittet är byggt runt "någon talar ett språk jag inte kan — visa mig vad de säger". Bra för resor, supportsamtal och att titta på innehåll på främmande språk.
Välj utifrån hur ofta du hamnar i den här situationen. Om du lever i internationella samtal förtjänar MacWhisper eller Superwhisper sin plats i menyraden. Om du bara behöver det då och då räcker kanske Apples Live Translation i FaceTime.
Diktera på ett språk, skriva på ett annat
Det vanligaste behovet av "realtidsöversättning" har inget med andra människors prat att göra. Det handlar om *dig*, som tänker på ditt modersmål men måste få ut engelska på pappret för att det är vad jobbet kräver.
Om du är spansk, fransk eller polsk och skriver mycket engelska på jobbet känner du till skatten. Du formulerar meningen i huvudet på ditt eget språk, översätter mentalt, och skriver sedan översättningen. Varje mejl är två utkast: det du skrev i huvudet och det dina fingrar producerade.
Formen på rätt verktyg här är annorlunda än vid direkttextning. Du behöver inte strömmande undertexter. Du behöver: håll in en tangent, prata naturligt på ditt språk, släpp, och få välputsad text på målspråket att landa i urklipp, redo att klistras in var som helst (Gmail, Slack, Notion, ett Jira-ärende).
Det är den luckan Voicr fyller. Håll in FN, prata på ett av 100 språk, sätt engelska som mål, och det som klistras in är ren engelska — inte din råa transkribering körd genom en separat översättare. Transkribering och översättning sker i ett enda steg istället för tal → transkribering → kopiera → översättare → klistra in. Hela processen tar ungefär lika lång tid som det tar dig att prata.
Det finns också ett automatiskt detekteringsläge som listar ut det talade språket från ljudet självt, så om du växlar mellan exempelvis spanska för privat Slack och engelska för kundmejl behöver du inte öppna någon väljare. En liten detalj, lätt att missa i en funktionslista. En längre genomgång finns i Tal till text på 100 språk på Mac.
Transkribera förinspelat ljud
Om du har en fil (en Zoom-inspelning, en röstmemo, en intervju, en podcast) är "realtid" fel ram. Skicka filen till ett Whisper-baserat verktyg som körs på full kvalitet och låt det ta två minuter. Det är noggrannheten som räknas.
MacWhisper och Whisper Transcription hanterar båda detta bra. Det gör även OpenAI:s API direkt om du är bekväm med ett script. För själva översättningen är det värt att notera att Whispers inbyggda översättning bara går i en riktning: vilket språk som helst → engelska. Om du behöver andra hållet (engelska → japanska, säg), kör transkriberingen genom en separat översättningsmodell efteråt, som Claude, GPT eller DeepL.
Hoppa över det här avsnittet om din inmatning alltid är live. Men om du spelar in intervjuer eller drar transkriberingar från gamla möten förblir offline-arbetsflödet billigare, mer exakt och lättare att fixa än strömmande.
Välj rätt setup för ditt arbetsflöde
Ett snabbt beslutsträd:
1. Jag vill ha undertexter i ett FaceTime- eller Meddelanden-samtal → Apple Live Translation. Gratis, inbyggt, på enheten. 2. Jag vill ha undertexter i ett Zoom/Meet/Teams-möte på ett språk jag inte kan → MacWhisper, Superwhisper eller Transcrybe. Välj en. 3. Jag vill diktera på mitt modersmål och få engelsk text att klistra in var som helst → Ett dikteringsverktyg med en tangent, som Voicr. Det här är vardagsfallet för tvåspråkiga yrkespersoner. 4. Jag vill transkribera en inspelad fil på ett annat språk och få engelska → MacWhisper eller någon Whisper-baserad skrivbordsapp. Offline, fullkvalitetsmodell, två minuters väntan.
De flesta landar med två verktyg, inte ett: något för direkttextning när det behövs (då och då) och något för daglig diktering (hela tiden). Den uppdelningen är normal. Ett textningsverktyg och ett dikteringsverktyg optimerar för olika saker, och att försöka få ett att göra båda betyder oftast att man gör båda sämre.
Sätt realistiska förväntningar
Några saker som varje demovideo glider förbi, värda att veta innan du satsar:
Latens är verklig. Även Whisper på enheten har 1–3 sekunders fördröjning för direkttextning. Molnbaserade verktyg lägger på ytterligare 1–2 sekunder. Räkna med det. Försök inte följa en snabb politisk debatt med direkttextning, du kommer hamna efter.
Översättningskvaliteten sjunker utanför de cirka 10 största språken. Whisper är utmärkt på engelska, spanska, franska, tyska, portugisiska, italienska, mandarin och japanska. Det blir märkbart svagare på thai, kantonesiska, vietnamesiska och de flesta afrikanska språk. Om ditt språk ligger i den långa svansen, testa innan du förlitar dig på det.
Systemljudfångst kräver behörighet. macOS låter inte en app lyssna på systemljud som standard. Varje verktyg i direkttextningskategorin guidar dig genom att ge Skärminspelning eller ljud-loopback-behörighet första gången. Det är normalt. Det är också därför vissa appar kräver en engångsinstallation av en virtuell ljudenhet.
Integriteten varierar. Apples verktyg och de flesta Whisper-baserade appar körs helt på enheten. Allt som skickar ljud till ett moln-API (vissa "AI-mötesassistenter") gör en annan avvägning. Om du jobbar inom juridik, vård eller något reglerat, kolla innan du slår på ett verktyg i ett kundsamtal.

En praktisk startpunkt
Den enklaste startpunkten, oavsett vad slutmålet är, är att välja det enskilda användningsfall du stöter på oftast den här veckan. Inte det sällsynta. Det dagliga.
Om du sitter i mycket internationella möten, installera ett direkttextningsverktyg, låt det ligga i menyraden och använd det i två veckor innan du bestämmer dig. Om du skriver mycket engelska medan du tänker på ett annat språk, prova att ersätta de tio nästa mejlen du skulle skrivit med diktering på ditt modersmål och låt verktyget producera engelskan.
Voicr hanterar specifikt dikteringsfallet. Håll in FN, prata på ditt språk, sätt engelska som mål, klistra in var som helst. Det finns en gratisnivå (5 000 ord i månaden, inget kreditkort) som räcker för att se om arbetsflödet faktiskt passar hur du skriver. För direkttextningsfallet har MacWhisper en gratisversion med den grundläggande Whisper-modellen som räcker för att testa upplevelsen innan du betalar.
Tekniken slutade vara flaskhalsen för ett tag sedan. Den intressanta frågan nu är vilket arbetsflöde du faktiskt sätter upp och använder, och det handlar om att välja rätt verktyg för den specifika friktion du fortsätter att stöta på. För mer om dikteringssidan går Så fungerar röstdiktering på Mac på riktigt igenom vad som händer mellan din röst och den färdiga texten i urklipp.

