Retour au blog

Voicr Team · 23 mai 2026

Voix-à-texte en 100 langues sur Mac : le guide complet

Comment fonctionne la dictée multilingue sur Mac en 2026, le paysage des 100 langues, détection automatique ou choix manuel, et de vrais workflows bilingues.

Voix-à-texte en 100 langues sur Mac : le guide complet

Vous commencez un e-mail en anglais, vous passez à l'espagnol pour un mot rapide à un collègue à Madrid, puis vous balancez une réponse Slack en français. Trois apps, trois langues, dix minutes. La moitié de ce temps, ce sont vos doigts, l'autre moitié, c'est le menu des langues dans la dictée du Mac.

Si vous parlez plus d'une langue, la dictée intégrée d'Apple donne l'impression d'avoir été pensée pour quelqu'un qui n'en parle qu'une. Vous choisissez une langue, vous dictez, puis vous fouillez dans Réglages Système ou vous cliquez sur un minuscule menu près du curseur pour changer. Manquez le changement et votre français ressort comme du n'importe quoi en anglais.

Quelque chose a discrètement changé l'an dernier. Une poignée d'apps Mac transcrivent et reformulent désormais votre voix dans environ 100 langues, avec une détection automatique qui devine ce que vous parlez sans que vous touchiez à un menu. Ce guide explique précisément ce que cela veut dire en 2026, quelles langues sont vraiment couvertes, où l'outil d'Apple s'arrête, et comment mettre en place un flux de dictée multilingue qui ne casse pas dès que vous changez de langue.

Ce que « 100 langues sur Mac » veut vraiment dire en 2026

Le chiffre de 100 langues que vous voyez sur les sites d'apps n'est pas du marketing. Il vient d'un modèle précis : Whisper d'OpenAI, entraîné sur environ 680 000 heures d'audio multilingue. La variante actuellement la plus utilisée, large-v3-turbo, prend en charge 99 langues, que la plupart des apps arrondissent à « 100 ».

Voici à peu près ce qui est couvert. L'ensemble européen complet, y compris les groupes nordique et slave. Les grandes langues asiatiques : mandarin, japonais, coréen, vietnamien, thaï, indonésien, tagalog, malais. Asie du Sud : hindi, bengali, tamoul, ourdou, marathi, népalais. Moyen-Orient : arabe, hébreu, persan, turc, azéri. Afrique : swahili, afrikaans. Et des langues moins évidentes comme le gallois, le maori, le biélorusse, le macédonien, le kazakh et le birman.

La qualité n'est pas uniforme sur toute cette liste. L'anglais, l'espagnol, le français, l'allemand, l'italien, le portugais, le néerlandais, le japonais et le mandarin sont en haut du tableau : des taux d'erreur de mots autour de 4 à 8 % sur de l'audio propre. Les langues moins courantes ou dont les données d'entraînement sont rares, comme le gallois ou le maori, peuvent monter à 15-25 %. Toujours utile, mais moins indulgent.

Le vrai changement, c'est que tout ça tourne désormais sur un Mac standard. Apple Silicon atteint le point où le grand modèle Whisper transcrit un clip de 30 secondes en moins de deux secondes en local, sans aller-retour vers le cloud. C'est pour ça que tant d'apps Mac se ressemblent soudain. Elles s'appuient toutes sur le même modèle.

Là où la dictée intégrée d'Apple atteint son plafond

Apple Dictation existe depuis 2012 et c'est gratuit. Pour une seule langue, dans une seule app, ça suffit. Pour un usage multilingue, trois choses cassent le flux.

Le nombre de langues. Apple prend en charge entre 50 et 60 langues et dialectes, selon la version de macOS. Convenable pour les grands marchés européens et asiatiques, mais vous pouvez vite vous retrouver à sec s'il vous faut l'ukrainien, le tagalog ou le gallois, ou si vous voulez des dialectes fins au-delà des quelques-uns proposés par Apple.

Pas de détection automatique de la langue. Apple Dictation utilise la dernière langue choisie. Oubliez de basculer et votre français passe dans le modèle anglais et ressort comme une bouillie qui rime vaguement avec ce que vous avez dit. Pour changer de langue, vous cliquez sur le petit indicateur de langue près du curseur et vous choisissez dans une liste. Chaque bascule est manuelle.

Transcription brute, sans polissage. Ce que vous dites est ce que vous obtenez, y compris les « euh », « du coup », les redémarrages et la demi-phrase commencée avant que vous changiez d'avis. C'est gênant dans une seule langue, c'est pire en multilingue, où on a tendance à parler plus prudemment pour ne pas perdre le modèle.

Si vous ne dictez qu'en anglais (ou qu'en français) et que vous acceptez de nettoyer derrière, l'outil d'Apple fait le job. Dès qu'il vous faut une deuxième langue, ou que vous voulez un texte directement collable sans le relire, vous l'avez dépassé.

Comment Whisper gère 100 langues sous le capot

Il vaut la peine de comprendre grossièrement ce qui se passe quand vous appuyez sur une touche et que vous parlez, parce que ça explique pourquoi certaines choses marchent et d'autres non.

Whisper est un unique réseau neuronal entraîné sur de l'audio en 99 langues. Au lieu de faire tourner un modèle différent pour chaque langue, il a appris à toutes les reconnaître d'un coup. L'entraînement partagé apporte quelque chose d'utile : une phrase en italien et une phrase en portugais partagent assez de traits acoustiques pour qu'apprendre l'une aide pour l'autre. L'inconvénient, c'est que toutes les langues se disputent la même capacité du modèle, donc les plus rares sont plus faibles.

Illustration de paroles en différentes langues qui entrent dans un seul modèle de transcription et en ressortent sous forme de texte soigné

Quand l'audio arrive, le modèle fait trois choses en une passe : 1. Il prédit la langue à partir des premières secondes d'audio. 2. Il transcrit les mots. 3. Il ajoute la ponctuation et la casse.

C'est la détection de langue qui rend le mode auto possible. Le modèle a appris à reconnaître quelle langue sonne comme quoi. Il vise juste, en général, dans la seconde ou les deux secondes après que vous commenciez à parler. Là où il bute : énoncés très courts (un ou deux mots), langues qui partagent beaucoup de vocabulaire (espagnol et italien, norvégien et suédois), et changement en cours de phrase. Whisper est conçu pour détecter une langue par clip, pas pour vous suivre quand vous sautez entre deux.

Si vous voulez le détail complet de la mécanique qui transforme la voix brute en texte propre, le pipeline de dictée vocale par IA reprend chaque étape.

Détection automatique ou choix manuel : quand chacun l'emporte

Les apps modernes de dictée multilingue proposent deux modes. Savoir lequel choisir fait la différence entre fluide et frustrant.

Utilisez la détection automatique quand :

Vous changez souvent de langue dans la journée mais vous tenez à une langue par dictée. Vous êtes développeur à Berlin qui écrit ses commentaires de code en anglais et ses messages Slack en allemand. Vous êtes journaliste entre des sources anglaises et japonaises. Vous gérez des tickets de support en quatre langues. Dans tous ces cas, chaque enregistrement est dans une seule langue ; ce qui change, c'est laquelle. La détection automatique vous épargne la chasse au menu à chaque fois.

Utilisez le choix manuel quand :

Vous travaillez dans des langues moins courantes où la détection est plus fragile (gallois, maori, biélorusse). Vous dictez dans un environnement bruyant où la première seconde d'audio risque d'être un bruit ambiant plutôt que de la parole. Vous dictez des énoncés courts où il n'y a pas assez d'audio pour détecter. Ou vous utilisez une langue qui chevauche fortement une autre que le modèle connaît bien (il devine parfois portugais quand vous vouliez galicien, par exemple).

Ce qui marche encore mal :

Le changement de langue en plein milieu d'une phrase. Si vous commencez en espagnol et lâchez un nom de marque en anglais au milieu, le modèle s'en sort. Si vous démarrez une phrase en espagnol et la terminez en anglais, vous obtiendrez souvent l'une des deux transcrite n'importe comment dans l'autre langue. La parade honnête : couper l'enregistrement à la frontière entre les langues et en relancer un nouveau.

Traduire en parlant : le workflow « parlez en X, sortie en anglais »

Une des fonctionnalités les plus négligées de la dictée moderne sur Mac, c'est parler-et-traduire. Vous parlez dans votre langue maternelle et le texte qui s'affiche est déjà dans une autre langue. Le plus souvent, cette cible est l'anglais.

Deux méthodes sous-jacentes rendent ça possible. D'abord, les anciennes variantes multilingues de Whisper intègrent une tâche de traduction : vous parlez dans n'importe laquelle des 99 langues et le modèle sort directement en anglais. La nouvelle variante turbo ne propose plus ça, donc la plupart des apps utilisent désormais une approche différente : Whisper transcrit dans la langue source, puis un modèle de langage traduit le texte. La seconde méthode donne une meilleure qualité et soigne le résultat en même temps, c'est pour ça qu'elle est devenue la norme.

Ça écrase un vrai workflow qui prenait trois étapes. Ancienne méthode : dicter dans sa langue maternelle, copier le texte, coller dans un traducteur, copier le résultat, coller dans son e-mail. Environ 30 secondes et quatre changements de contexte. Nouvelle méthode : tenir une touche, parler dans sa langue maternelle, du texte anglais soigné apparaît au curseur. Environ 4 secondes.

Si vous passez une partie de votre journée à écrire en anglais au travail mais que vous pensez plus vite dans une autre langue, cette seule fonctionnalité justifie d'installer une dictée moderne. Voicr le fait avec un seul raccourci : mettez la langue d'entrée sur Auto et l'anglais comme sortie soignée, et chaque enregistrement arrive en anglais prêt à envoyer, peu importe ce que vous avez parlé.

Vrais workflows multilingues sur Mac

La théorie ne coûte rien. Voici les schémas qui font vraiment gagner du temps à de vraies personnes.

Notes et journal bilingues

Si vous prenez vos notes dans votre langue maternelle mais évoluez dans un environnement de travail anglophone, la dictée vous donne le meilleur des deux. Réglez la langue source sur la vôtre et la sortie sur la même (sans traduction), et vous arrêtez complètement de taper. Pour des notes de réunion où vous voulez à la fois l'original et une version anglaise, dictez deux fois avec des réglages de sortie différents.

Du code avec des commentaires dans votre langue

Les développeurs dans des équipes non anglophones gardent souvent le code en anglais mais écrivent les commentaires dans la langue de leur équipe. La détection automatique gère ça sans réfléchir quand vous alternez entre dicter dans l'éditeur (descriptions de code, noms de fonctions en anglais) et dicter des commentaires dans votre langue. Chaque enregistrement est dans une seule langue ; le modèle choisit la bonne à chaque fois.

Support client sur quatre fuseaux horaires

Les agents de support qui traitent des tickets en anglais, espagnol, français et allemand jonglent d'habitude entre des profils de langue dans leurs outils. Avec la dictée multilingue, vous lisez le ticket et vous répondez dans sa langue, puis vous passez au suivant. Pas de changement de profil, pas de menu. Le polissage compte ici aussi : les réponses du support exigent un ton professionnel constant dans toutes les langues, pas une transcription brute.

Apprenants et enseignants de langues

Si vous apprenez une langue, la dicter vous force à travailler la prononciation et le débit. Si le modèle n'arrive pas à vous comprendre, c'est un retour. Si vous l'enseignez, dicter des phrases d'exemple vous épargne la saisie des accents, caractères spéciaux et diacritiques. Le modèle les ajoute correctement. Pour les deux, le flux parler-et-traduire fait office de test de compréhension instantané : parlez dans la langue que vous apprenez, regardez si l'anglais correspond à ce que vous vouliez dire.

Écrivains et journalistes internationaux

Les auteurs de textes longs qui pensent dans une langue et publient dans une autre font la traduction dans leur tête tout en tapant. C'est épuisant. Parlez le premier jet dans la langue dans laquelle vous pensez, laissez l'outil produire l'anglais, puis éditez. Le premier jet se fait 3 à 4 fois plus vite, et votre cerveau d'éditeur est plus frais parce qu'il n'a pas fait office de traducteur pendant la rédaction.

Comment configurer la dictée multilingue sur Mac

Il y a deux voies : l'outil intégré d'Apple pour le cas le plus simple, et une app tierce pour tout le reste.

Configurer Apple Dictation pour plusieurs langues

Ouvrez Réglages Système, allez dans Clavier, puis cliquez sur Dictée. Activez-la. Cliquez sur le menu déroulant Langues et ajoutez celles que vous voulez. Vous pouvez en ajouter environ six. À partir de là, quand vous lancez la dictée, un petit drapeau ou code de langue apparaît près du curseur. Cliquez dessus pour changer de langue. Limites : - Pas de détection automatique. Chaque bascule est un clic. - Seulement ~50 à 60 langues. - Transcription brute, sans polissage, sans mise en forme adaptée à l'app. - Coupure à 60 secondes dans les anciennes versions de macOS.

Configurer une app multilingue tierce

Les apps de dictée modernes pour Mac ressemblent surtout à des utilitaires de barre de menus qui fonctionnent dans tous les champs de texte de toutes les apps. La configuration ressemble à ceci : 1. Installez l'app et accordez les autorisations micro + accessibilité. 2. Définissez ou acceptez le raccourci (souvent FN ou ⌥Space, à tenir pour enregistrer). 3. Choisissez votre langue d'entrée. Pour le multilingue, mettez-la sur Auto. 4. Choisissez votre langue de sortie. Identique à l'entrée = transcription seule ; choisissez l'anglais (ou une autre) pour obtenir une traduction. 5. En option, fixez une consigne de polissage (« professionnel », « décontracté », « garder brut ») pour que le résultat se lise comme vous le voulez. À partir de là, partout où vous pouvez taper, vous pouvez dicter. Vous tenez la touche, vous parlez, vous relâchez, le texte arrive au curseur.

Si vous écrivez dans différentes apps avec différents tons (e-mail formel, Slack décontracté, doc technique), c'est là que les Smart Rules entrent en jeu : un style d'écriture par app qui s'applique automatiquement selon celle qui est active. Vous définissez la règle une fois et vous n'y pensez plus. Le même modèle multilingue gère tout.

À retenir, concrètement

Trois choses à garder en tête en mettant en place la dictée multilingue sur votre Mac :

Une langue par enregistrement, c'est la règle. Le modèle gère 100 langues, mais il en choisit une par clip. Coupez l'enregistrement à la frontière de la langue plutôt que d'essayer de basculer en plein milieu.

La détection automatique est le réglage par défaut au quotidien. Le choix manuel ne vaut le coup que pour les énoncés courts, les langues rares ou les environnements bruyants où la détection peut se tromper.

Traduire en parlant n'est pas un outil à part. Si votre langue de sortie est réglée sur l'anglais et votre entrée sur votre langue maternelle, chaque enregistrement est une traduction. Pas d'étape en plus, pas de deuxième app, pas de copier-coller.

Une seule touche, n'importe quelle langue

Si vous êtes arrivé jusqu'ici, la réponse à « comment dicter en 100 langues sur mon Mac en 2026 » tient en peu de mots : installez une app tierce bâtie sur Whisper, mettez la langue d'entrée sur Auto, tenez une touche et parlez. Le système gère la détection de langue, la transcription, le polissage et (en option) la traduction en un seul aller-retour.

Voicr fait ça avec un seul raccourci depuis n'importe quelle app de votre Mac. Tenez FN, parlez dans n'importe laquelle des 100 langues, relâchez, et un texte soigné arrive au curseur. Mettez la langue de sortie pour traduire à la volée, ou laissez-la sur la langue source pour une transcription propre. Il y a une formule gratuite avec 5 000 mots par mois, donc la façon la moins chère de savoir si la dictée multilingue a sa place dans votre flux, c'est de l'essayer sur le premier e-mail de demain.

Si vous voulez voir comment la dictée moderne sur Mac se compare en face-à-face avec ce qui tourne déjà sur votre machine, le comparatif Voicr vs Apple Dictation reprend les différences fonctionnalité par fonctionnalité.