आप Slack में तीन मैसेज गहरे हैं, सुबह के दस ईमेल में डूबे हैं, और आपकी कलाइयाँ पहले से ही शिकायत कर रही हैं। आप जानते हैं कि हर एक में क्या कहना है। बस सब कुछ टाइप करने का मन नहीं है।
डिक्टेशन को यह हल करना चाहिए। आपका Mac अभी, हर खुले ऐप में, यह कर सकता है। लेकिन ज़्यादातर लोग इसे कभी इस्तेमाल नहीं करते, और जो कोशिश करते हैं वे आमतौर पर एक हफ़्ते में हार मान लेते हैं।
इसकी वजह है घर्षण। "मैं यह कहना चाहता हूँ" और "टेक्स्ट स्क्रीन पर आ जाए" के बीच हर एक अतिरिक्त सेकंड वह सेकंड है जो आपके दिमाग ने विचार के बजाय टूल पर खर्च किया। समाधान है एक कीस्ट्रोक। एक की जो आप जिस भी ऐप में हों उसमें डिक्टेशन खोल दे — बिना मेन्यू, बिना क्लिक, बिना इंतज़ार के।
यह गाइड आपको दिखाती है कि इसे कैसे सेट अप करें, कौन-सी की चुनें, और क्यों अकेली की काफ़ी नहीं है।
एक कीस्ट्रोक सब कुछ क्यों बदल देता है
बोलना टाइप करने से लगभग तीन गुना तेज़ है। औसत व्यक्ति लगभग 40 शब्द प्रति मिनट टाइप करता है और 150 शब्द प्रति मिनट बोलता है। Stanford की एक रिसर्च टीम ने भी ऐसा ही अंतर पाया जब उन्होंने लोगों को कीबोर्ड के बजाय आवाज़ से टेक्स्ट मैसेज लिखते समय मापा।
सिर्फ़ रफ़्तार ही फ़ायदा नहीं है। टाइपिंग आपके हाथों और विचारों को दो अलग ट्रैक पर डाल देती है। आप एक वाक्य सोचते हैं, फिर उसे कीस्ट्रोक्स में बदलते हैं, फिर टाइपो ढूँढ़ते हैं। डिक्टेशन उस बीच के चरण को छोड़ देता है। आप वाक्य सोचते हैं और वह स्क्रीन पर आ जाता है।
यह तेज़ी तभी काम करती है जब ट्रिगर अदृश्य हो। अगर आपको माइक्रोफ़ोन आइकन पर क्लिक करना पड़े, किसी डिक्टेशन ऐप पर स्विच करना पड़े, या किसी विंडो के खुलने का इंतज़ार करना पड़े, तो आपका दिमाग वाक्य से बाहर निकलकर टूल पर चला जाता है। पूरी बात बिखर जाती है।
एक अकेली की जिसे आप बिना देखे, किसी भी ऐप में दबा सकते हैं, वही ट्रिगर को अदृश्य रखती है। दबाएँ, बोलें, छोड़ें। यही पूरा इंटरैक्शन है।
macOS में बिल्ट-इन डिक्टेशन शॉर्टकट
macOS में डिक्टेशन पहले से मौजूद है, और मुफ़्त है। डिफ़ॉल्ट शॉर्टकट आपके हार्डवेयर पर निर्भर करता है: - MacBook Pro और Air (2021 या उसके बाद): फ़ंक्शन रो में डेडिकेटेड माइक्रोफ़ोन की दबाएँ, जहाँ पहले F5 हुआ करती थी। - पुराने Mac: Fn की को जल्दी से दो बार टैप करें। - एक्सटर्नल कीबोर्ड: Control को दो बार टैप करें, या जो भी आपके सेटअप के लिए बराबर हो।
इसे चालू करने के लिए System Settings → Keyboard → Dictation खोलें और स्विच ऑन कर दें। पहली बार जब आप इसे चालू करते हैं, macOS एक ऑन-डिवाइस लैंग्वेज मॉडल डाउनलोड करता है। उसके बाद Apple Silicon Mac पर डिक्टेशन ऑफ़लाइन चलता है।
एक बार सक्रिय होने पर, किसी भी टेक्स्ट फ़ील्ड (Mail, Notes, ब्राउज़र टैब, Pages, Slack, Discord) में क्लिक करें और शॉर्टकट दबाएँ। आपको एक छोटा माइक्रोफ़ोन आइकन दिखेगा और एक टोन सुनाई देगी। बोलें, फिर रोकने के लिए Escape या दोबारा शॉर्टकट दबाएँ।
अपने डिक्टेशन शॉर्टकट को कस्टमाइज़ कैसे करें
Fn-Fn डिफ़ॉल्ट में एक दिक्कत है। आपको वही की दो बार दबानी पड़ती है, और टाइमिंग सही होनी चाहिए। आधी बार इसे एक प्रेस के तौर पर पढ़ा जाता है, ख़ासकर लैपटॉप पर जहाँ Fn की दूसरे मॉडिफ़ायर के साथ जगह साझा करती है।
किसी एक की पर स्विच करने से यह ठीक हो जाता है। ऐसे करें: 1. System Settings → Keyboard → Dictation खोलें। 2. Shortcut ड्रॉपडाउन ढूँढ़ें। 3. किसी प्रीसेट में से चुनें, या Customize चुनकर अपनी पसंद का की कॉम्बिनेशन दबाएँ।
आप कोई भी की या कॉम्बिनेशन चुन सकते हैं जिसे macOS स्वीकार करे। एकल की काम करती हैं। मॉडिफ़ायर + की कॉम्बो भी। एकमात्र नियम यह है कि शॉर्टकट खाली होना चाहिए। अगर कोई दूसरा ऐप या सिस्टम फ़ंक्शन उसका पहले से इस्तेमाल कर रहा है, तो macOS आपको बता देगा।
ऐसा कीस्ट्रोक चुनना जो टकराए नहीं
यह वह हिस्सा है जिसे ज़्यादातर गाइड छोड़ देती हैं। ग़लत शॉर्टकट चुनें और Photoshop में हर बार Cmd+D दबाने पर डिक्टेशन ग़लती से चालू हो जाएगा। या इससे भी बुरा, आपकी डिक्टेशन की कुछ और चला देगी।

ध्यान रखने लायक बातें: - F13 से F19 आपके सबसे सुरक्षित विकल्प हैं। ज़्यादातर एक्सटर्नल कीबोर्ड में ये होती हैं, और इनका macOS में कोई डिफ़ॉल्ट फ़ंक्शन नहीं है। F13 ख़ास तौर पर साफ़ है, स्टॉक macOS में शून्य कॉन्फ़्लिक्ट के साथ। F14 और F15 डिफ़ॉल्ट रूप से डिस्प्ले ब्राइटनेस के लिए रिज़र्व हैं, इसलिए पहले उन्हें System Settings → Keyboard Shortcuts → Display में बंद करना होगा। - Cmd, Option, और Control के साथ अक्षरों से बचें। लगभग हर ऐप इनका अपने शॉर्टकट के लिए इस्तेमाल करता है। आप हमेशा कॉन्फ़्लिक्ट से जूझते रहेंगे। - F1 से F12 तक की फ़ंक्शन कीज़ जोखिम भरी हैं अगर आपने "Use F1, F2, etc. keys as standard function keys" बंद कर रखा है। ये ब्राइटनेस, वॉल्यूम और मीडिया कंट्रोल भी हैं। - Caps Lock वाला तरीक़ा तब काम करता है जब आप असल में Caps Lock इस्तेमाल नहीं करते। Karabiner-Elements जैसे टूल इसे Hyper मॉडिफ़ायर (Cmd+Ctrl+Option+Shift) में रीमैप कर सकते हैं, जिससे आपको कॉन्फ़्लिक्ट-फ़्री ट्रिगर मिलता है। फिर Hyper+D आपका डिक्टेशन शॉर्टकट बन जाता है, और दुनिया में कोई ऐप Hyper+D का इस्तेमाल किसी और चीज़ के लिए नहीं करता।
अगर आप ऐसे MacBook पर हैं जिसमें F13 से F19 नहीं हैं, तो दाहिनी Option की एक और कम इस्तेमाल होने वाला विकल्प है। ज़्यादातर लैपटॉप यूज़र की दाहिनी Option की लगभग कभी नहीं दबाई जाती।
जो भी आप चुनें, परीक्षा वही है। क्या आप इसे बिना देखे, बिना हाथ ज़्यादा हिलाए, और बिना ग़लती से दबाए ट्रिगर कर सकते हैं? अगर हाँ, तो आपको आपकी की मिल गई।
पेच: macOS डिक्टेशन क्या नहीं करता
तो आपके पास एक की है। आप उसे दबाते हैं। macOS आपकी आवाज़ को ट्रांसक्राइब करता है। हो गया?
इतना ही नहीं। बिल्ट-इन डिक्टेशन की कुछ सीमाएँ हैं जो असली काम के लिए इस्तेमाल करते ही पहले हफ़्ते में सामने आ जाती हैं: - यह 30 से 60 सेकंड के आसपास टाइम-आउट हो जाता है। Apple ने कभी सटीक नंबर नहीं बताया, लेकिन यह सीमा असली है और इसे बदलने की कोई सेटिंग नहीं है। एक-लाइन के और छोटे मैसेज ठीक हैं। एक पूरा पैराग्राफ़ और आप दीवार से टकरा जाएँगे। - यह शाब्दिक रूप से ट्रांसक्राइब करता है। हर "उम", हर "अह", हर "मतलब, असल में, मुझे फिर से शुरू करने दो" टेक्स्ट में चला जाता है। आपने कहा है, तो वह वहाँ है। - ऐप की समझ नहीं है। यह नहीं जानता कि आप Slack मैसेज लिख रहे हैं या औपचारिक ईमेल। आपको हर हाल में वही कच्चा ट्रांसक्रिप्ट मिलता है। - कोई सफ़ाई नहीं। लंबे चलते वाक्य, छूटे हुए विराम चिह्न, अजीब कैपिटलाइज़ेशन। सब ठीक करना आप पर है।
शॉर्टकट आपको "किसी भी ऐप में बोलने" तक पहुँचाता है। जो टेक्स्ट यह बनाता है, असल में वही आप पेस्ट, सेंड या सेव करते हैं। यहीं पर ज़्यादातर लोग डिक्टेशन छोड़ देते हैं। वे की दबाते हैं, स्वाभाविक रूप से बोलते हैं, नतीजा देखते हैं, और महसूस करते हैं कि टाइप करना तेज़ होता। अगर यही गैप आपको रोकता है, तो Voicr और Apple के बिल्ट-इन डिक्टेशन की यह तुलना ठीक-ठीक बताती है कि क्या कमी है।
एक-की वर्कफ़्लो जो बोलते-बोलते सँवारता है
यही वजह है कि हमने Voicr बनाया। शॉर्टकट है FN। अपने Mac पर कहीं से भी इसे दबाए रखें। बोलें। छोड़ें। आपके क्लिपबोर्ड में टेक्स्ट पहले ही साफ़ है, फ़िलर शब्द हटे हुए, ग्रामर ठीक, और वाक्य पूरे। बस पेस्ट करने के लिए तैयार।

ट्रांसक्रिप्शन वाला हिस्सा वह नहीं है जहाँ Voicr अलग है। असली काम ट्रांसक्रिप्शन और पेस्ट के बीच होता है। Voicr आपकी बोली को एक AI पॉलिशिंग लेयर से गुज़ारता है जो जानती है कि आप कोई ऑडियोबुक नहीं सुना रहे। आप बहक सकते हैं, फिर से शुरू कर सकते हैं, बीच वाक्य में मन बदल सकते हैं, और फिर भी आउटपुट ऐसा लगता है जैसे आपने सोच-समझकर लिखा हो। (अगर आप यह जानना चाहते हैं कि वह पाइपलाइन अंदर से कैसे काम करती है, हमने यहाँ समझाया है: Mac पर AI वॉइस डिक्टेशन कैसे काम करता है।)
"किसी भी ऐप" वाले वादे के लिए कुछ अहम बातें: - यह हर उस ऐप में काम करता है जिसमें टेक्स्ट फ़ील्ड है। Slack, Mail, Notes, Pages, ब्राउज़र टैब, कोड एडिटर, Notion। जहाँ भी आप पेस्ट कर सकते हैं, वहाँ डिक्टेट कर सकते हैं। - इसमें Smart Rules हैं जो टोन को सक्रिय ऐप के हिसाब से ढाल देते हैं। Slack के लिए कैज़ुअल, Mail के लिए औपचारिक, कोड एडिटर के लिए तकनीकी। आप नियम एक बार सेट करते हैं और ऐप अपने आप बदलता रहता है। - FN की दबाकर रखने वाली है, डबल-टैप नहीं। न कोई टाइमिंग का खेल, न दूसरी प्रेस। दबाएँ, बोलें, छोड़ें। - एक अलग Dictation Mode आपको बिना पॉलिशिंग के कच्चा, सही विराम चिह्नों वाला ट्रांसक्रिप्शन देता है, जब आपको सिर्फ़ ट्रांसक्रिप्ट चाहिए और कुछ नहीं।
अगर बिल्ट-इन डिक्टेशन फ़्लो आपको खीझ दिला रहा है, तो आमतौर पर पॉलिशिंग वाला चरण ही कम था। कीस्ट्रोक आधा वर्कफ़्लो है। दूसरा आधा वही है जो असल में आपके क्लिपबोर्ड में पहुँचता है।
वॉइस टाइपिंग को स्वाभाविक बनाने के टिप्स
एक बार शॉर्टकट सेट हो जाए, तो अगला बदलाव आपके दिमाग में है। ज़्यादातर लोग जो डिक्टेशन आज़माते हैं, इससे वैसे बात करते हैं जैसे फ़ोन से करते: धीरे, सावधानी से, एक-एक शब्द। यह ग़लत आदत है।
कुछ आदतें जो काम आती हैं: 1. पूरे विचार में बोलें, शब्दों में नहीं। शब्दों के बीच रुकें नहीं। विचारों के बीच रुकें। मॉडल अटकाहटों को आपकी सोच से बेहतर सँभाल लेता है। 2. विराम चिह्नों को हाथ से डिक्टेट करने की कोशिश न करें। "कॉमा", "फ़ुल स्टॉप" और "नया पैराग्राफ़" कहना बिल्ट-इन डिक्टेशन में चलता है लेकिन आपकी लय तोड़ देता है। आउटपुट सँवारने वाले टूल विराम चिह्न आपके लिए जोड़ देते हैं। 3. पहले ड्राफ़्ट के लिए इस्तेमाल करें, फ़ाइनल कॉपी के लिए नहीं। डिक्टेशन तब सबसे तेज़ है जब आप नतीजे को शुरुआती बिंदु मानें। की दबाएँ, शब्द बाहर निकालें, फिर पढ़ें और सुधारें। 4. अपनी लड़ाई चुनें। लंबे ईमेल, Slack मैसेज, Notion डॉक्स, जर्नल एंट्री वहाँ हैं जहाँ डिक्टेशन का फ़ायदा है। पासवर्ड, कोड और सटीक तकनीकी शब्द वहाँ हैं जहाँ टाइपिंग अब भी जीतती है। 5. अपना रिफ़्लेक्स तैयार करें। पहले हफ़्ते के लिए, ख़ुद को मजबूर करें कि दो वाक्यों से लंबी हर चीज़ के लिए शॉर्टकट इस्तेमाल करें। उसके बाद यह अपने आप होने लगेगा।
सबसे बड़ा बदलाव मानसिक है। आप वाक्यों को बोलने से पहले दिमाग में लिखना बंद कर देते हैं। आप ज़ोर से सोचते हैं, और टेक्स्ट पीछे-पीछे आता है।
हर चीज़ डिक्टेट करने का आपका पहला दिन
एक की चुनें। आज, अभी। System Settings → Keyboard → Dictation खोलें, Customize पर क्लिक करें, और कुछ ऐसा बाइंड करें जिसे आप बिना सोचे दबा सकें। अगर आपके पास है तो F13। अगर नहीं है, तो दाहिनी Option।
फिर वादा करें कि उसे किसी एक असली काम के लिए इस्तेमाल करेंगे। अगले तीन ईमेल का जवाब आवाज़ से दें। अगले पाँच Slack मैसेज आवाज़ से भेजें। अगला नोट आवाज़ से लिखें। ख़ुद को आउटपुट पर मत आँकें। बस ध्यान दें कि विचार आपके दिमाग से स्क्रीन तक कितनी तेज़ी से पहुँचता है।
अगर macOS डिक्टेशन आपका काम कर देता है, तो बात ख़त्म। अगर आप हर ट्रांसक्रिप्ट को भेजने से पहले एडिट करते रहते हैं, तो कीस्ट्रोक ने अपना काम कर दिया। आपकी अड़चन जगह बदल चुकी है। अब वह कच्ची बोली और तैयार लेखन के बीच का गैप है, और वही गैप Voicr पाटता है। FN दबाए रखें, स्वाभाविक बोलें, सँवरा हुआ टेक्स्ट पेस्ट करें। एक की, किसी भी ऐप में, बिना सफ़ाई के चरण के।
जो भी हो, जिस दिन आप सब कुछ टाइप करना बंद कर देते हैं, उसी दिन आप अपने हफ़्ते का एक असली हिस्सा वापस पा लेते हैं।

