पिछले मंगलवार मैंने ख़ुद को अपनी टीम के लिए एक चार-पैराग्राफ़ का Slack अपडेट टाइप करते हुए पकड़ा। जब मैंने ख़त्म किया, तो टाइमस्टैम्प देखा। उस मैसेज को लिखने में आठ मिनट लगे थे।
जिस चीज़ को मैं नब्बे सेकंड में बोल सकता था, उसके लिए आठ मिनट। और वो कोई मुश्किल मैसेज भी नहीं था। बस तीन खुले सवालों के साथ एक प्रोजेक्ट स्टेटस अपडेट था।
एक औसत इंसान करीब 40 शब्द प्रति मिनट टाइप करता है। एक औसत इंसान करीब 150 शब्द प्रति मिनट *बोलता* है। यह 3.75 गुना का फ़र्क है, और हम में से ज़्यादातर लोग अपने वर्कडे का बड़ा हिस्सा इसकी धीमी तरफ़ बिताते हैं। मुझे एक ऐसा डिक्टेशन वर्कफ़्लो चाहिए था जो वाकई समय बचाए, न कि एक ऐसा जो टाइपिंग से ज़्यादा क्लीनअप का काम बना दे।
"बस सब कुछ डिक्टेट कर लो" क्यों काम नहीं करता
पहली कोशिश सबसे आम थी। मैंने macOS Dictation चालू किया और एक पूरा ईमेल बोलकर रिकॉर्ड किया। जो मिला वो था जुड़े हुए लंबे वाक्यों का पैराग्राफ़, गायब विराम-चिह्न, और तीन "उम्म" जो मुझे याद भी नहीं था कि मैंने बोले थे। फिर मैंने छह मिनट उसे एडिट करने में लगाए।
यही जाल है जिसमें ज़्यादातर लोग फँसते हैं। आप एक बार डिक्टेशन ट्राय करते हैं, कच्चा आउटपुट देखते हैं, और तय कर लेते हैं कि यह बेकार है। गणित तभी काम करता है जब बाद में सफ़ाई न करनी पड़े।
इससे बचने के दो रास्ते हैं। पहला है धीरे बोलना, साफ़ उच्चारण करना, और बोलकर ही विराम-चिह्न डालना। काम चल जाता है, लेकिन आप किसी स्क्रिप्ट पढ़ते रोबोट जैसे लगते हैं। दूसरा है कोई ऐसा टूल इस्तेमाल करना जो आपकी बात को अपने आप साफ़ कर दे। मैंने दूसरा रास्ता चुना। अगर आप साथ-साथ तुलना देखना चाहें, तो मैंने इसके बारे में Voicr और Apple के बिल्ट-इन डिक्टेशन की तुलना में लिखा है।
तीन श्रेणियाँ जिनमें मैंने अपनी लिखाई बाँटी
दो हफ़्तों की टेस्टिंग के बाद, मुझे एहसास हुआ कि मेरी लिखाई तीन बकेट्स में आती है। कामों को सही बकेट में डालना ही वो वजह थी जिससे यह वर्कफ़्लो असल में समय बचाने लगा।
सिर्फ़ आवाज़। लंबा सोच-विचार। Slack अपडेट, स्टेटस रिपोर्ट, ब्रेनस्टॉर्म नोट्स, प्रोजेक्ट रीकैप, ब्लॉग के पहले ड्राफ़्ट। ये आपकी ज़ुबान से कीबोर्ड के मुक़ाबले कहीं तेज़ निकलते हैं। सबसे मुश्किल हिस्सा है अपने आप को लैपटॉप से बात करते सुनने की आदत डालना।
हाइब्रिड। ईमेल, जवाब, और हर वो चीज़ जिसकी एक तय बनावट होती है। मैं बॉडी डिक्टेट करता हूँ, फिर कीबोर्ड पर लौटकर पहली लाइन सुधारता हूँ, गलत पहचाने गए नाम ठीक करता हूँ, या किसी पैराग्राफ़ की जगह बदलता हूँ। आवाज़ 80% काम संभालती है, उँगलियाँ बाक़ी 20%।
सिर्फ़ कीबोर्ड। दस शब्दों से कम के छोटे जवाब। कोड। नंबर, पते, और कोई भी सटीक चीज़। पासवर्ड। एक सीमा के नीचे बोलना टाइप करने से धीमा होता है।

मेरा रोज़ का डिक्टेशन वर्कफ़्लो, कदम-दर-कदम
यह रहा एक औसत सुबह का नज़ारा।
8:30, इनबॉक्स ट्रायाज। मैं ईमेल पर नज़र दौड़ाता हूँ और एक-लाइन के जवाबों के लिए कीबोर्ड इस्तेमाल करता हूँ ("ठीक है," "शुक्रवार तक हो जाएगा")। दो पैराग्राफ़ या उससे लंबी किसी भी चीज़ के लिए, मैं एक की दबाए रखता हूँ, जवाब बोलता हूँ, छोड़ता हूँ, पेस्ट कर देता हूँ। ज़्यादातर जवाब 20 से 30 सेकंड में हो जाते हैं। अगर आप पूरा वर्ज़न चाहें तो मैंने अपने ईमेल सेटअप पर Mac पर ईमेल डिक्टेट करने वाली इस पोस्ट में पूरी बात लिखी है।
9:30, Slack कैच-अप। वही रूटीन। छोटे रिएक्शन टाइप होते हैं। लंबी बातें या स्टेटस अपडेट डिक्टेट होते हैं। पॉलिश किया हुआ आउटपुट 5 से 10 सेकंड में मैसेज फ़ील्ड में आ जाता है। एक Slack के लिए ख़ास गाइड यहाँ है।
10:30, राइटिंग ब्लॉक। यहीं सबसे बड़ी जीत मिलती है। चाहे मैं कोई डॉक तैयार कर रहा हूँ, कोई ब्रीफ़, या किसी मीटिंग के नोट्स, मैं पहला पास बोलकर निकालता हूँ। आउटपुट अंतिम नहीं होता। यह एक 70% का ड्राफ़्ट होता है जिसे मैं एडिट कर सकता हूँ। लेकिन जो वरना 25 मिनट लेता, उसे बनाने में मुझे 8 मिनट लगते हैं।
इसके लिए मैं जो टूल इस्तेमाल करता हूँ वो है Voicr। एक की (मैं FN इस्तेमाल करता हूँ), बोलिए, छोड़िए। टेक्स्ट पॉलिश हो जाता है। न भरने वाले शब्द, न बहती लाइनें, न कोई "अं"। यह मेरे क्लिपबोर्ड पर पेस्ट करने के लिए तैयार आ जाता है। यह इस बात के हिसाब से भी ढल जाता है कि मैं किस ऐप में हूँ: Slack में आम लहजा, ईमेल में औपचारिक लहजा, डॉक्स में सादा टेक्स्ट। कोई मोड बदलने की ज़रूरत नहीं।

वो पाँच आदतें जिनसे डिक्टेशन वाकई आदत बन गई
कोई भी नया वर्कफ़्लो अपनाने में थोड़ी मेहनत लगती है। ये पाँच आदतें वो हैं जिनसे मैं "कभी-कभी ट्राय कर लूँगा" से "बिना सोचे ऐसा ही करता हूँ" तक पहुँचा।
1. एक ही की शॉर्टकट सेट करें। अगर आपके डिक्टेशन टूल को आपसे किसी मेन्यू पर क्लिक करवाना पड़े, कोई ऐप खुलवानी पड़े, या किसी विंडो से जूझना पड़े, तो आप एक हफ़्ते के अंदर इसे छोड़ देंगे। कोई ऐसा चुनें जिसमें ग्लोबल हॉटकी हो। एक प्रेस, एक रिलीज़।
**2. *पहला* ड्राफ़्ट डिक्टेट करें, एडिट बाद में।** पॉलिश की हुई चीज़ डिक्टेट करने की कोशिश न करें। कच्चा वर्ज़न जल्दी बाहर निकालें, फिर ठीक करें। "बोलते-बोलते एडिट करने" की आदत स्पीड का सारा फ़ायदा खा जाती है।
3. उन्हीं ऐप्स में इस्तेमाल करें जिनमें आप पहले से रहते हैं। एक ही ऐप में चलने वाला डिक्टेशन बेकार है। मेरा वाला Slack, Gmail, Notion, VS Code कमेंट्स, Apple Notes में, और जहाँ भी कर्सर हो, सब जगह चलता है।
4. अपने डिक्टेशन टूल से माफ़ी न माँगें। अगर आप बीच में "माफ़ कीजिए, इसे दूसरे शब्दों में कहता हूँ" कहना शुरू कर देते हैं, तो वह आपके टेक्स्ट में आ जाता है। बस आगे बढ़ते रहें। ऐसे सोचिए कि आप किसी दोस्त के लिए वॉयस नोट रिकॉर्ड कर रहे हैं।
5. पॉलिश पर भरोसा करें। सबसे बड़ा मानसिक बदलाव है "हर शब्द पर मेरा क़ाबू होना चाहिए" वाली सोच छोड़ देना। एक बार जब आप टूल पर भरोसा कर लेते हैं कि वह आपकी बात साफ़ कर देगा, तो आप बीच वाक्य में रुकना बंद कर देते हैं, और असली स्पीड वहीं से आती है।
मैं अब भी क्या डिक्टेट नहीं करता (और क्यों नहीं)
ईमानदार सीमाएँ ही बाकी वर्कफ़्लो को भरोसेमंद बनाती हैं।
मैं कोड डिक्टेट नहीं करता। कोशिश की थी। यह कमेंट्स और कमिट मैसेज के लिए चलता है, असली कोड के लिए नहीं। आप सिंबल के नाम सुधारने में जितना समय लगाते हैं, उससे ज़्यादा बचाते नहीं।
मैं भरी हुई जगहों में संवेदनशील बातें ज़ोर से नहीं बोलता। कॉफ़ी शॉप, खुले ऑफ़िस, हवाई जहाज़। उसे कीबोर्ड पर ही रखें या अकेले होने का इंतज़ार करें।
मैं छोटे मैसेज डिक्टेट नहीं करता। "धन्यवाद!" टाइप करना ज़्यादा तेज़ है। "रास्ते में हूँ" भी। अगर कुछ करीब 8 शब्दों से कम का है, तो कीबोर्ड जीतता है।
मैं ऐसी कोई भी चीज़ डिक्टेट नहीं करता जो पहली बार में ही परफ़ेक्ट होनी हो। कानूनी टेक्स्ट, कॉन्ट्रैक्ट, या ऐसी चीज़ें जो बिना दोबारा देखे क्लाइंट को जातीं हैं। पॉलिश अच्छी है, बेदाग़ नहीं।
असली गणित: वो 2 घंटे कहाँ से आते हैं
हिसाब-किताब दिखा देता हूँ।
एक आम हफ़्ते में, मैं ईमेल, मैसेज, डॉक्स, और नोट्स मिलाकर करीब 25,000 शब्द लिखता हूँ। 40 WPM की टाइपिंग पर, यह लगभग 10.4 घंटे है। पॉलिशिंग के बाद करीब 110 असरदार WPM की वास्तविक डिक्टेशन रफ़्तार पर, उतनी ही मात्रा में करीब 3.8 घंटे लगते हैं।
कच्चा फ़र्क 6.5 घंटे का है। लेकिन मैं सब कुछ डिक्टेट नहीं करता। मेरी करीब 30% लिखाई कीबोर्ड पर ही रहती है (छोटे जवाब, कोड, सटीक इनपुट)। तो असली बचत हफ़्ते में मोटे तौर पर 2 घंटे की निकलती है। यह 12-घंटे वाले उन दावों के मुक़ाबले मामूली है जो आपको इधर-उधर तैरते मिल जाएँगे। फिर भी साल में 100+ घंटे बन ही जाते हैं।
तीन पूरे वर्कडे जो मुझे वापस मिलते हैं। एक बार सेट कर लेने के बाद मुफ़्त चलने वाली आदत के लिए बुरा सौदा नहीं।
इस डिक्टेशन वर्कफ़्लो को एक हफ़्ते आज़माइए
यह रहा प्रयोग। अगले पाँच वर्कडेज़ तक, तीन वाक्यों से लंबा कोई भी मैसेज डिक्टेट कीजिए। ईमेल के जवाब, Slack अपडेट, डॉक के ड्राफ़्ट, मीटिंग नोट्स। बाकी सब छोटा, कीबोर्ड पर रखिए। हफ़्ते के आख़िर में देखिए कि आपने ड्राफ़्ट-और-दोबारा-लिखने के कितने चक्कर बचाए।
अगर आप कोई ऐसा टूल चाहते हैं जो पॉलिशिंग का काम अपने आप कर दे, ताकि आपकी बात बिना किसी क्लीनअप पास के साफ़, भेजने लायक टेक्स्ट बनकर आए, तो Voicr Mac पर यही करता है। FN दबाइए, बोलिए, पेस्ट कीजिए। हर महीने पहले 5,000 शब्द मुफ़्त, कोई क्रेडिट कार्ड नहीं।
या फिर macOS के बिल्ट-इन Dictation से शुरू कीजिए, अगर आप किसी भी टूल पर पैसे लगाने से पहले आदत आज़माना चाहते हैं। बस तैयार रहिए कि हर पास में थोड़ा अतिरिक्त एडिटिंग समय लगेगा। बात यह नहीं है कि आप कौन-सा टूल चुनते हैं। बात यह है कि क्या आप अपनी उँगलियों से वो काम करवाते रहेंगे जो आपकी आवाज़ ज़्यादा तेज़ी से कर सकती है।

