ब्लॉग पर वापस जाएं

Voicr Team · 23 मई 2026

सोच और लिखाई के बीच की दूरी मिटाने के लिए मैं AI का इस्तेमाल कैसे करता हूँ

एक पहले-पुरुष नज़रिया उस AI वर्कफ़्लो पर जिसने आख़िरकार मेरे दिमाग़ की बात को सोचने की रफ़्तार के क़रीब काग़ज़ पर उतारना संभव कर दिया।

सोच और लिखाई के बीच की दूरी मिटाने के लिए मैं AI का इस्तेमाल कैसे करता हूँ

ज़्यादातर सुबहें मैं अपना लैपटॉप इस साफ़ ख़्याल के साथ खोलता हूँ कि मुझे क्या लिखना है। पहली ईमेल तो दिमाग़ में पहले ही ड्राफ़्ट हो चुकी होती है। जब तक मेरी उँगलियाँ कीबोर्ड तक पहुँचती हैं, उसका आधा हिस्सा फिसल चुका होता है। मैं जो याद रहता है उसे टाइप करता हूँ, स्क्रीन पर ताकता हूँ, और बाक़ी हिस्सा वापस याद करने की कोशिश करता हूँ।

जो जगह आपके मन की बात और काग़ज़ पर उतरी हुई बात के बीच होती है, उसी को मैं ‘दूरी’ कह रहा हूँ। बरसों तक मैंने इसे लिखने का हिस्सा माना। यह लिखने का हिस्सा नहीं है। यह औज़ार की क़ीमत है। AI पहली ऐसी चीज़ है जिसने वाक़ई इसे मेरे लिए छोटा किया है।

यह पहले-पुरुष नज़रिया है। न लिस्टिकल, न टूल राउंडअप। बस वह वर्कफ़्लो जिस पर मैं पिछले एक साल में जम गया हूँ, उसमें जो काम करता है वह भी, और जो अब भी नहीं करता वह भी।

वह रफ़्तार की समस्या जिसकी कोई बात नहीं करता

आँकड़े समझा देते हैं कि यह दूरी क्यों मौजूद है। एक सामान्य डेस्कटॉप टाइपिस्ट लगभग 40 शब्द प्रति मिनट की रफ़्तार से चलता है। तेज़ पेशेवर 60 या 70 तक पहुँच जाते हैं। बातचीत की रफ़्तार बिना कोशिश किए लगभग 150 wpm रहती है। मन में बोलने वाली आवाज़, यानी जब आप एक वाक्य गढ़ते हैं तब दिमाग़ के अंदर चलने वाली ज़ुबान, इससे भी तेज़ चलती है, ऊँचे अनुमानों के हिसाब से क़रीब 300 wpm तक।

तो मोटा-मोटा अनुपात यह है: सोच 300 पर, बोलना 150 पर, टाइप करना 40 पर। टाइप करना इस पूरी कड़ी का सबसे धीमा हिस्सा है, और काफ़ी बड़े अंतर से। जो भी इंतज़ार आपको करना पड़े वह घर्षण है, और घर्षण ही वह जगह है जहाँ से विचार रिसते हैं।

मेरे लिए जो बदला वह टाइपिंग नहीं थी। मैं कीबोर्ड पर तेज़ नहीं हुआ। बदलाव यह था कि अड़चन की जगह बदल गई। मैंने टाइपिंग की रफ़्तार पर लिखने की कोशिश छोड़ दी और ख़ुद को बोलने की रफ़्तार पर लिखने देना शुरू कर दिया, और बैकग्राउंड में AI सफ़ाई का काम कर रहा था।

टाइपिंग कैसे चुपचाप आपको छोटा बना देती है

टाइपिंग की क़ीमत सिर्फ़ रफ़्तार नहीं है। दिक़्क़त यह है कि आप विचार को इस अड़चन में फ़िट करने के लिए छाँटने लगते हैं। आप छोटा वाला वर्ज़न लिखते हैं। बारीकियाँ छोड़ देते हैं। उदाहरण काट देते हैं। आप ‘सेंड’ दबाते हैं और थोड़ा झूठा सा महसूस करते हैं कि संदेश कितना सपाट निकला।

यह मुझे सबसे ज़्यादा Slack में महसूस होता था। मैं सोच-समझकर जवाब टाइप करना शुरू करता, कर्सर वहीं रुका रहता जब तक मैं वाक्य को दिमाग़ में दोबारा गढ़ता, फिर सब कुछ डिलीट कर देता और तीन शब्द भेज देता। “Sounds good.” “Got it.” “On it.” बहुत सी कामकाज की बातें वहीं ख़त्म हो जातीं, इसलिए नहीं कि मेरे पास कहने को कुछ नहीं था, बल्कि इसलिए कि उसे टाइप करने की क़ीमत उसके फ़ायदे से ज़्यादा थी।

जैसे ही मैंने वे जवाब टाइप करना बंद किया और बोलकर भेजना शुरू किया, मेरे संदेश लंबे, गर्मजोशी भरे और साफ़ हो गए। वही दिमाग़। बस आउटपुट का रास्ता बदला।

दूरी मिटने पर असल में कैसा लगता है

एक मंगलवार सुबह का दृश्य लीजिए। एक क्लाइंट ईमेल भेजता है कि प्रोजेक्ट पीछे क्यों है। असली जवाब है: कुछ हमारे स्कोप बदलाव, कुछ उनकी देर से मिली मंज़ूरी, कुछ एक छुट्टियों वाला हफ़्ता। यह कोई एक-पंक्ति वाला जवाब नहीं है। यह तीन पैराग्राफ़ हैं जिन्हें सधा हुआ रहना है पर बहाना भी नहीं लगना चाहिए।

पुराना मैं रिप्लाई खोलता, पहला वाक्य दो बार टाइप करता, मिटाता, और पंद्रह मिनट लगाकर चार शाइस्ता पैराग्राफ़ बनाता जो वैसे भी ठीक से वह नहीं कहते जो मेरा मतलब था।

अब वाला मैं एक बटन दबाए रखता हूँ, नब्बे सेकंड बोलता हूँ, बटन छोड़ देता हूँ। जवाब ईमेल में पहले से बैठा होता है, पैराग्राफ़ बँट चुके होते हैं, भरने वाले शब्द हट चुके होते हैं। मैं एक बार पढ़ता हूँ, एक वाक्यांश सुधारता हूँ, और भेज देता हूँ। पंद्रह की जगह दो मिनट में ईमेल तैयार, और वह उससे ज़्यादा क़रीब है जो मैं वाक़ई कहना चाहता था, क्योंकि मुझे विचार को टाइप करने की रफ़्तार में दबाना नहीं पड़ा।

बाईं ओर एक बिखरा हुआ स्पीच बबल जिसे AI दाईं ओर एक साफ़, सजी-सँवरी ईमेल में बदल देता है

जब पहली बार यह कारगर हुआ, मैं वहीं थोड़ी देर के लिए सुन्न रह गया। इसलिए नहीं कि तकनीक जादू है। वह जादू नहीं है। वजह सीधी थी: जिस घर्षण को मैंने लिखने का हिस्सा मान रखा था, वह अचानक वैकल्पिक हो गया था।

वे दो AI परतें जिन्होंने सब बदल दिया

मुझे यह समझने में थोड़ा वक़्त लगा कि मेरे वर्कफ़्लो में दो AI परतें हैं, और दोनों काम कर रही हैं। लोग या तो एक की बात करते हैं या दूसरी की; दोनों की बात कम ही होती है।

परत 1: आवाज़ अंदर, साफ़ टेक्स्ट बाहर

पहली परत है AI पॉलिशिंग के साथ वॉइस डिक्टेशन। मैं एक बटन दबाए रखता हूँ, सामान्य ढंग से बोलता हूँ (“उम्म”, बीच में रुक-रुक कर शुरू करना, अधूरे वाक्य और सब कुछ), और जो टेक्स्ट क्लिपबोर्ड में आता है वह पहले से ही साफ़ हो चुका होता है। भरने वाले शब्द हटे हुए। व्याकरण ठीक। लगातार चलती लंबी पंक्तियाँ असली पैराग्राफ़ों में बँटी हुई।

यह बिल्ट-इन डिक्टेशन जैसी चीज़ नहीं है। Apple Dictation आपको कच्चा ट्रांसक्रिप्ट देता है, उसमें “उम्म” तक मौजूद रहते हैं। AI पॉलिशिंग ट्रांसक्रिप्ट को नए सिरे से लिखती है पर आपका मतलब क़ायम रखती है। यह फ़र्क़ ठीक वैसा है जैसा रिकॉर्डिंग और ड्राफ़्ट के बीच होता है।

परत 2: टेक्स्ट अंदर, बेहतर टेक्स्ट बाहर

दूसरी परत है जगह पर ही टेक्स्ट सुधार। मैं कुछ चुनता हूँ जो पहले से लिखा है (एक पैराग्राफ़, एक वाक्य, पूरी ईमेल), एक शॉर्टकट दबाता हूँ, “इसे और छोटा करो” या “लहजा नरम करो” जैसा प्रॉम्प्ट चुनता हूँ, और चुना हुआ हिस्सा वहीं नया रूप ले लेता है। न टैब बदलना, न किसी चैटबॉट में कॉपी-पेस्ट। जो टेक्स्ट था उसकी जगह उसका बेहतर वर्ज़न आ जाता है।

वॉइस डिक्टेशन विचार को तेज़ी से काग़ज़ पर उतार देती है। जगह पर सुधार आख़िरी दस फ़ीसदी की चमक संभाल लेता है। दोनों मिलकर बोलने की रफ़्तार पर लिखने के उतने क़रीब पहुँच जाते हैं जितने अकेले-अकेले नहीं पहुँच सकते।

जो रोज़ का वर्कफ़्लो मैं सच में चलाता हूँ

यह रहा एक औसत दिन का असली रूप। यह कुछ हवाई बात नहीं है। यह वह आकार है जो आज मेरी लिखाई ने ले लिया है।

सुबह का इनबॉक्स। मैं हर ईमेल पढ़ता हूँ, फिर जवाब डिक्टेट करता हूँ। ज़्यादातर एक पैराग्राफ़ के होते हैं। कुछ लंबे। टाइप शायद ही कोई होता है। जो पूरा बैच पहले मेरा पहला घंटा खा जाता था, अब क़रीब बीस मिनट में निपट जाता है।

दिनभर Slack। छोटे जवाब अब भी टाइप होते हैं, क्योंकि उनमें घर्षण कम है और दिमाग़ी मेहनत भी थोड़ी। जिस भी जवाब को दो वाक्यों से ज़्यादा चाहिए, वह बोला जाता है। लहजा अपने आप अनौपचारिक हो जाता है क्योंकि Slack में मैं वैसे ही बात करता हूँ।

दस्तावेज़ और नोट्स। पहले ड्राफ़्ट लगभग हमेशा डिक्टेट होते हैं। मैं एक ख़ाली डॉक खोलता हूँ, जिस भी विषय पर लिखना है उस पर पाँच-दस मिनट बोलता हूँ, और मेरे पास एक असली ड्राफ़्ट होता है जिस पर काम किया जा सके। ड्राफ़्ट संपादित करना उसे शुरू करने से कहीं तेज़ है, और सोच और लिखाई के बीच की दूरी सबसे ज़्यादा ख़ाली पन्ने पर ही होती है।

संपादन का दौर। यहीं दूसरी परत अपनी जगह कमाती है। जो वाक्य अटके-अटके लगते हैं, मैं उन्हें चुनकर कसा हुआ वर्ज़न माँगता हूँ। जो पैराग्राफ़ बहुत अकड़े हुए लगते हैं, उनके लिए ज़्यादा गर्मजोशी वाला रूप माँगता हूँ। हर सुधार में दो सेकंड लगते हैं, वहीं की वहीं, बिना ऐप बदले।

एक चीज़ ने मुझे हैरान किया: अब मैं कुल मिलाकर कम नहीं, ज़्यादा शब्द लिखता हूँ। AI ने मेरा आउटपुट कम नहीं किया। इसने काम का वह हिस्सा हटा दिया जो सिर्फ़ कीबोर्ड पर ठोकने का टैक्स था।

अगर आप इसी बात का ईमेल वाला पहलू थोड़ा क़रीब से देखना चाहते हैं, तो मैंने उस पर Mac पर ईमेल डिक्टेट करना में और गहराई से लिखा है।

वह एक सेटिंग जिसने यह सब चलाने लायक बना दिया

एक सेटिंग है जिसे शुरू में मैं लगभग छोड़ने वाला था, और बाद में वही पता चला कि असली चीज़ है जो इस वर्कफ़्लो को रोज़मर्रा में टिकने लायक बनाती है: हर ऐप के लिए अलग लेखन शैली।

Slack और ईमेल को एक जैसा लहजा नहीं चाहिए। एक औपचारिक कवर लेटर को Notion के दिमाग़ी मंथन जैसा लहजा नहीं चाहिए। अगर AI पॉलिश सब कुछ एक ही आवाज़ में सपाट कर दे, तो आउटपुट तेज़ ज़रूर होगा पर बदतर हो जाएगा, और आप उस पर भरोसा करना बंद कर देंगे।

ठीक इसी वजह से Voicr में Smart Rules हैं। आप Slack के लिए अनौपचारिक लहजा सेट करते हैं, Mail के लिए थोड़ा औपचारिक, और टर्मिनल के लिए नंगा-सीधा। Voicr ख़ुद ही समझ लेता है कि अभी कौन-सा ऐप चालू है और सही शैली लगा देता है, आपको कुछ नहीं करना पड़ता। मैं हर ऐप में एक ही तरह बोलता हूँ; आउटपुट ख़ुद को ढाल लेता है। यही वह तरकीब थी जिसने मुझे “ज़रूरी” संदेशों के लिए कीबोर्ड पर लौटने से रोक दिया।

जहाँ कच्ची डिक्टेशन हाथ छुड़ा देती है (और पॉलिश आपको बचा लेती है)

कच्ची डिक्टेशन की एक ख़ास नाकामी है, जिसे हर वह आदमी पहचान लेगा जिसने इसे आज़माया है। आप एक पैराग्राफ़ बोलते हैं। ट्रांसक्रिप्ट वापस आता है, उसमें हर “उम्म” सुरक्षित, आपकी दो शुरुआतें आपस में जोड़ी हुई, और एक वाक्य जो चालीस शब्दों तक चलता गया क्योंकि आप कहीं रुके नहीं।

आप उसे संपादित कर सकते हैं। पर कच्चा ट्रांसक्रिप्ट संपादित करना अपने आप में एक काम है, और कई बार उसे साफ़ टाइप करने से भी धीमा निकलता है। यही वजह है कि बिल्ट-इन डिक्टेशन आज़माने वाले ज़्यादातर लोग हफ़्ते भर में हार मान लेते हैं।

पॉलिशिंग पूरा गणित बदल देती है। जब AI भरने वाले शब्द हटा देता है, व्याकरण सुधार देता है, और बहती हुई बातचीत को पैराग्राफ़ों में तोड़ देता है, तो जो निकलकर आता है वह ऐसा होता है जिसे मैं बिना दोबारा लिखे भेज दूँगा। डिक्टेशन का क़दम ड्राफ़्ट-शून्य नहीं रहता, वह क़रीब-क़रीब आख़िरी ड्राफ़्ट बन जाता है।

यह वह हिस्सा है जिसे प्रतिस्पर्धी लेख अक्सर लापरवाही से छू-छाकर निकल जाते हैं। टाइपिंग के मुक़ाबले बोलने का रफ़्तार वाला फ़ायदा सच में है, पर वह तभी काम का है जब आप उसे सफ़ाई के समय में लौटाकर न चुका दें।

ईमानदार समझौते

सब कुछ एकतरफ़ा जीत नहीं है। कुछ चीज़ें अब भी टाइप करने में बेहतर हैं:

- बहुत तकनीकी टेक्स्ट जिसमें कोड, कमांड के नाम या प्रोडक्ट SKU हों। डिक्टेशन शब्द तो पकड़ लेती है; पर चिह्न हमेशा सही नहीं आते। कोड मैं अब भी टाइप करता हूँ। - शोरगुल वाली जगहें। कैफ़े, हवाई जहाज़, साझा दफ़्तर। शांत कमरे में लैपटॉप से बोलना ठीक है। किसी के कॉल पर होते हुए उसके बगल बैठकर बोलना ठीक नहीं। - दूसरे लोगों के बीच संवेदनशील विषय। ब्रेकअप ईमेल या किसी को सख़्त फ़ीडबैक देने वाला नोट मैं ऐसी जगह ज़ोर से नहीं बोलूँगा जहाँ कोई सुन ले; टाइप करना बेहतर है। - गहरी संपादन। जब दस्तावेज़ क़रीब-क़रीब तैयार हो जाता है, मैं छोटे-छोटे सर्जिकल बदलाव कीबोर्ड से ही करना पसंद करता हूँ। आवाज़ चीज़ें पन्ने पर लाने के लिए है, अल्पविरामों को इधर-उधर खिसकाने के लिए नहीं।

कब वापस कीबोर्ड पर लौटना है, यह जानना भी इस वर्कफ़्लो का हिस्सा है। कीबोर्ड कहीं ग़ायब नहीं हुआ। बस अब वह पहली पसंद नहीं रहा।

इसने मेरे लिए असल में क्या बदला

सच्चा जवाब यह नहीं है कि “मैं अब चार गुना ज़्यादा कंटेंट निकालता हूँ।” यह उससे छोटा और अजीब है।

मैं Slack पर लंबे जवाब भेजता हूँ क्योंकि उन्हें लिखने की क़ीमत गिर गई है। मैं कम अधूरे नोट्स छोड़ता हूँ क्योंकि एक पूरी सोच डिक्टेट करना एक टुकड़ा टाइप करने से तेज़ है। मैं पहले ड्राफ़्ट उसी दिन लिख देता हूँ जिस दिन ख़याल आता है, बजाय किसी “तसल्ली से बैठने वाले” वक़्त के लिए बचाकर रखने के, जो अक्सर आता ही नहीं। एक विचार आने और उसका ड्राफ़्ट हाथ में होने के बीच का फ़ासला दिनों से सिमटकर मिनटों में आ गया है।

यही वह बात है जो रफ़्तार वाले आँकड़े नहीं पकड़ पाते। असली सवाल यह है कि क्या लिखने की क्रिया इतनी सस्ती हो गई है कि आप जब चाहें कर सकें, न कि उसे किसी ‘फ़ोकस ब्लॉक’ के लिए बचाकर रखें जो अक्सर कभी नहीं आता।

इसे आज ही कैसे आज़माएँ

अगर आप यह जाँचना चाहते हैं कि यह आपके लिए काम करता है या नहीं, अपना पूरा वर्कफ़्लो नए सिरे से डिज़ाइन करने मत बैठिए। एक छोटा-सा हिस्सा चुनिए।

1. अपनी अगली ऐसी ईमेल पर हाथ रखिए जिसके जवाब को दो वाक्यों से ज़्यादा चाहिए। 2. टाइप करने के बजाय डिक्टेशन की कुंजी दबाए रखिए और जो कहना है कह दीजिए। पहले से तय करके मत बोलिए। बस बोलिए। 3. कुंजी छोड़िए और जो टेक्स्ट उस फ़ील्ड में आया है उसे पढ़िए। 4. अगर वह उससे क़रीब है जो आप कहना चाहते थे, तो एक-दो वाक्यांश जो सही नहीं हैं उन्हें ठीक कीजिए और भेज दीजिए।

इसे पाँच बार दोहराइए। पहले दिन के ख़त्म होने तक आपको पता चल जाएगा कि जिस ‘दूरी’ की मैं बात कर रहा हूँ, वह आपकी भी दूरी है या नहीं।

अगर आप यह सब टुकड़े-टुकड़े जोड़े बिना सीधे ऊपर वाला वर्कफ़्लो चाहते हैं, तो Voicr वही ऐप है जो मैं इस्तेमाल करता हूँ। FN दबाइए, बोलिए, पेस्ट कीजिए। आउटपुट साफ़-सुथरा होता है, लहजा उसी ऐप के मुताबिक़ ढल जाता है जिसमें आप हैं, और टेक्स्ट चुनकर ⌥Space दबाने पर आपको दूसरे दौर के लिए जगह-पर-सुधार मिल जाते हैं। महीने के पाँच हज़ार शब्द Free हैं, अगर आप बस यह देखना चाहते हैं कि आपको जमता है या नहीं।

कीबोर्ड कहीं नहीं जा रहा। पर बीस साल में पहली बार, कंप्यूटर पर लिखते हुए, वह वह अड़चन नहीं है जिसके इर्द-गिर्द मुझे अपनी योजना बनानी पड़े।