एक वाक्य ज़ोर से बोलिए: "hey can you send me the latest numbers when you get a sec." यह कहाँ जा रहा है, इसी से तय होता है कि इसे क्या बनना चाहिए। इसे Slack में डालिए, यह वैसे ही ठीक है। किसी क्लाइंट को भेजी ईमेल में रखिए, तो इसमें अभिवादन और थोड़ी नरम माँग चाहिए। इसे Jira कमेंट के रूप में दर्ज कीजिए, तो यह सिकुड़कर तीन शब्द रह जाना चाहिए: "Need latest numbers."
यह तालमेल आप बिना सोचे-समझे कर लेते हैं। आपका दिमाग़ माहौल पढ़ लेता है, कौन-सा ऐप, कौन-सा व्यक्ति, कितनी औपचारिकता, और बाहर निकलते वक़्त शब्दों को नए सिरे से ढाल देता है। कॉन्टेक्स्ट-अवेयर AI ठीक यही काम, अपने आप, उस बोली पर करता है जो आप डिक्टेट करते हैं।
अभी इसकी परवाह करना इसलिए ज़रूरी है क्योंकि डिक्टेशन आख़िरकार अच्छा हो गया है। आप लगभग 150 शब्द प्रति मिनट की रफ़्तार से बोल सकते हैं, यानी ज़्यादातर लोग जिस 40 शब्द प्रति मिनट की रफ़्तार से टाइप करते हैं उससे तीन से चार गुना तेज़। लेकिन कच्ची बोली किसी एक ऐप की लिखने की चाह से मेल नहीं खाती। यह दोबारा लिखने वाली परत ही उस फ़ासले को पाटती है।
एक वाक्य, छह अलग संदेश
बोली रजिस्टर-निरपेक्ष होती है। जब आप बात करते हैं, तो कोई फ़ॉर्मैट नहीं चुनते। आप बस बात कह देते हैं, और फ़ॉर्मैट बाद में आप ख़ुद जोड़ते हैं, जब तय करते हैं कि यह कहाँ जाएगी।
लिखना उल्टी दिशा में काम करता है। आप जिस भी ऐप में टाइप करते हैं, उसके अपने ख़ामोश नियम होते हैं कि टेक्स्ट कैसा दिखना और सुनाई देना चाहिए।
नंबरों की वही माँग लीजिए और देखिए कि विंडो के हिसाब से यह कैसे रूप बदलती है: - Slack: "Hey, can you send the latest numbers when you get a sec?" - ईमेल: "Hi Maria, when you have a moment, could you send over the latest numbers? Thanks!" - Jira: "Need the latest numbers." - ख़ुद के लिए नोट: "Pending: latest numbers from Maria." - सहकर्मी को टेक्स्ट: "can u send the latest numbers?"
मंशा हर बार वही। पाँच जगहें, पाँच अलग सही जवाब। आप इन सबको माँग पर पहले ही तैयार कर लेते हैं। पेच यह है कि हर एक में आपको एक छोटा-सा फिर-से-ढालना झेलना पड़ता है जिसका आपको शायद ही एहसास होता है, और यह लगातार होता रहता है। एक Harvard Business Review अध्ययन ने पाया कि कर्मचारी दिन में करीब 1,200 बार ऐप्स के बीच आते-जाते हैं, यानी हर 24 सेकंड में लगभग एक बार। इनमें से कई स्विच के साथ एक नई लेखन शैली भी जुड़ी होती है।
ट्रांसक्रिप्शन बनाम कॉन्टेक्स्ट-अवेयर रीराइटिंग
दो कामों को अलग करके देखना मददगार है जिन्हें आमतौर पर एक ही समझ लिया जाता है। ट्रांसक्रिप्शन आवाज़ को शब्दों में बदलता है। कॉन्टेक्स्ट-अवेयर रीराइटिंग उन शब्दों को उस सही संदेश में बदलती है जो वे जहाँ जा रहे हैं वहाँ के लिए ठीक हो।
सादा ट्रांसक्रिप्शन पहले ही चरण पर रुक जाता है। Apple का बिल्ट-इन डिक्टेशन, ज़्यादातर स्पीच-टू-टेक्स्ट टूल, आपके फ़ोन के लाइव कैप्शन, ये आपको हू-ब-हू वही रिकॉर्ड थमा देते हैं जो आपने कहा था, फ़िलर और अधूरी शुरुआतों समेत।
एक झटपट सोचे विचार का कच्चा ट्रांसक्रिप्ट असल में ऐसा दिखता है: ``` um so yeah I was thinking we should probably like push the launch to next week because the the QA isn't done yet you know ```
कॉन्टेक्स्ट-अवेयर रीराइटिंग वही ऑडियो लेकर एक दूसरा सवाल पूछती है: यह कहाँ जा रहा है, और वहाँ इसकी आवाज़ कैसी होनी चाहिए? आपकी टीम को भेजे Slack संदेश में जाने पर यह ऐसे लौटता है: ``` Let's push the launch to next week. QA isn't done yet. ```
अंदर वही शब्द जाते हैं, बाहर अलग शब्द आते हैं, जो मंज़िल के हिसाब से ढले होते हैं। पहला एक रिकॉर्डिंग है। दूसरा कुछ ऐसा है जिसे आप सचमुच भेज सकते हैं। इस सँवारने वाले पहलू पर और जानने के लिए, AI वॉइस डिक्टेशन कैसे काम करता है पर हमारा विश्लेषण देखिए।

AI के लिए "कॉन्टेक्स्ट" का असल मतलब क्या है
"कॉन्टेक्स्ट-अवेयर" सुनने में धुँधला लगता है जब तक आप उन ख़ास संकेतों पर नज़र न डालें जिन्हें ये टूल पढ़ते हैं। इसमें कुछ भी रहस्यमय नहीं है। कॉन्टेक्स्ट उन संकेतों की एक छोटी सूची है जिन्हें AI किसी शब्द को छूने से पहले जाँचता है।
सक्रिय ऐप
सबसे ज़ोरदार संकेत यह है कि जब आप बोलते हैं तब किस ऐप पर फ़ोकस है। एक टूल देख सकता है कि सामने Slack है, या Gmail, या VS Code। यह एक बात ही शैली को काफ़ी हद तक सँकरा कर देती है। चैट छोटी और ढीली चाहती है, मेल संरचित और शिष्ट चाहती है, और कोड एडिटर कम-से-कम और शब्दशः चाहता है।
आपके कर्सर के आसपास का टेक्स्ट
कुछ टूल उस टेक्स्ट का थोड़ा हिस्सा पढ़ते हैं जो वहाँ है जहाँ आप टाइप करने वाले हैं। अगर ऊपर का संदेश "Dear Dr. Katz," से शुरू होता है, तो AI बातों को औपचारिक रखता है और नाम सही-सही लिखता है। अगर थ्रेड एक-एक लाइन के मज़ाक़ों का ढेर है, तो वह उसी के हिसाब से ढल जाता है।
वेबसाइट, सिर्फ़ ब्राउज़र नहीं
ब्राउज़र में ऐप पहचानना गड़बड़ हो जाता है, जहाँ Gmail, X, और एक Google Doc सब एक ही विंडो के पीछे छिपे होते हैं। बेहतर टूल इन्हें अलग करने के लिए URL देखते हैं, ताकि Gmail टैब को ईमेल वाला बर्ताव मिले और X टैब को एक चुटीली पोस्ट।
ऐप की श्रेणी
अब तक बने हर ऐप के लिए एक नियम रखने के बजाय, ज़्यादातर सिस्टम ऐप्स को मुट्ठीभर खानों में बाँट देते हैं: ईमेल, वर्क चैट, निजी मैसेजिंग, डॉक्स, कोड, और बाक़ी सबके लिए एक झोली। हर खाने की अपनी एक शैली होती है। कोई नया ऐप जो किसी जाने-पहचाने खाने में आता है, पहले ही दिन उसकी शैली अपना लेता है।
इन संकेतों को एक के ऊपर एक रखिए और AI के पास माहौल का एक ठीक-ठाक अंदाज़ा आ जाता है: किसी नाम वाले व्यक्ति को औपचारिक ईमेल, या किसी अनौपचारिक थ्रेड में फेंकी गई एक हल्की-फुल्की लाइन। यही अंदाज़ा है जिसके हिसाब से वह दोबारा लिखता है।
आपकी बोली सही संदेश कैसे बनती है
टुकड़ों को क़तार में रखिए और पूरी चीज़ चार झटपट चरण है, जो सब आपके वाक्य ख़त्म करने और टेक्स्ट के दिखने के बीच के एक-दो सेकंड में हो जाते हैं। 1. कैप्चर। आप एक की दबाकर बोलते हैं। जब तक आप छोड़ते नहीं, टूल रिकॉर्ड करता रहता है। 2. ट्रांसक्राइब। एक स्पीच मॉडल ऑडियो को कच्चे टेक्स्ट में बदल देता है, आपके शब्द ठीक वैसे ही जैसे आपने कहे थे। 3. कॉन्टेक्स्ट पहचानो। टूल सक्रिय ऐप, कर्सर के पास का टेक्स्ट, और यह जाँचता है कि ऐप किस खाने में आता है। 4. दोबारा लिखो। एक लैंग्वेज मॉडल कच्चा ट्रांसक्रिप्ट और वह कॉन्टेक्स्ट लेकर अंतिम संदेश लिखता है, जो वहाँ के हिसाब से नापा और ढाला होता है जहाँ वह जा रहा है।
चौथे चरण में एक बड़ा लैंग्वेज मॉडल असली भारी काम करता है। उसे आपका बिखरा हुआ ट्रांसक्रिप्ट और एक निर्देश मिलता है जो दरअसल इतना ही होता है, "यह एक वर्क ईमेल में जा रहा है, इसे वैसा पढ़ने लायक बना दो," और फिर वह सही लंबाई, टोन और आकार में टेक्स्ट लौटा देता है। नतीजे मॉडल के हिसाब से बदलते हैं, इसलिए आउटपुट को आख़िरी सच के बजाय एक मज़बूत पहले ड्राफ़्ट की तरह लीजिए।
macOS पर Voicr ठीक यही प्रवाह चलाता है। आप FN की दबाकर किसी भी ऐप से बोलते हैं। Voicr पहचान लेता है कि सामने कौन-सा ऐप है, अपने Smart Rules के ज़रिए मेल खाती शैली लगाता है, और सँवरा हुआ टेक्स्ट आपके क्लिपबोर्ड पर डाल देता है: Slack में अनौपचारिक, Gmail में पेशेवर, आपके एडिटर में कटा-छँटा। आपको टोन चुनने के लिए कभी कोई मेन्यू नहीं खोलना पड़ता। अगर आप देखना चाहते हैं कि ये प्रति-ऐप शैलियाँ कैसे लिखी जाती हैं, तो स्मार्ट राइटिंग रूल्स पर हमारी गाइड बताती है कि एक अच्छे नियम में क्या होता है।

दो किस्में: अपने आप पहचान और साफ़ बताए गए नियम
हर कॉन्टेक्स्ट-अवेयरनेस एक जैसी काम नहीं करती। टूल दो ख़ेमों में बँटते हैं, और फ़र्क़ ज़्यादातर इस बात का है कि शैली कौन तय करता है।
अपने आप वाली किस्म फ़ैसला आपके लिए कर देती है। वह ऐप पढ़ती है, उसे एक श्रेणी में रखती है, और बिना किसी सेटअप के एक बिल्ट-इन शैली लगा देती है। आप इसे इंस्टॉल करते हैं और यह बस काम करने लगती है। समझौता क़ाबू का है: जब इसका "ईमेल टोन" वाला अंदाज़ आपके अंदाज़ से मेल नहीं खाता, तो आप आउटपुट को हाथ से ठेलते रह जाते हैं।
साफ़ बताए गए नियमों वाली किस्म स्टीयरिंग आपके हाथ में दे देती है। आप हर ऐप के लिए एक छोटा निर्देश सीधी-सादी भाषा में लिखते हैं, जिसमें ठीक-ठीक बताते हैं कि उसकी आवाज़ कैसी होनी चाहिए। शुरू में सेटअप ज़्यादा है, पर आउटपुट आपकी पसंद से मेल खाता है क्योंकि पसंद आपने ख़ुद तय की है। एक Slack नियम ऐसा हो सकता है: ``` Rewrite as a casual Slack message. Two or three sentences, contractions fine, no greeting or sign-off. Light emoji only if it fits. ```
बेहतर टूल दोनों को मिला देते हैं: समझदार डिफ़ॉल्ट जो बिना मेहनत के काम करें, साथ में प्रति-ऐप नियम जो आप तब लिख सकें जब आपको परवाह हो। जिन ऐप्स को आप मुश्किल से छूते हैं उनके लिए डिफ़ॉल्ट पर टिक जाइए और उन दो-तीन के लिए साफ़ नियम बनाइए जहाँ आपका लिखना सचमुच मायने रखता है।
यह क्या सही करता है, और कहाँ अब भी लड़खड़ाता है
कॉन्टेक्स्ट-अवेयर रीराइटिंग सचमुच काम की है, पर यह एक शुरुआती बिंदु है, मन पढ़ने वाली नहीं। यह जहाँ ठोकर खाती है उसे जानना आपको आँख मूँदकर भरोसा करने से बचाता है।
फ़ॉर्मैट यह बिल्कुल सही करता है। मंशा का बस अंदाज़ा लगाता है।
AI बता सकता है कि आप ईमेल में हैं और एक अभिवादन जोड़ सकता है। यह भरोसे से नहीं बता सकता कि आप ईमानदार हैं या व्यंग्य कर रहे हैं, या "fine" का मतलब सचमुच ठीक है या यह कि आप अंदर ही अंदर ख़फ़ा हैं। किसी रजिस्टर के भीतर का टोन अब भी आपका ही काम है।
धुँधले ऐप इसे उलझा देते हैं
एक हर-काम वाला ब्राउज़र, एक चैट क्लाइंट चलाता टर्मिनल, एक नोट्स ऐप जिसे आप हर चीज़ के लिए इस्तेमाल करते हैं: ये कमज़ोर संकेत देते हैं। जब कॉन्टेक्स्ट गँदला हो, तो रीराइट एक सामान्य सँवार पर लौट आता है जो आपकी चाह से कम या ज़्यादा औपचारिक हो सकता है।
यह आपकी आवाज़ को घिस सकता है
रीराइटिंग को हद से ज़्यादा कस दीजिए और आपके संदेश बाक़ी सबके जैसे सुनाई देने लगते हैं, चिकने और काबिल और थोड़े बेजान। अच्छे टूल आपकी आवाज़ को सही रजिस्टर में ले जाते हैं, उसे किसी कॉर्पोरेट डिफ़ॉल्ट से बदलने के बजाय। अगर आउटपुट आप जैसा सुनाई देना बंद कर दे, तो नियमों पर ढील दीजिए।
भेजने से पहले आपको अब भी पढ़ना है
कोई नाम ग़लत निकल सकता है। कोई नंबर फिसल सकता है। भेजने से पहले नतीजे पर एक नज़र दौड़ा लीजिए, ठीक वैसे ही जैसे आप किसी ऑटोकरेक्ट हुए टेक्स्ट पर सेंड दबाने से पहले एक झलक देखते हैं।
कॉन्टेक्स्ट-अवेयर रीराइटिंग को काम पर लगाना
आज ही आज़माना चाहते हैं? उन दो ऐप्स से शुरू कीजिए जहाँ आप सबसे ज़्यादा लिखते हैं, आमतौर पर एक चैट टूल और ईमेल। वहाँ अपने अगले कुछ संदेश टाइप करने के बजाय डिक्टेट कीजिए, और देखिए कि बाद में आपको असल में कितना कम संपादन करना पड़ता है।
फिर चूकों पर ध्यान दीजिए। जब आउटपुट सही न हो, तो वह काम की जानकारी है। यह बताती है कि ऐप की शैली को कसने की ज़रूरत है, या यह कि आपको मंशा ज़बानी ज़्यादा साफ़ कहनी चाहिए। ये टूल जितनी साफ़ी से आप उन्हें बताते हैं कि हर ऐप कैसा सुनाई देना चाहिए, उतने ही पैने होते जाते हैं। यही तरकीब किसी भी ऐप में चलती है जिसमें आप लिखते हैं, सिर्फ़ उन दो ज़ाहिर ऐप्स में नहीं, जैसा हमने एक ही कीस्ट्रोक से किसी भी Mac ऐप में डिक्टेट करना में बताया था।
असली जीत सिर्फ़ रफ़्तार नहीं है, हालाँकि टाइप करने से तीन गुना तेज़ बोलना एक अच्छी बढ़त है। असल में जो बदलता है वह यह है कि आप फ़ॉर्मैट को अपने सिर में ढोना बंद कर देते हैं। आप विचार सोचते हैं, उसे एक बार कहते हैं, और टूल पर छोड़ देते हैं कि वह तय करे कि कौन-सा संस्करण कहाँ फ़बता है।
एक बार बोलिए, हर जगह लैंड कीजिए
पुरानी आदत यह है कि संदेश और फ़ॉर्मैट दोनों एक ही पल में लिखे जाएँ: शब्द, टोन, अभिवादन, समापन, सब एक ही बार में, हर ऐप के लिए, दिन भर। कॉन्टेक्स्ट-अवेयर AI इस झंझट को दो में बाँट देता है। आप विचार लाते हैं। वह फ़ॉर्मैट लाता है।
फ़र्क़ महसूस करने का सबसे तेज़ तरीक़ा यह है कि अपनी अगली ईमेल टाइप करने के बजाय डिक्टेट कीजिए। अगर आप ऐसी बोली चाहते हैं जो वहाँ के हिसाब से पहले ही ढली हुई आए जहाँ वह जा रही है, तो Voicr आपके Mac पर यही करता है: FN दबाइए, बोलिए, और टेक्स्ट उस ऐप के लिए सही टोन में लैंड हो जाता है जिसमें आप हैं। आपके मुँह से एक वाक्य, हर विंडो में सही संदेश।

