เช้าส่วนใหญ่ผมเปิดแล็ปท็อปโดยรู้ชัดว่าอยากเขียนอะไร อีเมลฉบับแรกร่างไว้เรียบร้อยในหัวแล้ว แต่พอนิ้วเริ่มแตะคีย์บอร์ด ครึ่งหนึ่งก็หลุดหายไป ผมพิมพ์ส่วนที่ยังจำได้ จ้องหน้าจอ แล้วพยายามดึงส่วนที่เหลือกลับมา
ระยะห่างระหว่างการรู้ว่าอยากพูดอะไรกับการพาให้มันลงสู่หน้าจอ คือสิ่งที่ผมเรียกว่าช่องว่าง หลายปีที่ผ่านมาผมมองว่ามันเป็นส่วนหนึ่งของการเขียน แต่จริง ๆ แล้วไม่ใช่ มันคือต้นทุนของเครื่องมือ และ AI เป็นสิ่งแรกที่ย่นช่องว่างนั้นให้ผมได้จริง ๆ
บทความนี้เขียนจากมุมมองส่วนตัว ไม่ใช่ลิสต์รวมเครื่องมือ ไม่ใช่บทรีวิวประจำปี เป็นแค่เวิร์กโฟลว์ที่ผมตกผลึกตลอดปีที่ผ่านมา ส่วนที่ใช้ได้จริง และส่วนที่ยังไม่เวิร์ก
ปัญหาเรื่องความเร็วที่ไม่ค่อยมีใครพูดถึง
ตัวเลขช่วยอธิบายว่าช่องว่างนี้เกิดขึ้นได้อย่างไร คนพิมพ์คอมพิวเตอร์ทั่วไปทำได้ราว ๆ 40 คำต่อนาที มืออาชีพที่เก่ง ๆ ก็ขึ้นไปถึง 60 หรือ 70 ส่วนการพูดคุยปกติอยู่ที่ราว 150 คำต่อนาที แบบไม่ต้องพยายาม ส่วนเสียงพูดในใจ คือเสียงที่ผุดในหัวตอนเรียบเรียงประโยค วิ่งเร็วกว่านั้นอีก ประเมินกันว่าอาจสูงถึง 300 คำต่อนาที
อัตราส่วนคร่าว ๆ จึงเป็น คิดที่ 300 พูดที่ 150 พิมพ์ที่ 40 การพิมพ์เป็นข้อต่อที่ช้าที่สุดในห่วงโซ่นี้แบบทิ้งห่าง ทุกสิ่งที่คุณต้องรอคือแรงต้าน และแรงต้านคือจุดที่ไอเดียรั่วไหลออกไป
สิ่งที่เปลี่ยนสำหรับผมไม่ใช่ความเร็วในการพิมพ์ ผมไม่ได้พิมพ์ไวขึ้นเลย แต่สิ่งที่เปลี่ยนคือผมขยับคอขวด ผมหยุดพยายามเขียนที่ความเร็วของการพิมพ์ แล้วเริ่มยอมให้ตัวเองเขียนที่ความเร็วของการพูด ปล่อยให้ AI เก็บกวาดอยู่เบื้องหลัง
ทำไมการพิมพ์ค่อย ๆ บีบเราให้ตัวเล็กลง
ต้นทุนของการพิมพ์ไม่ใช่แค่ความเร็ว มันคือการที่คุณเริ่มตัดความคิดให้พอดีกับคอขวด คุณเขียนเวอร์ชันสั้นลง คุณข้ามรายละเอียดที่ละเอียดอ่อน คุณตัดตัวอย่างทิ้ง คุณกดส่งแล้วรู้สึกแอบทุจริตนิด ๆ ว่าข้อความที่ส่งออกไปแบนกว่าที่ใจอยาก
ผมสังเกตเรื่องนี้ชัดที่สุดใน Slack ผมเริ่มพิมพ์คำตอบที่ระมัดระวัง มองเคอร์เซอร์กะพริบไปเรื่อย ๆ ขณะรีไรต์ประโยคในหัว แล้วลบทั้งหมด ส่งแค่สามคำแทน "ดีครับ" "รับทราบ" "กำลังทำอยู่" บทสนทนางานหลายครั้งจบลงตรงนั้น ไม่ใช่เพราะผมไม่มีอะไรจะเสริม แต่เพราะการเสริมมันมีต้นทุนสูงกว่าผลลัพธ์ที่ได้
พอผมหยุดพิมพ์คำตอบพวกนั้นแล้วหันมาพูดแทน ข้อความก็ยาวขึ้น อบอุ่นขึ้น และชัดเจนขึ้น สมองเดิม แค่เปลี่ยนช่องทางส่งออก
การปิดช่องว่างนั้นรู้สึกอย่างไรกันแน่
ลองนึกภาพเช้าวันอังคารธรรมดา ๆ ลูกค้าส่งอีเมลถามว่าทำไมโครงการถึงล่าช้า คำตอบจริง ๆ มีหลายชั้น ส่วนหนึ่งเพราะสโคปงานเปลี่ยน ส่วนหนึ่งเพราะเขาอนุมัติช้า อีกส่วนเพราะมีวันหยุดยาว มันไม่ใช่คำตอบประโยคเดียว มันคือสามย่อหน้าที่ต้องสุภาพแต่ไม่ลอยตัว
เวอร์ชันเก่าของผมจะเปิดหน้าตอบ พิมพ์ประโยคแรกซ้ำสองครั้ง ลบทิ้ง แล้วใช้เวลาสิบห้านาทีปั้นย่อหน้าสุภาพ ๆ สี่ย่อหน้าที่ยังไม่ค่อยตรงกับสิ่งที่ผมอยากจะสื่อจริง ๆ
เวอร์ชันปัจจุบันของผมกดปุ่มค้างหนึ่งปุ่ม พูดต่อเนื่องเก้าสิบวินาที แล้วปล่อย คำตอบโผล่อยู่ในช่องอีเมล แบ่งย่อหน้าให้แล้ว ขัดเกลาเรียบร้อย คำเติมที่ไม่จำเป็นถูกตัดออก ผมอ่านรอบเดียว แก้วลีนึง กดส่ง อีเมลใช้เวลาสองนาทีแทนที่จะเป็นสิบห้านาที และใกล้เคียงกับสิ่งที่ผมอยากพูดมากกว่า เพราะผมไม่ต้องบีบความคิดให้สั้นลงเท่าความเร็วการพิมพ์

ครั้งแรกที่มันใช้งานได้จริง ผมนั่งงงไปครู่นึง ไม่ใช่เพราะเทคโนโลยีเป็นเวทมนตร์ เพราะมันไม่ใช่ แต่เหตุผลเรียบง่ายกว่านั้น แรงต้านที่ผมยอมรับมาตลอดว่าเป็นส่วนหนึ่งของการเขียน กลายเป็นสิ่งที่เลือกได้แล้ว
AI สองชั้นที่ทำให้เกิดความต่าง
ผมใช้เวลาอยู่พักหนึ่งกว่าจะรู้ว่าเวิร์กโฟลว์ของผมมี AI สองชั้น และทั้งคู่ทำหน้าที่สำคัญ คนส่วนใหญ่พูดถึงชั้นใดชั้นหนึ่ง น้อยคนพูดทั้งสอง
ชั้นที่ 1: เสียงเข้า ข้อความที่ขัดเกลาแล้วออก
ชั้นแรกคือการบอกเสียงพร้อมการขัดเกลาด้วย AI ผมกดปุ่มค้างไว้ พูดแบบปกติ (มีคำว่า "เอ่อ" มีการเริ่มประโยคใหม่ มีประโยคที่ค้างครึ่งหนึ่ง) แล้วข้อความที่ลงในคลิปบอร์ดถูกขัดเกลาเรียบร้อยแล้ว คำเติมหายไป ไวยากรณ์ถูกต้อง ประโยคยาว ๆ ถูกแบ่งเป็นย่อหน้าจริง ๆ
นี่ไม่ใช่อันเดียวกับการสั่งเสียงที่ติดมากับเครื่อง Apple Dictation ให้สิ่งที่ถอดเสียงดิบ ๆ มาพร้อม "เอ่อ" ครบทุกอัน แต่การขัดเกลาด้วย AI จะรีไรต์ทรานสคริปต์โดยรักษาความหมายที่คุณตั้งใจไว้ ความต่างนี้คือความต่างระหว่างไฟล์เสียงกับแบบร่างจริง ๆ
ชั้นที่ 2: ข้อความเข้า ข้อความที่ดีกว่าออก
ชั้นที่สองคือการแก้ไขข้อความในที่ ผมเลือกข้อความที่เขียนไว้แล้ว (ย่อหน้า ประโยค หรือทั้งอีเมล) กดทางลัด เลือกพรอมต์อย่าง "ทำให้กระชับขึ้น" หรือ "ทำน้ำเสียงให้นุ่มลง" แล้วส่วนที่เลือกถูกรีไรต์ในตำแหน่งเดิม ไม่ต้องสลับแท็บ ไม่ต้องคัดลอกแล้วไปวางในแชตบอต ข้อความเดิมถูกแทนที่ด้วยเวอร์ชันที่ดีขึ้นของตัวเอง
การบอกเสียงพาความคิดลงสู่หน้าจอได้รวดเร็ว ส่วนการแก้ในที่จัดการสิบเปอร์เซ็นต์สุดท้ายของการขัดเกลา รวมกันแล้วใกล้เคียงกับการเขียนที่ความเร็วของการพูดมากกว่าใช้อย่างใดอย่างหนึ่งเดี่ยว ๆ
เวิร์กโฟลว์รายวันที่ผมใช้จริง
หน้าตาของวันปกติเป็นแบบนี้ ไม่มีอะไรเป็นทฤษฎี เป็นรูปร่างจริง ๆ ของการเขียนของผมตอนนี้
กล่องอีเมลตอนเช้า ผมอ่านอีเมลทีละฉบับ แล้วบอกเสียงตอบ ส่วนใหญ่เป็นย่อหน้าเดียว มีบ้างที่ยาวกว่านั้น แทบไม่มีฉบับไหนที่พิมพ์ตอบ งานทั้งล็อตที่เคยกินเวลาชั่วโมงแรกของวัน ตอนนี้ใช้เวลาราวยี่สิบนาที
Slack ตลอดทั้งวัน คำตอบสั้น ๆ ยังพิมพ์อยู่ เพราะแรงต้านต่ำและไม่ต้องคิดเยอะ อะไรก็ตามที่ยาวกว่าสองประโยคจะใช้พูด น้ำเสียงเป็นกันเองโดยอัตโนมัติ เพราะผมก็คุยใน Slack แบบกันเองอยู่แล้ว
เอกสารและบันทึก แบบร่างแรกแทบทั้งหมดเกิดจากการบอกเสียง ผมเปิดเอกสารเปล่า พูดต่อเนื่องห้าหรือสิบนาทีเกี่ยวกับสิ่งที่อยากครอบคลุม แล้วก็ได้แบบร่างจริง ๆ มาทำงานต่อ การแก้แบบร่างเร็วกว่าการเริ่มเขียนเยอะ และช่องว่างระหว่างความคิดกับการเขียนกว้างที่สุดในช่วงหน้ากระดาษเปล่า
รอบขัดเกลา จุดนี้คือที่ที่ชั้นที่สองคุ้มค่ามาก ๆ ผมเลือกประโยคที่อ่านแล้วสะดุด แล้วขอเวอร์ชันที่กระชับขึ้น ผมเลือกย่อหน้าที่เป็นทางการเกินไป แล้วขอเวอร์ชันที่อบอุ่นกว่า การแก้แต่ละครั้งใช้เวลาสองวินาที ในตำแหน่งเดิม ไม่ต้องสลับแอป
สิ่งที่ทำให้ผมประหลาดใจคือ ตอนนี้ผมเขียนคำรวมต่อวันมากขึ้น ไม่ใช่น้อยลง AI ไม่ได้เข้ามาแทนผลงานของผม มันแค่ตัดส่วนของงานที่เป็นแค่ภาษีกดคีย์บอร์ดออกไป
ถ้าอยากดูเฉพาะส่วนของอีเมลแบบเจาะลึก ผมเขียนไว้ใน บอกเสียงตอบอีเมลบน Mac
การตั้งค่าหนึ่งเดียวที่ทำให้ทุกอย่างใช้งานได้
มีการตั้งค่าหนึ่งที่ผมเกือบจะข้ามไปตอนลองใช้งานเวิร์กโฟลว์แบบนี้ครั้งแรก แล้วกลับกลายเป็นสิ่งที่ทำให้มันใช้งานได้จริง นั่นคือสไตล์การเขียนแยกตามแอป
Slack กับอีเมลไม่ได้อยากได้น้ำเสียงเดียวกัน จดหมายสมัครงานแบบเป็นทางการไม่ได้อยากได้น้ำเสียงเดียวกับสมุดระดมไอเดียใน Notion ถ้าการขัดเกลาของ AI ทำให้ทุกอย่างกลายเป็นเสียงเดียว ผลลัพธ์อาจเร็วขึ้นแต่แย่ลง และคุณจะหยุดเชื่อใจมัน
นี่คือเหตุผลที่ Voicr มี Smart Rules คุณตั้งน้ำเสียงเป็นกันเองสำหรับ Slack เป็นทางการกว่าสำหรับ Mail และสไตล์เรียบ ๆ ไม่ตกแต่งสำหรับเทอร์มินัล Voicr ตรวจจับว่าแอปไหนกำลังเปิดอยู่และเลือกสไตล์ที่เหมาะให้โดยที่คุณไม่ต้องทำอะไรเลย ผมบอกเสียงแบบเดียวกันในทุกแอป ส่วนผลลัพธ์ปรับเอง นั่นคือเคล็ดที่ทำให้ผมเลิกกลับไปใช้คีย์บอร์ดสำหรับข้อความ "สำคัญ ๆ"
จุดที่การบอกเสียงดิบ ๆ พังลง (และการขัดเกลาช่วยกู้)
การบอกเสียงดิบ ๆ มีโหมดความล้มเหลวเฉพาะตัวที่ใครก็ตามที่เคยลองจะรู้จัก คุณพูดหนึ่งย่อหน้า ทรานสคริปต์กลับมาพร้อม "เอ่อ" ครบทุกอัน รวมกับการเริ่มประโยคใหม่สองรอบที่ถูกต่อชนกัน และประโยคหนึ่งที่ยาวต่อเนื่องสี่สิบคำเพราะคุณไม่หยุดหายใจ
คุณแก้มันได้ แต่การแก้ทรานสคริปต์ดิบเป็นงานในตัวมันเอง และอาจช้ากว่าการพิมพ์เรียบ ๆ ตั้งแต่ทีแรกด้วยซ้ำ นั่นคือสาเหตุที่คนส่วนใหญ่ที่ลองใช้การบอกเสียงในตัวเลิกใช้หลังผ่านไปสัปดาห์เดียว
การขัดเกลาเปลี่ยนสมการตรงนี้ พอ AI ตัดคำเติม แก้ไวยากรณ์ แล้วแบ่งกำแพงคำพูดออกเป็นย่อหน้า ผลลัพธ์เป็นสิ่งที่ผมพร้อมจะส่งโดยไม่ต้องรีไรต์ ขั้นบอกเสียงเลิกเป็นแบบร่างศูนย์ แล้วกลายเป็นบางอย่างที่ใกล้แบบร่างฉบับสุดท้าย
นี่คือส่วนที่บทความคู่แข่งมักผ่านไปอย่างผิวเผิน ความได้เปรียบด้านความเร็วของเสียงเหนือการพิมพ์เป็นเรื่องจริง แต่มันมีประโยชน์ก็ต่อเมื่อคุณไม่ต้องเสียเวลาคืนไปกับการเก็บกวาด
การแลกเปลี่ยนแบบตรงไปตรงมา
ไม่ใช่ทุกอย่างจะเป็นชัยชนะที่สะอาด มีบางสิ่งที่ยังพิมพ์ดีกว่า
- ข้อความทางเทคนิคหนัก ๆ ที่มีโค้ด ชื่อคำสั่ง หรือรหัสสินค้า การบอกเสียงจับคำได้ แต่ไม่ค่อยจับสัญลักษณ์ ผมยังพิมพ์โค้ดอยู่ - สภาพแวดล้อมที่มีเสียงรบกวน ร้านกาแฟ เครื่องบิน ออฟฟิศใช้ร่วม การพูดกับแล็ปท็อปในห้องเงียบ ๆ โอเค แต่ทำตอนนั่งข้างคนที่กำลังประชุมไม่ใช่ความคิดที่ดี - เรื่องอ่อนไหวเมื่อมีคนอื่นอยู่ใกล้ อีเมลเลิกราหรือฟีดแบ็กแรง ๆ ผมยอมพิมพ์ดีกว่าพูดออกเสียงให้คนอื่นได้ยิน - การแก้ละเอียดเชิงลึก เมื่อเอกสารใกล้เสร็จแล้ว ผมชอบแก้เล็ก ๆ แบบเจาะจุดด้วยคีย์บอร์ดมากกว่า เสียงเอาไว้พาความคิดลงหน้ากระดาษ ไม่ใช่ขยับเครื่องหมายวรรคตอน
การรู้ว่าจะสลับกลับเมื่อไหร่เป็นส่วนหนึ่งของเวิร์กโฟลว์ คีย์บอร์ดไม่ได้หายไป มันแค่ไม่ใช่ตัวเลือกตั้งต้นอีกแล้ว
สิ่งที่เปลี่ยนไปสำหรับผมจริง ๆ
คำตอบตรง ๆ ไม่ใช่ "ผมผลิตคอนเทนต์ได้ 4 เท่า" มันเล็กและแปลกกว่านั้น
ผมตอบ Slack ยาวขึ้นเพราะต้นทุนในการเขียนตอบลดลง ผมทิ้งโน้ตค้าง ๆ น้อยลงเพราะการบอกเสียงทั้งความคิดเร็วกว่าการพิมพ์เศษส่วน ผมเขียนแบบร่างแรกในวันเดียวกับที่ไอเดียโผล่มา แทนที่จะเก็บไว้รอช่วงเวลาทำงานเข้มข้นที่มักไม่เคยมา ช่องว่างระหว่างการมีไอเดียกับการมีแบบร่างของมันหดจากหลายวันเหลือไม่กี่นาที
นี่คือสิ่งที่ตัวเลขความเร็วจับไม่ได้ คำถามจริง ๆ คือการเขียนถูกพอจะทำได้เมื่อไหร่ก็ตามที่อยากทำ แทนที่จะต้องเก็บออมเอาไว้สำหรับเวลาทำงานที่จดจ่อซึ่งมักไม่เคยมาถึงแล้วหรือยัง
จะลองสิ่งนี้วันนี้ได้อย่างไร
ถ้าอยากทดสอบว่าสิ่งนี้เวิร์กกับคุณไหม อย่าพยายามรื้อเวิร์กโฟลว์ทั้งหมด เลือกแค่จุดเดียว
1. เลือกอีเมลตอบกลับฉบับถัดไปที่ต้องการมากกว่าสองประโยค 2. แทนที่จะพิมพ์ กดปุ่มบอกเสียงค้างไว้แล้วพูดสิ่งที่อยากพูด ไม่ต้องสคริปต์ล่วงหน้า แค่พูด 3. ปล่อยปุ่ม แล้วอ่านสิ่งที่ลงในช่อง 4. ถ้าใกล้กับสิ่งที่ตั้งใจจะสื่อ แก้วลีหนึ่งหรือสองตรงที่ยังไม่ใช่ แล้วกดส่ง
ทำแบบนี้ห้าครั้ง ปลายวันแรกคุณจะรู้ว่าช่องว่างที่ผมกำลังพูดถึงเป็นช่องว่างของคุณด้วยหรือเปล่า
ถ้าอยากได้เวิร์กโฟลว์ด้านบนโดยไม่ต้องประกอบเองทีละชิ้น Voicr คือแอปที่ผมใช้ กด FN ค้าง พูด วาง ผลลัพธ์ขัดเกลาเรียบร้อย น้ำเสียงปรับตามแอปที่คุณเปิดอยู่ และการเลือกข้อความแล้วกด ⌥Space ให้คุณแก้ในที่สำหรับรอบที่สอง ห้าพันคำต่อเดือนใช้ฟรีถ้าแค่อยากลองดูว่าจะติดเป็นนิสัยไหม
คีย์บอร์ดไม่ได้จะหายไปไหน แต่เป็นครั้งแรกในยี่สิบปีของการเขียนบนคอมพิวเตอร์ มันไม่ใช่คอขวดที่ผมต้องวางแผนเลี่ยงอีกแล้ว

