คุณกำลังพิมพ์ตอบ Slack ไปสามข้อความติด อีเมลเช้านี้ก็เปิดไปสิบฉบับแล้ว และข้อมือของคุณก็เริ่มประท้วงเสียงดัง คุณรู้ว่าจะพูดอะไรในแต่ละข้อความ คุณแค่ไม่อยากนั่งพิมพ์มันออกมาทั้งหมด
การพิมพ์ด้วยเสียงควรจะแก้ปัญหานี้ได้ Mac ของคุณทำได้ตั้งแต่ตอนนี้ ในทุกแอปที่คุณเปิดอยู่ แต่คนส่วนใหญ่ไม่เคยใช้มัน และคนที่ลองใช้ก็มักยอมแพ้ภายในสัปดาห์เดียว
เหตุผลคือความหน่วง ทุกวินาทีที่ผ่านไประหว่าง "อยากพูดประโยคนี้" กับ "ข้อความปรากฏขึ้น" คือวินาทีที่สมองของคุณเสียให้กับเครื่องมือ ไม่ใช่ความคิด ทางแก้คือปุ่มเดียว ปุ่มเดียวที่เปิดการพิมพ์ด้วยเสียงในแอปที่คุณกำลังใช้อยู่ ไม่มีเมนู ไม่มีการคลิก ไม่ต้องรอ
คู่มือนี้จะบอกวิธีตั้งค่า เลือกปุ่มไหนดี และทำไมแค่ปุ่มอย่างเดียวยังไม่พอ
ทำไมปุ่มเดียวถึงเปลี่ยนทุกอย่าง
การพูดเร็วกว่าการพิมพ์ประมาณสามเท่า คนทั่วไปพิมพ์ได้ราว 40 คำต่อนาที แต่พูดได้ 150 คำต่อนาที ทีมวิจัยจากสแตนฟอร์ดพบช่องว่างที่ใกล้เคียงกันเมื่อจับเวลาคนเขียนข้อความด้วยเสียงเทียบกับคีย์บอร์ด
ความเร็วล้วน ๆ ไม่ใช่สิ่งเดียวที่คุณได้ การพิมพ์บังคับให้มือและความคิดวิ่งบนรางที่ต่างกัน คุณคิดประโยค แล้วแปลเป็นการกดปุ่ม แล้วเหลือบมองหาคำที่พิมพ์ผิด การพิมพ์ด้วยเสียงข้ามขั้นกลางนั้นไป คุณคิดประโยค แล้วมันก็ปรากฏขึ้น
การเร่งความเร็วนั้นจะได้ผลก็ต่อเมื่อจุดเริ่มต้นมองไม่เห็น ถ้าคุณต้องคลิกไอคอนไมโครโฟน สลับไปแอปพิมพ์ด้วยเสียง หรือรอหน้าต่างเด้งขึ้นมา สมองของคุณก็จะหลุดจากประโยคไปอยู่กับเครื่องมือทันที จุดประสงค์ทั้งหมดก็พังลง
ปุ่มเดียวที่คุณกดได้โดยไม่ต้องมอง ในแอปไหนก็ได้ คือสิ่งที่ทำให้จุดเริ่มต้นยังคงมองไม่เห็น กด พูด ปล่อย แค่นั้นคือทั้งหมดของการใช้งาน
ปุ่มลัด dictation ที่มากับ macOS
macOS มี dictation ในตัว และใช้ฟรี ปุ่มลัดเริ่มต้นขึ้นอยู่กับฮาร์ดแวร์ของคุณ: - MacBook Pro และ Air (ปี 2021 ขึ้นไป): กดปุ่มไมโครโฟนเฉพาะกิจในแถวฟังก์ชัน ตรงตำแหน่งที่เคยเป็น F5 - Mac รุ่นเก่ากว่านั้น: แตะปุ่ม Fn สองครั้งติดกันเร็ว ๆ - คีย์บอร์ดภายนอก: แตะ Control สองครั้ง หรืออะไรก็ตามที่เทียบเท่าในชุดของคุณ
วิธีเปิดใช้งานคือไปที่ System Settings → Keyboard → Dictation แล้วกดสวิตช์ ครั้งแรกที่เปิด macOS จะดาวน์โหลดโมเดลภาษาแบบรันบนเครื่อง หลังจากนั้น dictation จะทำงานแบบออฟไลน์บน Mac ที่ใช้ Apple Silicon
เมื่อเปิดใช้งานแล้ว คลิกในช่องข้อความใด ๆ (Mail, Notes, แท็บเบราว์เซอร์, Pages, Slack, Discord) แล้วกดปุ่มลัด คุณจะเห็นไอคอนไมโครโฟนเล็ก ๆ และได้ยินเสียงสัญญาณ พูดได้เลย จากนั้นกด Escape หรือกดปุ่มลัดอีกครั้งเพื่อหยุด
วิธีปรับแต่งปุ่มลัด dictation
ค่าเริ่มต้น Fn-Fn มีปัญหา คุณต้องกดปุ่มเดิมสองครั้ง และจังหวะต้องพอดี ครึ่งหนึ่งของเวลามันจะถูกตีความว่ากดครั้งเดียว โดยเฉพาะบนแล็ปท็อปที่ปุ่ม Fn อยู่ใกล้กับ modifier ตัวอื่น
การเปลี่ยนไปใช้ปุ่มเดียวแก้ปัญหานี้ได้ ทำตามนี้: 1. เปิด System Settings → Keyboard → Dictation 2. หาเมนูดรอปดาวน์ Shortcut 3. เลือกตัวเลือกที่ตั้งไว้ให้ หรือเลือก Customize แล้วกดปุ่มที่คุณอยากได้
คุณเลือกปุ่มหรือชุดปุ่มไหนก็ได้ที่ macOS ยอมรับ ปุ่มเดี่ยวก็ใช้ได้ ปุ่ม modifier บวกกับปุ่มอื่นก็ใช้ได้ กฎเดียวคือปุ่มลัดต้องว่าง ถ้าแอปอื่นหรือฟังก์ชันระบบใช้อยู่แล้ว macOS จะแจ้งคุณ
เลือกปุ่มที่ไม่ชนกับอย่างอื่น
นี่คือส่วนที่คู่มือส่วนใหญ่ข้ามไป เลือกปุ่มลัดผิดแล้วคุณจะเปิด dictation โดยไม่ตั้งใจทุกครั้งที่กด Cmd+D ใน Photoshop หรือแย่กว่านั้น ปุ่ม dictation ของคุณจะไปสั่งงานอื่นแทน

ต่อไปนี้คือสิ่งที่ควรพิจารณา: - F13 ถึง F19 คือทางเลือกที่ปลอดภัยที่สุด คีย์บอร์ดภายนอกส่วนใหญ่มีปุ่มเหล่านี้ และไม่มีฟังก์ชัน macOS เริ่มต้นที่ผูกอยู่ F13 สะอาดเป็นพิเศษ ไม่ชนกับอะไรเลยใน macOS มาตรฐาน F14 และ F15 ถูกจองไว้ปรับความสว่างจอตามค่าเริ่มต้น ดังนั้นต้องปิดก่อนใน System Settings → Keyboard Shortcuts → Display - หลีกเลี่ยง Cmd, Option และ Control คู่กับตัวอักษร เกือบทุกแอปใช้ปุ่มเหล่านี้เป็นปุ่มลัดของตัวเอง คุณจะต้องสู้กับการชนกันไปตลอด - ปุ่มฟังก์ชัน F1 ถึง F12 เสี่ยง ถ้าคุณปิด "Use F1, F2, etc. keys as standard function keys" ไว้ มันจะทำงานคู่กับความสว่าง เสียง และตัวควบคุมสื่อ - วิธีใช้ Caps Lock ใช้ได้ถ้าคุณไม่ได้ใช้ Caps Lock จริง ๆ เครื่องมืออย่าง Karabiner-Elements ปรับให้มันกลายเป็น Hyper modifier (Cmd+Ctrl+Option+Shift) ได้ ทำให้คุณมีปุ่มเริ่มต้นที่ไม่ชนกับใคร จากนั้น Hyper+D ก็จะกลายเป็นปุ่มลัด dictation ของคุณ และไม่มีแอปไหนในโลกใช้ Hyper+D สำหรับอะไรเลย
ถ้าคุณใช้ MacBook ที่ไม่มี F13 ถึง F19 ปุ่ม Option ขวาก็เป็นอีกตัวเลือกที่คนใช้น้อย ผู้ใช้แล็ปท็อปส่วนใหญ่มีปุ่ม Option ขวาที่แทบไม่เคยกดเลย
ไม่ว่าคุณเลือกอะไร เกณฑ์การทดสอบก็เหมือนกัน คุณกดมันได้โดยไม่ต้องมอง ไม่ต้องขยับมือมาก และไม่กดโดนเองได้ไหม ถ้าใช่ คุณก็ได้ปุ่มของคุณแล้ว
ข้อจำกัด: สิ่งที่ dictation ของ macOS ทำไม่ได้
เอาล่ะ คุณมีปุ่มเดียวแล้ว คุณกด macOS ถอดเสียงให้ จบไหม
ยังไม่จบ dictation ในตัวมีข้อจำกัดบางอย่างที่จะปรากฏให้เห็นภายในสัปดาห์แรกที่คุณใช้กับงานจริง: - มันหมดเวลาประมาณ 30 ถึง 60 วินาที Apple ไม่เคยประกาศตัวเลขที่แน่นอน แต่ ขีดจำกัดมีอยู่จริงและไม่มีการตั้งค่าใดเปลี่ยนได้ ประโยคสั้น ๆ และข้อความสั้นยังไหว แต่พอเป็นย่อหน้าเต็มก็จะชนกำแพง - มันถอดเสียงตามตัวอักษร ทุก "อืม" ทุก "เอ่อ" ทุก "คือว่า เอ่อ ขอเริ่มใหม่นะ" จะไปลงในข้อความหมด คุณพูดอะไรไป มันก็อยู่ในนั้น - ไม่รู้บริบทของแอป มันไม่รู้ว่าคุณกำลังเขียนข้อความ Slack หรืออีเมลทางการ คุณจะได้ข้อความถอดดิบ ๆ เหมือนเดิมไม่ว่าจะอยู่ที่ไหน - ไม่มีการเก็บกวาด ประโยคยาวรวด ขาดเครื่องหมายวรรคตอน ตัวพิมพ์ใหญ่แปลก ๆ ทั้งหมดต้องไปแก้เอง
ปุ่มลัดพาคุณไปถึง "พูดได้ในแอปไหนก็ได้" แต่ข้อความที่ออกมาคือสิ่งที่คุณวาง ส่ง หรือบันทึกจริง ๆ นั่นคือจุดที่คนส่วนใหญ่ยอมแพ้กับ dictation พวกเขากดปุ่ม พูดตามธรรมชาติ มองดูผลลัพธ์ แล้วก็รู้ว่าพิมพ์เองยังเร็วกว่า ถ้านั่นคือช่องว่างที่คุณเจออยู่ การเปรียบเทียบนี้ระหว่าง Voicr กับ dictation ในตัวของ Apple จะอธิบายให้เห็นชัดว่าขาดอะไรไป
เวิร์กโฟลว์ปุ่มเดียวที่ขัดเกลาให้ระหว่างคุณพูด
นี่คือเหตุผลที่เราสร้าง Voicr ขึ้นมา ปุ่มลัดคือ FN กดค้างไว้จากที่ไหนก็ได้บน Mac พูด ปล่อย ข้อความในคลิปบอร์ดของคุณถูกเก็บกวาดเรียบร้อยแล้ว คำเติมหายไป ไวยากรณ์ถูกแก้ ประโยคจบครบ พร้อมวาง

ส่วนการถอดเสียงไม่ใช่จุดที่ Voicr ต่างจากตัวอื่น งานจริงเกิดขึ้นระหว่างการถอดเสียงกับการวาง Voicr ส่งคำพูดของคุณผ่านชั้น AI ขัดเกลาที่รู้ว่าคุณไม่ได้กำลังบรรยายหนังสือเสียง คุณจะพูดเรื่อยเปื่อย เริ่มใหม่ เปลี่ยนใจกลางประโยคก็ได้ ผลที่ออกมายังอ่านเหมือนคุณตั้งใจเขียนอย่างพิถีพิถัน (ถ้าอยากรู้ลึกกว่านี้ว่ากระบวนการเบื้องหลังทำงานยังไง เราอธิบายไว้ที่นี่: การพิมพ์ด้วยเสียง AI บน Mac ทำงานอย่างไร)
รายละเอียดบางอย่างที่สำคัญสำหรับสัญญาว่า "ทุกแอป": - ใช้ได้กับทุกแอปที่มีช่องข้อความ Slack, Mail, Notes, Pages, แท็บเบราว์เซอร์, โปรแกรมแก้โค้ด, Notion ที่ไหนก็ตามที่คุณวางข้อความได้ คุณก็พิมพ์ด้วยเสียงได้ - มี Smart Rules ที่ปรับโทนตามแอปที่กำลังใช้งานอยู่ สบาย ๆ สำหรับ Slack ทางการสำหรับ Mail เชิงเทคนิคสำหรับโปรแกรมแก้โค้ด ตั้งกฎครั้งเดียว แอปก็สลับให้อัตโนมัติ - ปุ่ม FN คือกดค้างเพื่ออัด ไม่ใช่กดสองครั้ง ไม่มีลูกเล่นเรื่องจังหวะ ไม่มีการกดซ้ำ กด พูด ปล่อย - Dictation Mode แยกต่างหากให้คุณถอดเสียงดิบ ๆ พร้อมเครื่องหมายวรรคตอนที่ถูกต้อง โดยไม่ขัดเกลา สำหรับเวลาที่คุณต้องการแค่ทรานสคริปต์เพียว ๆ
ถ้าเวิร์กโฟลว์ dictation ในตัวเคยทำให้คุณหัวร้อน ขั้นตอนการขัดเกลามักเป็นสิ่งที่ขาดหายไป ปุ่มลัดคือครึ่งหนึ่งของเวิร์กโฟลว์ อีกครึ่งคือสิ่งที่ไปอยู่ในคลิปบอร์ดของคุณจริง ๆ
เคล็ดลับให้การพิมพ์ด้วยเสียงรู้สึกเป็นธรรมชาติ
เมื่อตั้งปุ่มลัดเรียบร้อย สิ่งที่ต้องปรับต่อไปอยู่ในหัวของคุณเอง คนส่วนใหญ่ที่ลองพิมพ์ด้วยเสียงจะพูดกับมันแบบเดียวกับที่พูดกับโทรศัพท์ ช้า ๆ ระวัง ๆ ทีละคำ นั่นคือสัญชาตญาณที่ผิด
นิสัยบางอย่างที่ช่วยได้: 1. พูดเป็นความคิดที่สมบูรณ์ ไม่ใช่ทีละคำ อย่าพักระหว่างคำ ให้พักระหว่างไอเดีย โมเดลรับมือกับความติด ๆ ขัด ๆ ได้ดีกว่าที่คุณคิด 2. อย่าพยายามพูดเครื่องหมายวรรคตอนเอง การพูดว่า "จุลภาค" "จุด" หรือ "ขึ้นย่อหน้าใหม่" ทำได้ใน dictation ในตัว แต่จะทำให้กระแสความคิดสะดุด เครื่องมือที่ขัดเกลาผลลัพธ์จะใส่เครื่องหมายวรรคตอนให้คุณเอง 3. ใช้สำหรับร่างแรก ไม่ใช่ฉบับสุดท้าย การพิมพ์ด้วยเสียงเร็วที่สุดเมื่อคุณมองผลลัพธ์เป็นจุดเริ่มต้น กดปุ่ม ปล่อยคำออกมา แล้วค่อยอ่านและปรับ 4. เลือกสนามรบให้เป็น อีเมลยาว ข้อความ Slack เอกสาร Notion ไดอารี่ คือที่ที่การพิมพ์ด้วยเสียงคุ้มค่า รหัสผ่าน โค้ด และศัพท์เทคนิคแม่นยำคือที่ที่การพิมพ์ยังชนะ 5. ฝึกรีเฟล็กซ์ สัปดาห์แรก บังคับตัวเองให้ใช้ปุ่มลัดสำหรับทุกอย่างที่ยาวเกินสองประโยค หลังจากนั้นมันจะกลายเป็นอัตโนมัติ
การเปลี่ยนแปลงที่ใหญ่ที่สุดคือเรื่องในหัว คุณจะหยุดร่างประโยคในใจก่อนพูด คุณจะคิดดัง ๆ ออกมา แล้วข้อความก็จะตามไปทัน
วันแรกที่คุณพิมพ์ทุกอย่างด้วยเสียง
เลือกปุ่ม วันนี้ ตอนนี้เลย เปิด System Settings → Keyboard → Dictation คลิก Customize แล้วผูกกับอะไรก็ได้ที่คุณกดได้โดยไม่ต้องคิด F13 ถ้ามี Option ขวา ถ้าไม่มี
จากนั้นให้คำมั่นว่าจะใช้มันกับงานจริงสักงาน ตอบอีเมลสามฉบับต่อไปด้วยเสียง ส่งข้อความ Slack ห้าข้อความต่อไปด้วยเสียง เขียนโน้ตชิ้นต่อไปด้วยเสียง อย่าเพิ่งให้คะแนนผลลัพธ์ ให้สังเกตว่าความคิดเดินทางจากหัวไปจอเร็วขึ้นแค่ไหน
ถ้า dictation ของ macOS เพียงพอสำหรับคุณ ก็จบแค่นั้น แต่ถ้าคุณพบว่าตัวเองแก้ทุกทรานสคริปต์ก่อนส่ง ปุ่มลัดทำหน้าที่ของมันแล้ว คอขวดของคุณขยับไปอีกที่ ตอนนี้มันคือช่องว่างระหว่างคำพูดดิบกับงานเขียนที่เสร็จสมบูรณ์ และนั่นคือช่องว่างที่ Voicr ปิดให้ กด FN ค้าง พูดตามธรรมชาติ วางข้อความที่ขัดเกลาแล้ว ปุ่มเดียว ในทุกแอป ไม่มีขั้นตอนเก็บกวาด
ไม่ว่าทางไหน วันที่คุณเลิกพิมพ์ทุกอย่าง คือวันที่คุณได้สัปดาห์ของคุณคืนมาเป็นชิ้นใหญ่

