คุณเคยสงสัยไหมว่าจะทำให้ AI คิดเหมือนมนุษย์มากขึ้นได้อย่างไร แม้ว่า Large Language Models (LLM) จะทำนายคำถัดไปในลำดับได้อย่างยอดเยี่ยม แต่บ่อยครั้งที่ LLM มักจะสะดุดเมื่อเผชิญกับปัญหาที่ต้องใช้การคิดอย่างเป็นระบบ ลองนึกถึงการกระตุ้นแบบ Chain-of-Thought ซึ่งเป็นเทคนิคที่เปลี่ยนโฉมหน้าของวิธีการโต้ตอบกับ AI
ลองจินตนาการว่าคุณกำลังสอนเด็กให้แก้ปริศนาที่ซับซ้อน แทนที่จะให้พวกเขาเห็นภาพสุดท้าย คุณจะคอยชี้แนะพวกเขาในแต่ละขั้นตอน นั่นคือสิ่งที่การกระตุ้น ความคิดแบบห่วงโซ่ (CoT) ทำกับผู้เรียน LLM โดยการให้ตัวอย่างที่แสดงให้เห็นการใช้เหตุผลแบบทีละขั้นตอน เราช่วยให้โมเดลเหล่านี้ไปถึงวิธีแก้ปัญหาที่ถูกต้องผ่านความก้าวหน้าที่เป็นตรรกะ
วิธีการกระตุ้นแบบดั้งเดิมมักนำไปสู่ผลลัพธ์ที่คาดเดายาก อย่างไรก็ตาม การกระตุ้นแบบ CoT จะแบ่งปัญหาที่ซับซ้อนออกเป็นส่วนย่อยๆ เพื่อให้โมเดลสามารถจัดการกับแต่ละองค์ประกอบได้อย่างเป็นระบบ แนวทางนี้ได้รับการพิสูจน์แล้วว่าประสบความสำเร็จอย่างมาก จนโมเดลที่ล้ำสมัย เช่น ผลิตภัณฑ์ล่าสุดของ OpenAI ได้นำแนวทางนี้มาผนวกเข้ากับฟังก์ชันหลัก
มาดูตัวอย่างในทางปฏิบัติกัน ลองนึกภาพว่าคุณกำลังช่วย AI แก้สมการนี้
5x-4 = 16
คำสั่ง CoT จะช่วยแนะนำโมเดลดังต่อไปนี้:
5x/5 = 20/5
x = 4
แนวทางที่มีโครงสร้างนี้ช่วยให้มั่นใจถึงความแม่นยำและสาธิตกระบวนการใช้เหตุผล ซึ่งมีค่าอย่างยิ่งโดยเฉพาะอย่างยิ่งเมื่อต้องจัดการกับการดำเนินการทางคณิตศาสตร์ที่ซับซ้อน
เทคนิคทั้งสองนี้อาจดูคล้ายกันในตอนแรก แต่มีวัตถุประสงค์ที่แตกต่างกัน:
การแจ้งเตือนแบบ Few-Shot : ให้ตัวอย่างที่แสดงอินพุตและเอาต์พุต เช่น คีย์คำตอบแบบตัวเลือกหลายตัว
การกระตุ้นความคิดแบบห่วงโซ่ : แสดงกระบวนการใช้เหตุผลแบบครบถ้วน เช่น แสดงงานทั้งหมดในโจทย์คณิตศาสตร์
การแจ้งเตือนแบบ Few-Shot จะมีลักษณะดังนี้:
Example 1: Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Answer: $22 Example 2: Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Answer: $22
การกระตุ้นความคิดแบบห่วงโซ่ จะมีลักษณะดังนี้:
Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Thinking: 1. Calculate cost of books: 2 books × $5 = $10 2. Calculate cost of markers: 4 markers × $3 = $12 3. Total cost = Cost of books + Cost of markers = $10 + $12 = $22 Answer: $22 Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Thinking: 1. Calculate cost of notebooks: 3 notebooks × $4 = $12 2. Calculate cost of pens: 5 pens × $2 = $10 3. Total cost = Cost of notebooks + Cost of pens = $12 + $10 = $22 Answer: $22
การใช้ประโยคที่เรียบง่ายแต่ทรงพลังอย่าง " มาคิดทีละขั้นตอนกันเถอะ " จะใช้การกระตุ้นแบบ Zero-shot CoT ในสถานการณ์ที่คุณไม่มีกรณีตัวอย่างอยู่ในมือ ตัวอย่างเช่น "มาคิดทีละขั้นตอนกันเถอะ: อธิบายฟิสิกส์ควอนตัม"
การกระตุ้น CoT จะมีประสิทธิภาพเมื่อต้องจัดการกับ:
เกณฑ์มาตรฐานล่าสุดจาก Claude แสดงให้เห็นว่าวิธีการที่ใช้การกระตุ้น CoT แบบ 3 ช็อตหรือ 5 ช็อตนั้นทำได้ดีสำหรับงานที่เน้นการใช้เหตุผลอย่าง GPQA และ MMLU
ความก้าวหน้าล่าสุดในการใช้เหตุผลของ AI จะผสานองค์ประกอบภาพและข้อความในกระบวนการรับรู้ ลองนึกภาพ AI วินิจฉัยการซ่อมจักรยาน ทำความเข้าใจคู่มือ และให้คำแนะนำด้วยภาพและเสียงตลอดทุกขั้นตอนของกระบวนการ แนวทางแบบหลายโหมดนี้แสดงถึงความก้าวหน้าที่กำลังจะเกิดขึ้นในการสนับสนุน AI
แม้ว่าการกระตุ้นความคิดแบบเป็นลำดับจะทรงพลัง แต่ก็มีข้อจำกัดบางประการ เส้นทางการใช้เหตุผลที่โมเดลดำเนินการนั้นไม่ได้รับประกันว่าจะไม่มีข้อผิดพลาด และผลลัพธ์อาจแตกต่างกันเล็กน้อย
ต่อไปนี้เป็นเคล็ดลับบางประการเพื่อให้ได้ผลลัพธ์ที่ดีขึ้น:
เมื่อพิจารณาจากความก้าวหน้าของ AI จะเห็นได้ว่าการกระตุ้นแบบ Chain-of-Thought (CoT) เป็นเทคนิคที่มีประสิทธิภาพในการใช้ประโยชน์จากความสามารถในการใช้เหตุผลขั้นสูง สิ่งสำคัญที่ต้องทราบคือ การใช้การกระตุ้นแบบ CoT เพื่อพัฒนาแอปพลิเคชันหรือเพื่อให้ได้ผลลัพธ์ที่เหมาะสมยิ่งขึ้นในการมีส่วนร่วมกับ AI จะช่วยเพิ่มโอกาสในการประสบความสำเร็จได้อย่างมาก
เจตนาไม่ได้อยู่ที่การได้รับคำตอบที่ถูกต้องเพียงอย่างเดียว แต่ยังรวมถึงการเข้าใจขั้นตอนที่ดำเนินการเพื่อให้ได้คำตอบนั้นด้วย และนั่นคือความงดงามของการกระตุ้นแบบห่วงโซ่แห่งความคิด