paint-brush
เทคนิคการกระตุ้นใหม่อ้างว่าจะช่วยให้ AI คิดได้เหมือนมนุษย์โดย@mahakshah
850 การอ่าน
850 การอ่าน

เทคนิคการกระตุ้นใหม่อ้างว่าจะช่วยให้ AI คิดได้เหมือนมนุษย์

โดย Mahak Shah4m2025/01/15
Read on Terminal Reader

นานเกินไป; อ่าน

การกระตุ้นความคิดแบบห่วงโซ่กำลังปฏิวัติวิธีที่เราโต้ตอบกับ AI โดยจะแบ่งปัญหาที่ซับซ้อนออกเป็นส่วนย่อยๆ ที่เข้าใจง่าย ทำให้โมเดลสามารถจัดการกับแต่ละองค์ประกอบได้อย่างเป็นระบบ แนวทางที่มีโครงสร้างนี้ช่วยให้มั่นใจได้ถึงความแม่นยำและสาธิตกระบวนการคิด ซึ่งมีประโยชน์อย่างยิ่งเมื่อต้องจัดการกับการดำเนินการทางคณิตศาสตร์ที่ซับซ้อน
featured image - เทคนิคการกระตุ้นใหม่อ้างว่าจะช่วยให้ AI คิดได้เหมือนมนุษย์
Mahak Shah HackerNoon profile picture


คุณเคยสงสัยไหมว่าจะทำให้ AI คิดเหมือนมนุษย์มากขึ้นได้อย่างไร แม้ว่า Large Language Models (LLM) จะทำนายคำถัดไปในลำดับได้อย่างยอดเยี่ยม แต่บ่อยครั้งที่ LLM มักจะสะดุดเมื่อเผชิญกับปัญหาที่ต้องใช้การคิดอย่างเป็นระบบ ลองนึกถึงการกระตุ้นแบบ Chain-of-Thought ซึ่งเป็นเทคนิคที่เปลี่ยนโฉมหน้าของวิธีการโต้ตอบกับ AI

การทำลายห่วงโซ่แห่งความคิดที่กระตุ้น


ลองจินตนาการว่าคุณกำลังสอนเด็กให้แก้ปริศนาที่ซับซ้อน แทนที่จะให้พวกเขาเห็นภาพสุดท้าย คุณจะคอยชี้แนะพวกเขาในแต่ละขั้นตอน นั่นคือสิ่งที่การกระตุ้น ความคิดแบบห่วงโซ่ (CoT) ทำกับผู้เรียน LLM โดยการให้ตัวอย่างที่แสดงให้เห็นการใช้เหตุผลแบบทีละขั้นตอน เราช่วยให้โมเดลเหล่านี้ไปถึงวิธีแก้ปัญหาที่ถูกต้องผ่านความก้าวหน้าที่เป็นตรรกะ


ที่มาของภาพ: Wei et al. (2022)


สูตรวิเศษ: ทำไมมันถึงได้ผล


วิธีการกระตุ้นแบบดั้งเดิมมักนำไปสู่ผลลัพธ์ที่คาดเดายาก อย่างไรก็ตาม การกระตุ้นแบบ CoT จะแบ่งปัญหาที่ซับซ้อนออกเป็นส่วนย่อยๆ เพื่อให้โมเดลสามารถจัดการกับแต่ละองค์ประกอบได้อย่างเป็นระบบ แนวทางนี้ได้รับการพิสูจน์แล้วว่าประสบความสำเร็จอย่างมาก จนโมเดลที่ล้ำสมัย เช่น ผลิตภัณฑ์ล่าสุดของ OpenAI ได้นำแนวทางนี้มาผนวกเข้ากับฟังก์ชันหลัก


การประยุกต์ใช้ในโลกแห่งความเป็นจริง: การแก้ปริศนาทางคณิตศาสตร์


มาดูตัวอย่างในทางปฏิบัติกัน ลองนึกภาพว่าคุณกำลังช่วย AI แก้สมการนี้

5x-4 = 16


คำสั่ง CoT จะช่วยแนะนำโมเดลดังต่อไปนี้:

  1. ขั้นตอนแรก: บวก 4 ทั้งสองข้าง
    • 5x - 4 + 4 = 16 + 4
    • 5x = 20
  2. ขั้นตอนที่สอง: หารทั้งสองข้างด้วย 5
    • 5x/5 = 20/5

    • x = 4


แนวทางที่มีโครงสร้างนี้ช่วยให้มั่นใจถึงความแม่นยำและสาธิตกระบวนการใช้เหตุผล ซึ่งมีค่าอย่างยิ่งโดยเฉพาะอย่างยิ่งเมื่อต้องจัดการกับการดำเนินการทางคณิตศาสตร์ที่ซับซ้อน


ความคิดแบบต่อเนื่องกับการกระตุ้นแบบไม่กี่ช็อต: ทำความเข้าใจความแตกต่าง


เทคนิคทั้งสองนี้อาจดูคล้ายกันในตอนแรก แต่มีวัตถุประสงค์ที่แตกต่างกัน:


  • การแจ้งเตือนแบบ Few-Shot : ให้ตัวอย่างที่แสดงอินพุตและเอาต์พุต เช่น คีย์คำตอบแบบตัวเลือกหลายตัว

  • การกระตุ้นความคิดแบบห่วงโซ่ : แสดงกระบวนการใช้เหตุผลแบบครบถ้วน เช่น แสดงงานทั้งหมดในโจทย์คณิตศาสตร์


การแจ้งเตือนแบบ Few-Shot จะมีลักษณะดังนี้:

 Example 1: Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Answer: $22 Example 2: Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Answer: $22


การกระตุ้นความคิดแบบห่วงโซ่ จะมีลักษณะดังนี้:

 Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Thinking: 1. Calculate cost of books: 2 books × $5 = $10 2. Calculate cost of markers: 4 markers × $3 = $12 3. Total cost = Cost of books + Cost of markers = $10 + $12 = $22 Answer: $22 Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Thinking: 1. Calculate cost of notebooks: 3 notebooks × $4 = $12 2. Calculate cost of pens: 5 pens × $2 = $10 3. Total cost = Cost of notebooks + Cost of pens = $12 + $10 = $22 Answer: $22

ห่วงโซ่แห่งความคิดแบบ Zero-Shot


การใช้ประโยคที่เรียบง่ายแต่ทรงพลังอย่าง " มาคิดทีละขั้นตอนกันเถอะ " จะใช้การกระตุ้นแบบ Zero-shot CoT ในสถานการณ์ที่คุณไม่มีกรณีตัวอย่างอยู่ในมือ ตัวอย่างเช่น "มาคิดทีละขั้นตอนกันเถอะ: อธิบายฟิสิกส์ควอนตัม"

คุณควรใช้การแจ้งเตือน CoT เมื่อใด?


การกระตุ้น CoT จะมีประสิทธิภาพเมื่อต้องจัดการกับ:

  • การคำนวณที่ซับซ้อน
  • การใช้เหตุผลเชิงตรรกะหลายขั้นตอน
  • สามัญสำนึก
  • การจัดการเชิงสัญลักษณ์


เกณฑ์มาตรฐานล่าสุดจาก Claude แสดงให้เห็นว่าวิธีการที่ใช้การกระตุ้น CoT แบบ 3 ช็อตหรือ 5 ช็อตนั้นทำได้ดีสำหรับงานที่เน้นการใช้เหตุผลอย่าง GPQA และ MMLU

อนาคต: ห่วงโซ่แห่งความคิดแบบหลายรูปแบบ


ความก้าวหน้าล่าสุดในการใช้เหตุผลของ AI จะผสานองค์ประกอบภาพและข้อความในกระบวนการรับรู้ ลองนึกภาพ AI วินิจฉัยการซ่อมจักรยาน ทำความเข้าใจคู่มือ และให้คำแนะนำด้วยภาพและเสียงตลอดทุกขั้นตอนของกระบวนการ แนวทางแบบหลายโหมดนี้แสดงถึงความก้าวหน้าที่กำลังจะเกิดขึ้นในการสนับสนุน AI


แหล่งที่มาของภาพ: Zhang และคณะ (2023)

การเพิ่มประสิทธิภาพของข้อความแจ้งเตือน CoT ของคุณให้สูงสุด


แม้ว่าการกระตุ้นความคิดแบบเป็นลำดับจะทรงพลัง แต่ก็มีข้อจำกัดบางประการ เส้นทางการใช้เหตุผลที่โมเดลดำเนินการนั้นไม่ได้รับประกันว่าจะไม่มีข้อผิดพลาด และผลลัพธ์อาจแตกต่างกันเล็กน้อย


ต่อไปนี้เป็นเคล็ดลับบางประการเพื่อให้ได้ผลลัพธ์ที่ดีขึ้น:

  • ทดสอบอย่างละเอียดด้วยวิธีการที่แตกต่างกัน
  • พิจารณาการรวมการแจ้งเตือน CoT เข้ากับกลยุทธ์การแจ้งเตือนอื่นๆ
  • ใช้โมเดลขนาดใหญ่ที่มีพารามิเตอร์มากกว่า 100 พันล้านรายการ หากเป็นไปได้

บทสรุป


เมื่อพิจารณาจากความก้าวหน้าของ AI จะเห็นได้ว่าการกระตุ้นแบบ Chain-of-Thought (CoT) เป็นเทคนิคที่มีประสิทธิภาพในการใช้ประโยชน์จากความสามารถในการใช้เหตุผลขั้นสูง สิ่งสำคัญที่ต้องทราบคือ การใช้การกระตุ้นแบบ CoT เพื่อพัฒนาแอปพลิเคชันหรือเพื่อให้ได้ผลลัพธ์ที่เหมาะสมยิ่งขึ้นในการมีส่วนร่วมกับ AI จะช่วยเพิ่มโอกาสในการประสบความสำเร็จได้อย่างมาก


เจตนาไม่ได้อยู่ที่การได้รับคำตอบที่ถูกต้องเพียงอย่างเดียว แต่ยังรวมถึงการเข้าใจขั้นตอนที่ดำเนินการเพื่อให้ได้คำตอบนั้นด้วย และนั่นคือความงดงามของการกระตุ้นแบบห่วงโซ่แห่งความคิด

เชิงอรรถ

  1. Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, B., Xia, F., Chi, E., Le, Q., & Zhou, D. (2022). การกระตุ้นความคิดแบบห่วงโซ่กระตุ้นให้เกิดการใช้เหตุผลในโมเดลภาษาขนาดใหญ่
  2. Kojima, T., Gu, SS, Reid, M., Matsuo, Y. และ Iwasawa, Y. (2022). โมเดลภาษาขนาดใหญ่คือ Zero-Shot Reasoners
  3. Zhang, Zhuosheng และคณะ "การใช้เหตุผลแบบห่วงโซ่ความคิดหลายรูปแบบในแบบจำลองภาษา" arXiv preprint arXiv:2302.00923 (2023)