ធ្លាប់ឆ្ងល់ពីរបៀបធ្វើឱ្យ AI គិតកាន់តែដូចមនុស្ស? ខណៈពេលដែលគំរូភាសាធំ (LLMs) ពូកែក្នុងការទស្សន៍ទាយពាក្យបន្ទាប់ក្នុងលំដាប់មួយ ពួកគេតែងតែជំពប់ដួលនៅពេលប្រឈមមុខនឹងបញ្ហាដែលទាមទារការគិតជាវិធីសាស្ត្រ។ បញ្ចូលខ្សែសង្វាក់នៃការគិត - បច្ចេកទេសផ្លាស់ប្តូរហ្គេមដែលផ្លាស់ប្តូររបៀបដែលយើងធ្វើអន្តរកម្មជាមួយ AI ។
ស្រមៃមើលការបង្រៀនកូនឱ្យដោះស្រាយល្បែងផ្គុំរូបដ៏ស្មុគស្មាញមួយ។ ជំនួសឱ្យការបង្ហាញពួកគេនូវរូបភាពចុងក្រោយ អ្នកណែនាំពួកគេតាមជំហាននីមួយៗ។ នោះហើយជាអ្វីដែល Chain-of-Thought (CoT) ជំរុញឱ្យធ្វើសម្រាប់ LLMs ។ តាមរយៈការផ្តល់នូវឧទាហរណ៍ដែលបង្ហាញពីការវែកញែកជាជំហានៗ យើងជួយគំរូទាំងនេះទៅដល់ដំណោះស្រាយត្រឹមត្រូវតាមរយៈដំណើរការឡូជីខល។
វិធីសាស្រ្តដាស់តឿនតាមបែបប្រពៃណីតែងតែនាំទៅរកលទ្ធផលបុក ឬខកខាន។ ទោះជាយ៉ាងណាក៏ដោយ ការជម្រុញ CoT បំបែកបញ្ហាស្មុគ្រស្មាញទៅជាកំណាត់ដែលអាចរំលាយបាន ដែលអនុញ្ញាតឱ្យគំរូដើម្បីដោះស្រាយសមាសធាតុនីមួយៗជាប្រព័ន្ធ។ វិធីសាស្រ្តនេះបានបង្ហាញឱ្យឃើញពីភាពជោគជ័យយ៉ាងខ្លាំងដែលម៉ូដែលទំនើបៗដូចជាការផ្តល់ជូនចុងក្រោយបង្អស់របស់ OpenAI បានដាក់បញ្ចូលវាទៅក្នុងមុខងារស្នូលរបស់ពួកគេ។
ចូរយើងចូលទៅក្នុងឧទាហរណ៍ជាក់ស្តែង។ ស្រមៃថាអ្នកកំពុងជួយ AI ដោះស្រាយសមីការនេះ។
5x − 4 = 16
នេះជារបៀបដែល CoT prompting ណែនាំគំរូ៖
5x/5 = 20/5
x = ៤
វិធីសាស្រ្តដែលមានរចនាសម្ព័ន្ធនេះធានានូវភាពត្រឹមត្រូវ និងបង្ហាញពីដំណើរការវែកញែក—អ្វីមួយដែលមានតម្លៃជាពិសេសនៅពេលដោះស្រាយប្រតិបត្តិការគណិតវិទ្យាដ៏ស្មុគស្មាញ។
បច្ចេកទេសទាំងពីរនេះអាចហាក់ដូចជាស្រដៀងគ្នានៅ glance ដំបូង ប៉ុន្តែពួកវាបម្រើគោលបំណងផ្សេងគ្នា៖
Few-Shot Prompting ៖ ផ្តល់ឧទាហរណ៍ដែលបង្ហាញពីការបញ្ចូល និងលទ្ធផល ដូចជាគ្រាប់ចុចចម្លើយពហុជម្រើស។
Chain-of-Thought Prompting : បង្ហាញពីដំណើរការហេតុផលពេញលេញ ដូចជាការបង្ហាញការងារទាំងអស់នៅក្នុងបញ្ហាគណិតវិទ្យា។
Few-Shot Prompting នឹងមើលទៅដូចនេះ៖
Example 1: Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Answer: $22 Example 2: Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Answer: $22
Chain-of-Thought Prompting នឹងមើលទៅដូចនេះ៖
Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Thinking: 1. Calculate cost of books: 2 books × $5 = $10 2. Calculate cost of markers: 4 markers × $3 = $12 3. Total cost = Cost of books + Cost of markers = $10 + $12 = $22 Answer: $22 Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Thinking: 1. Calculate cost of notebooks: 3 notebooks × $4 = $12 2. Calculate cost of pens: 5 pens × $2 = $10 3. Total cost = Cost of notebooks + Cost of pens = $12 + $10 = $22 Answer: $22
ដោយប្រើឃ្លាដ៏សាមញ្ញ ប៉ុន្តែមានអានុភាពនៃ " ចូរយើងគិតមួយជំហានម្តងៗ " Zero-shot CoT prompting ត្រូវបានប្រើក្នុងកាលៈទេសៈ នៅពេលដែលអ្នកមិនមានករណីឧទាហរណ៍ងាយស្រួល។ ឧទាហរណ៍ "ចូរយើងគិតមួយជំហានម្តង ៗ ៖ ពន្យល់រូបវិទ្យា quantum ។"
ការជម្រុញ CoT ភ្លឺនៅពេលដោះស្រាយជាមួយ៖
ស្តង់ដារថ្មីៗបំផុតពីលោក Claude បានបង្ហាញថាវិធីសាស្រ្តដែលប្រើការជំរុញ CoT 3-shot ឬ 5-shot កំពុងដំណើរការបានល្អសម្រាប់កិច្ចការដែលមានហេតុផល-ធ្ងន់៖ GPQA និង MMLU។
ភាពជឿនលឿនចុងក្រោយបង្អស់នៅក្នុងហេតុផល AI រួមបញ្ចូលធាតុផ្សំដែលមើលឃើញ និងអត្ថបទនៅក្នុងដំណើរការយល់ដឹង។ ស្រមៃមើល AI ធ្វើរោគវិនិច្ឆ័យការជួសជុលកង់ ស្វែងយល់ពីសៀវភៅណែនាំ និងផ្តល់ការណែនាំជាសំឡេង និងជារូបភាពនៅទូទាំងដំណាក់កាលនីមួយៗនៃដំណើរការ។ វិធីសាស្រ្តពហុមុខងារបង្ហាញពីការរីកចម្រើននាពេលខាងមុខក្នុងការគាំទ្រ AI ។
ខណៈពេលដែលការជំរុញឱ្យមានការគិតតាមខ្សែសង្វាក់មានថាមពល វាដំណើរការជាមួយនឹងដែនកំណត់ជាក់លាក់។ ផ្លូវនៃការវែកញែកដែលគំរូអនុវត្តគឺមិនត្រូវបានធានាថាគ្មានកំហុសទេ ហើយមានភាពខុសគ្នាតិចតួចនៅក្នុងលទ្ធផល។
នេះគឺជាគន្លឹះមួយចំនួនដើម្បីទទួលបានលទ្ធផលកាន់តែប្រសើរ៖
ដោយគិតពីរបៀបដែល AI មានការរីកចម្រើន វាគឺជាភស្តុតាងដែលថា Chain-of-Thought (CoT) ជាបច្ចេកទេសដ៏មានប្រសិទ្ធភាពមួយសម្រាប់ការប្រើប្រាស់សមត្ថភាពហេតុផលកម្រិតខ្ពស់បន្ថែមទៀត។ វាជារឿងសំខាន់ក្នុងការកត់សម្គាល់ថា ការប្រើប្រាស់ CoT ដែលជំរុញឱ្យមានការអភិវឌ្ឍន៍កម្មវិធី ឬសម្រាប់ការសម្រេចបាននូវលទ្ធផលដ៏ល្អប្រសើរបន្ថែមទៀតនៅក្នុងការចូលរួមរបស់ AI បង្កើនឱកាសនៃការសម្រេចបានជោគជ័យ។
ចេតនាមិនត្រឹមតែដើម្បីសម្រេចបាននូវការឆ្លើយតបដ៏ត្រឹមត្រូវប៉ុណ្ណោះទេ ប៉ុន្តែក៏នៅលើការយល់ដឹងអំពីនីតិវិធីដែលបានអនុវត្តដើម្បីធ្វើដូច្នេះដែរ ហើយនោះគឺជាភាពស្រស់ស្អាតនៃខ្សែសង្វាក់នៃការគិត។