paint-brush
បច្ចេកទេសបំផុសគំនិតថ្មីអះអាងថាអាចជួយ AI គិតដូចមនុស្សដោយ@mahakshah
854 ការអាន
854 ការអាន

បច្ចេកទេសបំផុសគំនិតថ្មីអះអាងថាអាចជួយ AI គិតដូចមនុស្ស

ដោយ Mahak Shah4m2025/01/15
Read on Terminal Reader

យូរ​ពេក; អាន

ការជំរុញឱ្យមានការគិតជាច្រវាក់កំពុងធ្វើបដិវត្តន៍ពីរបៀបដែលយើងធ្វើអន្តរកម្មជាមួយ AI ។ វាបំបែកបញ្ហាស្មុគ្រស្មាញទៅជាកំណាត់ដែលអាចរំលាយបាន ដែលអនុញ្ញាតឱ្យគំរូដោះស្រាយសមាសធាតុនីមួយៗជាប្រព័ន្ធ។ វិធីសាស្រ្តដែលមានរចនាសម្ព័ន្ធនេះធានានូវភាពត្រឹមត្រូវ និងបង្ហាញពីដំណើរការវែកញែក ដែលជាអ្វីដែលមានតម្លៃជាពិសេសនៅពេលដោះស្រាយប្រតិបត្តិការគណិតវិទ្យាដ៏ស្មុគស្មាញ។
featured image - បច្ចេកទេសបំផុសគំនិតថ្មីអះអាងថាអាចជួយ AI គិតដូចមនុស្ស
Mahak Shah HackerNoon profile picture


ធ្លាប់ឆ្ងល់ពីរបៀបធ្វើឱ្យ AI គិតកាន់តែដូចមនុស្ស? ខណៈពេលដែលគំរូភាសាធំ (LLMs) ពូកែក្នុងការទស្សន៍ទាយពាក្យបន្ទាប់ក្នុងលំដាប់មួយ ពួកគេតែងតែជំពប់ដួលនៅពេលប្រឈមមុខនឹងបញ្ហាដែលទាមទារការគិតជាវិធីសាស្ត្រ។ បញ្ចូលខ្សែសង្វាក់នៃការគិត - បច្ចេកទេសផ្លាស់ប្តូរហ្គេមដែលផ្លាស់ប្តូររបៀបដែលយើងធ្វើអន្តរកម្មជាមួយ AI ។

បំបែកខ្សែសង្វាក់នៃការគិតបំផុសគំនិត


ស្រមៃមើលការបង្រៀនកូនឱ្យដោះស្រាយល្បែងផ្គុំរូបដ៏ស្មុគស្មាញមួយ។ ជំនួសឱ្យការបង្ហាញពួកគេនូវរូបភាពចុងក្រោយ អ្នកណែនាំពួកគេតាមជំហាននីមួយៗ។ នោះហើយជាអ្វីដែល Chain-of-Thought (CoT) ជំរុញឱ្យធ្វើសម្រាប់ LLMs ។ តាមរយៈការផ្តល់នូវឧទាហរណ៍ដែលបង្ហាញពីការវែកញែកជាជំហានៗ យើងជួយគំរូទាំងនេះទៅដល់ដំណោះស្រាយត្រឹមត្រូវតាមរយៈដំណើរការឡូជីខល។


ប្រភពរូបភាព៖ Wei et al. (2022)


រូបមន្តវេទមន្ត៖ ហេតុអ្វីបានជាវាដំណើរការ


វិធីសាស្រ្តដាស់តឿនតាមបែបប្រពៃណីតែងតែនាំទៅរកលទ្ធផលបុក ឬខកខាន។ ទោះជាយ៉ាងណាក៏ដោយ ការជម្រុញ CoT បំបែកបញ្ហាស្មុគ្រស្មាញទៅជាកំណាត់ដែលអាចរំលាយបាន ដែលអនុញ្ញាតឱ្យគំរូដើម្បីដោះស្រាយសមាសធាតុនីមួយៗជាប្រព័ន្ធ។ វិធីសាស្រ្តនេះបានបង្ហាញឱ្យឃើញពីភាពជោគជ័យយ៉ាងខ្លាំងដែលម៉ូដែលទំនើបៗដូចជាការផ្តល់ជូនចុងក្រោយបង្អស់របស់ OpenAI បានដាក់បញ្ចូលវាទៅក្នុងមុខងារស្នូលរបស់ពួកគេ។


កម្មវិធីពិភពលោកពិត៖ ដោះស្រាយល្បែងផ្គុំរូបគណិតវិទ្យា


ចូរយើងចូលទៅក្នុងឧទាហរណ៍ជាក់ស្តែង។ ស្រមៃថាអ្នកកំពុងជួយ AI ដោះស្រាយសមីការនេះ។

5x − 4 = 16


នេះជារបៀបដែល CoT prompting ណែនាំគំរូ៖

  1. ជំហានដំបូង: បន្ថែម 4 ទៅភាគីទាំងពីរ
    • 5x − 4 + 4 = 16 + 4
    • 5x = 20
  2. ជំហានទីពីរ៖ បែងចែកភាគីទាំងពីរដោយ 5
    • 5x/5 = 20/5

    • x = ៤


វិធីសាស្រ្តដែលមានរចនាសម្ព័ន្ធនេះធានានូវភាពត្រឹមត្រូវ និងបង្ហាញពីដំណើរការវែកញែក—អ្វីមួយដែលមានតម្លៃជាពិសេសនៅពេលដោះស្រាយប្រតិបត្តិការគណិតវិទ្យាដ៏ស្មុគស្មាញ។


ខ្សែសង្វាក់នៃការគិតធៀបនឹងការជំរុញឱ្យមានការបាញ់ប្រហារតិចតួច៖ ការយល់ដឹងពីភាពខុសគ្នា


បច្ចេកទេសទាំងពីរនេះអាចហាក់ដូចជាស្រដៀងគ្នានៅ glance ដំបូង ប៉ុន្តែពួកវាបម្រើគោលបំណងផ្សេងគ្នា៖


  • Few-Shot Prompting ៖ ផ្តល់ឧទាហរណ៍ដែលបង្ហាញពីការបញ្ចូល និងលទ្ធផល ដូចជាគ្រាប់ចុចចម្លើយពហុជម្រើស។

  • Chain-of-Thought Prompting : បង្ហាញពីដំណើរការហេតុផលពេញលេញ ដូចជាការបង្ហាញការងារទាំងអស់នៅក្នុងបញ្ហាគណិតវិទ្យា។


Few-Shot Prompting នឹងមើលទៅដូចនេះ៖

 Example 1: Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Answer: $22 Example 2: Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Answer: $22


Chain-of-Thought Prompting នឹងមើលទៅដូចនេះ៖

 Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Thinking: 1. Calculate cost of books: 2 books × $5 = $10 2. Calculate cost of markers: 4 markers × $3 = $12 3. Total cost = Cost of books + Cost of markers = $10 + $12 = $22 Answer: $22 Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Thinking: 1. Calculate cost of notebooks: 3 notebooks × $4 = $12 2. Calculate cost of pens: 5 pens × $2 = $10 3. Total cost = Cost of notebooks + Cost of pens = $12 + $10 = $22 Answer: $22

Zero-Shot Chain-of-Thought


ដោយប្រើឃ្លាដ៏សាមញ្ញ ប៉ុន្តែមានអានុភាពនៃ " ចូរយើងគិតមួយជំហានម្តងៗ " Zero-shot CoT prompting ត្រូវបានប្រើក្នុងកាលៈទេសៈ នៅពេលដែលអ្នកមិនមានករណីឧទាហរណ៍ងាយស្រួល។ ឧទាហរណ៍ "ចូរយើងគិតមួយជំហានម្តង ៗ ៖ ពន្យល់រូបវិទ្យា quantum ។"

តើអ្នកគួរប្រើ CoT prompting នៅពេលណា?


ការជម្រុញ CoT ភ្លឺនៅពេលដោះស្រាយជាមួយ៖

  • នព្វន្ធស្មុគស្មាញ
  • ហេតុផលឡូជីខលច្រើនជំហាន
  • សតិអារម្មណ៍
  • ឧបាយកលជានិមិត្តសញ្ញា


ស្តង់ដារថ្មីៗបំផុតពីលោក Claude បានបង្ហាញថាវិធីសាស្រ្តដែលប្រើការជំរុញ CoT 3-shot ឬ 5-shot កំពុងដំណើរការបានល្អសម្រាប់កិច្ចការដែលមានហេតុផល-ធ្ងន់៖ GPQA និង MMLU។

អនាគត៖ ខ្សែសង្វាក់នៃគំនិតចម្រុះ


ភាពជឿនលឿនចុងក្រោយបង្អស់នៅក្នុងហេតុផល AI រួមបញ្ចូលធាតុផ្សំដែលមើលឃើញ និងអត្ថបទនៅក្នុងដំណើរការយល់ដឹង។ ស្រមៃមើល AI ធ្វើរោគវិនិច្ឆ័យការជួសជុលកង់ ស្វែងយល់ពីសៀវភៅណែនាំ និងផ្តល់ការណែនាំជាសំឡេង និងជារូបភាពនៅទូទាំងដំណាក់កាលនីមួយៗនៃដំណើរការ។ វិធីសាស្រ្តពហុមុខងារបង្ហាញពីការរីកចម្រើននាពេលខាងមុខក្នុងការគាំទ្រ AI ។


ប្រភពរូបភាព៖ Zhang et al. (2023)

ការបង្កើនប្រសិទ្ធភាពនៃ CoT របស់អ្នកជំរុញឱ្យ


ខណៈពេលដែលការជំរុញឱ្យមានការគិតតាមខ្សែសង្វាក់មានថាមពល វាដំណើរការជាមួយនឹងដែនកំណត់ជាក់លាក់។ ផ្លូវ​នៃ​ការ​វែកញែក​ដែល​គំរូ​អនុវត្ត​គឺ​មិន​ត្រូវ​បាន​ធានា​ថា​គ្មាន​កំហុស​ទេ ហើយ​មាន​ភាព​ខុស​គ្នា​តិចតួច​នៅ​ក្នុង​លទ្ធផល។


នេះគឺជាគន្លឹះមួយចំនួនដើម្បីទទួលបានលទ្ធផលកាន់តែប្រសើរ៖

  • សាកល្បងយ៉ាងហ្មត់ចត់ជាមួយវិធីសាស្រ្តផ្សេងគ្នា។
  • ពិចារណាការរួមបញ្ចូល CoT ជម្រុញជាមួយនឹងយុទ្ធសាស្រ្តជំរុញផ្សេងទៀត។
  • ប្រើម៉ូដែលធំជាងដែលមានប៉ារ៉ាម៉ែត្រលើសពី 100 ពាន់លាន ប្រសិនបើអាច។

សេចក្តីសន្និដ្ឋាន


ដោយគិតពីរបៀបដែល AI មានការរីកចម្រើន វាគឺជាភស្តុតាងដែលថា Chain-of-Thought (CoT) ជាបច្ចេកទេសដ៏មានប្រសិទ្ធភាពមួយសម្រាប់ការប្រើប្រាស់សមត្ថភាពហេតុផលកម្រិតខ្ពស់បន្ថែមទៀត។ វាជារឿងសំខាន់ក្នុងការកត់សម្គាល់ថា ការប្រើប្រាស់ CoT ដែលជំរុញឱ្យមានការអភិវឌ្ឍន៍កម្មវិធី ឬសម្រាប់ការសម្រេចបាននូវលទ្ធផលដ៏ល្អប្រសើរបន្ថែមទៀតនៅក្នុងការចូលរួមរបស់ AI បង្កើនឱកាសនៃការសម្រេចបានជោគជ័យ។


ចេតនាមិនត្រឹមតែដើម្បីសម្រេចបាននូវការឆ្លើយតបដ៏ត្រឹមត្រូវប៉ុណ្ណោះទេ ប៉ុន្តែក៏នៅលើការយល់ដឹងអំពីនីតិវិធីដែលបានអនុវត្តដើម្បីធ្វើដូច្នេះដែរ ហើយនោះគឺជាភាពស្រស់ស្អាតនៃខ្សែសង្វាក់នៃការគិត។

លេខយោង

  1. Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, B., Xia, F., Chi, E., Le, Q., & Zhou, D. (2022) ។ ខ្សែសង្វាក់នៃការគិតដែលជំរុញឱ្យទាញហេតុផលក្នុងគំរូភាសាធំៗ។
  2. Kojima, T., Gu, SS, Reid, M., Matsuo, Y., & Iwasawa, Y. (2022)។ គំរូភាសាធំគឺជាអ្នកផ្តល់ហេតុផល Zero-Shot ។
  3. លោក Zhang, Zhuosheng, et al ។ "ហេតុផលខ្សែសង្វាក់នៃការគិតច្រើននៅក្នុងគំរូភាសា។" arXiv បោះពុម្ពជាមុន arXiv: 2302.00923 (2023) ។


L O A D I N G
. . . comments & more!

About Author

Mahak Shah HackerNoon profile picture
Mahak Shah@mahakshah
A seasoned Software engineer having 6 years of experience with industry leaders like Splunk, Salesforce and Samsung.

ព្យួរស្លាក

អត្ថបទនេះត្រូវបានបង្ហាញនៅក្នុង...