អ្នកនិពន្ធ៖
(1) Raphaël Millière, នាយកដ្ឋានទស្សនវិជ្ជា, សាកលវិទ្យាល័យ Macquarie ([email protected]);
(2) Cameron Buckner, នាយកដ្ឋានទស្សនវិជ្ជា, សាកលវិទ្យាល័យ Houston ([email protected]) ។
តារាងតំណភ្ជាប់
2. primer នៅលើ LLMs
២.១. មូលដ្ឋានគ្រឹះប្រវត្តិសាស្ត្រ
២.២. LLMs ដែលមានមូលដ្ឋានលើប្លែង
3. ចំណុចប្រទាក់ជាមួយនឹងបញ្ហាទស្សនវិជ្ជាបុរាណ
៣.២. Nativism និងការទទួលបានភាសា
៣.៥. ការបញ្ជូនចំណេះដឹងវប្បធម៌ និងភាសាវិទ្យា
4. សេចក្តីសន្និដ្ឋាន សទ្ទានុក្រម និងឯកសារយោង
3. ចំណុចប្រទាក់ជាមួយនឹងបញ្ហាទស្សនវិជ្ជាបុរាណ
បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត រួមទាំងស្ថាបត្យកម្ម NLP ជំនាន់មុន គឺជាការផ្តោតអារម្មណ៍នៃការស៊ើបអង្កេតទស្សនវិជ្ជាជាយូរមកហើយ ជាពិសេសក្នុងចំណោមទស្សនវិទូនៃចិត្ត ភាសា និងវិទ្យាសាស្ត្រ។ ការពិភាក្សាទស្សនវិជ្ជាជាច្រើនជុំវិញប្រព័ន្ធទាំងនេះ ទាក់ទងនឹងភាពសមស្របរបស់ពួកគេក្នុងការយកគំរូតាមការយល់ដឹងរបស់មនុស្ស។ ជាពិសេស ការជជែកវែកញែកផ្តោតលើថាតើពួកវាបង្កើតបានជាគំរូល្អប្រសើរនៃដំណើរការយល់ដឹងរបស់មនុស្សជាជាងសមភាគីបុរាណ និមិត្តសញ្ញា និងច្បាប់របស់ពួកគេ។ នៅទីនេះ យើងពិនិត្យមើលសំណួរទស្សនវិជ្ជាសំខាន់ៗដែលបានលេចឡើងទាក់ទងនឹងតួនាទីនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលជាគំរូនៃភាពវៃឆ្លាត ហេតុផល ឬការយល់ដឹង ដោយផ្តោតលើការចាប់កំណើតបច្ចុប្បន្នរបស់ពួកគេនៅក្នុងបរិបទនៃការពិភាក្សាដែលកំពុងបន្តអំពីផលប៉ះពាល់នៃ LLMs ដែលមានមូលដ្ឋានលើប្លែង។
ការជជែកដេញដោលនាពេលថ្មីៗនេះត្រូវបានបិទបាំងដោយលំនាំការសន្និដ្ឋានខុសឆ្គង ដែលយើងហៅថា "ការបកស្រាយឡើងវិញនូវភាពខុសឆ្គង"។ ភាពខុសឆ្គងនេះកើតឡើងនៅពេលដែលអ្នករិះគន់ជំទាស់ថាប្រព័ន្ធមួយមិនអាចយកគំរូតាមជាក់លាក់ណាមួយបានទេ។
សមត្ថភាពយល់ដឹង ដោយសារប្រតិបត្តិការរបស់វាអាចត្រូវបានពន្យល់ក្នុងន័យអរូបី និងបរិត្តផរណាច្រើន។ នៅក្នុងបរិបទបច្ចុប្បន្ន ភាពខុសឆ្គងបង្ហាញឱ្យឃើញនៅក្នុងការអះអាងដែលថា LLMs មិនអាចក្លាយជាគំរូដ៏ល្អនៃសមត្ថភាពយល់ដឹងមួយចំនួន𝜙 ដោយសារតែប្រតិបត្តិការរបស់ពួកគេគ្រាន់តែមាននៅក្នុងការប្រមូលផ្ដុំនៃការគណនាស្ថិតិ ឬប្រតិបត្តិការពិជគណិតលីនេអ៊ែរ ឬការទស្សន៍ទាយសញ្ញាបន្ទាប់។ ទឡ្ហីករណ៍បែបនេះមានសុពលភាពលុះត្រាតែមានភ្ជាប់មកជាមួយនូវភស្តុតាងដែលបង្ហាញថាប្រព័ន្ធមួយដែលបានកំណត់ក្នុងលក្ខខណ្ឌទាំងនេះគឺមិនអាចអនុវត្តបាន 𝜙 ។ ដើម្បីបង្ហាញ សូមពិចារណាពីតក្កវិជ្ជាដែលមានកំហុសក្នុងការអះអាងថាព្យាណូមិនអាចបង្កើតភាពសុខដុមរមនាបានទេព្រោះវាអាចត្រូវបានពិពណ៌នាថាជាបណ្តុំនៃញញួរវាយខ្សែអក្សរ ឬ (ច្បាស់ជាងនេះទៅទៀត) ដែលសកម្មភាពខួរក្បាលមិនអាចអនុវត្តការយល់ដឹងបានទេព្រោះវាអាចត្រូវបានពិពណ៌នាថាជាបណ្តុំនៃសរសៃប្រសាទ។ សំណួរសំខាន់គឺមិនមែនថាតើប្រតិបត្តិការរបស់ LLM អាចត្រូវបានពិពណ៌នាយ៉ាងសាមញ្ញក្នុងន័យមិនមែនផ្លូវចិត្តទេ ប៉ុន្តែថាតើប្រតិបត្តិការទាំងនេះនៅពេលដែលរៀបចំបានត្រឹមត្រូវអាចអនុវត្តដំណើរការដូចគ្នា ឬក្បួនដោះស្រាយដូចចិត្ត នៅពេលដែលបានពិពណ៌នានៅកម្រិតសមស្របនៃអរូបីគណនា។
The Redescription Fallacy គឺជារោគសញ្ញានៃនិន្នាការទូលំទូលាយដើម្បីព្យាបាលសំណួរទស្សនវិជ្ជាសំខាន់ៗអំពីបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលជាទ្រឹស្តីសុទ្ធសាធ ដែលនាំទៅដល់ការទាមទារជាគោលការណ៍ដែលមិនអាចកែប្រែបានចំពោះការមិនបញ្ជាក់ជាក់ស្តែង។ សម្មតិកម្មនៅទីនេះគួរតែត្រូវបានណែនាំដោយភស្តុតាងជាក់ស្តែងទាក់ទងនឹងសមត្ថភាពនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដូចជា LLMs និងភាពសមស្របរបស់ពួកគេជាគំរូនៃការយល់ដឹង (សូមមើលតារាងទី 1)។ ជាការពិត ការពិចារណាអំពីស្ថាបត្យកម្ម គោលបំណងសិក្សា ទំហំគំរូ និងទិន្នន័យបណ្តុះបណ្តាលរបស់ LLMs ជារឿយៗមិនគ្រប់គ្រាន់ក្នុងការកំណត់បញ្ហាទាំងនេះទេ។ ជាការពិតណាស់ ការជជែកវែកញែករបស់យើងគឺថាការជជែកវែកញែកទស្សនវិជ្ជាស្នូលជាច្រើនលើសមត្ថភាពនៃបណ្តាញសរសៃប្រសាទជាទូទៅ និងជាពិសេស LLMs យ៉ាងហោចណាស់មួយផ្នែកលើភស្តុតាងជាក់ស្តែងទាក់ទងនឹងយន្តការផ្ទៃក្នុង និងចំណេះដឹងដែលពួកគេទទួលបានក្នុងអំឡុងពេលបណ្តុះបណ្តាល។ ម្យ៉ាងវិញទៀត ការជជែកដេញដោលទាំងនេះជាច្រើនមិនអាចដោះស្រាយជាអាទិភាពបានទេ ដោយពិចារណាលើលក្ខណៈទូទៅនៃគំរូដែលមិនបានបណ្តុះបណ្តាល។ ផ្ទុយទៅវិញ យើងត្រូវពិចារណាលើការរកឃើញពិសោធន៍អំពីឥរិយាបថ និងដំណើរការខាងក្នុងនៃគំរូដែលបានបណ្តុះបណ្តាល។
នៅក្នុងផ្នែកនេះ យើងពិនិត្យមើលការជជែកដេញដោលដ៏យូរអំពីសមត្ថភាពនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរស់ឡើងវិញ និងផ្លាស់ប្តូរដោយការអភិវឌ្ឍន៍នៃការរៀនសូត្រជ្រៅជ្រះ និងភាពជោគជ័យថ្មីៗរបស់ LLMs ជាពិសេស។ ភ័ស្តុតាងអំពីអាកប្បកិរិយាដែលទទួលបានពីគំរូ និងការពិសោធន៍គោលដៅមានសារៈសំខាន់ខ្លាំងណាស់ចំពោះការជជែកពិភាក្សាទាំងនោះ។ ទោះយ៉ាងណាក៏ដោយ យើងកត់សំគាល់តាំងពីដើមដំបូងមកថា ភស្តុតាងបែបនេះក៏មិនគ្រប់គ្រាន់ដើម្បីគូររូបភាពពេញលេញដែរ។ ដោយភ្ជាប់ទៅការព្រួយបារម្ភអំពី Blockheads ដែលបានពិនិត្យនៅក្នុងផ្នែកទីមួយ យើងក៏ត្រូវតែពិចារណាផងដែរអំពីភស្តុតាងអំពីរបៀបដែល LLMs ដំណើរការព័ត៌មានខាងក្នុង ដើម្បីបិទគម្លាតរវាងការទាមទារអំពីការអនុវត្តរបស់ពួកគេ និងសមត្ថភាពដាក់បញ្ចូល។ វិធីសាស្រ្តពិសោធន៍ស្មុគ្រស្មាញត្រូវបានបង្កើតឡើងដើម្បីកំណត់អត្តសញ្ញាណ និងអន្តរាគមន៍លើតំណាង និងការគណនាដែលទទួលបានដោយ LLMs ដែលបានទទួលការបណ្តុះបណ្តាល។ វិធីសាស្រ្តទាំងនេះមានការសន្យាដ៏អស្ចារ្យក្នុងការដោះស្រាយបញ្ហាទស្សនវិជ្ជាមួយចំនួនដែលត្រូវបានពិនិត្យនៅទីនេះលើសពីសម្មតិកម្មបណ្តោះអាសន្នដែលគាំទ្រដោយភស្តុតាងអាកប្បកិរិយា។ យើងទុកការពិភាក្សាលម្អិតបន្ថែមទៀតអំពីវិធីសាស្រ្តទាំងនេះ និងការរកឃើញពិសោធន៍ដែលត្រូវគ្នាទៅនឹងផ្នែកទី II ។
ក្រដាសនេះ មាននៅលើ arxiv ក្រោមអាជ្ញាប័ណ្ណ CC BY 4.0 DEED ។