239 ការអាន

របៀបដែលទស្សនវិទូ និងអ្នកវិទ្យាសាស្ត្រមើលការយល់ដឹង AI

ដោយ Philosophical3m2025/02/24
Read on Terminal Reader

យូរ​ពេក; អាន

ទស្សនវិទូជជែកគ្នាថាតើ LLMs យកគំរូតាមការយល់ដឹងរបស់មនុស្ស ឬគ្រាន់តែជាប្រព័ន្ធស្ថិតិ។ Redescription Fallacy បកស្រាយខុសប្រតិបត្តិការរបស់ AI ហើយការស្រាវជ្រាវជាក់ស្តែងគឺចាំបាច់ដើម្បីដោះស្រាយបញ្ហាទាំងនេះ។
featured image - របៀបដែលទស្សនវិទូ និងអ្នកវិទ្យាសាស្ត្រមើលការយល់ដឹង AI
Philosophical HackerNoon profile picture
0-item

អ្នកនិពន្ធ៖

(1) Raphaël Millière, នាយកដ្ឋានទស្សនវិជ្ជា, សាកលវិទ្យាល័យ Macquarie ([email protected]);

(2) Cameron Buckner, នាយកដ្ឋានទស្សនវិជ្ជា, សាកលវិទ្យាល័យ Houston ([email protected]) ។

តារាងតំណភ្ជាប់

អរូបី និង ១ សេចក្តីផ្តើម

2. primer នៅលើ LLMs

២.១. មូលដ្ឋានគ្រឹះប្រវត្តិសាស្ត្រ

២.២. LLMs ដែលមានមូលដ្ឋានលើប្លែង

3. ចំណុចប្រទាក់ជាមួយនឹងបញ្ហាទស្សនវិជ្ជាបុរាណ

៣.១. សមាសភាព

៣.២. Nativism និងការទទួលបានភាសា

៣.៣. ការយល់ដឹងភាសានិងមូលដ្ឋាន

៣.៤. ម៉ូដែលពិភពលោក

៣.៥. ការបញ្ជូនចំណេះដឹងវប្បធម៌ និងភាសាវិទ្យា

4. សេចក្តីសន្និដ្ឋាន សទ្ទានុក្រម និងឯកសារយោង

3. ចំណុចប្រទាក់ជាមួយនឹងបញ្ហាទស្សនវិជ្ជាបុរាណ

បណ្តាញសរសៃប្រសាទសិប្បនិម្មិត រួមទាំងស្ថាបត្យកម្ម NLP ជំនាន់មុន គឺជាការផ្តោតអារម្មណ៍នៃការស៊ើបអង្កេតទស្សនវិជ្ជាជាយូរមកហើយ ជាពិសេសក្នុងចំណោមទស្សនវិទូនៃចិត្ត ភាសា និងវិទ្យាសាស្ត្រ។ ការពិភាក្សាទស្សនវិជ្ជាជាច្រើនជុំវិញប្រព័ន្ធទាំងនេះ ទាក់ទងនឹងភាពសមស្របរបស់ពួកគេក្នុងការយកគំរូតាមការយល់ដឹងរបស់មនុស្ស។ ជាពិសេស ការជជែកវែកញែកផ្តោតលើថាតើពួកវាបង្កើតបានជាគំរូល្អប្រសើរនៃដំណើរការយល់ដឹងរបស់មនុស្សជាជាងសមភាគីបុរាណ និមិត្តសញ្ញា និងច្បាប់របស់ពួកគេ។ នៅទីនេះ យើងពិនិត្យមើលសំណួរទស្សនវិជ្ជាសំខាន់ៗដែលបានលេចឡើងទាក់ទងនឹងតួនាទីនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលជាគំរូនៃភាពវៃឆ្លាត ហេតុផល ឬការយល់ដឹង ដោយផ្តោតលើការចាប់កំណើតបច្ចុប្បន្នរបស់ពួកគេនៅក្នុងបរិបទនៃការពិភាក្សាដែលកំពុងបន្តអំពីផលប៉ះពាល់នៃ LLMs ដែលមានមូលដ្ឋានលើប្លែង។


ការជជែកដេញដោលនាពេលថ្មីៗនេះត្រូវបានបិទបាំងដោយលំនាំការសន្និដ្ឋានខុសឆ្គង ដែលយើងហៅថា "ការបកស្រាយឡើងវិញនូវភាពខុសឆ្គង"។ ភាពខុសឆ្គងនេះកើតឡើងនៅពេលដែលអ្នករិះគន់ជំទាស់ថាប្រព័ន្ធមួយមិនអាចយកគំរូតាមជាក់លាក់ណាមួយបានទេ។


តារាងទី 1 | ប្រភេទនៃភស្តុតាងជាក់ស្តែងដែលអាចត្រូវបាននាំយកមកនៅក្នុងការជជែកពិភាក្សាទស្សនវិជ្ជាអំពី LLMs


សមត្ថភាពយល់ដឹង ដោយសារប្រតិបត្តិការរបស់វាអាចត្រូវបានពន្យល់ក្នុងន័យអរូបី និងបរិត្តផរណាច្រើន។ នៅក្នុងបរិបទបច្ចុប្បន្ន ភាពខុសឆ្គងបង្ហាញឱ្យឃើញនៅក្នុងការអះអាងដែលថា LLMs មិនអាចក្លាយជាគំរូដ៏ល្អនៃសមត្ថភាពយល់ដឹងមួយចំនួន𝜙 ដោយសារតែប្រតិបត្តិការរបស់ពួកគេគ្រាន់តែមាននៅក្នុងការប្រមូលផ្ដុំនៃការគណនាស្ថិតិ ឬប្រតិបត្តិការពិជគណិតលីនេអ៊ែរ ឬការទស្សន៍ទាយសញ្ញាបន្ទាប់។ ទឡ្ហីករណ៍បែបនេះមានសុពលភាពលុះត្រាតែមានភ្ជាប់មកជាមួយនូវភស្តុតាងដែលបង្ហាញថាប្រព័ន្ធមួយដែលបានកំណត់ក្នុងលក្ខខណ្ឌទាំងនេះគឺមិនអាចអនុវត្តបាន 𝜙 ។ ដើម្បីបង្ហាញ សូមពិចារណាពីតក្កវិជ្ជាដែលមានកំហុសក្នុងការអះអាងថាព្យាណូមិនអាចបង្កើតភាពសុខដុមរមនាបានទេព្រោះវាអាចត្រូវបានពិពណ៌នាថាជាបណ្តុំនៃញញួរវាយខ្សែអក្សរ ឬ (ច្បាស់ជាងនេះទៅទៀត) ដែលសកម្មភាពខួរក្បាលមិនអាចអនុវត្តការយល់ដឹងបានទេព្រោះវាអាចត្រូវបានពិពណ៌នាថាជាបណ្តុំនៃសរសៃប្រសាទ។ សំណួរសំខាន់គឺមិនមែនថាតើប្រតិបត្តិការរបស់ LLM អាចត្រូវបានពិពណ៌នាយ៉ាងសាមញ្ញក្នុងន័យមិនមែនផ្លូវចិត្តទេ ប៉ុន្តែថាតើប្រតិបត្តិការទាំងនេះនៅពេលដែលរៀបចំបានត្រឹមត្រូវអាចអនុវត្តដំណើរការដូចគ្នា ឬក្បួនដោះស្រាយដូចចិត្ត នៅពេលដែលបានពិពណ៌នានៅកម្រិតសមស្របនៃអរូបីគណនា។


The Redescription Fallacy គឺជារោគសញ្ញានៃនិន្នាការទូលំទូលាយដើម្បីព្យាបាលសំណួរទស្សនវិជ្ជាសំខាន់ៗអំពីបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលជាទ្រឹស្តីសុទ្ធសាធ ដែលនាំទៅដល់ការទាមទារជាគោលការណ៍ដែលមិនអាចកែប្រែបានចំពោះការមិនបញ្ជាក់ជាក់ស្តែង។ សម្មតិកម្មនៅទីនេះគួរតែត្រូវបានណែនាំដោយភស្តុតាងជាក់ស្តែងទាក់ទងនឹងសមត្ថភាពនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដូចជា LLMs និងភាពសមស្របរបស់ពួកគេជាគំរូនៃការយល់ដឹង (សូមមើលតារាងទី 1)។ ជាការពិត ការពិចារណាអំពីស្ថាបត្យកម្ម គោលបំណងសិក្សា ទំហំគំរូ និងទិន្នន័យបណ្តុះបណ្តាលរបស់ LLMs ជារឿយៗមិនគ្រប់គ្រាន់ក្នុងការកំណត់បញ្ហាទាំងនេះទេ។ ជាការពិតណាស់ ការជជែកវែកញែករបស់យើងគឺថាការជជែកវែកញែកទស្សនវិជ្ជាស្នូលជាច្រើនលើសមត្ថភាពនៃបណ្តាញសរសៃប្រសាទជាទូទៅ និងជាពិសេស LLMs យ៉ាងហោចណាស់មួយផ្នែកលើភស្តុតាងជាក់ស្តែងទាក់ទងនឹងយន្តការផ្ទៃក្នុង និងចំណេះដឹងដែលពួកគេទទួលបានក្នុងអំឡុងពេលបណ្តុះបណ្តាល។ ម្យ៉ាងវិញទៀត ការជជែកដេញដោលទាំងនេះជាច្រើនមិនអាចដោះស្រាយជាអាទិភាពបានទេ ដោយពិចារណាលើលក្ខណៈទូទៅនៃគំរូដែលមិនបានបណ្តុះបណ្តាល។ ផ្ទុយទៅវិញ យើងត្រូវពិចារណាលើការរកឃើញពិសោធន៍អំពីឥរិយាបថ និងដំណើរការខាងក្នុងនៃគំរូដែលបានបណ្តុះបណ្តាល។


នៅក្នុងផ្នែកនេះ យើងពិនិត្យមើលការជជែកដេញដោលដ៏យូរអំពីសមត្ថភាពនៃបណ្តាញសរសៃប្រសាទសិប្បនិម្មិតដែលត្រូវបានរស់ឡើងវិញ និងផ្លាស់ប្តូរដោយការអភិវឌ្ឍន៍នៃការរៀនសូត្រជ្រៅជ្រះ និងភាពជោគជ័យថ្មីៗរបស់ LLMs ជាពិសេស។ ភ័ស្តុតាងអំពីអាកប្បកិរិយាដែលទទួលបានពីគំរូ និងការពិសោធន៍គោលដៅមានសារៈសំខាន់ខ្លាំងណាស់ចំពោះការជជែកពិភាក្សាទាំងនោះ។ ទោះយ៉ាងណាក៏ដោយ យើងកត់សំគាល់តាំងពីដើមដំបូងមកថា ភស្តុតាងបែបនេះក៏មិនគ្រប់គ្រាន់ដើម្បីគូររូបភាពពេញលេញដែរ។ ដោយភ្ជាប់ទៅការព្រួយបារម្ភអំពី Blockheads ដែលបានពិនិត្យនៅក្នុងផ្នែកទីមួយ យើងក៏ត្រូវតែពិចារណាផងដែរអំពីភស្តុតាងអំពីរបៀបដែល LLMs ដំណើរការព័ត៌មានខាងក្នុង ដើម្បីបិទគម្លាតរវាងការទាមទារអំពីការអនុវត្តរបស់ពួកគេ និងសមត្ថភាពដាក់បញ្ចូល។ វិធីសាស្រ្តពិសោធន៍ស្មុគ្រស្មាញត្រូវបានបង្កើតឡើងដើម្បីកំណត់អត្តសញ្ញាណ និងអន្តរាគមន៍លើតំណាង និងការគណនាដែលទទួលបានដោយ LLMs ដែលបានទទួលការបណ្តុះបណ្តាល។ វិធីសាស្រ្តទាំងនេះមានការសន្យាដ៏អស្ចារ្យក្នុងការដោះស្រាយបញ្ហាទស្សនវិជ្ជាមួយចំនួនដែលត្រូវបានពិនិត្យនៅទីនេះលើសពីសម្មតិកម្មបណ្តោះអាសន្នដែលគាំទ្រដោយភស្តុតាងអាកប្បកិរិយា។ យើងទុកការពិភាក្សាលម្អិតបន្ថែមទៀតអំពីវិធីសាស្រ្តទាំងនេះ និងការរកឃើញពិសោធន៍ដែលត្រូវគ្នាទៅនឹងផ្នែកទី II ។


ក្រដាសនេះ មាននៅលើ arxiv ក្រោមអាជ្ញាប័ណ្ណ CC BY 4.0 DEED ។


L O A D I N G
. . . comments & more!

About Author

Philosophical HackerNoon profile picture
Philosophical@philosophical
Philosophical: Questions that span centuries, ideas that shape the mind.

ព្យួរស្លាក

អត្ថបទនេះត្រូវបានបង្ហាញនៅក្នុង...

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks