239 уншилтууд

Философичид болон эрдэмтэд танин мэдэхүйн хиймэл оюун ухааныг хэрхэн хардаг вэ?

by Philosophical3m2025/02/24
Read on Terminal Reader

Хэтэрхий урт; Унших

Философичид LLM нь хүний танин мэдэхүйг загварчлах эсвэл зүгээр л статистик систем мөн үү гэж маргаж байна. Дахин тайлбарлах төөрөгдөл нь хиймэл оюун ухааны үйл ажиллагааг буруу тайлбарлаж байгаа тул эдгээр асуудлыг шийдвэрлэхийн тулд эмпирик судалгаа хийх шаардлагатай байна.
featured image - Философичид болон эрдэмтэд танин мэдэхүйн хиймэл оюун ухааныг хэрхэн хардаг вэ?
Philosophical HackerNoon profile picture
0-item

Зохиогчид:

(1) Рафаэл Миллиер, Маккуарийн их сургуулийн Философийн тэнхим ([email protected]);

(2) Камерон Бакнер, Хьюстоны Их Сургуулийн Философийн тэнхим ([email protected]).

Холбоосуудын хүснэгт

Хураангуй болон 1 танилцуулга

2. LLM дээрх праймер

2.1. Түүхэн үндэс

2.2. Трансформаторт суурилсан LLM

3. Сонгодог философийн асуудлуудтай харилцах

3.1. Зохиолч чанар

3.2. Төрөлх үзэл ба хэл эзэмших

3.3. Хэлний ойлголт, үндэслэл

3.4. Дэлхийн загварууд

3.5. Соёлын мэдлэг, хэл шинжлэлийн шат дамжлага

4. Дүгнэлт, тайлбар толь, ашигласан материал

3. Сонгодог философийн асуудлуудтай харилцах

Хиймэл мэдрэлийн сүлжээ, түүний дотор NLP-ийн өмнөх архитектурууд нь гүн ухааны судалгаа, ялангуяа оюун ухаан, хэл, шинжлэх ухааны философичдын анхаарлын төвд байсаар ирсэн. Эдгээр системийг тойрсон гүн ухааны хэлэлцүүлгийн ихэнх хэсэг нь хүний танин мэдэхүйг загварчлахад тохиромжтой эсэх талаар эргэлддэг. Тодруулбал, эдгээр нь хүний танин мэдэхүйн үндсэн үйл явцын сонгодог, бэлгэдлийн, дүрэмд суурилсан загваруудаас илүү сайн загвар болж чадах эсэх талаар мэтгэлцээнд төвлөрдөг. Энд бид трансформаторт суурилсан LLM-ийн үр дагаврын талаар үргэлжилсэн хэлэлцүүлгийн хүрээнд хиймэл мэдрэлийн сүлжээнүүдийн оюун ухаан, оновчтой байдал, танин мэдэхүйн загвар болох үүргийн талаар үүссэн философийн гол асуултуудыг авч үзэх болно.


Сүүлийн үеийн мэтгэлцээнүүд бидний "Дахин тайлбарын төөрөгдөл" гэж нэрлэдэг төөрөгдүүлсэн дүгнэлтийн загвараар бүрхэгджээ. Систем тодорхой нэг зүйлийг загварчилж чадахгүй гэж шүүмжлэгчид маргах үед энэхүү төөрөгдөл үүсдэг


Хүснэгт 1 | LLM-ийн талаархи философийн мэтгэлцээнд авчирч болох эмпирик нотолгооны төрлүүд


Танин мэдэхүйн чадавхи, учир нь түүний үйл ажиллагааг хийсвэр багатай, илүү дефляциар тайлбарлах боломжтой. Өнөөгийн нөхцөлд LLM нь танин мэдэхүйн зарим чадавхийн сайн загвар байж чадахгүй гэсэн төөрөгдөлөөс харагдаж байна, учир нь тэдний үйл ажиллагаа нь зөвхөн статистик тооцоолол, шугаман алгебрийн үйлдлүүд эсвэл дараагийн тэмдгийн таамаглалаас бүрддэг. Эдгээр үндэслэлээр тодорхойлсон систем нь угаасаа 𝜙 хэрэгжүүлэх чадваргүй гэдгийг нотлох баримт хавсаргасан тохиолдолд л ийм аргументууд хүчинтэй болно. Төгөлдөр хуурыг чавхдас цохих алхуудын цуглуулга гэж тодорхойлж болох учраас эв зохицол бий болгож чадахгүй, эсвэл (илүү тодоор) тархины үйл ажиллагаа нь танин мэдэхүйн үйл ажиллагааг хэрэгжүүлэх боломжгүй, учир нь үүнийг мэдрэлийн үйл ажиллагааны цуглуулга гэж тодорхойлж болно гэсэн алдаатай логикийг авч үзье. Чухал асуулт бол LLM-ийн үйл ажиллагааг оюун санааны бус үг хэллэгээр хялбарчлан тайлбарлаж чадах эсэх биш, харин эдгээр үйлдлүүд нь зохих ёсоор зохион байгуулагдсан тохиолдолд тооцооллын хийсвэрлэлийн зохих түвшинд дүрслэгдсэн тохиолдолд оюун ухаантай ижил үйл явц эсвэл алгоритмуудыг хэрэгжүүлж чадах эсэх явдал юм.


Дахин тайлбарлах төөрөгдөл нь хиймэл мэдрэлийн сүлжээний талаарх философийн гол асуултуудыг онолын үүднээс авч үзэх өргөн хүрээний чиг хандлагын шинж тэмдэг бөгөөд эмпирик няцаалтад үл нийцэх зарчмын үндэслэлтэй нэхэмжлэлийг шүүрэхэд хүргэдэг. Энд байгаа таамаглалууд нь LLM гэх мэт хиймэл мэдрэлийн сүлжээнүүдийн чадавхи, тэдгээрийн танин мэдэхүйн загвар болохуйц байдлын талаархи эмпирик нотолгоонд тулгуурласан байх ёстой (хүснэгт 1-ийг үзнэ үү). Үнэн хэрэгтээ LLM-ийн архитектур, сургалтын зорилго, загварын хэмжээ, сургалтын өгөгдлийн талаархи бодол нь эдгээр асуудлыг шийдвэрлэхэд хангалтгүй байдаг. Үнэндээ мэдрэлийн сүлжээ, тэр дундаа LLM-ийн чадавхийн талаарх философийн олон маргаан нь сургалтын явцад олж авсан дотоод механизм, мэдлэгтэй холбоотой эмпирик нотолгоонд тулгуурладаг нь бидний маргаан юм. Өөрөөр хэлбэл, бэлтгэгдээгүй загваруудын ерөнхий шинж чанарыг харгалзан эдгээр мэтгэлцээний ихэнхийг априори шийдвэрлэх боломжгүй юм. Үүний оронд бид бэлтгэгдсэн загвар өмсөгчдийн зан байдал, дотоод үйл ажиллагааны талаархи туршилтын үр дүнг харгалзан үзэх ёстой.


Энэ хэсэгт бид гүнзгий сургалтын хөгжил, ялангуяа LLM-ийн сүүлийн үеийн амжилтаар дахин сэргэж, өөрчлөгдсөн хиймэл мэдрэлийн сүлжээнүүдийн чадавхийн тухай олон жилийн маргааныг авч үзэх болно. Жишиг болон зорилтот туршилтаас олж авсан зан үйлийн нотолгоо нь эдгээр мэтгэлцээнд ихээхэн ач холбогдолтой юм. Гэсэн хэдий ч, бид эхнээсээ ийм нотлох баримт бүрэн дүр зургийг зурахад хангалтгүй гэдгийг тэмдэглэж байна; Эхний хэсэгт авч үзсэн блок толгойнуудын талаархи санаа зовоосон асуудалтай холбогдож, бид LLM-ууд гүйцэтгэл болон ур чадварын талаархи нэхэмжлэлийн хоорондын зөрүүг арилгахын тулд мэдээллийг дотооддоо хэрхэн боловсруулдаг талаарх нотолгоог мөн авч үзэх ёстой. Сургалтанд хамрагдсан LLM-ийн олж авсан дүрслэл, тооцооллыг тодорхойлох, хөндлөнгөөс оролцох туршилтын нарийн аргуудыг боловсруулсан. Эдгээр аргууд нь зан үйлийн нотлох баримтаар дэмжигдсэн урьдчилсан таамаглалаас гадна энд авч үзсэн философийн зарим асуудлыг шийдвэрлэх маш том амлалт өгдөг. Бид эдгээр аргууд болон холбогдох туршилтын үр дүнгийн талаар илүү нарийвчилсан хэлэлцүүлгийг II хэсэгт үлдээж байна.


Энэхүү баримт бичгийг CC BY 4.0 DEED лицензийн дагуу архиваас авах боломжтой .


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks