paint-brush
Horudhac ku saabsan Qaabka Luqadda Weyn (LLM) Kordhinta Farshaxanka: 2. Horudhaca Sirdoonka Artificial (AI) Dardariyeyaashaby@mandliya
703 akhrin
703 akhrin

Horudhac ku saabsan Qaabka Luqadda Weyn (LLM) Kordhinta Farshaxanka: 2. Horudhaca Sirdoonka Artificial (AI) Dardariyeyaasha

by Ravi Mandliya8m2024/11/07
Read on Terminal Reader

Aad u dheer; In la akhriyo

Boostadani waxay sahamisaa dardar-geliyayaasha AI iyo saamaynta ay ku leeyihiin geynta Hababka Luuqadaha Waaweyn (LLMs) ee cabbirka.
featured image - Horudhac ku saabsan Qaabka Luqadda Weyn (LLM) Kordhinta Farshaxanka: 2. Horudhaca Sirdoonka Artificial (AI) Dardariyeyaasha
Ravi Mandliya HackerNoon profile picture

Sahaminta dardar-geliyayaasha AI iyo saamaynta ay ku leeyihiin geynta Hababka Luuqadaha Waaweyn (LLMs) cabbir ahaan.


Qoraallada taxanahan :

  1. Horudhac ku Saabsan Qaabka Luuqadda Weyn (LLM) Kordhinta Faallada: 1. Asalkii Hore iyo Samaynta Dhibaatada

  2. Horudhac ku saabsan Qaabka Luqadda Weyn (LLM) Kobcinta Farshaxanka: 2. Horudhaca Sirdoonka Artificial (AI) Dardariyeyaasha (bootkan)


Maqaalkii hore, waxaan ka wada hadalnay caqabadaha Model Luqadda Weyn (LLM), sida daahitaanka sare, isticmaalka khayraadka degdega ah, iyo arrimaha miisaanka. Wax ka qabashada arrimahan si wax ku ool ah waxay badanaa u baahan tahay taageerada qalabka saxda ah. Boostadani waxay u dhexaysaa dardar-geliyayaasha AI-qalabka gaarka ah ee loogu talagalay in lagu wanaajiyo waxqabadka culayska shaqada AI, oo ay ku jirto dulucda LLM-oo iftiiminaya qaab-dhismeedkooda, noocyada muhiimka ah, iyo saamaynta ay ku geeyaan LLM-yada cabbirkooda.

Waa maxay sababta AI Accelerators?

Haddii aad waligaa la yaabtay sida shirkadaha sida OpenAI iyo Google ay u maamulaan moodooyinkan waaweyn ee luuqadaha ee u adeegaya malaayiin isticmaaleyaal isku mar ah, sirtaasi waxay ku jirtaa qalab gaar ah oo loo yaqaan dardargeliyayaasha AI. In kasta oo CPU-yada dhaqameedku ay si fiican u qabtaan hawlaha guud ee ujeeddooyinka, looma hagaajinin baahida culeyska shaqada ee AI. Xawaariyeyaasha AI, marka la barbardhigo, waa ujeedo loo dhisay hawlaha AI, oo bixiya helitaanka xogta xawaaraha sare leh, awoodaha socodsiinta barbar socda, iyo taageerada xisaabinta saxda ah ee hoose. Marka loo beddelo xisaabinta ee dardar-geliyayaasha AI, ururradu waxay gaari karaan guulo waxqabad oo la taaban karo oo ay yareeyaan kharashaadka, gaar ahaan marka ay wadaan moodallo adag sida LLMs. Aynu sahamno qaar ka mid ah noocyada caadiga ah ee dardar-geliyayaasha AI iyo faa'iidooyinka gaarka ah ee culeysyadan shaqada.

Noocyada AI Accelerators

Xawaariyeyaasha AI waxay u kala baxaan qaabab kala duwan, mid walbana waxaa loogu talagalay hawlo gaar ah iyo deegaan AI ah. Saddexda nooc ee ugu waaweyn waa GPU-yada, TPUs, iyo FPGAs/ASICs, mid walbana leh astaamo iyo faa'iidooyin gaar ah:

Unugyada Habaynta Garaafyada (GPUs)

Asal ahaan loogu horumaray samaynta garaafyada, GPU-yadu waxay noqdeen aalad awood badan oo loogu talagalay hawlaha barashada qoto dheer sababtoo ah awoodooda wax-qabad ee barbar socda. Nashqaddoodu waxay si fiican ugu habboon tahay xisaabinta matrix-ka-sare ee wax-soo-saarka, kuwaas oo lagama maarmaan u ah hawlaha sida dareenka LLM. GPU-yada ayaa si gaar ah caan uga ah xarumaha xogta ee tababarka iyo ka-fiirsashada cabbirka. GPU-yada sida NVIDIA Tesla, AMD Radeon, iyo Intel Xe ayaa si weyn loogu isticmaalaa daruuraha iyo jawiga dhismaha.

Unugyada Hagaajinta Tensor-ka (TPUs)

Google ayaa u horumarisay TPU-yada si gaar ah loogu talagalay culeysyada shaqada ee barashada qoto dheer, iyadoo la hagaajinayo tababbarka ku saleysan TensorFlow iyo fikradda. TPU-yada waxaa loogu talagalay in ay si hufan u dardargeliyaan hawlaha baaxadda leh ee AI, iyaga oo awood u siinaya qaar badan oo ka mid ah codsiyada Google, oo ay ku jiraan raadinta iyo tarjumaada. Waxaa laga heli karaa Google Cloud, TPUs waxay bixiyaan waxqabad sare labadaba tababarka iyo fikradda, taas oo ka dhigaysa doorasho la doorbido isticmaalayaasha TensorFlow.

Qalabyada Albaabka-Barnaamijka-Garoonka (FPGAs) / Wareegyada Isku-dhafan ee Gaarka ah (ASICs)

FPGAs iyo ASICs waa laba nooc oo kala duwan oo dardargeliyaha la beddeli karo kuwaas oo taageera hawlo gaar ah oo AI ah. FPGAs waa dib loo habayn karo, taas oo u oggolaanaysa inay la qabsadaan noocyada AI iyo codsiyada kala duwan, halka ASICs ay ujeedo u yihiin hawlo gaar ah, oo bixiya waxtarka ugu sarreeya ee culeysyadaas shaqada. Labada noocba waxaa loo isticmaalaa xarumaha xogta iyo cidhifka, halkaas oo daahitaan hooseeya iyo wax soo saarka sare ay muhiim u yihiin. Tusaalooyinka waxaa ka mid ah Intel Arria iyo Xilinx Alveo (FPGAs) iyo Google's Edge TPU (ASICs).

Farqiga muhiimka ah ee u dhexeeya CPUs iyo AI Accelerators

Nashqadaha kala duwan ee CPU-yada iyo dardar-geliyayaasha AI waxay ka dhigaan kuwo ku habboon noocyada kala duwan ee culeysyada shaqada. Halkan waxaa ah isbarbardhigga qaar ka mid ah sifooyinka ugu muhiimsan:

  • Dhismaha : Iyadoo CPUs ay yihiin soo-saareyaal ujeedo-guud ah, dardar-geliyayaasha AI waa qalab gaar ah oo loo habeeyay culeysyada shaqada ee AI. CPUs sida caadiga ah waxay leeyihiin koofiyado yar laakiin xawaarahooda saacadaha sarreeya, taas oo ka dhigaysa inay ku habboon yihiin hawlaha u baahan waxqabad hal xadhig ah oo degdeg ah. Xawaariyeyaasha AI, si kastaba ha ahaatee, waxay leeyihiin kumanaan koofiyado ah oo loo habeeyay habaynta barbar socota iyo soo saarista sare.
  • Saxnaanta iyo Xusuusta : CPU-yadu waxay inta badan adeegsadaan xisaabin sax ah oo sarreeya iyo xusuusta kaydka weyn, taasoo taageerta hawlaha xisaabinta guud. Taas bedelkeeda, dardar-geliyayaasha AI waxay taageeraan xisaabinta saxda ah ee hooseeya, sida 8-bit ama 16-bit, yaraynta raadadka xusuusta iyo isticmaalka tamarta iyada oo aan wax badan loo dhimin saxnaanta-furaha LLM.
  • Waxtarka Tamarta : Waxaa loogu talagalay hawlaha culus ee AI, dardar-geliyayaashu waxay isticmaalaan awood aad uga yar hawlgalkiiba marka loo eego CPU-yada, taas oo gacan ka geysanaysa kaydinta kharashka iyo saameynta hoose ee deegaanka marka la geeyo qiyaasta.


Jaantus isbarbar dhigaya qaab-dhismeedka CPU iyo GPU, oo muujinaya kala duwanaanshaha tirada xudunta u ah iyo awoodaha farsamayn ee isbarbar socda Tixraaca: Barnaamij-samaynta Barnaamijyada Isbarbar-dhigga Badan ee David B. Kirk iyo Wen-mei W. Hwu [1]


Ogsoonow in CPU gudaheeda ay ku jiraan koofiyadaha yar yar (4-8) naqshadeyntana waxaa loo habeeyay daahitaanka hooseeya iyo waxqabadka hal-xadhkaha sare leh. Taas bedelkeeda, GPU-yadu waxay leeyihiin kumanyaal koofiyado ah waxaana loo habeeyay wax-soo-saar sare iyo habayn isbarbar socda. Awooda farsamaynta ee barbar socota waxay u oggolaanaysaa GPU-yada inay si hufan u maareeyaan culayska shaqada ee baaxadda leh ee AI.

Astaamaha Muhiimka ah ee Dardariyeyaasha AI & Saamaynta Ku Saabsan Faragelinta LLM

Xawaariyeyaasha AI waxaa lagu dhisay dhowr astaamood oo ka dhigaya kuwo ku habboon inay wax ka qabtaan culeysyada shaqada AI ee baaxadda leh sida qaddarinta LLM. Tilmaamaha muhiimka ah waxaa ka mid ah:

Nidaaminta barbar-socodka

Xawaariyeyaasha AI waxaa loogu talagalay habayn ballaaran oo isbarbar socda, taas oo ay ugu wacan tahay qaab-dhismeedkooda oo leh kumanaan diirad. Isbarbar yaacaani wuxuu u oggolaanayaa inay si hufan u maareeyaan xisaabinta matrixka degdega ah ee looga baahan yahay cabbirka LLM. Xawaareyaal badan ayaa sidoo kale waxaa ku jira koofiyadaha tensor-ka ee gaarka ah, kuwaas oo loo habeeyay hawlaha tensor-ka sida isku-dhufashada matrixka. Awoodahani waxay ka dhigaan dardar-geliyayaasha AI si aad uga dhakhso badan CPU-yada marka lagu farsameynayo hawlaha LLM ee cabbirka.

Iskudhufashada Matrix cufan iyo Sparse ee xawaaraha AI Tixraac: Kordhinta Modellada Aasaaska ee AI Accelerators ee Youngsuk Park, et al.

Xusuusta Bandwidth Sare

Xawaareyaashu waxay la yimaadaan xusuus gaar ah oo awood u siinaya xawaaraha sare ee xawaaraha, taas oo u oggolaanaysa inay galaan xog-ururinta waaweyn iyo cabbirrada moodeelka oo leh daahitaanno yar. Sifadan ayaa lama huraan u ah soo jeedinta LLM, halkaas oo helitaan xog joogto ah looga baahan yahay in lagu shubo qoraalka gelinta iyo cabbiraadaha moodeelka. Xusuusta-bandwidth-ka-sare waxay yaraynaysaa cilada ku jirta dib-u-soo-celinta xogta, taasoo keenta daahsoon hoose iyo hagaajinta waxqabadka.

Xawaaraha Sare ee Isku xidhka Bandwidth

Xawaariyeyaasha AI waxay ku qalabaysan yihiin isku-xireyaasha xawaaraha sare leh si ay u fududeeyaan gudbinta xogta degdegga ah gudaha qalabyada kala duwan. Tani waxay si gaar ah muhiim ugu tahay cabirida saamiga LLM ee aaladaha kala duwan, halkaasoo dardargeliyayaashu u baahan yihiin inay la xiriiraan oo ay wadaagaan xogta si hufan. Xadhkaha sare ee isku xidhka ayaa hubiya in xogta waaweyni loo kala qaybin karo aaladaha oo dhan si wada jir ah looga baaraandegi karo iyada oo aan sababin dhalooyin.

Xisaabinta Saxnaanta Hoose

Faa'iidada kale ee dardar-geliyayaasha AI waa taageerada ay u hayaan xisaab-hoosaadka saxda ah, sida 8-bit integer iyo 16-bit xisaabinta-sabaynta. Tani waxay yaraynaysaa isticmaalka xusuusta iyo isticmaalka tamarta, taasoo ka dhigaysa hawlaha AI mid waxtar leh. Fikradda LLM, xisaabinta saxnaanta hoose waxay bixisaa habayn degdeg ah iyadoo la ilaalinayo saxnaanta ku filan codsiyada badankooda. Xawaariyeyaasha AI waxay leeyihiin xulashada nooca xogta oo hodan ah.

Noocyada xogta ee lagu taageeray dardar-geliyayaasha AI. Tixraac: Kordhinta Modellada Aasaaska ee AI Accelerators ee Youngsuk Park, et al.

Maktabadaha la Habeeyay iyo Qaab-dhismeedka

Badi dardargeliyayaasha AI waxay la yimaadaan maktabado la hagaajiyay oo loogu talagalay qaab-dhismeedka AI ee caanka ah, sida cuDNN ee NVIDIA GPUs iyo XLA ee Google TPUs. Maktabadahani waxay bixiyaan API-yo heer sare ah oo loogu talagalay fulinta hawlaha AI ee caadiga ah waxaana ku jira hagaajinta gaar ahaan LLMs. Isticmaalka maktabadahaan waxay sahlaysa horumarinta moodeelka degdega ah, geynta, iyo kobcinta fikradda.

Miisaanka iyo Waxtarka Tamarta

Xawaariyeyaasha AI aad ayay u miisaaman yihiin, taas oo u oggolaanaysa in la geeyo kooxaha ama xarumaha xogta si ay si hufan ugu maareeyaan culayska shaqada ee waaweyn. Waxaa sidoo kale loogu talagalay inay noqdaan kuwo tamar-ku-ool ah, oo u isticmaala awood ka yar CPU-yada hawlaha la midka ah, taas oo ka dhigaysa inay ku habboon yihiin codsiyada xisaabinta degdegga ah sida qiyaasta LLM. Waxtarkani wuxuu caawiyaa dhimista labadaba qiimaha hawlgalka iyo saameynta deegaanka ee socodsiinta moodooyinka AI ee waaweyn.

Isbarbardhigga ee dardargeliyayaasha AI

Noocyada kala duwan ee farsamooyinka isbarbardhigga ayaa la adeegsadaa si loo kordhiyo waxtarka dardar-geliyayaasha AI ee tixraaca LLM:

Isbarbar-dhigga Xogta

Isbarbar yaaca xogtu waxa ay ku lug leedahay kala qaybinta xogta wax gelinta ee dufcooyin badan iyo habaynta dufc kasta si barbar socda. Tani waxay faa'iido u leedahay culeyska shaqada ee AI ee ku lug leh xog-ururinta, sida tababarka qoto dheer ee barashada iyo ka-fiirsashada. Iyadoo loo qaybinayo xogta qalabyo kala duwan, dardar-geliyayaasha AI waxay si degdeg ah u socodsiin karaan culayska shaqada waxayna hagaajin karaan waxqabadka guud. Tusaalaha isbarbardhigga xogta ee dulucda LLM waa u kala qaybinta qoraalka wax gelinta ee dufcaddo iyo habaynta dufc walba xawaare gooni ah.

Isbarbardhigga Xogta ee dardar-geliyayaasha AI

Isbarbardhigga Model

Isbarbardhigga moodelku waxa uu ku lug leeyahay kala qaybinta qaybaha moodeelka AI qalabyo kala duwan, taas oo awood u siinaysa isbarbardhigga qaybo kala duwan oo moodeel ah. Habkani wuxuu si gaar ah muhiim ugu yahay moodooyinka waaweyn ee AI ee ka sarreeya awoodda xusuusta aaladda ama u baahan xisaabinta qaybsan si loo habeeyo waxtarka leh. Isbarbardhigga moodeelka ayaa si weyn loogu isticmaalaa moodooyinka luqadaha waaweyn (LLMs) iyo qaab dhismeedka waxbarashada qoto dheer ee kale halkaasoo cabbirka moodeelku uu caqabad weyn ku yahay.

Isbarbardhigga moodelku waxa lagu fulin karaa laba hab oo waaweyn:

Parallelism intra-Layer Parallelism (Tensor Parallelism) : Lakabyada shakhsi ahaaneed ama qaybaha ayaa u kala qaybsan dhammaan qalabka, iyada oo qalab kastaa uu gacanta ku hayo qayb ka mid ah xisaabinta gudaha lakabka isku midka ah. Tusaale ahaan, moodooyinka beddelka, madaxa dareenka ama lakabyada shabakada quudinta horay u sii socota ayaa loo qaybin karaa qalabyo badan. Habkani waxa uu yareeyaa isgaadhsiinta korka sare ah maadaama qalabku u baahan yahay oo kaliya in lagu wada shaqeeyo xuduudaha lakabka.

Isbarbardhigga Tensor-ka ee xawaaraha AI

Isku-dhafka lakabka (Pipeline Parallelism) : Kooxaha isku xigxiga ee lakabyada ayaa loo qaybiyaa dhammaan qalabka, abuurista dhuumaha xisaabinta. Qalab kastaa wuxuu farsameeyaa lakabyada loo qoondeeyay ka hor inta aan natiijada loo gudbin aaladda xigta ee dhuumaha. Habkani wuxuu si gaar ah waxtar ugu leeyahay shabakadaha qoto dheer laakiin wuxuu soo bandhigayaa daahitaanka dhuumaha.

Isbarbardhigga Dhuumaha ee xawaaraha AI

Isbarbar-dhigga Hawsha

Isbarbar-dhigga Hawshu waxa ay ku lug leedahay in culayska shaqada AI loo kala qaybiyo hawlo badan iyo habaynta hawl kasta si barbar-dhac ah. Tani waxay faa'iido u leedahay culeyska shaqada ee AI ee ku lug leh hawlo badan oo madax-bannaan, sida wadista madaxbannaan. Iyadoo la adeegsanayo hawlaha isku midka ah, dardar-geliyayaasha AI waxay yareyn karaan waqtiga ay ku qaadato si loo dhamaystiro hawlaha adag iyo hagaajinta guud ee waxqabadka. Isbarbardhigga Hawsha waxaa inta badan loo adeegsadaa dardar-geliyayaasha AI ee hawlaha sida ogaanshaha shayga iyo falanqaynta muuqaalka.

isbarbardhigga hawsha ee dardargelinta AI

Tixgeli LLM oo leh 70 bilyan oo cabbir oo ka baaraandegaya dufcaddii qoraalka qoraalka:

  • Isbarbar-dhigga Xogta : Dufcaddii wax-gelinta waxay u qaybsan tahay GPU-yo badan, mid walbana wuxuu si madax-bannaan u socodsiinayaa qayb ka mid ah agabyada.
  • Isbarbar-dhigga Tensor-ka : Madax-fiirinta moodeelka beddelka ayaa loo qaybiyaa qalabyo badan, iyadoo qalab kastaa uu gacanta ku hayo qayb-hoosaadyada madaxyada.
  • Isbarbar-dhigga Dhuumaha : Lakabyada nooca transformer-ka waxa loo kala qaybiyaa kooxo isku xiga, iyada oo koox kastaa lagu farsameeyo qalab kala duwan oo qaab dhuumaalaysi ah leh.
  • Isbarbar-dhigga Hawsha : Codsiyo kala duwan oo madax-bannaan ayaa isku mar looga baaraandegayaa unugyo dardar-gelineed oo kala duwan.

Qaabka wada shaqaynta ee dardargeliyayaasha AI

Xawaariyeyaasha AI waxay inta badan si wada jir ah ula shaqeeyaan CPU-da ugu weyn si ay u dejiyaan hawlaha xisaabinta ee culus. CPU-da ugu weyn ayaa mas'uul ka ah hawlaha guud ee ujeeddooyinka iyo dardargeliyayaasha AI ayaa mas'uul ka ah hawlaha xisaabinta culus. Tan waxaa badanaa loo yaqaan ka-shaqeynta. Halkan waxaa ah jaantus fudud oo lagu muujinayo sida ay AI Accelerators ula shaqeeyaan CPU-da ugu weyn. Waa kuwan qaar ka mid ah magac-u-jeedin kooban oo loogu talagalay ka-shaqeynta:

  • Martigeliyaha : CPU ugu weyn. Waxay mas'uul ka tahay socodka ugu muhiimsan ee barnaamijka. Waxa ay habaysaa hawsha iyada oo raraysa xogta ugu muhiimsan oo ay gacanta ku hayso hawl-gallada wax-gelinta/soo-saarka. Habka wada shaqaynta, martigeliyaha wuxuu bilaabay habka, u gudbiyaa xogta AI Accelerators, oo wuxuu helaa natiijooyinka. Waxay maamushaa dhammaan caqli-celinta xisaab-la'aanta waxayna ka tagtaa tirooyinka ku sii qulqulaya AI Accelerators.
  • Aaladda : Xawaareyaasha AI. Waxay mas'uul ka yihiin hawlaha xisaabinta ee culus. Ka dib markii uu helo xogta martida loo yahay, dardariyuhu wuxuu ku shubaa xusuusta gaarka ah wuxuuna sameeyaa habayn isbarbar socda oo loogu talagalay culeysyada shaqada AI, sida isku dhufashada matrixka. Marka ay dhamaystirto habaynta, waxay kaydisaa natiijooyinka waxayna dib ugu celisaa martigeliyaha.

Wada shaqaynta socodka shaqada

Isbeddellada soo baxaya ee dardargeliyayaasha AI

Maaddaama culeysyada shaqada AI ay sii wadaan inay koraan kakanaanta iyo cabbirka, dardar-geliyayaasha AI ayaa horumaraya si ay u daboolaan baahiyaha codsiyada casriga ah. Qaar ka mid ah isbeddellada muhiimka ah ee qaabaynaya mustaqbalka dardar-geliyayaasha AI [3] waxaa ka mid ah:

Unugyada Hagaajinta Caqliga leh (IPUs)

Waxaa soo saaray Graphcore, IPUs waxaa loogu talagalay inay qabtaan hawlaha barashada mashiinka adag oo leh hufnaan sare. Nashqaddoodu waxay diiradda saartaa habaynta isbarbar-dhigga, taasoo ka dhigaysa inay ku habboon yihiin culeyska shaqada ee baaxadda weyn ee AI.

Unugyada socodka xogta dib loo habeyn karo (RDUs)

Waxaa sameeyay SambaNova Systems, RDUs waxaa loogu talagalay in lagu dardargeliyo culeyska shaqada ee AI iyadoo la wanaajinayo socodka xogta processor-ka si firfircooni leh. Habkani waxa uu wanaajiyaa waxqabadka iyo hufnaanta hawlaha sida faragelinta LLM.

Unugyada Habaynta Neural (NPUs)

NPU-yadu waxay ku takhasuseen barashada qoto dheer iyo hawlaha shabakada neerfaha, iyagoo siinaya habayn xog hufan oo ku haboon culayska shaqada ee AI. Waxay si sii kordheysa ugu dhex milmeen aaladaha u baahan awooda aaladda AI.

Gabagabo

Maqaalkan, waxaan ka wada hadalnay doorka dardar-geliyayaasha AI si kor loogu qaado waxqabadka culeyska shaqada AI, oo ay ku jiraan dareenka LLM. Iyaga oo ka faa'iidaysanaya awoodaha isbarbardhigga, xusuusta xawaaraha sare leh, iyo xisaabinta saxda ah ee hooseeya ee dardar-geliyayaasha, ururradu waxay gaari karaan faa'iidooyin waxqabad oo la taaban karo iyo keydin kharash marka la geynayo LLM-yada cabbirka. Fahamka sifooyinka muhiimka ah iyo noocyada dardar-geliyayaasha AI ayaa lagama maarmaan u ah hagaajinta soo-jeedinta LLM iyo hubinta ka faa'iidaysiga kheyraadka ee baaxadda ballaaran ee AI. Boostada soo socota, waxaan ka wada hadli doonaa farsamooyinka hagaajinta nidaamka ee lagu geynayo LLM-yada cabbirka iyadoo la adeegsanayo dardar-geliyayaasha AI.

Tixraacyo

  • [1] Barnaamij-sameeyayaal isbarbar socda oo ay sameeyeen David B. Kirk iyo Wen-mei W. Hwu
  • [2] Kor-u-qaadista Tusaalooyinka Aasaaska AI Accelerators ee Youngsuk Park, et al.
  • [3] Qiimaynta Soo koraysa AI/ML Accelerators: IPU, RDU, iyo NVIDIA/AMD GPUs ee Hongwu Peng, et al.