paint-brush
Дали кинескиот DeepSeek може да ја уништи теоријата „Повеќе графички процесори, повеќе моќ“?од страна на@linked_do
722 читања
722 читања

Дали кинескиот DeepSeek може да ја уништи теоријата „Повеќе графички процесори, повеќе моќ“?

од страна на George Anadiotis9m2025/01/30
Read on Terminal Reader

Премногу долго; Да чита

Почетокот на 2025 година е и можеби веќе сме сведоци на момент на редефинирање на вештачката интелигенција, како што ја запознавме во последните неколку години. Дали канонот на „повеќе графички процесори е сè што ви треба“ ќе се промени?
featured image - Дали кинескиот DeepSeek може да ја уништи теоријата „Повеќе графички процесори, повеќе моќ“?
George Anadiotis HackerNoon profile picture
0-item
1-item
2-item

Почетокот на 2025 година е и можеби веќе сме сведоци на редефинирање на моментот за вештачката интелигенција, како што го запознавме во последните неколку години. Дали канонот на „повеќе графички процесори е сè што ви треба“ ќе се промени?


Каков необичен пресврт на настаните. Прво, проектот Stargate . Заедничкото вложување создадено од OpenAI, SoftBank, Oracle и инвестициската компанија MGX има за цел да инвестира до 500 милијарди американски долари во инфраструктура за вештачка интелигенција во САД до 2029 година.


Arm, Microsoft, Nvidia, Oracle и OpenAI се клучните почетни технолошки партнери во она што е наречено „проект на Менхетен на 21 век“, со директна поддршка од американската администрација. Претседателот Доналд Трамп го нарече „најголемиот инфраструктурен проект за вештачка интелигенција во историјата“.


Списокот на водечки технолошки партнери со седиште во САД во проектот и огромната инвестиција во она што беше стратешка иницијатива за САД – инфраструктурата за вештачка интелигенција за обезбедување лидерство во вештачката интелигенција – е она што го поттикнува паралелизмот со проектот на Менхетен.


Двата производители на чипови со вештачка интелигенција на списокот - Arm и Nvidia - се предводени од извршни директори со тајванско потекло. Тоа е забележливо, имајќи ги предвид тековните тензични односи на Тајван со Кина и фактот дека проектот Stargate е најновиот во низата неодамнешни политики на САД кои имаат за цел да ја зајакнат домашната инфраструктура и знаење за вештачка интелигенција, притоа наметнувајќи ограничувања на остатокот од светот , првенствено. Кина.


Сепак, ништо од тоа не беше важно за пазарот, што ги зголеми акциите на Nvidia уште еднаш во последните неколку години на објавувањето на проектот Stargate . Но, тоа беше се пред објавувањето на DeepSeek R1.


DeepSeek R1 е нов модел на расудување со отворен код, објавен само неколку дена по објавувањето на проектот Stargate. Моделот е развиен од кинескиот стартап за вештачка интелигенција DeepSeek, кој тврди дека R1 се совпаѓа или дури го надминува ChatGPT o1 на OpenAI на повеќе клучни репери, но работи со мал дел од цената.


Она што е извонредно за DeepSeek R1 е тоа што е развиен во Кина, и покрај сите ограничувања на чиповите со вештачка интелигенција што треба да ја попречат способноста да се постигне напредок во ВИ. Дали тоа значи дека конвенционалната мудрост на OpenAI и САД за „повеќе графички процесори е сè што ви треба“ во вештачката интелигенција е на пат да се промени ?

Чипови со вештачка интелигенција, пари, талент и инженерство

Вистината е, кога пред неколку дена договоривме разговор за чипови со вештачка интелигенција со Крис Какрис, ниту проектот Stargate ниту DeepSeek R1 не се појавија на сцената со вештачка интелигенција. Иако не ги очекувавме свесно овие случувања, знаевме дека чиповите со вештачка интелигенција се тема што заслужува внимание, а Какрис е инсајдер.


Донекаде стана традиција Orchestrate all the Things да ги анализира чиповите со вештачка интелигенција и да води увид од експерти во областа, а разговорот со Какрис е најновото парче од оваа традиција.


Крис Какрис е основач и извршен директор на InAccel . InAccel што им помага на компаниите да ги забрзаат своите апликации користејќи хардверски акцелератори во облакот полесно од кога било. Тој е исто така широко цитиран истражувач со повеќе од 20 години искуство на FPGA и хардверски акцелератори за машинско учење, мрежна обработка и обработка на податоци.

Откако InAccel неодамна беше купен од Интел , Какрис се врати на истражување, моментално работејќи како доцент на Катедрата за електротехника и електроника на Универзитетот во Западна Атика.


При поставувањето на сцената за разговор со оваа навремена вест, воведната забелешка на Какрис беше дека иновацијата во чиповите со вештачка интелигенција е „скап спорт“, поради што тоа најчесто се случува во индустријата за разлика од академските кругови. Во исто време, сепак, тој истакна дека потребните ресурси не се сведуваат само на пари, туку тоа подразбира и талент и инженерство.


За Какрис, политиките на САД се на добар пат во однос на нивната цел да ја вратат експертизата и да ја направат земјата самодоволна. Бидејќи е европски граѓанин, тој исто така ја повика ЕУ да примени слични иницијативи, заедно со многу гласови кои повикуваат ЕУ да ја засили својата игра со графичкиот процесор . Дали, сепак, гледајќи како е постигнат успехот на DeepSeek, има што да не научи?

Учење од успехот на DeepSeek

Според извештајот „ Генеративна вештачка интелигенција во земјите на БРИКС+ “, за разлика од другите земји на БРИКС, Кина користи и странски графички картички (преку облакот и во сопствените центри за податоци) и локални картички направени од кинески компании.


Во моментов, има повеќе од 10 компании во Кина кои развиваат сопствени графички картички, а процесот на префрлување на локални графички процесори по користење на NVIDIA, наводно, не е тежок за кинеските компании.


Се чини дека за да останат конкурентни во трката за вештачка интелигенција, нациите ќе мора да ги преиспитаат своите опции, потенцијално позајмувајќи ги страниците од кинеската книга за игри . Какрис се согласи дека Кина напредува во скокови и граници, прво имитирајќи, а потоа развивајќи свои иновативни техники.


„Тие можат да се мешаат и да се спојат. Тие можат да комбинираат различни верзии на графички процесори и други процесорски единици со цел да создадат моќен центар за податоци или облак. Ова е многу корисно, особено ако мислите дека во минатото, можеби требаше да купувате нова опрема на секои три или четири години.


Сега иновацијата е толку брза што речиси секоја година имате се помоќни чипови и помоќни процесори. Дали има смисла да се фрлаат процесори стари една или две години? Значи, дефинитивно, треба да најдете начин да ги искористите ресурсите, дури и ако тоа се хетерогени ресурси. Ова би било многу поекономично“, рече Какрис.


Пријавените трошоци за обука на DeepSeek R1 се силен аргумент за поддршка на овој пристап. Покрај обуката за хетерогена инфраструктура, пристапот на DeepSeek вклучуваше намалување на нумеричката прецизност, способност за читање со повеќе токени и примена на интелигентна техника Mixture of Experts.


Резултатот е намалување на трошоците за обука од 100 милиони долари на околу 5 милиони долари и намалување на потребите за хардвер од 100.000 графички процесори на само 2.000, што го прави развојот на вештачката интелигенција достапен на стандардните графички процесори за игри. Уште повеќе, дури и ако DeepSeek не е 100% со отворен код – што и да значи тоа за LLM – неговиот процес може да се реплицира.




Чиповите со вештачка интелигенција и моделите со вештачка интелигенција со отворен код се дел од сеопфатната обука за прагматична вештачка интелигенција.


Теорија и практични лаборатории. Сеопфатно повлекување. Кохорта со ограничени седишта.


Кликнете овде за да се регистрирате за обуката за прагматична вештачка интелигенција


Оценување на пазарот на чипови со вештачка интелигенција

Непосредна реакција на веста беше митинг на распродажба , при што акциите на Nvidia паднаа за 17% по вестите . Пазарот веќе започна со корекција на курсот во моментот на пишување, при што и надолните и нагорните трендови се донекаде предвидливи.


Од една страна, она што го покажа DeepSeek беше дека има многу простор за зголемување на ефикасноста во обуката на модели со вештачка интелигенција со врвни перформанси, активно поткопувајќи ја конвенционалната мудрост. Од друга страна, тоа не значи дека Nvidia сè уште не е лидер и можеме да очекуваме уште еднаш да го видиме парадоксот на Jevon на дело .


Nvidia го задржа темпото на иновации во 2024 година , објавувајќи и последователно испраќајќи ја својата најнова архитектура Blackwell, проширувајќи го својот екосистем и постигнувајќи повеќе финансиски и деловни пресвртници. Какрис истакна дека Nvidia веќе не продава само чипови, туку отишле кон вертикална интеграција на нивната технологија NVLink со нивните чипови на платформата DGX .


Но, графичките процесори на Nvidia не се единствената игра во градот. AMD од своја страна најави нов акцелератор за вештачка интелигенција, Instinct MI325X . Како што истакна Какрис, серијата MI300 е многу моќна, со специјализирани единици за забрзување на трансформаторите - клучна архитектура за моделите со големи јазици. Растот на AMD наводно е поттикнат од центарот за податоци и производите за вештачка интелигенција .


Огромното мнозинство луѓе и организации ќе бидат корисници на вештачка интелигенција, а не градители на вештачка интелигенција. За нив, користењето или дури и градењето на апликации за вештачка интелигенција всушност не е прашање на обука на сопствен модел, туку користење или дотерување на претходно обучен модел.


Какрис го повика и напредокот на Интел со Гауди. И покрај високите перформанси на Гауди 3, сепак, Intel се чини дека заостанува во однос на уделот на пазарот, најмногу поради софтверот . Во исто време, Интел презема потези да ја продаде својата FPGA единица, Altera .


FPGA, тврди Какрис, можеби не се најефикасните решенија за обука за вештачка интелигенција, но имаат многу смисла за заклучување, и тука има доволно простор за конкуренција и иновации. Токму ова – градење софтверски слој за работа со FPGA – на кој работеше InAccel и што доведе до купување од страна на Intel.


Секако, Какрис ја нагласи важноста на софтверскиот слој. На крајот на денот, дури и ако чипот има супериорни перформанси, ако не е лесен за користење за програмерите преку софтверскиот слој, тоа ќе го попречи усвојувањето. Nvidia ја одржува значајната предност на софтверскиот слој поради сеприсутниот CUDA стек , во кој продолжува да инвестира.


Остатокот од индустријата, предводена од Интел преку иницијативата UXL Foundation / OneAPI , прави напори да го достигне. AMD има свој софтверски слој - ROCm. Но, достигнувањето нема да се случи преку ноќ. Како што рече Какрис, слојот на софтверот треба да овозможи користење на хардверскиот слој без промена на ниту една линија код.


Nvidia исто така ги засилува своите заклучоци и софтверска стратегија со својата новообјавена NIM рамка, која се чини дека има одредено усвојување . Конкуренцијата исто така се фокусира на заклучоците . Има низа предизвикувачи како Groq , Tenstorrent , GraphCore , Cerebras и SambaNova , кои се борат за дел од колачот на пазарот за заклучоци.

Работ: забрзување и енергетска ефикасност

Додека DeepSeek е истакнат приказ на придобивките од оптимизацијата, тој исто така не е единствениот. Какрис беше вклучен во неодамнешното сеопфатно истражување и споредба на хардверското забрзување на LLM , со многу од оние кои се насочени кон заклучоци.


Еден начин да го направите тоа е да го направите ова преку API-и на даватели на вештачка интелигенција - обично OpenAI или Anthropic. Меѓутоа, за пософистицирани случаи на употреба, од причини поврзани со приватноста, усогласеноста, конкурентската предност, барањата за апликација или трошоците, крајните корисници ќе сакаат да распоредат модели на вештачка интелигенција на сопствената инфраструктура.


Гери Маркус укажува на нашите пет работи што повеќето луѓе не ги разбираат за DeepSeek

Тоа може да вклучува цела низа опкружувања, кои се движат од простор и приватен облак до раб и гол метал. Особено со LLM, постои дури и опција да се активираат локално на машините што се наоѓаат на полица . Го прашавме Какрис дали верува дека локалното / рабното распоредување на LLM има смисла.


Какрис забележа дека заклучокот може да работи со „смалени“, ака квантизирани верзии на модели со вештачка интелигенција. Истражувањата сугерираат дека дури и 1-битни верзии на модели се остварливи . Какрис истакна дека и покрај тоа што постојат специјализирани хардверски архитектури, од оние што се широко достапните графички процесори и FPGA обезбедуваат најдобри перформанси, при што FPGA се енергетски поефикасни.

Одиме напред: иновации и специјализација

Што се однесува до идниот развој, Какрис го истакна пресметувањето во меморијата како област на која треба да се внимава. Главната идеја е да може да се комбинира складирање и пресметување на иста единица, со што се елиминира потребата за пренос на податоци и се доведува до подобри перформанси. Тоа е инспирирано од начинот на кој функционираат биолошките невронски мрежи и се нарекува невроморфно пресметување.


Има повеќе области на значајни случувања, како што се чиплетите , специјализираните чипови прилагодени за архитектурата на трансформаторот што ги напојува LLM , фотоничната технологија и новите програмски јазици за вештачката интелигенција .


Во однос на повеќе краткорочни до среднорочни перспективи и прашањето дали има простор за иновации во светот во кој доминира Nvidia, Какрис верува дека вградените системи и Edge AI претставуваат можност за предизвикувачите:


„Постојат различни барања и различни спецификации во доменот на Edge AI. Мислам дека има простор за иновации во Edge AI, на пример во видео апликации за болници или автономно возење и авијација.


Мислам дека тоа ќе се случи. Ајде да зборуваме за графичките процесори. Значи, NVIDIA е лидер во графичките процесори, но недостигаа графички процесори за уредите што се носат. И видовме одлична компанија, Think Silicon , која се засили и развива графички процесор кој е специјализиран за фит бендови или паметни часовници, а потоа го купи Applied Materials .


Иновациите ќе се случат во области кои се премногу мали за компании како Nvidia или Intel, но доволно добри за помалите компании кои можат да направат специјализирани производи“.


Придружете се на билтенот „Оркестрирајте ги сите работи“.

Приказни за тоа како технологијата, податоците, вештачката интелигенција и медиумите се влеваат една во друга и ги обликуваат нашите животи.

Анализи, есеи, интервјуа и вести. Средна до долга форма, 1-3 пати месечно.

Кликнете овде за да се претплатите


L O A D I N G
. . . comments & more!

About Author

George Anadiotis HackerNoon profile picture
George Anadiotis@linked_do
Got Tech, Data, AI and Media, and he's not afraid to use them.

ВИСЕТЕ ТАГОВИ

ОВОЈ СТАТИЈА БЕШЕ ПРЕТСТАВЕН ВО...