Ang Artificial Intelligence (AI) ay hindi na isang futuristic na konsepto na nakakulong sa mga research lab at high-tech na korporasyon. Ito ay hinabi na ngayon sa tela ng ating pang-araw-araw na buhay, humuhubog kung paano tayo nagtatrabaho, nakikipag-usap, at nilulutas ang mga kumplikadong problema. Gayunpaman, habang lumalaki ang impluwensya ng AI, lumalaki din ang mga pagkakaiba sa kung sino ang may access sa potensyal na pagbabago nito. Ang "Democratizing AI" ay tungkol sa pagbagsak ng mga hadlang—teknikal, pang-ekonomiya, at panlipunan—upang lahat, hindi lamang ang iilan na may pribilehiyo, ay magagamit ang kapangyarihan nito. Ine-explore ng artikulong ito kung paano ang mga open-source na tool, naa-access na edukasyon, at etikal na mga balangkas ay nagtutulak sa kilusan upang gawing inklusibong puwersa ang AI para sa inobasyon, equity, at pandaigdigang pag-unlad; at nagpapakilala ng bagong proyektong Spin I undertake para tugunan ang ilang mga puwang sa ecosystem para sa pagbuo ng isang demokratikong hinaharap sa AI.
Sa mga unang araw nito, ang AI ay higit na bago kaysa sa isang tool. Sa unang bahagi nito, bumubuo ng magkakaugnay na mga tugon sa wika, ngunit ganap na kulang sa katalinuhan at pagganap na kinakailangan upang harapin ang mga gawain at hamon sa totoong mundo. Sa paglipas ng panahon, ang ilang mga pambihirang tagumpay ng mga kumpanya ng teknolohiya, mga mananaliksik at mga startup sa larangan ay ginawang mas naa-access at praktikal ang mga tool na ito. Gayunpaman, ang cutting-edge ng AI research ay nananatili pa rin sa mga kamay ng iilan na may mga mapagkukunan upang mamuhunan sa supercomputing power, specialized talent, at proprietary data. Para sa karamihan ng mga indibidwal at organisasyon, ang mga hadlang sa pagpasok ay nakakatakot pa rin at ang AI innovation ay maaaring parang isang malayong pagkakataon, isang binabantayang kuta, na nagbabanta sa kanilang mga trabaho, negosyo at kabuhayan. Kung walang malaking pagpopondo o pag-access sa mga maimpluwensyang network, nananatiling mahirap ang mga prospect na magkaroon ng foothold sa larangan ng transformative na teknolohiyang ito.
Ang mga hadlang sa pananalapi sa kabila ng hype at propaganda, ay nananatiling napakalawak. Ang pagbuo ng mga AI system ay nangangailangan ng access sa cutting-edge na hardware sa malalaking sukat, na tanging ang pinakamayayamang manlalaro ang kayang bayaran. Ang pagsasanay at pagpapatakbo ng inference sa sukat para sa kahit isang modelo ng AI ay maaaring humiling ng computational power na nagkakahalaga ng daan-daang libo hanggang milyon-milyong dolyar. Bukod pa rito, ang masalimuot na katangian ng AI ay lumilikha ng isang matarik na agwat sa kadalubhasaan, na naa-access lamang ng isang maliit na kadre ng mga napakahusay na inhinyero at mananaliksik. Para sa mga startup, nonprofit, at innovator sa mga underfunded na institusyon, ang AI ay—at madalas pa rin—isang malayong pangarap, isang transformative na teknolohiya na naka-lock sa likod ng mga gate na hindi nila mabubuksan, na may mga sulyap lamang ng pag-asa na ibinibigay sa ilang mga freebies na idinisenyo upang gawing mga consumer ang mga tao para sa teknolohiya kaysa sa mga kalahok sa mga bunga ng paggawa, pamumuhunan at pagsulong ng AI.
Ang pananaliksik sa AI ay karaniwang nakatuon sa pagtiyak ng pagiging patas, pagkakapantay-pantay, at pagbabago sa buong mundo. Gayunpaman, may mga hamon na dulot ng panlipunan, pampulitika, pang-ekonomiya at legal na pakikibaka kung paano makakaapekto ang komersyalisasyon ng AI sa mga trabaho, pagkakasundo sa lipunan, sikolohikal at pinansiyal na kagalingan ng mga komunidad sa buong planeta. Ang ganitong malalim na epekto ay nangangailangan ng demokratikong partisipasyon ng lahat ng stakeholder.
Mayroong apat na aspeto sa demokratisasyon at komersyalisasyon ng AI: access sa Data, Compute, IP (technical knowhow) at Pananalapi.
Sa harap ng Data: Madalas na ginagamit ng mga proprietary AI model ang napakaraming pribado at pampublikong data nang walang tahasang pahintulot ng user. Ang mga tagalikha at may-ari ng data na ito ay bihirang makatanggap ng pantay na pagkilala o bahagi sa kita at paglago na nabuo ng mga modelong ito, na nagpapataas ng makabuluhang etikal, legal at pinansyal na mga alalahanin. Ang pagdemokrata ng pagmamay-ari sa AI at mga asset ng data ay isang mahalagang hakbang patungo sa pagbibigay kapangyarihan sa mga indibidwal at komunidad na magkaroon ng pagmamay-ari ng kanilang mga kontribusyon, na tinitiyak na ang mga benepisyo ng AI ay naipamahagi nang mas patas sa buong lipunan. Ang mga kumpanyang tulad ng Google, Meta, Microsoft at OpenAI ay napunta na sa mainit na tubig kasama ang mga organisasyon at katawan ng gobyerno sa buong mundo at ang mga halimbawa ng naturang mga legal na labanan ay makikita sa demanda ng New York times laban sa OpenAI [1, 2], na tumututol sa paggamit nito ng content ng NY Times sa pagsasanay sa mga modelo nito, o legal na pagpataw ng Australia sa Google at Meta upang bayaran ang mga ahensya ng balita sa Australia kapag ang mga resulta ng paghahanap nito ay nagpapakita ng halaga ng pera (3) kung paano naglaro ang labanan sa data at content monetization bago pa man lumitaw ang mga modernong LLM). Ang ganitong mga legal at panlipunang labanan ay nagpapakita ng kahalagahan ng paglalagay ng monetary at legal na mga mekanismo para sa pagbabahagi ng data kung saan ang AI advances ay ginawa.
[1] https://harvardlawreview.org/blog/2024/04/nyt-v-openai-the-timess-about-face/
[2] https://www.theguardian.com/media/2023/dec/27/new-york-times-openai-microsoft-lawsuit
[3] https://www.france24.com/en/live-news/20241212-australia-to-force-tech-titans-to-pay-for-news
Sa harap ng Compute: Ang konsentrasyon ng mga mapagkukunan sa pag-compute sa mga kamay ng ilang mga entity na may mahusay na pinondohan ay pumipigil sa katalinuhan ng tao at lumilikha ng mga masasamang insentibo upang palitan ang mga manggagawang bumubuo ng mga asset ng AI na may parehong mga asset ng AI sa hinaharap. Maraming mahuhusay na innovator ang hindi makakapagdisenyo, lumikha, o nagmamay-ari ng mga bagong modelo ng AI dahil lang sa kulang sila ng access sa computational infrastructure na kinakailangan para mabuo ang mga ito. Ang pagkakaiba-iba na ito ay nagpapanatili ng isang sistema ng "mayroon" at "may-hindi," kung saan ang iilan lamang na may pribilehiyo ang maaaring aktibong lumahok sa paghubog sa kinabukasan ng AI [4, 5, 6]. Ang demokratisasyon ay kinakailangan upang tulay ang agwat na ito sa pamamagitan ng pagbibigay ng access sa mga mapagkukunan at mga resulta ng modelo, pag-level sa larangan ng paglalaro para sa mga indibidwal at organisasyon sa buong mundo. Ang mga asset ng AI ay higit pang may malaking epekto sa pagiging produktibo at pagbawas sa lakas-paggawa at mga kinakailangan sa trabaho. Bilang resulta, ang paglikha ng mga mekanismo sa pananalapi at legal na shareholding upang makibahagi sa mga bunga ng paggawa, financing, compute, data, at IP development na humahantong sa mga pag-unlad ng AI ay mahalaga sa pagtiyak ng patas na pag-access sa AI na nabuong kapital at mga kita sa hinaharap.
[5] https://www.nature.com/articles/d41586-024-03792-6
[6] https://www.signalfire.com/blog/ai-compute-shortage
Sa harap ng Pananalapi: Ang pag-access sa Pananalapi, ay nagpapatibay sa kakayahan ng mga indibidwal at organisasyon na mamuhunan sa pagbuo ng AI at maging mga shareholder sa hinaharap ng AI. Habang sa bahagi ng input, ang mga mapagkukunang pinansyal ay kinakailangan upang ma-access ang compute, data at talent pool para sa pagbuo at pagpapatakbo ng AI, ang isang mas mahalagang pagsasaalang-alang sa pananalapi ay nasa bahagi ng output ng equation. Ang mga modelo ng AI ay may posibilidad na epektibong mapalitan ang paggawa ng tao, na lumilikha ng mga pagkakataon para sa mga indibidwal at organisasyon na magsimula at magpatakbo ng kanilang sariling mga negosyo at makabuo ng kita mula sa kanilang mga operasyon. Gayunpaman, ang pribilehiyong ito kung pinaghihigpitan ng mga hadlang sa pananalapi sa iilan lamang, ay nagmumula sa halaga ng mga nawalang trabaho at isang pagkiling sa power dynamics patungo sa oligarkikong istruktura ng negosyo dahil sa pagkakaiba sa pagitan ng mga may access sa pananalapi upang bumuo at magpatakbo ng mga negosyong nakabatay sa AI kumpara sa mga walang pananalapi, depende sa kasanayan, oras, at paggawa sa isang lumiliit na grupo ng mga pagkakataon kung gaano kahalaga ang pag-aautomat ng mga pagkakataon sa paghawak ng kanilang trabaho. at ang mga bahagi ng kita sa lalong nagiging automated na mundong ito ay naipapamahagi sa pagitan ng mga nagtutustos ng naturang pag-unlad kumpara sa mga namumuhunan nang may oras, kasanayan at pagsisikap sa pagbuo ng mga naturang negosyo. Higit pa rito, kung paano ibinibigay ang mga pagkakataon sa pamumuhunan sa pananalapi at mga pagkakataon sa pagbuo ng kita sa patuloy na batayan sa pagpapatakbo ng naturang mga negosyong nakabatay sa AI na lampas sa mga unang panalo at kabayaran, ay isang mahalagang pagsasaalang-alang upang maiwasan ang mga salungatan sa hinaharap na magmula sa gayong mga pagkakaiba.
Ang tunay na demokratisasyon ay dapat lumampas sa pag-access sa mga kasangkapan at imprastraktura sa larangan ng pananalapi, pagkakapantay-pantay at mga pagkakataon sa kita. Nangangailangan ito ng pangako sa etikal na pagsasanay, ang paggamit ng magkakaibang mga dataset, at ang pagtatatag ng mga pantay na istruktura ng pamamahala. Sa pamamagitan ng pagtugon sa mga bias sa mga sistema ng AI at pagtiyak ng pananagutan sa paggamit ng mga ito, lumikha kami ng teknolohiya na hindi lamang naa-access ngunit responsable din at kasama. Ang demokrasya sa AI ay hindi lamang isang teknikal na layunin; ito ay isang societal imperative upang matiyak na ang AI ay nagsisilbing isang puwersa para sa ibinahaging pag-unlad sa halip na pagkakahati at tunggalian.
Maraming opensource AI models at agentic frameworks ang available na ngayon sa pamamagitan ng mga platform tulad ng Ollama, HuggingFace, Letta, LangChain, upang pangalanan ang ilan (maaari kang sumangguni sa buod ni Letta ng AI agent stacks [7] upang makakuha ng maikling ideya kung ano ang hitsura ng open at closed API technology stack). Sa madaling sabi, maraming open source at open weight na mga modelo ng AI ang ibinabahagi na online na magagamit ng mga creator at kumpanya bilang panimulang punto at bumuo ng kanilang mga produkto sa itaas hangga't mayroon silang pinansyal, computational, data, at teknikal na mapagkukunan upang maisagawa sa isang business plan. Iyan ay kung saan ang catch ay namamalagi gayunpaman, may mga limitasyon sa pagkakaroon ng apat na mapagkukunan sa itaas, at bawat isa sa mga ito ay maaaring maging sanhi ng isang organisasyon upang mawalan ng malay o sumuko sa kanilang AI.
[7] https://www.letta.com/blog/ai-agents-stack
Sa pagsulat ng artikulong ito, wala pa ring standardized na legal at pinansiyal na mekanismo sa lugar upang ibahagi at pagkakitaan ang data ng mga indibidwal at kumpanya bilang mga supplier ng data para sa pagbuo ng AI sa sukat. Si Yann LeCun, VP at Chief AI Scientist sa Meta ay nag-post kamakailan tungkol sa paksa ng data at hinikayat ang mga institusyon, pamahalaan at komunidad na gawing malayang magagamit ang data para sa pagsasanay sa ilalim ng kundisyon na ang mga naturang modelo ay malayang magagamit gamit ang mga timbang at inference code. Ang nasabing modelo ng pagbabahagi ng data ay nag-aalok ng implicit deal ng pagkuha ng mas maraming kinatawan na mga modelo ng AI sa publiko habang pinapayagan ang mga kumpanya na makakuha ng access sa mga kinatawan ng set ng data, na gumagawa ng isang implicit na social contract para sa panlipunang kabutihan habang pinapayagan ang mga kumpanya na panatilihin ang ilang partikular na IP at interes sa negosyo sa pagsasanay at pagbabago ng mga naturang modelo.
Sa kabilang dulo ay ang paggamit ng pampublikong data ng mga kumpanya para sa pagsasanay ng mga saradong modelo ng API, na nagbibigay ng bayad na access sa publiko sa mga resultang modelo ng AI ngunit walang kakayahang mag-host o magbago o magpatakbo ng mga sinanay na modelo.
Ang isang mid-path na madalas na iminungkahi ngunit hindi pa ipinapatupad ay ang pagbibigay ng data para sa pagsasanay na may ilang partikular na kabayaran sa pamamagitan ng mga mekanismo ng shareholding sa loob ng modelo. Ang mga halimbawa ng naturang mga panukala ay matatagpuan sa [8, 9].
[9] Pagbabahagi ng Data na May Nakabahaging Mga Benepisyo: Artificial Intelligence Perspective, National Library of Medicine, https://pubmed.ncbi.nlm.nih.gov/37642995/
[10] Pagbabahagi ng data sa edad ng malalim na pag-aaral, https://www.nature.com/articles/s41587-023-01770-3
Ang isang teknikal na hadlang dito ay ang pagpapatupad ng mga mekanismo ng zero-trust para ipatupad ang mga kontrata kung saan ibabahagi ang data at ipatupad ang access sa mga resulta ng AI ayon sa idinidikta ng mga tuntunin ng isang kontrata. Ang mga matalinong kontrata sa Web3 ay nagbibigay ng natural na akma para sa pagpapatupad ng mga naturang mekanismo ng pagbabahagi ng data, gayunpaman, ang isang solusyon ay kailangang i-customize na isinasaisip ang mga alalahanin sa privacy at nang hindi isinasakripisyo ang mga lehitimong competitive na bentahe [10] na hinahanap ng mga kumpanya at stakeholder sa loob ng ilang partikular na domain ng application sa pamamagitan ng privatized data at AI model environment.
Bilang solusyon sa unang pass, tinutugunan ko ang mas simpleng paradigm ng pagbabahagi ng data na tinutukoy ni Yann LeCun sa kanyang post, kung saan naka-target ang pagbabahagi ng data sa konteksto ng kabutihang panlipunan. Sa pamamagitan ng Web3, zero-trust na mekanismo, nagdaragdag ako ng karagdagang layer sa panukalang ito, kung saan ang mga tao ay maaaring mabayaran ng patas sa pamamagitan ng mga NFT token para sa kanilang kontribusyon sa data sa pagsasanay ng isang modelo at maging mga kalahok sa pananalapi sa proseso ng pamumuhunan at paglago na nakabatay sa AI.
Gaya ng naka-highlight sa itaas, ang availability at affordability ng compute resources ay kadalasang isang limiting factor para sa mga indibidwal at organisasyon. Kadalasan ang mga high end na GPU ay hindi kayang bayaran o naka-lock sa pamamagitan ng mga kontrata at sa gayon ay hindi available sa bukas na merkado. Gayunpaman, mayroong kasaganaan ng hindi gaanong ginagamit na mga consumer grade GPU sa mga kamay ng mga indibidwal at organisasyon. Dagdag pa, ang mga consumer grade GPU tulad ng RTX3090/4090 ay naipakita na na nagbibigay ng maihahambing na pagganap sa mga high-end na GPU sa pagsasanay at hinuha sa mga mid-sized na modelo tulad ng Llama3 at mas mataas (na may AI model performance na maihahambing sa OpenAI GPT4 o mas mataas). Nagbubukas ito ng pagkakataong mag-offload ng ilang inference at gastos sa pagsasanay sa in-house na hardware sa mas murang rate kaysa sa mga GPU na available sa komersyo sa cloud. Nagbibigay-daan din ito sa mga indibidwal at organisasyon na maging mga host para sa AI model training at inference resources para makapagbigay ng democratized na access sa kanilang mga kapantay sa loob ng organisasyon o sa internet, na lumilikha ng parang AirBnB na setup para sa AI infrastructure.
Sa panig ng pananalapi, nag-aalok ang mga cloud service provider tulad ng Google ng ilang partikular na libreng cloud credit sa mga startup na bumubuo ng AI. Mayroon ding iba pang Cloud Service Provider na nag-aalok ng mga high end na GPU server para rentahan sa mapagkumpitensyang presyo (kadalasan ay masyadong mahal para sa mga indibidwal, at mas maliliit na kumpanya). Ang problema ay medyo natugunan sa pamamagitan ng pribadong equity investments sa mga startup na bumubuo ng AI (lumilikha ng tulong sa paglutas ng mga problema sa pananalapi para sa mga startup ngunit nag-iiwan pa rin ng maraming talent pool na hindi maabot ng mga namumuhunan at vice versa). Nagbibigay ang Spin ng alternatibong paraan para sa mga startup at indibidwal upang makakuha ng mga mapagkukunan sa pagkalkula sa isang naka-sponsor o mas abot-kayang rate mula sa mga cloud provider, institusyon at mga kapantay sa internet.
Higit pa sa pag-compute, nagpapatuloy din ang problema sa pagpopondo sa pagkuha ng data at ang pagbabahagi ng data na nakabatay sa NFT/smart contract ay nagbibigay ng alternatibong paraan upang ikonekta ang data sa mga AI system para sa pagsasanay at mga application na batay sa RAG. Sa bahagi ng output ng pagbuo ng halaga sa pamamagitan ng AI, ang Spin ay nagbibigay din ng mga resource provider (mga host para sa data - tulad ng mga artist, manunulat, creator, at compute - tulad ng mga cloud service provider, enterprise at indibidwal na host), isang pathway para pagkakitaan ang kanilang mga mapagkukunan at maging direkta, aktibo at patuloy na mga kalahok at benepisyaryo sa AI value chain, na nagbibigay ng mas demokratikong framework na naipamahagi sa kung paano nagiging automated ang halaga sa mundo.
May tatlong hakbang na mahalaga sa demokrasya ng AI:
1. Pagpapatupad ng data at mga batas sa IP sa loob ng AI ecosystem
Bilang mga indibidwal at organisasyon, kailangan nating magsimula sa pamamagitan ng pagprotekta sa ating mga karapatan laban sa maling paggamit ng data sa AI training at AI generated (inference) na mga output. Nangangailangan ito ng makabuluhang trabaho patungo sa pagtatatag ng mga legal at teknikal na mekanismo para sa pagpapatupad ng proteksyon ng data at pag-detect ng mga paglabag sa copyright ng AI. Ang problema ay isang mapaghamong problema, kapwa para sa mga tagapagpatupad ng copyright at para sa mga developer ng AI at kumpanya na maaaring hindi sinasadyang lumalabag sa mga copyright nang hindi nila napagtatanto na nagawa na nila ito, dahil sa napakalaking dami ng data na pinag-aralan ng isang modelo ng AI. Kung ikaw ay isang manunulat, isang mamamahayag, isang artist, isang abogado, isang stakeholder sa legal at teknikal na mga hamon sa pagpapatupad ng proteksyon ng data at mga copyright para sa iyong sarili o sa iyong organisasyon, pagkatapos ay maghanap ng mga solusyon sa pagpapatupad ng mga naturang mekanismo.
Kung isa kang kumpanya o indibidwal na bumubuo ng AI, alamin ang higit pa tungkol sa kung paano mo legal na maa-access ang pampubliko at pribadong data nang hindi nilalabag ang mga karapatan ng mga may-ari.
Ang malaking wika at iba pang mga modelo ng AI ay nangangailangan ng napakalaking halaga ng pag-compute para sa parehong pagsasanay at hinuha. Maaari at dapat kang maging kalahok at mamumuhunan sa compute ecosystem na ito. Sa kasalukuyan, milyun-milyong indibidwal at mga startup sa paligid ng salita ang na-bottleneck sa dami ng compute na magagamit nila para tumakbo at mag-eksperimento sa AI. Maaari kang maging host para sa naturang AI gamit lang ang consumer grade GPU na mayroon ka sa bahay at ang mga open source na modelo ng AI na regular na inilabas ng komunidad. Sa pamamagitan ng pagbibigay ng ganoong pag-compute, maaari mong pagkakitaan ang iyong kapangyarihan sa pag-compute at bawasan ang mga bottleneck para sa milyun-milyong innovator, mananaliksik at startup sa buong mundo, habang kumikita ng kaunting pera.
Bilang mga developer ng AI, kailangan nating malaman ang epekto sa lipunan ng ating trabaho sa kagalingan sa pananalapi at kabuhayan ng bilyun-bilyong pamilya at indibidwal sa buong mundo. Ang pagpapagana sa mga indibidwal ng access sa kaalaman at pag-access sa data, pagkalkula at pananalapi upang maging mga shareholder at stakeholder sa mga stream ng kita na nabuo gamit ang AI ay isang mahalagang pagsasaalang-alang upang mapanatili ang pagkakasundo sa lipunan at maiwasan ang mga salungatan sa lipunan na lumitaw sa hinaharap. Isinasaalang-alang na ang mga pag-uusap tungkol sa unibersal na pangunahing kita sa harap ng mga pagkawala ng trabaho na hinimok ng AI, gayunpaman, ang isang mas makatwirang premise para sa pagbibigay ng ganoong unibersal na kita ayon sa proporsyon sa data, pagbabago at pag-compute ng mga kontribusyon ng mga indibidwal ay nagbibigay-daan sa mga tao na tumanggap ng ganoong kita na may higit na dignidad at may sapat na katwiran na dahilan habang nag-aambag sila ng kanilang data, pag-compute at modelo ng IP sa ecosystem. Ang pagbibigay sa mga AI developer, data contributor, at compute contributor, lahat, ng patuloy na pinagmumulan ng kita sa hinaharap -mas automated gamit ang AI, na may mas kaunting pagkakataon para sa patuloy na trabahong kumikita, ay isang mahalagang pagsasaalang-alang.
Bilang isang tagapagtatag ng startup sa espasyong ito, sumusubok ako ng PoC para sa Spin sa https://synaptrix.org at pinahahalagahan ko ang iyong feedback.
Ano sa palagay mo, ano ang gusto mong hitsura ng hinaharap ng AI?