paint-brush
Dari OpenAI ke AI Tertutup: Chip Kustom Menutup Pintu—Apa Selanjutnya?oleh@bigmao
450 bacaan
450 bacaan

Dari OpenAI ke AI Tertutup: Chip Kustom Menutup Pintu—Apa Selanjutnya?

oleh susie liu11m2024/11/20
Read on Terminal Reader

Terlalu panjang; Untuk membaca

Kabar yang beredar adalah OpenAI bekerja sama dengan Broadcom untuk mengembangkan chip khusus. Tersirat dalam rumor ini adalah pesan bahwa hari-hari AI yang dapat diakses secara universal mungkin sudah berakhir—inilah mengapa perangkat keras desainer tidak dapat dihindari, bagaimana teknologi dapat menggunakan chip untuk membelenggu kita, dan apa yang diharapkan dari tahun 2025.
featured image - Dari OpenAI ke AI Tertutup: Chip Kustom Menutup Pintu—Apa Selanjutnya?
susie liu HackerNoon profile picture
0-item
1-item
2-item

Pada akhir Oktober, muncul laporan—atas kebaikan Reuters—bahwa OpenAI bekerja sama dengan Broadcom untuk mengembangkan silikon khusus yang dirancang untuk menangani beban kerja AI-nya yang sangat besar . Sumber mengungkapkan bahwa perusahaan telah mengamankan kapasitas produksi dengan TSMC dan menyusun tim teknisi yang terdiri dari 20 orang , dengan merekrut mantan veteran dari divisi prosesor Tensor Google. Jadwal produksi tetap fleksibel, dengan chip yang berpotensi diluncurkan paling lambat tahun 2026 , tetapi dasar sudah diletakkan untuk perubahan besar dalam cara OpenAI menangani infrastrukturnya.


Meskipun langkah tersebut memang sejalan dengan strategi OpenAI yang sedang berlangsung untuk mendiversifikasi rantai pasokannya dan mengendalikan biaya infrastruktur yang terus meningkat, rumor ini dapat menjadi pesan bahwa hari-hari AI yang dapat diakses secara universal mungkin sudah berakhir. Masa depan AI bukanlah dunia yang lebih besar dan lebih cerah yang terbuka bagi siapa saja dengan pikiran yang cemerlang—melainkan ruang tunggu VIP dengan chip khusus untuk dinding , yang biaya keanggotaannya mencapai satu miliar dolar.


Perangkat keras khusus niscaya akan mendatangkan terobosan , namun juga membangun penghalang ; barikade yang membuat masyarakat umum—dan sebagian besar pemain lainnya—di luar hanya bisa melihat ke dalam.


Dan mungkin itulah yang diinginkan dunia teknologi selama ini.


Mari kita lihat mengapa perlombaan senjata perangkat keras tidak dapat dihindari, bagaimana chip berperan dalam strategi teknologi yang lebih besar untuk mendominasi, dan apa yang diharapkan selanjutnya.

Keripik Kentang Kustom: Cara Mewah untuk Mengatakan “Kita Terjebak”

AI telah membuat kita bermimpi besar—mulai dari robot terapi yang dipersonalisasi hingga drone pengiriman otonom dan diagnostik yang digerakkan oleh AI di setiap ponsel. Namun, langkah terbaru OpenAI untuk mengembangkan chip khusus menandakan ambisi liar kita terhadap AI kini memerlukan model yang sangat tangguh sehingga bahkan prosesor serba guna yang paling canggih pun mengibarkan bendera putih . Silikon khusus bukan tentang membuat AI lebih cepat, lebih baik, dan lebih bebas, tetapi tentang menjaga semuanya tetap bertahan di bawah tuntutan yang terus meningkat—pengakuan diam-diam bahwa kita telah mencapai batas inovasi yang hanya dapat dipecahkan oleh perangkat keras.


Inilah yang mendorong kebutuhan akan silikon khusus.


Kepribadian ChatGPT yang Sebenarnya: Sangat Membutuhkan Perawatan

Kebijaksanaan LLM seperti GPT-4 dan Gemini dibangun di atas model berbasis transformer yang melacak miliaran parameter. Namun kecerdasan ini harus dibayar dengan harga : tulang punggung mekanisme self-attention yang membutuhkan perkalian matriks besar-besaran yang menghabiskan bandwidth memori. Arsitektur transformer juga membutuhkan penskalaan kompleksitas kuadratik , yang berarti bahwa perluasan model meningkatkan permintaan secara eksponensial . Ketika LLM mencoba untuk meningkatkan permainan mereka melalui pelapisan pada pembelajaran penguatan (RL) untuk beradaptasi dengan umpan balik secara real-time, atau mencoba memetakan koneksi menggunakan jaringan saraf grafik (GNN) , hal-hal berputar menjadi pesta data yang serius, mengirimkan persyaratan daya melalui atap. Jika Anda memperhatikan ChatGPT telah mengalami serangan epilepsi sesekali akhir-akhir ini, inilah alasannya .


Chip khusus seperti TPU milik Google dapat mengatasi masalah ini dengan mengintegrasikan memori pita lebar (HBM) ke dalam chip, mengelola pergerakan data dan meningkatkan hierarki memori untuk mengurangi latensi, dan juga memanfaatkan susunan sistolik untuk memparalelkan operasi matriks.

AI Generatif: Dari Output Hingga Gangguan

AI generatif bergeser dari menghasilkan output tunggal seperti teks atau gambar ke mahakarya lintas-moda melalui pencampuran berbagai bentuk media (teks, audio, video). Sihir teknis ini menimbulkan kekacauan komputasional—setiap modalitas memiliki kebutuhan pemrosesan yang berbeda, dan meminta AI untuk mencerna semuanya secara bersamaan membebani GPU serbaguna yang tidak dirancang untuk menjadi ahli dalam hal manipulasi. Selain itu, model sintesis waktu nyata untuk fitur keterlibatan yang ditingkatkan, seperti alur cerita yang adaptif secara dinamis untuk game atau filter SFX untuk streaming langsung, menuntut latensi yang sangat rendah dan kecepatan inferensi yang cepat, persyaratan yang sulit dipenuhi oleh GPU tanpa menimbulkan penundaan dan tagihan listrik yang sangat tinggi.


Silikon kustom seperti A100 dari NVIDIA dan TPU dari Google mengatasi masalah ini dengan GPU multi-instance (MIG) dan inti tensor , yang memungkinkan komputasi lintas-moda real-time yang hemat daya dengan membagi tugas menjadi proses paralel dan terisolasi pada chip yang sama. Aritmatika dengan presisi rendah juga dapat diperkenalkan untuk memungkinkan pemrosesan dalam format seperti FP16 atau INT8, bukan FP32, yang mempertahankan akurasi tanpa merusak perangkat keras.

AI Hidup-atau-Mati: Presisi yang Menguras Jaringan Listrik

Menavigasi kekacauan dunia nyata berisiko tinggi —pikirkan mengemudi otonom, robotika, drone—mengharuskan **==AI yang digerakkan oleh peristiwa==** merespons dengan kecepatan super, tugas yang sesuai dengan model neuromorfik dan probabilistik yang akan merusak chip yang sudah ada. Chip khusus seperti Loihi dari Intel dibuat dengan arsitektur yang meniru jaringan saraf biologis, mengandalkan jaringan saraf spiking (SNN) dan pemrosesan berbasis peristiwa untuk menganalisis data hanya saat peristiwa relevan sambil mengalokasikan sumber daya secara dinamis berdasarkan pola data yang masuk. Meskipun desain ini memungkinkan operasi berdaya rendah dan latensi rendah dalam skala besar, desain ini tidak kompatibel dengan perangkat keras yang ada di pasar terbuka.

Kecerdasan Buatan Sosial: Mematahkan Kemanusiaan Membutuhkan Kerja Keras

Ah, aplikasi AI yang menarik namun secara etis suram yang diharapkan para raksasa akan membuat kita terpesona oleh platform mereka dan tergila-gila dengan hewan peliharaan terprogram mereka. Menguraikan sifat manusia yang sulit dipahami membutuhkan sistem yang menafsirkan, memprediksi, dan beradaptasi dengan perilaku pada tingkat individu dan masyarakat— mekanisme perhatian lintas modal , GNN untuk membedah interaksi kolektif, komputasi afektif untuk mengembangkan kecerdasan emosional, grafik pengetahuan untuk memastikan relevansi kontekstual, dan daftarnya terus bertambah. Lebih jauh lagi, AI sosial mungkin beroperasi dalam konteks yang sensitif (seperti di dalam robot-tikus penyembuh depresi), yang mengharuskan AI pada perangkat untuk menjaga data pengguna . Tak perlu dikatakan, semua komputasi ini mengirim chip arus utama dan pemrosesan batch mereka ke dalam keadaan lumpuh.


Proses ini menuntut efisiensi data jarang dan akurasi tinggi pada latensi rendah , persyaratan yang dapat dipenuhi oleh silikon perancang melalui penggabungan fitur-fitur seperti arsitektur memori terpadu , akselerator khusus tugas , pengoptimalan data jarang (digunakan dalam IPU Graphcore), dan pengoptimalan fusi multimoda .

AI Ilmiah: Batas Akhir yang Terlalu Besar untuk Perangkat Keras Konvensional

Meskipun kurang menjadi kesayangan media daripada domain lain, AI ilmiah siap menjadi batas paling revolusioner dalam kecerdasan buatan . Tetapi hanya jika perangkat keras dapat mengimbangi. Agar AI ilmiah generatif menciptakan kemungkinan baru (misalnya molekul, material, dan sistem baru), kerangka kerja komputasi tingkat lanjut seperti model difusi , VAE , transformer , dan pembelajaran penguatan harus dikombinasikan dengan pengetahuan khusus domain. AI non-generatif yang digunakan untuk pemodelan dan simulasi prediktif berurusan dengan data skala petabyte dan sistem berdimensi tinggi, menggunakan mekanisme seperti pemecah PDE , GNN , model Bayesian , dan analisis elemen hingga (FAE) . Meskipun dua cabang AI ilmiah melayani tujuan yang berbeda, keduanya menyerukan presisi, skalabilitas, dan intensitas komputasi—kriteria yang hanya dapat dipenuhi oleh mekanisme paling elit di AI generatif dan prediktif. Sudah jelas bahwa perangkat keras yang sudah jadi tidak akan berhasil.

Kematian AI Terbuka dan Daya Tarik Eksklusivitas

Jalan menuju silikon yang dibuat khusus hadir dengan label harga yang hampir menjamin stratifikasi akses ke AI. Ekonomi 101: untuk menutupi biaya yang sangat besar, OpenAI (dan semua yang mengikutinya) mau tidak mau akan membebankan beban kepada pelanggan, menggabungkan akses ke penawaran yang akan membuat langganan kita saat ini terlihat seperti uang receh .


Namun jangan salah mengartikan harga yang meningkat dan sistem hierarki yang mana kekuatan finansial merupakan prasyarat sebagai taktik bertahan hidup yang reaktif; ini adalah peluang strategis—karena eksklusivitas bukanlah bug; itu adalah fitur yang telah lama ditunggu-tunggu oleh dunia teknologi.


Vendor Lock-In 2.0: Merantai Perusahaan Melalui Chip

Perangkat keras proprietary menghadirkan medan gravitasi : begitu perusahaan tertanam dalam ekosistem yang menggabungkan perangkat lunak dan silikon khusus, mereka secara efektif terikat olehnya. Menenun tumpukan perangkat lunak ke dalam silikon menciptakan mekanisme di mana sistem hanya dapat berfungsi pada puncaknya dalam domain penyedia— pengaturan yang tidak dapat diubah di mana perangkat keras mendikte perangkat lunak . Setelah perusahaan membangun aplikasi dan alur kerja mereka di sekitar lingkungan khusus ini, meninggalkannya bukan sekadar masalah mentransfer data atau lisensi perangkat lunak, tetapi merekayasa ulang dari awal —seperti mencoba mentransfer kemajuan dari PS ke Xbox .


Dan seiring dengan iterasi perangkat keras, integrasi menjadi lebih lancar, sehingga biaya keluar melambung tinggi dengan setiap pembaruan . Dengan peningkatan kinerja, loyalitas pun semakin kuat—seperti pada sebagian besar ekosistem yang terintegrasi secara vertikal, beralih berarti memulai dari awal.

Chip Kustom, Aturan Kustom: Membunuh Persaingan dengan Desain

Fragmen silikon kustom memecah ekosistem AI menjadi taman berpagar tempat interoperabilitas yang mendefinisikan ledakan AI awal mati. Karena efisiensi dan kontrol yang lebih tinggi yang ditawarkan oleh chip kustom, OpenAI dapat menetapkan standar (seperti standar kinerja, fitur, dan persyaratan kompatibilitas) yang berputar di sekitar sistem miliknya dan paten intelektual , meminggirkan inisiatif sumber terbuka dan pemain kecil yang tidak dapat bersaing dengan kemajuan yang bergantung pada perangkat keras. Jika Anda punya ide, Anda mungkin perlu membawanya ke OpenAI dan memohon dukungan perangkat keras, seperti para teknisi yang saat ini mengantre di luar pintu putar NVIDIA.


Silikon kustom menciptakan kesenjangan pengetahuan sekaligus kesenjangan akses. Dengan merancang perangkat keras yang dioptimalkan untuk arsitektur AI milik sendiri, OpenAI tidak hanya mempercepat modelnya sendiri tetapi juga membangun ekosistem yang tidak dapat dipahami yang tidak dapat direkayasa ulang atau ditiru secara efektif oleh para pesaing. Asimetri pembelajaran ini secara efektif menghalangi para pesaing untuk belajar atau berinovasi dalam paradigma yang sama, menjadikan eksklusivitas sebagai senjata untuk memperlambat kemajuan di seluruh industri.


Perangkat keras eksklusif menjadi blokade inovasi , yang memungkinkan penyedia mengendalikan laju kemajuan , dan memastikan bahwa mereka tetap berada di pusat babak berikutnya dalam AIbabak di mana bakat dan kreativitas takluk pada kekuatan modal mentah .

Di Balik Chip Tertutup: Opacity Memastikan Dominasi

Tidak seperti perangkat lunak, yang dapat direkayasa ulang atau difork, proses berbasis perangkat keras secara fisik tidak transparan dan sulit didekonstruksi tanpa menghabiskan banyak uang. Lapisan abstraksi yang tidak dapat ditembus ini bertindak sebagai benteng terakhir, yang memperkuat klaim OpenAI atas Tahta Besi AI.


Menghindari Pengawasan: Akuntabilitas Tanpa Jawaban


Silikon kustom menawarkan perisai yang nyaman untuk mata regulator yang tajam dan pertanyaan sulit dari media dan kelompok advokasi melalui penambahan lapisan kompleksitas yang membuat cara kerja internal sistem lebih sulit dijelaskan, dan bahkan lebih sulit diaudit. Perusahaan dapat berargumen bahwa keluaran tertentu bukanlah cacat desain yang disengaja, tetapi produk sampingan dari interaksi perangkat keras-perangkat lunak, yang mengalihkan pengawasan dengan menunjukkan ketidakjelasan bawaan sistem.


Parameter kinerja yang dapat diprediksi juga dapat digunakan untuk mengurangi variabilitas sistem untuk penerapan di lingkungan kritis tertentu. Ketidakjelasan ini memastikan bahwa perusahaan tidak perlu mengungkapkan trade-off atau kerentanan dalam model mereka, terutama dalam industri seperti perawatan kesehatan, keuangan, atau pertahanan yang sangat mengutamakan keandalan.


Asuransi Internal: Melindungi Permata Mahkota


Dengan sebagian besar perusahaan AI bergantung pada tenaga kerja yang terdistribusi, kontraktor, atau penyedia infrastruktur cloud, risiko kebocoran kekayaan intelektual tumbuh. Karena universalitas bahasa pemrograman dan kerangka kerja, perangkat lunak secara inheren portabel dan dapat direplikasi. Sebaliknya, pengembangan perangkat keras sangat kontekstual , bergantung pada keahlian khusus dan silo dan akses ke jalur produksi, proses, dan fasilitas tertentu—kompartementalisasi ini berarti tidak ada satu pun insinyur yang memiliki cukup pengetahuan atau sumber daya untuk menyiapkan keajaiban bagi pesaing. Dengan mengelas inovasi ke dalam chip, OpenAI mengikat IP mereka ke infrastruktur daripada individu , meminimalkan risiko kehilangan keunggulan kompetitif ketika insinyur menyerahkan pengunduran diri mereka.

Efek Jaringan: Mengubah Persepsi Menjadi Realitas


Dengan membuat cara kerja internal sistem AI tidak dapat diakses, OpenAI memastikan hanya mereka yang dapat menentukan dan mengendalikan narasi kemampuan mereka . Sama seperti bagaimana GPU NVIDIA menjadi identik dengan kinerja AI karena tolok ukur yang dioptimalkan untuk arsitekturnya, OpenAI dapat membuat metriknya sendiri yang terkait dengan silikonnya, membingkai peningkatan tambahan sebagai pengubah permainan . Kurangnya transparansi juga berarti tonggak kinerja selektif (misalnya, "inferensi 5x lebih cepat") yang dicapai melalui pengoptimalan perangkat keras kecil dapat dipasarkan sebagai terobosan asli , menuai manfaat karena dianggap sebagai pelopor sambil menyembunyikan trade-off atau keterbatasan.


Karena tidak ada cara untuk membandingkan atau memvalidasi klaim, pelanggan, investor, dan media terpaksa mempercayai omongan humas perusahaan. Kebohongan dapat menyebar ke belahan dunia lain sementara kebenaran masih dalam proses: sebentar lagi kita semua akan mempercayai versi "inovasi" yang dicurangi ini, menyerahkan uang dan berita utama, dan dominasi yang dibuat-buat menjadi kenyataan nyata.

Ilusi ini lebih merupakan strategi merek daripada strategi teknis, yang mengubah ketidakjelasan menjadi alat untuk kepemimpinan pasar yang berkelanjutan.

Prospek 2025: Akan Ada Inovasi, Hanya Saja Bukan Untuk Anda


Perangkat keras merupakan hambatan, tetapi teknologi tidak pernah melambat karena adanya hambatan. Jangan terkecoh—kemajuan sejati akan berfungsi untuk mengonsolidasikan pengaruh perusahaan dan kendali kompetitif, sementara hal-hal baru yang dihadirkan untuk masyarakat umum dan perusahaan akan menjadi perampasan data yang disamarkan dalam berbagai lapisan PR.

Mainan Konsumen: Data, Gangguan, dan Kewaspadaan Anda yang Menurun

Apakah Anda berpikir beban kerja pengembangan perangkat keras akan menghambat operasi konsumen? Tidak, semuanya akan tampak lebih cepat , karena kita hanya akan terus menyerahkan data perilaku kita sebagai ganti " kemajuan ". Namun, sekarang kakek-nenek kita menemukan hiburan dalam chatbot, teknologi akan beralih dari mencoba memikat Anda dengan pelayan menjadi gimmick yang terasa seperti berasal dari "Kembali ke Masa Depan". (Jangan khawatir, teknologi akan secara berkala memberikan asisten unik itu tampilan baru agar tetap segar di radar kita. OpenAI dilaporkan meluncurkan agen AI yang disebut "Operator" pada Januari 2025. Sumber menunjukkan bahwa Operator akan berinteraksi langsung dengan komputer Anda, terutama berfungsi sebagai peningkatan alur kerja dan alat peramban web, mengotomatiskan tugas dan merampingkan pengalaman daring. Jadi, mata-mata desktop.)


Perusahaan besar akan beralih dari perangkat lunak ke gadget canggih untuk menarik minat yang canggih — Altman baru saja merekrut mantan pimpinan perangkat keras Orion Caitlin Kalinowski, Zuck tengah menggarap tangan robot, bahkan Cook tengah mempertimbangkan perangkat rumah pintar. Wall Street akan membawa hal yang tidak masuk akal ke pasar, mulai dari produk aneh seperti kalung menyeramkan milik Friend hingga aplikasi yang meragukan seperti Daze.


Gegap gempita dan berita utama yang tiada henti tidak hanya akan mendorong kita untuk membeli; namun juga akan mengikis pertahanan kita, mempersiapkan kita untuk dengan senang hati menerima apa pun yang dihadirkan masa depan AI yang dilengkapi perangkat keras.

Enterprise Tools: Meningkatkan Kedalaman, Bukan Luasnya

Uang yang sebenarnya ada di dompet lembaga, bukan perorangan. Namun, perusahaan hanya akan mengadopsi solusi yang tepat sasaran, yang berarti AI perlu menggali lebih dalam lagi dari sekadar titik masalah yang dangkal. Tahun depan tidak akan membahas tentang alat serba guna untuk memperlunak bisnis terhadap gagasan AI, tetapi model khusus domain yang memaparkan algoritme pada semua seluk-beluk setiap sektor, departemen, tim, dan karyawan.


Contoh kasusnya : Microsoft , bekerja sama dengan Siemens , Bayer , dan Rockwell , baru saja meluncurkan serangkaian model AI untuk mengatasi tantangan khusus dalam bidang manufaktur, pertanian, dan layanan keuangan. Startup AI khusus ceruk pasar juga meraup keuntungan besar—Breakr untuk pemasaran musik, Dreamwell untuk otomatisasi influencer, Beeble untuk VFX, dan itu baru dari beberapa bulan terakhir. Analis memperkirakan bahwa kapitalisasi pasar AI vertikal akan setidaknya 10x lebih besar dari SaaS vertikal lama.

Guarded Genius: Menjadi pelopor bagi yang bergengsi

Perusahaan teknologi menyimpan tenaga mereka untuk kemajuan transformatif yang akan mengikat masa depan mereka dengan masa depan kaum elit: perusahaan raksasa dan pemerintah. OpenAI menyajikan cetak biru untuk infrastruktur AI AS kepada Trump, dan Anthropic baru saja bermitra dengan kontraktor pertahanan Palantir untuk "memproses sejumlah besar data kompleks dengan cepat, meningkatkan wawasan berbasis data, mengidentifikasi pola dan tren dengan lebih efektif, menyederhanakan peninjauan dan persiapan dokumen, dan membantu pejabat AS untuk membuat keputusan yang lebih tepat dalam situasi yang sensitif terhadap waktu." Microsoft bermitra dengan BlackRock, IBM bekerja sama dengan AWS, dan Google beralih ke Saudi .


Apa yang melatarbelakangi kemitraan ini? Hanya waktu yang dapat menjawabnya.

Pemikiran Akhir: Sebuah Studi Kasus untuk PR Hall of Fame


Kisah AI untuk semua—janji inovasi bersama dan akses universal—selalu terasa terlalu indah untuk menjadi kenyataan. Namun, jika dipikir-pikir kembali, mungkinkah para visioner yang memecahkan kode kecerdasan itu sendiri benar-benar terkejut oleh keniscayaan silikon khusus dan pembelian senilai miliaran dolar?


Penulis ini tidak yakin.


Dan sekarang, dengan membingkai perubahan perangkat keras sebagai respons heroik terhadap tuntutan AI yang terus berkembang, perusahaan seperti OpenAI dengan cermat menghindari kenyataan bahwa mereka telah membangun ke arah eksklusivitas sejak awal.


“Terbuka” selalu menjadi latihan pencitraan merek, rencana hubungan masyarakat yang telah berlangsung selama puluhan tahun, dan demokrasi hanyalah slogan.


Mungkin aspek AI yang paling revolusioner mungkin bukan teknologinya, tetapi narasi yang dijual kepada kita.