Selepas GPT-3.5 dilancarkan dan mendapat populariti, OpenAI memutuskan pada yuran $20 yang kami semua akan bayar untuk langganan premium untuk mendapatkan semua akses AI generatif yang kami inginkan.
Apa yang dimasukkan ke dalam pengiraan ini? Tidak mungkin banyak.
Ia adalah bayaran standard yang diputuskan oleh eksekutif OpenAI akan berjalan lancar untuk produk berasaskan langganan.
Orang lain seperti Claude dan Perplexity terpaksa mengikutnya dengan kekal dengan nombor $20 kerana kini tiada siapa yang akan membayar sesen pun.
Kecuali, ternyata bahawa pengguna benar-benar ingin membuat wang untuk wang apabila membayar langganan dan dengan penggunaan, kos GPU telah berjalan terlalu tinggi — menjadikan 20 dolar merugikan langganan untuk syarikat AI generatif.
OpenAI berusaha untuk membetulkan perkara ini dengan langganan $200 yang hebat yang memberikan akses terbang tinggi kepada model peringkat teratasnya seperti o1 dan o3 dan ejen AI seperti Operator dan Penyelidikan Dalam.
Kecuali, Sam Altman mendedahkan bahawa penggunaan walaupun pada peringkat ini adalah sangat tinggi sehingga OpenAI tidak boleh membuat keuntungan.
OpenAI menetapkan bar dan semua orang terpaksa mengikutinya.
Kejutan DeepSeek
Dalam semua ini, DeepSeek mendedahkan satu kejutan — bahawa ia menjangkakan margin keuntungan teori sebanyak 545%.
Ini adalah teori kerana DeepSeek tidak mengambil kira pengecasan yang kurang semasa waktu bukan puncak, perbezaan dalam modelnya dan hakikat bahawa ia menyediakan banyak akses melalui antara muka web di chat.deepseek.com dan apl mudah alih.
Jadi, bagaimana DeepSeek mampu menghasilkan keuntungan? Nah, kerana ia mendakwa menggunakan GPU yang kosnya jauh lebih rendah dalam kuantiti yang jauh lebih rendah. Ia juga membawa pasukan yang lebih kecil — kira-kira 200 dianggarkan berbanding 2,000+ pekerja OpenAI.
Bagaimanapun, agak tidak masuk akal untuk bercakap tentang DeepSeek, kerana isu kepercayaan tentang cara maklumat dari China biasanya datang. Namun begitu, ia adalah projek yang paling menarik dalam dua aspek — penemuannya dalam model penaakulan yang kekal tiada tandingan dan sumbangannya kepada indiehacker dan etos sumber terbuka.
Apakah harga yang sesuai untuk dibayar untuk AI?
Nilai sebenar untuk mana-mana syarikat atau industri datang dengan jawapan kepada soalan mudah: Adakah pengguna mahu membayar untuk produk atau perkhidmatan anda?
Venture Capitalists mencurahkan berbilion-bilion dan berbilion-bilion ke dalam pembangunan AI dengan harapan untuk pulangan yang gemilang. Pemimpin dalam ruang seperti OpenAI yang bergelut untuk mencapai keseimbangan antara kos dan hasil bukanlah petanda yang baik.
Sesetengah industri seperti Web3 selama-lamanya terperangkap dalam zon "industri pemula" ini dan AI tidak mahu berada dalam syarikat ini.
Jadi, bagaimanakah keuntungan akan diperoleh?
Sam kini bermain-main dengan idea bahawa kita mungkin membayar untuk apa yang kita gunakan.
Saya tidak pasti dari mana cadangan itu datang tetapi saya menjangkakan ia akan menjadi bencana jika dilaksanakan.
Ini tidak berbeza dengan cara kami membayar API OpenAI semasa membina apl kami sendiri tetapi mengira token bukanlah cara orang ramai mahu menggunakan aplikasi sembang AI pengguna akhir.
Beban 'Pengguna Berat'
Model bebas rata yang dilaksanakan pada masa ini mungkin menyakitkan sekarang tetapi mungkin hanya berfungsi untuk jangka panjang.
Kenapa awak tanya?
Kerana pengguna awal juga berkemungkinan menjadi pengguna paling berat.
Untuk yuran langganan rata untuk membayar dividen, syarikat memerlukan lebih banyak pertanyaan sekali-sekala dan kurang nerd AI seperti saya.
Penyelesaian yang lebih baik mungkin adalah dengan mengekalkan langganan $20 dengan akses model asas tanpa had sedia ada (GPT-4o, o3-mini, o3-mini-high, dll.) dan memberikan ciri premium terhad seperti penggunaan 5 Deep Research atau 3 gesaan GPT-4.5, dengan keupayaan untuk membayar lebih banyak semasa anda pergi.
Analisis asas tentang cara model harga yang berbeza akan disusun untuk OpenAI, yang dihasilkan dengan skrip tersuai dalam Python.
Bayar setiap penggunaan sangat masuk akal dengan kecenderungan yang besar terhadap pengguna berkuasa, yang merupakan senario yang mungkin berlaku pada masa itu. Dengan penggunaan yang lebih luas dan kecenderungan yang berubah-ubah, anda berkemungkinan memperoleh hasil yang lebih baik dengan struktur yuran tetap.
Caj $20 tambah tambahan untuk penggunaan tambahan, dan anda mempunyai senario yang optimum — untuk pengguna dan syarikat. Sekurang-kurangnya, itulah trend yang kelihatan sekarang.
Itulah pemikiran yang saya tinggalkan hari ini.
Apa yang Baru?
- Ibu bapa Claude, Anthropic telahmengumpul lagi $3.5 bilion dalam pusingan pembiayaan yang menghargainya pada $61.5 bilion!
- OpenAI membawakan model GPT-4.5 yang paling "pintar emosi" kepada pengguna Plus.
- Deutsche Telekom melancarkan " telefon AI " dengan kerjasama Perplexity. (Saya menjangkakan ia tidak penting.)
- Amazon mungkin sedang mengusahakan model penaakulan hibridnya sendiri, sama seperti yang dilancarkan oleh Claude baru-baru ini dalam Sonnet 3.7.
- Rakan kongsi Nvidia utama CoreWeave, yang berada di landasan untuk IPO, telah memperoleh platform pembangun AI Weights & Biases.