Di tengah kegilaan awal ChatGPT, saya mendapat teks daripada bekas rakan sekerja. Dia mahu menjalankan idea oleh saya. Sentiasa orang yang suka sumbang saran, kami membuat panggilan dan dia memulakan dengan "Ingat bagaimana anda selalu meminta saya untuk menarik data untuk anda? Bagaimana jika anda boleh melakukannya sendiri?” Dan kemudian dia terus mengemukakan idea kepada saya bahawa beribu-ribu (berpuluh-puluh ribu?) orang lain berfikir pada masa yang sama: LLM boleh digunakan untuk teks-ke-SQL untuk membantu mereka yang kurang teknikal menjawab soalan data mereka sendiri.
Saya tertarik dengan idea itu, tetapi sebelum menyelam dalam kepala dahulu, saya memberitahu Lei (kini CTO saya) bahawa kami perlu melakukan beberapa pengesahan. Kami menghubungi rakan dan bekas rakan sekerja dari pelbagai industri. Terdapat minat yang kuat terhadap "analitik layan diri" sebenar. Kami tahu ia akan menjadi lebih rumit daripada yang kelihatan, tetapi peluang itu terasa terlalu baik untuk dilepaskan. Jadi Lei dan saya meninggalkan The Shire dan memulakan perjalanan kami untuk mencipta visi kami:
Siaran ini bukan mengenai produk kami sendiri (walaupun, jika anda ingin tahu, anda boleh membaca lebih lanjut tentang cara beberapa idea di bawah memaklumkan produk terbaru kami berfungsi
Nota: Perjalanan ini sangat kekurangan ahli sihir dan pertempuran epik Middle-earth. 🧙
Kami tidak akan terlalu lama memikirkan "mengapa". Jika anda membaca ini, anda mungkin termasuk dalam salah satu daripada dua kumpulan:
Mengabaikan keprihatinan terhadap peranan penganalisis dan saintis data, idea AI yang serba tahu yang boleh menjawab sebarang soalan tentang data organisasi terdengar bagus. Atau sekurang-kurangnya, ia kedengaran bagus untuk organisasi dan pemimpin perniagaannya yang kreativiti mereka untuk cara bertanya soalan tidak terhad. AI ini boleh menjadi penyelesaian untuk mewujudkan organisasi "didorong data" di mana setiap pemimpin bersandar pada bukti empirikal untuk membuat keputusan strategik mereka. Dan semuanya pada sebahagian kecil daripada kos yang biasanya diambil. Akhirnya! Organisasi boleh memanfaatkan "minyak baharu" yang telah mereka dengari sejak 2010.
Tetapi jika ini adalah masalah yang sangat berharga untuk diselesaikan dan AI telah menjadi begitu baik, mengapa tiada produk yang benar-benar menyelesaikannya setakat ini?
Tinjauan industri baru-baru ini menggambarkan gambaran kompleks penggunaan AI dalam perusahaan.
Pengguna pakai AI–terutamanya dalam perusahaan–mempunyai bar yang tinggi dalam hal jangkaan teknologi. Dalam konteks analisis data dan impian layan diri, kami mengharapkan alatan AI kami untuk:
Malangnya, kebanyakan penyelesaian semasa menggunakan rangka kerja AI monolitik tradisional, yang sering gagal memenuhi jangkaan. Dalam beberapa tahun kebelakangan ini, saya dan pasukan Fabi.ai bekerja keras dalam isu ini. Kami membina prototaip untuk perusahaan dan meneroka banyak pilihan. Pada akhirnya, kami menyedari bahawa Retrieval Augment Generation (RAG) mahupun penalaan halus tidak dapat menyelesaikan masalah ini dengan rangka kerja monolitik semasa.
Apabila kami menguji pendekatan ini, beberapa perkara menjadi jelas kepada kami:
Selepas melihat isu ini, kami memikirkan cara menjadikan AI menyesuaikan diri dengan lebih baik kepada masalah. Ketika itulah ejen AI mula bermain dan mengukuhkan konsep ini untuk kami.
Sebaik sahaja kami melihat rangka kerja agenik, kami tahu ia akan mengubah permainan. Kami tiba-tiba merasakan kami boleh membiarkan AI memutuskan cara menjawab soalan. Ia boleh berfungsi melalui langkah-langkah dan menyelesaikan masalah dengan sendirinya. Jika AI menulis pertanyaan SQL yang terlepas nilai nol dalam medan "Jenis akaun", ia boleh mengeringkan pertanyaan, mengesan ralat dan membetulkannya sendiri. Tetapi bagaimana jika kita boleh mengambil langkah ini lebih jauh dan membiarkan AI beroperasi kebanyakannya dalam Python dan memanfaatkan LLM? Kini, AI melakukan lebih daripada menarik data. Ia boleh menggunakan pakej Python atau LLM untuk mencari outlier, arah aliran atau cerapan unik, yang biasanya anda perlu cari secara manual.
Tetapi kami masih mempunyai satu masalah: data perusahaan yang tidak kemas. Kami percaya organisasi boleh menyelesaikannya dengan menggunakan amalan kejuruteraan data yang kukuh, seperti a
Apabila syarikat berkembang, mereka mengendalikan lebih banyak data dan mempunyai lebih ramai pengguna. Idea mesh ejen membantu mengimbangi pembuatan keputusan yang cepat dengan kawalan yang diperlukan untuk tadbir urus. Ejen khusus membantu menetapkan sempadan dan tanggungjawab yang jelas untuk setiap AI. Mereka juga mencipta cara berskala untuk ejen berkomunikasi. Selain itu, mereka boleh membantu mengurus sumber dengan cekap merentas pasukan dan syarikat.
Idea di sebalik ejen khusus ialah ejen ini boleh dan hanya akan menjawab soalan pada set data yang ditakrifkan dengan sangat ketat. Sebagai contoh, anda boleh membuat dan melancarkan ejen AI yang menjawab soalan tentang kempen pemasaran. Atau anda boleh membina satu lagi untuk menjawab soalan tentang saluran pemasaran, seterusnya dan seterusnya.
Hanya ada satu kelemahan: Pengguna perlu tahu ejen mana yang hendak dituju untuk soalan mana. Ia seperti perlu mengetahui penganalisis pemasaran yang betul untuk bertanya soalan berbanding hanya bertanya soalan umum. Dengan soalan umum, seseorang dalam pasukan boleh mengarahkannya kepada orang yang betul. Di sinilah konsep "jaringan ejen" dimainkan.
Jika ejen tunggal boleh menjawab soalan khusus domain dengan pasti, maka mengapa tidak membiarkan ejen bercakap antara satu sama lain? Mengapa tidak, sebagai contoh, ejen kempen pemasaran hanya bertanya kepada ejen saluran paip jika mereka boleh menjawab soalan dengan lebih mudah? Kami percaya ia sepatutnya boleh. Sebenarnya, kami berpendapat bahawa pada masa hadapan akan ada rangkaian ejen dengan struktur hierarki. Anda boleh membayangkan "ejen GTM" yang memanggil "Ejen pemasaran." Ejen ini kemudiannya memanggil kedua-dua "ejen Saluran Paip" dan "Ejen kempen Pemasaran."
Idea ini adalah seperti idea yang lebih umum yang terapung di sekitar AI yang dikenali sebagai "
Pendekatan mesh ini menawarkan beberapa kelebihan utama berbanding AI monolitik (pada lapisan semantik murni):
Pada penghujung hari, idea mesh ini bukan novel. Ini mencerminkan konsep gabungan pakar yang telah ditunjukkan untuk meningkatkan ketepatan untuk LLM. Ia hanya mengambil idea yang sama dan membawanya kepada ejen AI.
Di Fabi.ai, kami mempunyai perjalanan yang jauh untuk membina jaringan Agen Penganalisis. Tetapi, kami telah pun mengatasi beberapa cabaran infrastruktur teknikal yang besar sepanjang perjalanan.
Ejen penganalisis data AI memerlukan seni bina yang unik. Reka bentuk ini mesti membenarkan mereka menggunakan Python atau LLM untuk menjawab soalan, kekal selari dengan sumber data dan sesuai dengan platform kolaboratif, sambil kekal selamat dan berskala. Setiap ejen perlu beroperasi dalam kernel Python sendiri, yang perlu diputar ke atas atau ke bawah dengan cepat untuk mengurangkan kos dan kekal selari dengan data sumber.
Seni bina yang tidak menyediakan kernel individu kepada setiap ejen boleh menghadapi salah satu daripada risiko berikut:
Cabaran membina platform jenis ini adalah sama seperti cabaran AI kerana ia adalah cabaran DevOps.
Memandangkan syarikat perusahaan menguruskan lebih banyak aplikasi AI dalam operasi mereka, mereka memerlukan pendekatan khusus dan ditadbir dengan baik. Rangka kerja mesh ejen menggunakan ejen data AI khusus sebagai cara untuk menskalakan AI dalam analisis data. Pendekatan ini memastikan keselamatan, kebolehpercayaan dan prestasi tetap utuh.
Kami mungkin menjangkakan AI berada di mana-mana sekarang, menjawab kebanyakan soalan data. Tetapi, jika kita lihat dengan teliti, kemajuan dalam masa dua tahun sahaja sejak ChatGPT dilancarkan adalah mengagumkan. Masih banyak yang perlu kita pelajari dalam perjalanan ini. Walau bagaimanapun, dalam fikiran saya, ejen dan rangka kerja ejen akan menjadi kunci kepada AI perusahaan.