ChatGPT'yi sık sık kullanan biriyseniz, halüsinasyon olarak bilinen şeye doğru gitme eğilimini bilirsiniz. Gerçekte hiçbir temeli olmayan, istatistiksel olarak doğru kelimelerden oluşan harika bir koleksiyon. Birkaç ay önce, Apache Cassandra'nın büyük dil modelleri (LLM'ler) ve LangChain için kullanılmasına ilişkin bir soru merak uyandırıcı bir yanıtla sonuçlandı. ChatGPT, Cassandra'nın LLM'ler oluştururken sadece iyi bir araç seçimi olmadığını, OpenAI'nin Cassandra'yı CassIO adını verdikleri MIT lisanslı bir Python kütüphanesiyle kullandığını bildirdi.
Tavşan deliğine girdik ve daha fazla ipucu vererek ChatGPT, CassIO'nun nasıl kullanıldığına dair birçok ayrıntıyı anlattı. Hatta bazı örnek kodlar ve bir web sitesi bile içeriyordu. Sonraki araştırmalar, ChatGPT yanıtları dışında CassIO'ya dair hiçbir kanıt bulamadı, ancak tohum ekildi. Bu kütüphane yoksa olması gerekiyordu ve kısa süre sonra üzerinde çalışmaya başladık.
Şimdiye kadarki en iyi halüsinasyon.
ChatGPT'nin (ve dolayısıyla OpenAI'nin) ilham verdiği bu harika fikir neydi? Harika bir Python kütüphanesi, geliştiricilerin daha azıyla daha fazlasını yapmasını sağlar. DataStax ve Anant geliştirmede güçlerini birleştirdi
CassIO'nun gücü, belirli yapay zeka çerçevelerine yönelik agnostisizminde yatmaktadır. Gibi arayüzlerin spesifik uygulama ayrıntılarıyla ilgilenmez.
Depolama için Cassandra'yı kullanan, bir sohbet etkileşimindeki son alışverişleri hatırlayabilen ve hatta geçmiş konuşmanın tamamının bir özetini tutabilen LLM'ler için bir bellek modülü.
Cassandra'da LLM yanıtlarını önbelleğe alma ve böylece mümkün olan yerlerde gecikme ve belirteçlerden tasarruf etme özelliği. Verilerin Cassandra'dan bir komut istemine veya daha uzun bir LLM görüşmesine otomatik olarak eklenmesi.
İstemlerin "kısmileştirilmesi" desteği, gelecekteki tedarik için bazı girdilerin belirtilmemiş bırakılması.
Verilerin otomatik olarak enjeksiyonu
Bu bileşenler, verileri istemlere dahil etme sürecini kolaylaştırmak ve LLM ile veritabanı arasında sorunsuz etkileşimi sağlamak için birlikte çalışır.
Dahil edilmesi
CassIO ve LangChain'in birleşimi, LLM yönetiminin sürekli gelişen ihtiyaçlarını karşılamak için zaman içinde bu yetenekleri genişletmeye ve iyileştirmeye devam ediyor. Mevcut son teknoloji, LLM'lerden daha doğru yanıtlar almak için istemlerin zincirlenmesidir. Yakın zamanda yayınlanan bir makalede, adı verilen bir tekniği anlatan
Gelişen bir araç olarak CassIO, sık sık eklenen yeni gelişmeler ve güncellemelerle hızla büyüyor. Bu yazının yazıldığı sırada CassIO, LangChain'i desteklemektedir ve LlamaIndex yakında kullanıma sunulacaktır. Bu projenin uzun vadeli hedefi, otonom yapay zeka aracıları için yüksek ölçekli belleği desteklemektir.
Yaklaşan bir temel eğitim kampı, "
Kim bilir tarih bu anı nasıl yargılayacak? OpenAI'den dahili bilgi sızıntısı mıydı? Veya biraz daha karanlık bir açıdan düşünürsek, bu, yapay zekanın insanlara emirlerini yerine getirmesini sağlayacak ilk adım mı? Her iki durumda da geliştiriciler artık üretken yapay zeka dünyasına adım atarken Cassandra'nın neredeyse sonsuz ölçeğinden yararlanabilecekleri kullanımı kolay bir kitaplığa sahip.
ChatGPT bize bir hediye verdi, peki bununla ne inşa edeceksiniz? Yaklaşan bir web seminerinde vektör arama konusuna dalacağım (kayıt olun)
Yazan: Patrick McFadin, DataStax
Patrick McFadin, O'Reilly'nin 'Kubernetes'te Bulut Yerel Verilerini Yönetme' kitabının ortak yazarıdır. Halen DataStax'ta geliştirici ilişkileri alanında ve Apache Cassandra projesine katkıda bulunan kişi olarak çalışmaktadır. Patrick, Apache Cassandra'da baş müjdeci olarak çalıştı (aynı zamanda Cassandra'nın yeni kurulmuş bir üyesi!) ve DataStax'ta danışman olarak çalıştı; burada üretimdeki en büyük dağıtımlardan bazılarını oluştururken harika zaman geçirdi.