Şu anda üretken yapay zekanın durumu hakkında pek çok soru dönüyor. Şirketler özel GenAI çabalarında ne kadar ilerleme kaydetti? Kuruluşlar aslında kendi özel verilerini kullanarak iğneyi hareket ettirecek şekilde yapay zeka uygulamaları mı geliştiriyor? Nasıl bir mimariye ihtiyaç var?
Bu sorular şaşırtıcı değil; yapay zeka hakkında, arsız iyimserlikten bıkkın şüpheciliğe kadar pek çok abartılı reklamla karışık çok çeşitli görüşler mevcut.
Bunun, GenAI pazarındaki durumu üç alanda netleştirmeye yardımcı olduğunu buldum: pazarın ne görmek istediği, ne olabileceğine dair korkular ve 2024'te ne olacağı (ve nasıl).
GenAI, OpenAI'nin ChatGPT'yi piyasaya sürdüğü 2022 sonlarında sahneye çıktı ve bu tür bir teknolojinin ne kadar güçlü ve erişilebilir olabileceğini gösterdi. Yapay zekanın potansiyel avantajına dair heyecan her yerdeydi. Kısa sürede GenAI her kuruluştaki her uygulamaya aşılanacaktı. Yatırımcılar, GenAI'yi destekleyecek altyapıyı sağlayan şirketler için hokey sopası benzeri bir büyüme eğrisi öngördü.
Öte yandan karşı çıkanlar, "Westworld" ile "Black Mirror" arasında bir geçiş olan distopik bir yapay zeka geleceği tasavvur ettiler. Diğerleri ise bir yapay zeka balonu konusunda uyarıyor . Yatırım açısından bakıldığında, bazıları bunun yeniden kriptoya benzediğini söylüyor; çok fazla heyecan ve heyecan ve ardından dumanlar tüten bir krater.
Bu korkuların ikisinin de yersiz olduğunu düşünüyorum. Elbette her yeni teknoloji dalgasında GenAI'yi yanlış nedenlerle kullanan kötü aktörler olacaktır. Ve GenAI'nin olanaklarına dair heyecan her yerde; "kabarcıklı" bir havası var ve hatta kripto vızıltısından bile daha sert olabilir.
Ancak GenAI ile kripto arasındaki en büyük fark, ilkinin kuruluşlar ve endüstriler arasında pek çok gerçek kullanım durumunun bulunmasıdır. Kriptoda güçlü bir kullanım durumu vardı: güvenilmeyen taraflar arasındaki finansal işlemler (diğer adıyla kara para aklama). Bu, ana akım kesimin pek ilgilenmediği bir konu.
Şu anda, GenAI uygulamalarının durumu bana şirketlerin internet üzerinden kredi kartı kullanımını nasıl güvenli hale getireceklerini bulmaya çalıştıkları 1990'ların sonundaki e-ticareti hatırlatıyor . Kuruluşların bunu güvenli bir şekilde nasıl yapacaklarını bulması biraz zaman aldı, ancak bir kez öğrendiklerinde birden herkesin bir e-ticaret sitesi oldu.
Şu anda GenAI'da gördüğüm paralel: dil modellerinin halüsinasyon yoluyla yanlış yanıtlar vermemesini nasıl sağlayabilirim? Güzel haberler? Bu çözüldü ( geri almayla artırılmış nesil veya RAG sayesinde; daha fazlası aşağıda).
Geçen yıl gördüğümüz şeylerin çoğu, konsept kanıtı olan GenAI projeleriydi: bir şirketin liderlerine nelerin mümkün olduğunu gösteren uygulamalar. Ancak çok az şirket tam üretimde olan uygulamalar oluşturmak için bunun ötesine geçti. "Üretim" derken, bir kuruluşun müşteriler veya çalışanlar tarafından prototip olmayan bir şekilde kullanılan bir yapay zeka uygulamasına sahip olduğunu kastediyorum.
Başka bir deyişle, iş operasyonlarının bazı bölümlerindeki faaliyetlerin rutin bir parçası olarak mevcuttur. Ön büro olabilir, müşteri hizmetlerine yapılan bir çağrının arkasında olabilir ama işin ana kısmına yakın bir yerdedir.
Walmart bunun iyi bir erken örneğidir. Perakendeci Ocak ayında alışveriş uygulamasına GenAI destekli aramayı eklediğini duyurdu . Apple'ın, çalışanlarının daha hızlı teknik destek sağlamasına yardımcı olmak için bir GenAI aracını test ettiği bildiriliyor . Bunun gibi daha fazla örnek görmeye başlayana kadar GenAI, Gartner'ın " heyecan döngüsü " olarak adlandırdığı şeyin erken aşamasında biraz daha oyalanacak.
Volkswagen, otomobilleri için navigasyon ve bilgi-eğlence uygulamalarına yönelik GenAI uygulamaları geliştirmek üzere şirket içi bir laboratuvar kurduğunu duyurdu.
Bununla birlikte, bazılarının düşündüğü gibi “üretkenlik platosuna” ulaşmaktan o kadar da uzakta değiliz. Daha önce de belirttiğim gibi, modellerin çıktılarına güvenmek, halüsinasyonları azaltarak ilgili ve doğru büyük dil modeli (LLM) yanıtlarını nasıl üretecekleri konusunda hâlâ boğuşan kuruluşlar için bir engel olmuştur.
Modellere diğer kaynaklardan gerçek zamanlı olarak ek veri veya bağlam sağlayan (çoğunlukla vektörleri depolayabilen bir veritabanı) RAG, bu sorunun çözülmesine yardımcı olmak için kullanılıyor. Bu teknoloji ilerlemesi, kuruluşların en değerli varlığı olan kendi verileri üzerine inşa edilen, alana özgü, ısmarlama GenAI uygulamaları geliştirmenin anahtarıdır.
RAG, kurumsal bağlamı GenAI uygulamalarına dahil etmek için fiili bir yöntem olarak ortaya çıkmış olsa da, önceden eğitilmiş bir modelin bir veri alt kümesi üzerinde daha fazla eğitilmesi durumunda ince ayardan da sıklıkla bahsedilmektedir. Bu yöntemin yararlı olabileceği zamanlar vardır ancak gizlilik, güvenlik veya hız konusunda herhangi bir endişe varsa RAG doğru seçimdir.
Uygulamaya bağlamın nasıl eklendiğine bakılmaksızın, konuştuğum yatırımcılardan sıklıkla aldığım en büyük soru, şirketlerin GenAI uygulamalarından ne zaman para kazanmaya başlayacağıdır?
Cevabım: Takip ettiğiniz işletmelerin çoğu tüketime dayalı işletmelerdir. Birçoğu artık deneyleri, kavram kanıtlarını (POC'ler) ve müşterilerinin oluşturduğu niş uygulamaları destekliyor; bunların tüketim açısından pek bir faydası yok.
Ancak büyük yapay zeka uygulamaları POC'den gerçek üretime geçmeye başladıkça bu durum değişmeye başlıyor. Bunun 2024 yılı sonunda ciddi anlamda gerçekleşeceğini öngörüyorum. 2024 yılının ikinci yarısında iki yerden başlayarak meyvelerini verecek.
İlk olarak perakendede yaygınlaşıyor (daha önce bahsedilen Walmart örneğine bakın). Ayrıca "Yapay Zeka intraneti" adını verdiğim alanda da yaygın bir şekilde benimsendiğini göreceksiniz: PDF ile sohbet, bilgi tabanları ve dahili çağrı merkezleri.
Bu tür uygulamaların tüketimin artmasıyla birlikte Microsoft , Google ve hatta Oracle gibi şirketler yapay zekadan elde edilen sonuçları raporlamaya başlıyor. Hiper ölçekleyiciler alanının dışında, diğer yapay zeka altyapı şirketleri muhtemelen gelecek yılın Ocak, Şubat ve Mart aylarında yayınlayacakları kazanç raporlarında artışları vurgulamaya başlayacaklar.
Tüketime dayalı yapay zeka altyapı şirketlerinin temelleri şimdiden atıldı. Etki alanına özel, özel uygulamalardan oluşan geniş bir taban için nelerin mümkün olduğunu gösteren güçlü, ticari kanıt noktalarını zaten gördük. Yaratıcı AI uygulamalarından (Midjourney, Adobe Firefly ve diğer görüntü oluşturucular) GitHub Copilot ( 1 milyondan fazla geliştirici kullanıyor ), Glean ve diğerleri gibi bilgi uygulamalarına kadar bu uygulamalar büyük oranda benimsendi ve önemli ölçüde üretkenlik sağladı kazanır.
Özel uygulamalardaki ilerleme, bilginin etkileşim noktasına iletilmesini kolaylaştırması gereken sektörlerde ve kullanım durumlarında en ileri düzeydedir. Bilgi, kullanıma hazır modeller (açık kaynak veya özel), RAG ve tercih ettikleri bulut sağlayıcı kullanılarak kendi verilerinden elde edilecek.
İşletmelerin, üretim ölçeğinde çalışmanın zorluklarına hazır, özel GenAI uygulamaları oluşturması için üç öğe gereklidir: akıllı bağlam, uygunluk ve ölçeklenebilirlik.
GenAI uygulamalarında yararlı, ilgili ve doğru yanıtlar oluşturmak için özel verilerin nasıl kullanıldığına hızlıca bir göz atalım.
Uygulamalar, her türlü veri biçiminde kullanıcı girdisini alır ve hepsini, esasen verilerden anlam çıkaran, RAG kullanarak bir vektör veritabanından bilgi alan ve LLM'nin kullanabileceği "akıllı bağlamı" oluşturan bir yerleştirme motoruna besler. kullanıcıya gerçek zamanlı olarak sunulan bağlamsallaştırılmış, halüsinasyon içermeyen bir yanıt oluşturmak.
Bu, operasyonel veritabanı şirketlerinde pek duyduğunuz bir konu değil. Ancak yapay zeka ve vektör veritabanları alanında alaka, yararlı, doğru ve halüsinasyon içermeyen tepkiler üretmek için kritik olan hatırlama ve kesinliğin bir karışımıdır.
Geleneksel veritabanı işlemlerinden farklı olarak vektör veritabanları, doğası gereği deterministik olmayan anlamsal veya benzerlik aramasına olanak tanır. Bu nedenle, aynı sorgu için döndürülen sonuçlar, bağlama ve arama sürecinin nasıl yürütüldüğüne bağlı olarak farklı olabilir. Burası, vektör veritabanının gerçek dünya uygulamalarında nasıl çalıştığı konusunda doğruluk ve alakanın önemli bir rol oynadığı yerdir. Doğal etkileşim, benzerlik aramasında döndürülen sonuçların doğru VE istenen sorguyla alakalı olmasını gerektirir.
POC'lerin ötesine geçen ve üretime geçen GenAI uygulamaları, yüksek verim gerektirir. Verim esas olarak belirli bir süre içinde depolanabilen, erişilebilen veya alınabilen veri miktarıdır. Yüksek verimlilik, gerçek zamanlı, etkileşimli, veri yoğunluklu özelliklerin uygun ölçekte sunulması açısından kritik öneme sahiptir; yazma işlemleri genellikle birden fazla kaynaktan milyarlarca vektör içerir ve GenAI uygulamaları saniyede çok büyük miktarlarda istek üretebilir.
Daha önceki teknolojik yenilik dalgalarında olduğu gibi, GenAI yerleşik bir modeli izliyor ve tüm işaretler onun önceki teknoloji devrimlerinden daha hızlı ilerlediğini gösteriyor. Bu konudaki tüm olumsuz ve olumlu yanıltmacaları bir kenara bırakırsanız, POC GenAI uygulamalarını üretime geçirmek için çalışan şirketlerin umut verici ilerlemeler kaydettiği açıktır.
Ve işverenim DataStax gibi bu uygulamalar için ölçeklenebilir, kurulumu kolay temeller sağlayan şirketler, müşterilerinin tüketiminin faydalarını bazılarının düşündüğünden daha kısa sürede görmeye başlayacak.
Yazan: Ed Anuff, DataStax
DataStax'ın müşterilerin GenAI uygulamalarını üretime geçirmesine nasıl olanak sağladığı hakkında daha fazla bilgi edinin.