paint-brush
Yapay Zekanın O Günleri Geride Kaldıile@aibites
1,594 okumalar
1,594 okumalar

Yapay Zekanın O Günleri Geride Kaldı

ile Shrinivasan Sankar5m2024/07/13
Read on Terminal Reader

Çok uzun; Okumak

Yapay zeka son on yılda gerçek anlamda bir evrim geçirdi; bebekten canavara dönüştü. Burada nelerin değiştiğini hızlı bir şekilde özetliyorum
featured image - Yapay Zekanın O Günleri Geride Kaldı
Shrinivasan Sankar HackerNoon profile picture

Bu hafta, AI Kavramlarını veya kodlama eğitimlerini açıklayan her zamanki makalelerimden biraz uzaklaşıyorum. Evet, bu, baştan sona yürüyebilecek kadar şanslı olduğum yolda felsefi, nostaljik bir tur.


Bir alana oldukça erken başlamanın nadir ayrıcalıklarından biri de alanın bebeğiniz gibi büyüdüğünü görmenizdir. On yıl önce Bilgisayarla Görme alanında yüksek lisans eğitimime başladığımda, CS mezunu bir arkadaşım şunu sordu: "Bilgisayarlı görme ne anlama geliyor?" İnternette dolaşan segmentasyon (aşağıya bakın) gibi bilgisayarla görme görevlerine ilişkin yeterli videonun olduğu günümüzde bu önemsiz bir sorudur.

Görüntü segmentasyonunun bir sonucu; derin öğrenme on yıl önce ortaya çıktığında tüm internette yaygın olan bir Görüntü İşleme görevi.

Peki son on yılda neler değişti? Madalyonun her zaman iki yüzü vardır. Ayrıca büyüme hem iyi hem de kötü olabilir.

Kapalı Topluluk — Küçük Güzeldi

İzlanda'daki insanların bir şekilde birbirleriyle akraba olduğunu ve eğer birisi ikinci dereceden kuzenin dışındaysa, onunla evlenmenin iyi bir fikir olduğunu söylüyorlar.


Benzer şekilde yapay zeka topluluğu da birbirine sıkı sıkıya bağlıydı. Birbirine sıkı sıkıya bağlı bir topluluğun duyguları artık geride kaldı. Araştırmadan herhangi biriyle etkileşime geçtiğinizde genellikle onların hangi gruba ait olduğunu biliyordunuz. Sahadaki etkilerini okuduğunuzda ve takdir ettiğinizde, onların çalışmalarıyla bir şekilde ilişki kuracak ve onlara saygı duyacaksınız.


Saha sonsuz bir şekilde havaya uçarken, birinin işini biliyorum demek bile, unut gitsin demek giderek zorlaşıyor. Takip edilmesi bile zor olan çok fazla yeni isim ve yeni dal var.


Başka bir örnek olarak PyTorch henüz emekleme aşamasındaydı. Slack topluluğu o kadar küçük ve yardımseverdi ki PyTorch geliştiricileri kütüphanenin kullanımıyla ilgili sorularımızı doğrudan yanıtladı. Bu, onun hakkında giderek daha fazla şey öğrenmeyi teşvik etti. Bugün çerçeve oldukça olgunlaştı ve LangChain ve Llamaindex gibi yeni çerçeveler desteklendi. Odak noktası, diğer herhangi bir AI dalından ziyade Yüksek Lisans'tır.

Donanım Lüks

O günlerde, etkili bir şey yaratmak için tek bir GPU üzerinde derin bir sinir ağını eğitiyorduk. CVPR, NeurIPS ve ICML gibi önde gelen konferanslarda yayınlanan çalışmaların çoğu, tek bir 8 GB GPU makinesinde veya en kötü durumda, nadir durumlarda 4 GPU'lu tek bir makinede eğitilip çoğaltılabilir.

Tesla'nın yapay zeka için kullandığı en yeni GPU kümelerinin görüntüsü (kaynak: https://www.hpcwire.com/off-the-wire/tesla-to-roll-out-advanced-supercomputer )


Kaggle yarışmalarına katılmak için yalnızca 8 GB RAM'e sahip tek bir ticari GPU satın aldığım için ne kadar mutlu olduğumu çok iyi hatırlıyorum. Kaggle Grandmasters'ın kazanan çözümlerinden bazıları, derin öğrenme modellerini evdeki tek bir GPU makinesinde eğitti.


Günümüzün yapay zeka dünyasının temel modelleri eğitmek için bir GPU kümesine ihtiyacı var. Bu modellerin ince ayarını yapmak bile 24 GB GPU'lara ihtiyaç duyuyor; bunlar canavar gibi, pahalı ve yalnızca "Yapay Zeka bütçesi" olan işletmeler tarafından karşılanabilir.

Beceri Seti Talebi

O günler, sahanın henüz yapay zeka ambalajını almadığı günlerdi. İşe alım görevlilerine "derin öğrenme" mühendislerini avlamak gibi uzaylı bir görev verildi. İşe alım uzmanları ve start-up kurucuları, tüm kanallar aracılığıyla derin öğrenme uzmanlarını arıyorlardı. LinkedIn'de derin öğrenme mühendisi olarak ekibine katılmamı isteyen düzenli mesajlar almak bir normdu.

Yalnızca 5 gün önce yayınlanan ve 100'den fazla başvuru alan bir Makine Öğrenim Mühendisi için iş ilanının ekran görüntüsü!


Mevcut durum şu ki, "Makine Öğrenim Mühendisi" pozisyonları için LinkedIn'de reklam yayınlandıktan sonraki bir gün içinde 100'den fazla başvuru alınıyor. İnanmakta zorluk çekiyorsanız yukarıdaki ekran görüntüsüne bir göz atın. Başvuranın becerilerinin iş spesifikasyonuyla ne kadar alakalı olduğu sorusu hala devam etmektedir. Ancak pazar oldukça hızlı bir şekilde becerilere doymuş durumda!

Alt Beceriler – Operasyonlar ve Mimari

Büyüme, daha fazla çeşitlilik ve fırsat anlamına gelir. Makine öğrenimi operasyonları, LLM operasyonları ve makine öğrenimi mimarları gibi yeni roller ortaya çıkıyor. Küçük, tek modelli dosyaların (< 1 GB) olduğu günler geride kaldı. Modellerin hem boyut hem de yetenek açısından büyümesi, bunların konuşlandırılması ve bakımında yeni becerilerin ortaya çıkmasına neden oldu.


Ayrıca modellerin eğitimi ve dağıtımı MFLow gibi araçlarla otomatikleştiriliyor. Eğitime yönelik bulut altyapısının yeterince karmaşık olması gerekiyor. Bütün bunlar, özel sorumluluklara sahip tam zamanlı rollerin ortaya çıkmasına neden oldu.

Güle güle ML Mühendisi, Merhaba Yapay Zeka Mühendisi

Yapay zekayla çalışmanın en eğlenceli tarafı model mimarisini yazmak ve şirket içi verilerimizi kullanarak modeli sıfırdan eğitmektir. Her ne kadar bu, verilerin çok fazla ön işlenmesini gerektirse de, modelleri eğitmek ve eğitim sonuçlarını görselleştirmek eskiden çok eğlenceliydi. Bunun için Makine Öğrenimi (ML) Mühendisi adı verilen özel bir rol vardı / hala var.


Teknoloji devlerinin temel modellerinin geliştirilmesi bu rolü yeniden tanımlıyor. Model boyutları büyüdükçe eğitim bütçeleri de devasa boyutlara ulaşıyor. Nitekim LLama 2 modelinin eğitiminin Meta'ya maliyeti 20 milyon dolardı. Açıkça görülüyor ki yapay zekayı benimsemeye çalışan start-up'lar veya kuruluşlar bu miktardaki parayı çöpe atmak istemiyorlar. Artık Mistral ve Anthropic gibi bazı şirketler dışında temel modellerin teknoloji devlerinin geliştirmesine yönelik olduğu tespit edildi.


Ne yazık ki bu, ML Mühendisi rolünün Yapay Zeka Mühendisi rolüne dönüştürüleceği anlamına geliyor. ML Mühendisi rolü tamamen model mimarileri geliştirmek, eğitmek ve değerlendirmekle ilgiliydi. Yeni Yapay Zeka Mühendisi rolü çoğunlukla API'ler geliştirmeyi veya temel modelleri başlatmak için Teknoloji devleri (OpenAI, Meta ve Google) tarafından sağlanan API'leri çağırmayı içeriyor.


Nadir durumlarda, bu temel modellere ince ayar yapılması da gerekebilir. Ancak şirketler, RAG boru hatları oluşturma veya temel modellerini "olduğu gibi" kullanma ve bunlara ince ayar yapma seçeneğine sahiptir.

Çözüm

Sonuç olarak, bunu Yazılım mühendisliği ve Makine Öğrenimi rollerinin yavaş bir birleşimi olarak görüyorum. Yazılım mühendisleri ile derin öğrenme uzmanları arasındaki çizgi silikleşiyor. Dolayısıyla önümüzdeki yıllarda yazılım mühendisleri, hem kod yazmak hem de müşteri ihtiyaçlarını çözmek için temel modellerle birlikte çalışan yapay zeka mühendisleri olacak.


Ayrıca önümüzdeki yıllarda şirketler iki kategoriye ayrılacak: Yapay Zeka ürünleri ve Yapay Zeka hizmetleri şirketleri. Yapay zeka ürün şirketleri, temel modeller geliştirmek için yine OpenAI, Meta ve Google olacak. Yapay zeka hizmetleri şirketleri, müşterilerine hizmet vermek için yapay zeka temel modelleri etrafında RAG tarzı işlem hatlarını ince ayar yaparak veya geliştirerek API hizmetleri sağlayacak.


Son olarak, iş başvurularındaki ani artış, dot com balonu gibi balonun patlamak üzere olduğuna mı işaret ediyor? Öyle hissediyorum, EVET. Ama bekleyip izleyelim…

Haykırmak

Umarım faydalı olmuştur.


Bu makaleyi beğendiyseniz neden beni takip etmiyorsunuz? heyecan En iyi yapay zeka laboratuvarlarından araştırma güncellemeleri, video eğitim bağlantıları ve yeni yapay zeka araçları için?


Ayrıca lütfen bana abone olun Youtube kanalı AI kavramlarını ve makalelerini görsel olarak açıkladığım yer.