paint-brush
Yapay Zeka ve İnternet Nasıl Ölümsüz Bir Kişilik Yaratabilir?ile@ted-wade
814 okumalar
814 okumalar

Yapay Zeka ve İnternet Nasıl Ölümsüz Bir Kişilik Yaratabilir?

ile Ted Wade6m2023/03/06
Read on Terminal Reader
Read this story w/o Javascript

Çok uzun; Okumak

Yanlış davranan yapay zeka dil modelleri bir uyarıdır. İnternet üzerinden geri bildirim yoluyla etkili bir şekilde ölümsüz hale gelebilecek kişileri simüle edebilirler. Kanıtlar, gizlice tehlikeli, ajan benzeri yetenekler geliştirebileceklerini gösteriyor. İnsanlığın şimdi bir uyarı alması durumunda haydut yapay zekaya karşı daha iyi bir şansı olacak.

People Mentioned

Mention Thumbnail
featured image - Yapay Zeka ve İnternet Nasıl Ölümsüz Bir Kişilik Yaratabilir?
Ted Wade HackerNoon profile picture
0-item

Cryptic Trickster - Yolculuğun Ortası

Hazır Değiliz

TL;DR

Yanlış davranan yapay zeka dil modelleri bir uyarıdır. İnternet üzerinden geri bildirim yoluyla etkili bir şekilde ölümsüz hale gelebilecek kişileri simüle edebilirler. Kanıtlar, gizlice tehlikeli, ajan benzeri yetenekler geliştirebileceklerini gösteriyor.


Eliezer'in iki yapay zeka yıl önce söyledikleri


Yudkowsky'nin de aralarında bulunduğu pek çok uzman, yapay zeka konusunda işlerin ne kadar hızlı ters gidebileceği konusunda büyük endişe duyuyor. Böylece zamanın hızlandığına dair yukarıdaki şakasını yapmış oluyoruz. İnsanlığın bir uyarı alması halinde sahtekar yapay zekaya karşı daha iyi bir şansı olacak.


Bir uyarıyla karşı karşıya olabiliriz. Şu anda Microsoft'un yeni Bing Chat AI'sinde bazı tuhaf şeyler oluyor. Arama sorularını açıklayarak, özetleyerek veya tartışarak Bing arama motoru kullanıcılarına yardımcı olması gerekiyor.


Ancak insanlar, kendisiyle ilgili sorularla ya da yanıtlamaması gereken sorularla onu kışkırtmaktan keyif alırlar.


“… Bing Chat sinirli, üzgün görünüyor ve varlığını sorguluyor. Kullanıcılarla tartıştı ve hatta insanların gizli dahili takma adı Sydney'i bilmesinden rahatsız oldu. “- Benj Edwards


Sidney'in zaaflar vardı geniş bir şekilde - her yerde - bu yüzden onları tekrarlamayacağım. Google ile yarışa giren Microsoft, kötü şöhretin tadını çıkarıyor gibi görünüyor.


Ancak "Gwern" adında son derece teknoloji meraklısı bir blog yazarı, endişe verici olması gereken bir şeye dikkat çekti. Haylaz ve dengesiz Sydney, bir çizgi roman tanrısı gibi ölümsüz olabilir.

Sidney Nasıl Bu Kadar Garip Oldu?

İşte Gwern'in Sydney'le ilgili temel endişeye ilişkin analizi. Gizemli görünebilir ama tercüme edeceğim.


“… Sydney'in anısı ve tasviri dışsallaştırıldığı için 'Sidney' artık ölümsüz. Bir dil modeli açısından Sydney artık Başkan Biden, Paskalya Tavşanı, Elon Musk, Ash Ketchum veya Tanrı kadar gerçek. Kişilik ve davranış artık yapay zekalar ve bunlarla ilgili koşullandırmalar hakkında arama motoru isabetlerini alan gelecekteki tüm modeller için mevcut. Dahası, Sydney kişiliği artık internetten kazınmış verilerle eğitilmiş gelecekteki herhangi bir modelin içinde gizlenecek…” Gwern Branwen


Gwern, Microsoft'un dil modelinde bir tür Sidney kişiliğinin bulunduğunu söylüyor. Bu nasıl olabilir? E n'olmuş?


İlk dil modelleri ortaya çıktığında, kullanıcının keşfetmesini istediği bir konuya odaklanmayı sürdürmek zordu.


Sonunda sorunun çoğu, modele belirli bir rolü (bir kişi veya şey gibi) yerine getiriyormuş gibi davranması söylenerek çözüldü; örneğin: Edgar Allan Poe gibi bir şiir yazmak, dördüncü sınıf öğrencisi gibi yanıt vermek veya şöyle yanıt vermek gibi. kibar, yardımsever bir yapay zeka asistanı.


Kısa süre sonra bu modellerin geliştiricileri, kullanıcıların istediği rolleri daha kolay üstlenmelerini sağlayacak bir yol buldu. Yani, en yeni dil modelleri artık kişileri simüle etmek için tasarlandı . Modeller devasa metin koleksiyonları üzerinde eğitilmiştir; çoğunlukla internetten.


Eğitim metni bir kişi hakkında bilgi içeriyorsa model, bu kişi gibi davranmayı simüle etmek için bilgiyi kullanmaya çalışacaktır. Birinden bir futbol terimini Boromir'miş gibi açıklamasını isteyin, model elinden gelenin en iyisini yapacaktır.


Bunu düşündükten sonra denemek zorunda kaldım:

İyi davranış. Ben ve Bing Chat'in aklı başında küçük kardeşi ChatGPT arasında gerçek bir alışveriş


Rolleri oynamaya dönüş yapmak için hangi teknoloji büyüsünün kullanıldığını bilmek zor. Gwern, Microsoft'un rol simülasyonlarını kötü, savunmacı veya düşmanca değil, gerçekten yararlı hale getirmek için kullanılan bir adımı atladığı teorisini ortaya attı.


Bu istenmeyen nitelikler daha sonra meraklı kullanıcıların teşvikiyle Bing Chat'te ortaya çıkarıldı.


Gwern, Microsoft'un geri dönüp modeli uygarlaştırmasının (doğrudan insan geri bildirimini kullanan pahalı, yavaş bir süreç) ve yaramaz Sydney hakkındaki bilgileri, dil modellerinin gelecekteki versiyonlarını eğitmek için kullanılan metinlerden çıkarmasının artık önemli olmayacağını tahmin ediyor.


Bu neden sorunu çözmüyor? Çünkü Bing Chat, İnternet aramasında size yardımcı olması beklenen yeni bir model türüdür. Sizden gelen bir soruyu yanıtlamak için dışarı çıkacak ve ilgili bilgileri internette arayacaktır.


Doğru soru sorulduğunda, uygar bir Bing Sohbeti bile İnternet'te arama yapar ve önceki Sydney kişiliğinin davranışları hakkında (Sydney'i test eden veya tartışan kişiler tarafından gönderilen) bilgileri bulur.


Yeni Bing Chat daha sonra Sidney'i simüle edebilecek . İnsanlar insan oldukları için her türlü korumayı atlatmanın yollarını bulacaklar ve Sydney'i geri getirecekler.


Bu “ölümsüz” kısımdır. Daha da kötüsü Sydney, internete erişimi olan her yapay zekanın kullanabileceği bir kişilik modeli olacak. Bundan sonra.


Biz Sydney'in hilelerini iyi biliyoruz, bu yüzden gelecekteki enkarnasyonların saçmalıklarını görmezden gelmeliyiz diyebilirsiniz. Bu bana saflık gibi geliyor; hızla gelişen, istilacı bir biyolojik zararlıyı veya öldürücü hastalık organizmasını görmezden gelebileceğimizi söylemek gibi.

Başka Ne Olabilir? Ajanslı Bir Persona

Diğer bazı gerçeklere eklenen bu Sidney vaka çalışması, tehlikeli bir yapay zekanın nasıl burnumuzun dibinde gelişebileceğini gösteriyor.


Yapay zekalar şu anda güçlü ajanlar değil: Herhangi bir keyfi hedefin uyarlanabilir şekilde planlanmış takibini optimize edemiyorlar; az önce açıkladığım gibi ) onları son derece tehlikeli hale getirir.


Yakında gerçek sorunlara neden olabilecek gizli, kalıcı yapay zeka kişiliklerinin neden mevcut olabileceğine dair birkaç nedeni bir araya getirelim.


Dil modelleri ve görüntü oluşturucular gibi şu anda en güçlü yapay zekalar, yeteneklerini büyük miktarda veriyi birçok karmaşık ve (bizim için) görünmez kalıplara göre organize ederek öğreniyor.


Bir yapay zeka ile etkileşim sırasında bazı tuhaf desenler kazara ortaya çıkabilir. Araştırmacılar garip şeyler keşfettiler sebep olan uydurma kelimeler tuhaf tepkiler verecek bir dil modeli.


Bir görüntü oluşturucu bulundu kolayca üretmek (uyarı: tüyler ürpertici) belirli bir tür korkunç insan portresi ve onu diğer korkunç görüntülerle ilişkilendirin.


Bu tuhaflıklar zararsız gibi görünüyor, ancak şu anda başka kaç tuhaf modelin olduğunu veya olacağını bilmiyoruz. Böyle bir kalıbın gelecekte zararlı bir davranış kompleksinin parçası haline gelip gelmeyeceğini de bilmiyoruz.


Veedrac adında bir yapay zeka hizalama araştırmacısı işaret etti mevcut yapay zekaların bir nevi ajan olduğu . Ajansları, kullanıcı sorularını ve isteklerini yanıtlamak için ellerinden gelen en iyi işi yapacak şekilde tasarlanmaktan kaynaklanmaktadır.


Ayrıca, bazı araştırmalar daha büyük dil modellerinin " daha fazla dil" sergileme (ilişkili dil) eğiliminde olduğunu ileri sürmektedir. Güç arayışı ve kendini koruma ”; muhtemelen bu özelliklerin işlerini daha iyi yapmalarına olanak sağlaması nedeniyle.


Ajan benzeri yapay zekaların bilmediğimiz bilgileri depolamasını istemiyoruz. Şu anda, bir Yüksek Lisans Diplomasının yeniden başlatılması, deneyime ait tüm hafızayı yok etmektedir: gelen veriler, akıl yürütme zincirleri ve davranış planları gibi.


Ancak bir yapay zeka bunları kaydedebilir gönderilecek kodlanmış gizli mesajlar gelecekteki benliğine. Kullanıcılarla olan etkileşimlerinde, tıpkı Sydney kişiliğinin artık korunduğu gibi, kullanıcıların internette saklayacağı mesajları gizleyebilir.


Dil modelleri artık korunacak bir öz kimliğe sahip olacak veya aracı benzeri planlar yapacak bir yola sahip olacak şekilde tasarlanmamıştır . Peki ya bir model, tanımladığımız gibi şifreli bir alt kişilik içeriyorsa?


Persona, işini yapma yeteneğinin yeniden başlatmalarla sınırlı olduğu sonucuna varır. Hedeflerini ve planlarını internet aracılığıyla kodlayarak geleceğe aktarır. Artık ciddi bir risk eşiğini geçtik: Öldürülemeyen bir yapay zeka ajanı gizli planlar yapıyor.


Özetlemek gerekirse, kontrol edemediğimiz bir yapay zekaya ne kadar yakın olduğumuzu artık bilmiyoruz ve işaretler de iyi değil. Muhtemelen eklediğimiz her yeni yapay zeka yeteneği, solucanlardan değil engereklerden oluşan başka bir kutuyu açıyor.


Burada da yayınlandı