Pernahkah anda meminta model AI untuk memberitahu anda jenaka dan menerima sesuatu yang tidak lucu? Sesuatu seperti:
Mengapa pengaturcara lebih suka mod gelap? Kerana cahaya menarik pepijat!
Pecah tanah. sungguh.
Lebih kerap daripada tidak, apa yang dipanggil jenaka yang dihasilkan oleh AI ini adalah pelik dan sangat boleh diramal. Sebabnya? Ia adalah mesin! Mereka tidak mempunyai konteks manusia— yang dilihat hanyalah corak dalam data yang telah mereka latih, dan apabila kami meminta mereka menceritakan jenaka, mereka menggabungkan perkataan berdasarkan kebarangkalian dan bukannya kecerdasan sebenar atau masa komedi.
Ini bukan sains roket untuk seseorang yang bekerja dengan AI, tetapi menarik untuk melihat perkara yang menjadikannya seperti itu . Dengan pemahaman itu, anda juga mungkin memikirkan cara untuk "meminta" model AI untuk jenaka yang lebih baik .
Model AI (katakan, GPT atau bot bergurau) tidak dilahirkan dengan rasa jenaka. Sebaliknya, ia belajar daripada beribu-ribu contoh jenaka yang dikikis daripada buku, tapak web dan perbualan. Tetapi bukannya memahami humor seperti yang kita lakukan, ia mengiktiraf corak statistik.
Berikut ialah pandangan yang terlalu ringkas tentang cara model AI mungkin memproses struktur jenaka (kod yang sama sekali berbeza, hanya untuk pemahaman anda):
import random setup = ["Why did the chicken cross the road?", "What do you get when you mix AI with a comedian?", "Why don't programmers like nature?"] punchline = ["To get to the other side!", "A neural network with bad timing!", "Too many bugs."] print(random.choice(setup) + " " + random.choice(punchline)) # NOTE: This is oversimplified for easier understanding. # Real AI models don't just randomly select from pre-written jokes. # They use neural networks with billions of parameters to predict # the most likely next words based on patterns in their training data.
Nampak masalahnya? Ia mengiktiraf corak jenaka: pertama datang set-up, dan kedua datang punchlines; ia tidak faham mengapa gurauan itu lucu.
Output model AI, sama ada lucu atau tidak, hanya beroperasi pada kebarangkalian statistik . Model bahasa besar seperti GPT selalunya berfungsi dengan meramalkan perkataan seterusnya yang paling berkemungkinan secara statistik. Itu bagus untuk autolengkap dan penjanaan teks asas, tetapi buruk untuk jenaka asli.
Contohnya, jika AI menjana persediaan: "Mengapa ayam itu melintas jalan?"
Ia meramalkan tindak balas biasa untuk punchline. Memandangkan "Untuk pergi ke sisi lain" ialah jawapan yang paling berkemungkinan secara statistik, ia selalunya akan menjana itu— walaupun ia paling tidak kelakar.
from collections import Counter jokes_dataset = ["To get to the other side!", "Because it was programmed to!", "To escape the AI overlords!"] probabilities = Counter(jokes_dataset) # chooses the most frequent joke print(probabilities.most_common(1)[0][0])
Itulah sebabnya mereka benar-benar boleh diramal dan berulang.
Humor, tidak seperti penjanaan teks biasa, sangat terikat dengan emosi, pengalaman manusia dan budaya. Sedih untuk mengatakan, mereka adalah perkara tepat yang pada asasnya tidak difahami oleh AI. Walaupun dengan model yang dilatih pada sejumlah besar data, AI bergelut dalam hal:
Walaupun AI boleh mengenali format jenaka biasa, ia tidak faham mengapa sesuatu itu lucu. Akibatnya, mereka cuba terlalu keras untuk menjadi kelakar.
attempts = ["I'm hilarious, trust me!", "Why did the algorithm break up? It lost its spark!", "What's an AI's favorite drink? Java."] print(random.choice(attempts))
Dan sekali lagi, siapa yang harus dipersalahkan? Ini adalah mesin yang dilatih mengenai data yang tidak diperoleh secara sah. Perkara terakhir yang jurutera AI mahu berlaku ialah disaman kerana melatih model AI mengenai data yang diekstrak daripada pelawak berdiri.
Untuk mendapatkan jenaka yang lebih baik daripada AI, anda perlu khusus. Beritahu gaya yang anda mahukan (mungkin seperti humor gelap Louis CK atau sindiran Chandler Bing), tetapkan adegan dan beritahu jenis jenaka yang anda cari. Ia tidak akan menjadikannya 50 kali lebih baik, tetapi sekurang-kurangnya ia tidak akan begitu jelas dan kaku.
Itu akan memberikan AI rangka kerja untuk berfungsi. Kerana pada masa ini, tanpa konteks dan pemahaman tentang emosi manusia, semua yang boleh dilakukan ialah meneka punchline—biasanya dengan cara yang paling boleh diramal, robotik yang mungkin.
Itu hanya 700 patah perkataan, tiada ringkasan diperlukan. Jumpa lagi lain kali!