คุณเคยขอให้โมเดล AI เล่าเรื่องตลกให้คุณฟังหรือไม่ แล้วได้รับคำตอบที่แย่มากว่าไม่ตลกเลย เช่น:
ทำไมโปรแกรมเมอร์ถึงชอบโหมดมืด เพราะแสงดึงดูดแมลงได้!
ก้าวล้ำจริงๆ
บ่อยครั้ง เรื่องตลกที่ AI สร้างขึ้นนั้นแปลกประหลาดและคาดเดาได้ง่ายมาก เหตุผลก็คือ มันเป็นเครื่องจักร! เครื่องจักรไม่มีบริบทของมนุษย์ มันเห็นแค่รูปแบบในข้อมูลที่ได้รับการฝึกมาเท่านั้น และเมื่อเราขอให้พวกมันเล่าเรื่องตลก พวกมันก็จะรวบรวมคำขึ้นมาตามความน่าจะเป็น แทนที่จะใช้ไหวพริบหรือจังหวะการแสดงตลกที่แท้จริง
นี่ไม่ใช่เรื่องยากสำหรับคนที่ทำงานกับ AI แต่เป็นเรื่องที่น่าสนใจที่จะได้เห็น ว่าอะไรทำให้ AI เป็นแบบนั้น ด้วยความเข้าใจดังกล่าว คุณอาจคิดออกว่าจะ "ถาม" โมเดล AI ว่าให้เล่าเรื่องตลกอย่างไรดี
โมเดล AI (เช่น GPT หรือหุ่นยนต์เล่าเรื่องตลก) ไม่ได้เกิดมามีอารมณ์ขัน แต่เรียนรู้จากตัวอย่างเรื่องตลกนับพันๆ ตัวอย่างที่รวบรวมมาจากหนังสือ เว็บไซต์ และบทสนทนา แต่แทนที่จะ เข้าใจ อารมณ์ขันเหมือนที่เราทำ โมเดล AI กลับจดจำรูปแบบทางสถิติ
ต่อไปนี้คือตัวอย่างง่ายๆ ของวิธีที่โมเดล AI อาจประมวลผลโครงสร้างตลก (โค้ดที่แตกต่างกันโดยสิ้นเชิง เพียงเพื่อให้คุณเข้าใจ):
import random setup = ["Why did the chicken cross the road?", "What do you get when you mix AI with a comedian?", "Why don't programmers like nature?"] punchline = ["To get to the other side!", "A neural network with bad timing!", "Too many bugs."] print(random.choice(setup) + " " + random.choice(punchline)) # NOTE: This is oversimplified for easier understanding. # Real AI models don't just randomly select from pre-written jokes. # They use neural networks with billions of parameters to predict # the most likely next words based on patterns in their training data.
เห็นปัญหาหรือไม่? มันรู้จัก รูปแบบ ของเรื่องตลก โดยเริ่มจากการปูเรื่องก่อน จากนั้นจึงค่อยมาดูประเด็นสำคัญ มันไม่เข้าใจว่าทำไมเรื่องตลกถึงตลก
ผลลัพธ์ของโมเดล AI ไม่ว่าจะตลกหรือไม่ก็ตาม จะทำงานโดยอาศัยความน่าจะเป็นทางสถิติเท่านั้น โมเดลภาษาขนาดใหญ่ เช่น GPT มักทำงานโดยทำนายคำถัดไปที่น่าจะเป็นไปได้ทางสถิติมากที่สุด ซึ่งวิธีนี้ดีสำหรับการเติมคำอัตโนมัติและการสร้างข้อความพื้นฐาน แต่ไม่ดีสำหรับอารมณ์ขันแบบเดิมๆ
เช่น หาก AI สร้างการตั้งค่าว่า: “ทำไมไก่ถึงข้ามถนน?”
มันทำนายคำตอบทั่วไปสำหรับมุกตลก เนื่องจาก "เพื่อไปอีกด้านหนึ่ง" เป็นคำตอบที่น่าจะเป็นไปได้ทางสถิติมากที่สุด มันจึงมักจะสร้างคำตอบนั้นขึ้นมา แม้ว่าคำตอบนั้นจะไม่ตลกที่สุดก็ตาม
from collections import Counter jokes_dataset = ["To get to the other side!", "Because it was programmed to!", "To escape the AI overlords!"] probabilities = Counter(jokes_dataset) # chooses the most frequent joke print(probabilities.most_common(1)[0][0])
เพราะเหตุนี้มันจึงคาดเดาได้และซ้ำซากจริงๆ
อารมณ์ขันนั้นแตกต่างจากการสร้างข้อความทั่วไป ตรงที่มันมีความเกี่ยวข้องอย่างลึกซึ้งกับอารมณ์ ประสบการณ์ของมนุษย์ และวัฒนธรรม น่าเสียดายที่ AI ไม่เข้าใจสิ่งเหล่านี้โดยพื้นฐาน แม้ว่าจะมีการฝึกโมเดลด้วยข้อมูลจำนวนมหาศาล แต่ AI ก็ยังประสบปัญหาเมื่อต้องจัดการกับสิ่งต่อไปนี้:
แม้ว่า AI จะสามารถจดจำรูปแบบของเรื่องตลกทั่วไปได้ แต่ก็ไม่ เข้าใจ ว่าทำไมเรื่องบางเรื่องถึงตลก ดังนั้นจึงพยายามมากเกินไปที่จะทำให้ตลก
attempts = ["I'm hilarious, trust me!", "Why did the algorithm break up? It lost its spark!", "What's an AI's favorite drink? Java."] print(random.choice(attempts))
แล้วใครจะโทษได้ล่ะ? เครื่องจักรเหล่านี้ถูกฝึกโดยใช้ข้อมูลที่ได้มาอย่างไม่ถูกต้องตามกฎหมาย สิ่งสุดท้ายที่วิศวกร AI ไม่อยากให้เกิดขึ้นก็คือการถูกฟ้องร้องในการฝึกโมเดล AI โดยใช้ข้อมูลที่ดึงมาจากนักแสดงตลก
หากต้องการให้ AI เล่าเรื่องตลกได้ดีขึ้น คุณต้องระบุให้ชัดเจน บอกสไตล์ที่คุณต้องการ (เช่น อารมณ์ขันแบบมืดหม่นของ Louis CK หรืออารมณ์ขันแบบเสียดสีของ Chandler Bing) กำหนดฉาก และแจ้งให้ AI ทราบว่าคุณต้องการอารมณ์ขันแบบใด แม้จะไม่ได้ทำให้ดีขึ้น 50 เท่า แต่ก็อย่างน้อยก็จะไม่ดูเรียบง่ายและแข็งทื่อจนเกินไป
นั่นจะทำให้ AI มีกรอบการทำงาน เพราะตอนนี้ หากไม่มีบริบทและความเข้าใจในอารมณ์ของมนุษย์ สิ่งเดียวที่ AI ทำได้คือเดาประเด็นสำคัญ ซึ่งโดยปกติแล้วจะทำในลักษณะที่คาดเดาได้ง่ายที่สุดและคล้ายหุ่นยนต์
700 คำเท่านั้น ไม่ต้องสรุปอะไร เจอกันใหม่คราวหน้าครับ!