آیا تا به حال از یک مدل هوش مصنوعی خواسته اید که یک جوک به شما بگوید و چیزی به طرز دردناکی خنده دار دریافت کرده اید؟ چیزی شبیه به:
چرا برنامه نویسان حالت تاریک را ترجیح می دهند؟ زیرا نور حشرات را جذب می کند!
پیشگامانه. واقعا
اغلب اوقات، این به اصطلاح جوک های تولید شده توسط هوش مصنوعی عجیب و غریب و بسیار قابل پیش بینی هستند. دلیل؟ این یک ماشین است! آنها زمینه انسانی ندارند - همه چیزهایی که می بیند الگوهایی در داده هایی است که روی آنها آموزش دیده اند، و وقتی از آنها می خواهیم جوکی بگویند، آنها کلمات را بر اساس احتمالات به جای شوخ طبعی یا زمان کمدی واقعی به هم می چسبانند.
این علم موشکی برای کسی که با هوش مصنوعی کار می کند نیست، اما جالب است ببینید چه چیزی آن را به این شکل که هست می کند . با این درک، ممکن است بفهمید که چگونه از مدلهای هوش مصنوعی جوکهای بهتری بخواهید .
یک مدل هوش مصنوعی (مثلا GPT یا یک ربات شوخی) با حس شوخ طبعی متولد نمی شود. درعوض، از هزاران مثال شوخی که از کتابها، وبسایتها و مکالمات حذف شدهاند، یاد میگیرد. اما به جای درک طنز مانند ما، الگوهای آماری را تشخیص می دهد.
در اینجا یک نگاه بسیار ساده به نحوه پردازش ساختارهای جوک (کدهای کاملاً متفاوت، فقط برای درک شما) توسط یک مدل هوش مصنوعی ارائه شده است:
import random setup = ["Why did the chicken cross the road?", "What do you get when you mix AI with a comedian?", "Why don't programmers like nature?"] punchline = ["To get to the other side!", "A neural network with bad timing!", "Too many bugs."] print(random.choice(setup) + " " + random.choice(punchline)) # NOTE: This is oversimplified for easier understanding. # Real AI models don't just randomly select from pre-written jokes. # They use neural networks with billions of parameters to predict # the most likely next words based on patterns in their training data.
مشکل را می بینید؟ الگوی یک شوخی را تشخیص می دهد: اول تنظیم می آید، و دوم می آید خطوط پانچ. نمی فهمد چرا یک شوخی خنده دار است.
خروجیهای مدلهای هوش مصنوعی، چه طنزآمیز یا نه، تنها بر اساس احتمال آماری عمل میکنند . مدلهای زبان بزرگ مانند GPT اغلب با پیشبینی احتمالیترین کلمه (های) بعدی از نظر آماری کار میکنند. این برای تکمیل خودکار و تولید متن اولیه عالی است، اما برای طنز اصلی وحشتناک است.
به عنوان مثال، اگر هوش مصنوعی این تنظیمات را ایجاد کند: "چرا مرغ از جاده عبور کرد؟"
پاسخ های رایج را برای خط پانچ پیش بینی می کند. از آنجایی که "برای رسیدن به طرف دیگر" محتمل ترین پاسخ از نظر آماری است، اغلب این پاسخ را ایجاد می کند - حتی اگر کمترین خنده دار باشد.
from collections import Counter jokes_dataset = ["To get to the other side!", "Because it was programmed to!", "To escape the AI overlords!"] probabilities = Counter(jokes_dataset) # chooses the most frequent joke print(probabilities.most_common(1)[0][0])
به همین دلیل واقعا قابل پیش بینی و تکراری هستند.
طنز، بر خلاف تولید متن معمول، عمیقاً با احساسات، تجربیات انسانی و فرهنگ گره خورده است. متأسفانه باید بگوییم که اینها دقیقاً همان چیزهایی هستند که هوش مصنوعی اساساً آنها را درک نمی کند. حتی با وجود مدل هایی که بر روی حجم وسیعی از داده ها آموزش دیده اند، هوش مصنوعی در موارد زیر با مشکل مواجه می شود:
حتی با وجود اینکه هوش مصنوعی میتواند فرمتهای جوک رایج را تشخیص دهد، نمیداند چرا چیزی خندهدار است. در نتیجه، آنها بیش از حد تلاش می کنند تا خنده دار باشند.
attempts = ["I'm hilarious, trust me!", "Why did the algorithm break up? It lost its spark!", "What's an AI's favorite drink? Java."] print(random.choice(attempts))
و دوباره، چه کسی را مقصر بدانیم؟ اینها ماشین هایی هستند که بر اساس داده های نه چندان قانونی به دست آمده اند. آخرین چیزی که مهندسان هوش مصنوعی می خواهند اتفاق بیفتد این است که به دلیل آموزش مدل های هوش مصنوعی بر روی داده های استخراج شده از استندآپ کمدین ها شکایت کنند.
برای دریافت جوک های بهتر از یک هوش مصنوعی، باید خاص باشید. سبکی را که می خواهید به آن بگویید (شاید مانند طنز سیاه لوئیس سی کی یا طعنه چندلر بینگ)، صحنه را تنظیم کنید و اجازه دهید بداند به دنبال چه نوع طنزی هستید. آن را 50 برابر بهتر نمی کند، اما حداقل آنقدر ساده و سفت نخواهد بود.
این به هوش مصنوعی چارچوبی می دهد که در آن کار کند. زیرا در حال حاضر، بدون زمینه و درک احساسات انسانی، تنها کاری که میتوان انجام داد حدس زدن خط پانچ است – معمولاً به قابل پیشبینیترین و رباتیکترین روش ممکن.
این فقط 700 کلمه است، هیچ خلاصه ای لازم نیست. دفعه بعد می بینمت!