AI モデルにジョークを言うように頼んだのに、ひどく面白くないジョークが返ってきたことはありませんか? たとえば、次のようなものです。
プログラマーがダークモードを好むのはなぜでしょうか? 光はバグを引き寄せるからです。
画期的。本当に。
AI が生成したいわゆるジョークは、たいてい奇妙で、非常に予測可能なものになっています。その理由は、AI は機械だからです。AI には人間の文脈がありません。AI が見るのは、トレーニングされたデータのパターンだけです。AI にジョークを言うように頼むと、AI は実際の機知やコメディのタイミングではなく、確率に基づいて言葉をつなぎ合わせます。
これは、AI を扱う人にとっては難解なことではありませんが、 AI がなぜそうなっているのかを知るのは興味深いことです。それを理解すれば、 AI モデルにもっと良いジョークを「尋ねる」方法もわかるかもしれません。
AI モデル (GPT やジョークを言うボットなど) はユーモアのセンスを持って生まれるわけではありません。その代わりに、本、Web サイト、会話から収集した何千ものジョークの例から学習します。ただし、人間のようにユーモアを理解するのではなく、統計的なパターンを認識します。
以下は、AI モデルがジョーク構造を処理する方法の簡略化された図です (理解しやすいように、完全に異なるコードです)。
import random setup = ["Why did the chicken cross the road?", "What do you get when you mix AI with a comedian?", "Why don't programmers like nature?"] punchline = ["To get to the other side!", "A neural network with bad timing!", "Too many bugs."] print(random.choice(setup) + " " + random.choice(punchline)) # NOTE: This is oversimplified for easier understanding. # Real AI models don't just randomly select from pre-written jokes. # They use neural networks with billions of parameters to predict # the most likely next words based on patterns in their training data.
問題が分かりますか? ジョークのパターンを認識します。最初に設定があり、次にオチがあります。ジョークがなぜ面白いのか理解していません。
AI モデルの出力は、ユーモラスであるかどうかに関わらず、統計的確率のみに基づいて動作します。GPT のような大規模な言語モデルは、多くの場合、統計的に最も可能性の高い次の単語を予測することによって機能します。これは、オートコンプリートや基本的なテキスト生成には最適ですが、オリジナルのユーモアには適していません。
たとえば、AI が「なぜニワトリは道路を横断したのか?」という設定を生成するとします。
これは、オチに対する一般的な回答を予測します。「向こう側へ行くため」は統計的に最も可能性の高い回答であるため、最も面白くない回答であるにもかかわらず、この回答が生成されることがよくあります。
from collections import Counter jokes_dataset = ["To get to the other side!", "Because it was programmed to!", "To escape the AI overlords!"] probabilities = Counter(jokes_dataset) # chooses the most frequent joke print(probabilities.most_common(1)[0][0])
だからこそ、それらは本当に予測可能で反復的なものなのです。
ユーモアは、通常のテキスト生成とは異なり、感情、人間の経験、文化と深く結びついています。残念ながら、これらは AI が根本的に理解できないものです。膨大な量のデータでトレーニングされたモデルであっても、AI は次のことに苦労します。
AI は一般的なジョークの形式を認識できますが、なぜ面白いのかは理解できません。その結果、面白くしようと頑張りすぎてしまいます。
attempts = ["I'm hilarious, trust me!", "Why did the algorithm break up? It lost its spark!", "What's an AI's favorite drink? Java."] print(random.choice(attempts))
では、誰のせいでしょうか? これらは、あまり合法的に取得されていないデータでトレーニングされたマシンです。AI エンジニアが最も望まないことは、スタンダップ コメディアンから抽出したデータで AI モデルをトレーニングしたことで訴えられることです。
AI からもっと良いジョークを引き出すには、具体的にする必要があります。自分が望むスタイル (ルイス CK のブラック ユーモアやチャンドラー ビングの皮肉など) を伝え、場面を設定し、どんな種類のユーモアを求めているかを伝えます。50 倍良くなるわけではありませんが、少なくともそれほど平凡で堅苦しいものにはなりません。
そうすれば、AI が作業できる枠組みが手に入る。なぜなら、現状では、文脈も人間の感情の理解もないので、AI ができるのは、たいていは最も予測可能なロボット的な方法で、オチを推測することだけだからだ。
たった 700 語なので、要約は必要ありません。また次回お会いしましょう!