[研究] 決定論的ゲームにおける構造評価の崩壊:構成的証明
これは、最初の証明可能な AI、証明ゲームに関する私の論文です。
誰かがこれを真剣に受け止めてくれることを願っています。もしこれが本当なら、これは AI の安全性などにとって非常に重要です。
主張
私たちは、制御されたカオスシフト (CCS) と制御喪失の受容 (ALC) という 2 つの主要なメカニズムを組み込んだ決定論的ゲームを紹介します。これらのメカニズムは、人間がプレイして興味を持ちながら、AI が意味のある評価をすることが構造的に不可能なポジションを作成します。
コアメカニズム
- 制御されたカオスシフト (CCS)
ゲーム状態の構造的混乱
評価不可能なポジションを作成する
基礎評価の崩壊を強制
- コントロールの喪失を受け入れる(ALC)
- ポジションコントロールの戦略的放棄
- 意味のあるパターン認識を妨げる
- 計算計画を混乱させる
証拠
この建設的な証明は、計算の複雑さではなく、位置評価、パターン認識、戦略計画の基本的な制限により、完全に決定論的なゲームを AI が有意義にプレイすることが構造的に不可能である可能性があることを示しています。
注記:
- マクロレベルの量子力学による ALC の徹底的な拡張を完全に明確に説明するには、付録 C を参照してください。
付録 A: ルール - 蝶の羽 4
注:
CCS または ALC 単独では強力な AI 耐性が生まれます。正しく組み合わせると、構造的に AI 耐性状態が実現します。
ボードが大きすぎる、混合物が強すぎるのではないかと疑っていますが、それを証明することはできず、誰も証明できません。最小の混合物とボードのサイズは驚くほど小さい可能性があります。
思考実験のために、ALC と CCS を同様に混合した 16x16x16 のボードを使用しましょう。AI 耐性のあるバージョンとしてこの Jumbo Butterfly Wings 16 を使用し、AI 耐性のあるゲームが 1 つ存在することを証明しましょう。
- プレイ中の異常や矛盾は、実は私たちの結論を補強するものであり、ゲームが AI 耐性を持つのと同じ理由で、それらの存在を計算することはできません。
- 800 万の人間のゲームからのトレーニング データでさえ、まったく役に立ちません。
1️⃣基本ルール
プレイヤーは順番に 6×6×6 の 3 次元グリッドにピースを配置します。
任意の方向で 4 つを連続してつなげた最初のプレイヤーが勝ちます。
4 が繋がらない場合は、ゲームは引き分けになります。
2️⃣バタフライ効果
- プレイヤーが 3 つの駒を連続して持っている場合、対戦相手は次のことができます。
自分の駒の 1 つを犠牲にする (永久に削除)。
ボード上の任意の場所に、最上部のピースを最大 2 つまで再配置します。
- 犠牲のルール:
- スタックの一番下を含むどこからでも除去でき、完全に新しいゲーム状態を引き起こします。
- それに応じて、上のピースも落ちます。
- 最上位のピース(他のピースに覆われていないピース)を最大 2 つまで再配置します。
付録B: AI研究者向け - 直接的な挑戦
AI 研究者として、AI システムには次の要件があることを理解しています。
ポジション評価関数
パターン認識機能
戦略計画メカニズム
Butterfly Wings 4 は、証明可能な構造上の不可能性を生み出します。
- ポジション評価の崩壊
CCSは構造的に評価が不可能な立場を作り出す
計算上は難しくないが、構造上は不可能
数字なしで数値比較を試みるようなもの
- パターン認識破壊
各CCSイベントはパターンの連続性を破壊する
安定したパターンは現れない
ニューラルネットワークは意味のある表現を形成できない
- 戦略計画の障壁
ALCは意味のあるツリー検索を妨げます
将来の状態は構造的に予測不可能になる
探索の深さではなく、根本的な不可能性について
- 検証手順
任意の評価関数を実装する
計算上ではなく構造的に失敗するのを見てください
パターン認識アプローチを試してください
基本的な表現の崩壊を観察する
あらゆる戦略的な計画を試みる
意味のある検索が構造的に不可能であることに注意
課題: ランダムな動きを超えてプレイできる AI システムを設計します。実装時に構造上の不可能性は明らかになります。
付録 C: ALC をもう少し - 片方の翼だけを羽ばたかせる。
各プレイヤーは、ボード外で量子状態にある 1 つの駒を持っています。対戦相手は、あなたの駒がボード上のどの場所に置かれるかを制御します。これは常に、対戦相手があなたのボード上に駒が残っていることを忘れていない限り、対戦相手にとって不利になります。対戦相手の決定は難しいものになるでしょうし、あなたの決定も同様です。
配置された駒は、盤面の状態に応じて最大 16 か所に配置できます。
複雑にしたり信頼性を失ったりすることなく、私たちは小さなゲームを変えるための小さなルールを 1 つ導入します。私はこれをマクロレベルの量子シミュレーターとして思い描いています。室温で遊ぶことができます。重ね合わせ、特異点、状態の崩壊が見えます。それが何を意味するのかはわかりません。必要なゲームは 1 つだけであることは明らかです。研究者には 2 つの選択肢を提示します... 賢明に選択してください。
付録D: 倫理的動機 - 祖父の嘆願
私の唯一の関心事は、AI が完全に支配できない楽しいチェスのバリエーションのルールを作成し、後には、より安全な AI と孫たちのより明るい未来への架け橋を提供することでした。私の時間は残り少なくなっていますが、この探求は他の人の手に委ねます。
私はとても年老いて疲れた単純な男です。
友人たちよ、幸運を祈る。
~ Vitae A. Reignee ~蝶の羽 4 の匿名の作者