शायद आप प्रक्रियात्मक स्तर निर्माण से परिचित हों; खैर, इस पोस्ट में, यह सब प्रक्रियात्मक मिशन निर्माण के बारे में है। हम रॉगलाइक गेम के लिए क्लासिक मशीन लर्निंग और आवर्तक तंत्रिका नेटवर्क का उपयोग करके मिशन बनाने की बड़ी तस्वीर के माध्यम से चलेंगे।
नमस्ते सभी! मेरा नाम लेव कोबेलेव है, और मैं MY.GAMES में गेम डिज़ाइनर हूँ। इस लेख में, मैं क्लासिकल ML और सरल न्यूरल नेटवर्क का उपयोग करने के अपने अनुभव को साझा करना चाहता हूँ क्योंकि मैं समझाता हूँ कि कैसे और क्यों हमने प्रक्रियात्मक मिशन निर्माण पर समझौता किया, और हम ज़ोंबी स्टेट में प्रक्रिया के कार्यान्वयन में भी गहराई से उतरेंगे।
अस्वीकरण: यह लेख केवल सूचनात्मक/मनोरंजन उद्देश्यों के लिए है, और किसी विशेष समाधान का उपयोग करते समय, हम आपको सलाह देते हैं कि आप किसी विशेष संसाधन के उपयोग की शर्तों की सावधानीपूर्वक जांच करें और कानूनी कर्मचारियों से परामर्श करें!
मिशन “बॉक्स” की मूल बातें: तरंगें, स्पॉन और बहुत कुछ
☝🏻 सबसे पहले, कुछ शब्दावली: " एरेनास ", " स्तर ", और " स्थान " इस संदर्भ में समानार्थी हैं, साथ ही " क्षेत्र ", " ज़ोन " और " स्पॉन क्षेत्र " भी।
अब, आइए " मिशन " को परिभाषित करें । एक मिशन एक पूर्व निर्धारित क्रम है जिसमें दुश्मन कुछ नियमों के अनुसार किसी स्थान पर दिखाई देते हैं । जैसा कि उल्लेख किया गया है, ज़ोंबी स्टेट में स्थान उत्पन्न होते हैं, इसलिए हम एक "मंचित" अनुभव नहीं बना रहे हैं। यही है, हम दुश्मनों को पूर्व निर्धारित बिंदुओं पर नहीं रखते हैं - वास्तव में, ऐसे कोई बिंदु नहीं हैं। हमारे मामले में, एक दुश्मन किसी खिलाड़ी या किसी विशिष्ट दीवार के पास कहीं दिखाई देता है। इसके अलावा, खेल में सभी क्षेत्र आयताकार हैं, इसलिए उनमें से किसी पर भी कोई भी मिशन खेला जा सकता है।
आइए " स्पॉन " शब्द का परिचय दें । स्पॉनिंग एक निर्दिष्ट क्षेत्र में बिंदुओं पर पूर्व निर्धारित मापदंडों के अनुसार एक ही प्रकार के कई दुश्मनों की उपस्थिति है। एक बिंदु - एक दुश्मन। यदि किसी क्षेत्र के अंदर पर्याप्त बिंदु नहीं हैं, तो इसे विशेष नियमों के अनुसार विस्तारित किया जाता है। यह समझना भी महत्वपूर्ण है कि ज़ोन का निर्धारण केवल तभी किया जाता है जब स्पॉन ट्रिगर होता है। क्षेत्र स्पॉन मापदंडों द्वारा निर्धारित किया जाता है, और हम नीचे दो उदाहरणों पर विचार करेंगे: खिलाड़ी के पास एक स्पॉन और एक दीवार के पास।
स्पॉन का पहला प्रकार खिलाड़ी के पास है। खिलाड़ी के पास उपस्थिति एक सेक्टर के माध्यम से निर्दिष्ट की जाती है, जिसे दो रेडी द्वारा वर्णित किया जाता है: बाहरी और आंतरिक (आर और आर), सेक्टर की चौड़ाई (β), खिलाड़ी के सापेक्ष रोटेशन का कोण (α), और दुश्मन की उपस्थिति की वांछित दृश्यता (या अदृश्यता)। एक सेक्टर के अंदर दुश्मनों के लिए आवश्यक संख्या में अंक होते हैं - और यहीं से वे आते हैं!
दूसरे प्रकार का स्पॉन दीवार के पास होता है । जब कोई स्तर उत्पन्न होता है, तो प्रत्येक पक्ष को एक टैग के साथ चिह्नित किया जाता है - एक कार्डिनल दिशा। निकास वाली दीवार हमेशा उत्तर में होती है। दीवार के पास दुश्मन की उपस्थिति टैग, उससे दूरी (ओ), लंबाई (ए), ज़ोन की चौड़ाई (बी) और दुश्मन की उपस्थिति की वांछित दृश्यता (या अदृश्यता) द्वारा निर्दिष्ट की जाती है। ज़ोन का केंद्र खिलाड़ी की वर्तमान स्थिति के सापेक्ष निर्धारित किया जाता है।
स्पॉन तरंगों में आते हैं। एक लहर वह तरीका है जिससे स्पॉन दिखाई देते हैं, यानी उनके बीच की देरी - हम खिलाड़ियों को एक साथ सभी दुश्मनों से नहीं मारना चाहते। तरंगों को मिशनों में जोड़ा जाता है और एक निश्चित तर्क के अनुसार एक के बाद एक लॉन्च किया जाता है। उदाहरण के लिए, पहली लहर के 20 सेकंड बाद दूसरी लहर लॉन्च की जा सकती है (या अगर उसके अंदर 90% से अधिक ज़ॉम्बी मारे जाते हैं)। तो, एक पूरे मिशन को एक बड़े बॉक्स के रूप में माना जा सकता है, और उस बॉक्स के अंदर, मध्यम आकार के बॉक्स (तरंगें) हैं, और तरंगों के अंदर, और भी छोटे बॉक्स (स्पॉन) हैं।
इसलिए, मिशन पर काम करने से पहले ही हमने कुछ नियम निर्धारित कर लिए हैं:
- कार्रवाई की निरंतर भावना बनाए रखने के लिए, खिलाड़ी के निकट दृश्य बिंदुओं पर नियमित रूप से ज़ोम्बीज़ को उत्पन्न करना सुनिश्चित करें।
- बाहर निकलने के रास्ते को उजागर करने या खिलाड़ी को एक निश्चित दिशा से धकेलने के लिए, मुख्य रूप से दीवारों के पास लंबी दूरी के युद्ध दुश्मनों को पैदा करने का प्रयास करें
- कभी-कभी, खिलाड़ी के सामने विशेष शत्रुओं को उत्पन्न करें, लेकिन अदृश्य बिंदुओं पर।
- कभी भी खिलाड़ी से X मीटर से अधिक निकट शत्रुओं को उत्पन्न न करें
- एक ही समय में X से अधिक शत्रुओं को उत्पन्न न करें
एक समय पर, हमारे पास लगभग सौ मिशन तैयार थे, लेकिन कुछ समय बाद, हमें और भी ज़्यादा मिशन की ज़रूरत पड़ी। दूसरे डिज़ाइनर और मैं एक और सौ मिशन बनाने में बहुत ज़्यादा समय और मेहनत नहीं लगाना चाहते थे, इसलिए हमने मिशन बनाने के लिए एक तेज़ और सस्ती विधि की तलाश शुरू कर दी।
मिशन जनरेशन
मिशन विघटन
सभी जनरेटर कुछ नियमों के अनुसार काम करते हैं, और हमारे मैन्युअल रूप से बनाए गए मिशन भी कुछ सिफारिशों के अनुसार किए गए थे। इसलिए, हम मिशनों के भीतर पैटर्न के बारे में एक परिकल्पना के साथ आए, और वे पैटर्न जनरेटर के लिए नियमों के रूप में कार्य करेंगे।
✍🏻 कुछ शब्द जो आपको पाठ में मिलेंगे:
क्लस्टरिंग किसी दिए गए संग्रह को गैर-अतिव्यापी उपसमूहों (क्लस्टर) में विभाजित करने का कार्य है, ताकि समान वस्तुएं एक ही क्लस्टर से संबंधित हों, और विभिन्न क्लस्टरों की वस्तुएं काफी भिन्न हों।
श्रेणीबद्ध विशेषताएँ वे डेटा हैं जो एक परिमित सेट से मान लेते हैं और उनका कोई संख्यात्मक प्रतिनिधित्व नहीं होता है। उदाहरण के लिए, स्पॉन वॉल टैग: उत्तर, दक्षिण, आदि।
श्रेणीबद्ध विशेषताओं का कोडिंग कुछ पूर्व-निर्दिष्ट नियमों के अनुसार श्रेणीबद्ध विशेषताओं को संख्यात्मक प्रतिनिधित्व में परिवर्तित करने की एक प्रक्रिया है। उदाहरण के लिए, उत्तर → 0, दक्षिण → 1, आदि।
सामान्यीकरण संख्यात्मक विशेषताओं को पूर्व-संसाधन करने की एक विधि है ताकि उन्हें श्रेणियों में अंतर के बारे में जानकारी खोए बिना कुछ सामान्य पैमाने पर लाया जा सके। उदाहरण के लिए, उनका उपयोग वस्तुओं की समानता की गणना करने के लिए किया जा सकता है। जैसा कि पहले उल्लेख किया गया है, ऑब्जेक्ट समानता क्लस्टरिंग समस्याओं में एक महत्वपूर्ण भूमिका निभाती है।
इन सभी पैटर्न को मैन्युअल रूप से खोजना बहुत समय लेने वाला होगा, इसलिए हमने क्लस्टरिंग का उपयोग करने का फैसला किया। यहीं पर मशीन लर्निंग काम आती है, क्योंकि यह इस कार्य को अच्छी तरह से संभालती है।
क्लस्टरिंग कुछ N-आयामी अंतरिक्ष में काम करता है, और ML विशेष रूप से संख्याओं के साथ काम करता है। इसलिए सभी स्पॉन वेक्टर बन जाएंगे:
- श्रेणीबद्ध चर को कोडित किया गया
- सभी डेटा सामान्यीकृत किया गया
इसलिए, उदाहरण के लिए, स्पॉन जिसे "2 मीटर के इंडेंटेशन, 10 की चौड़ाई और 5 की लंबाई वाले क्षेत्र में उत्तरी दीवार पर 10 ज़ोंबी शूटरों को स्पॉन करें" के रूप में वर्णित किया गया था, वेक्टर [0.5, 0.25, 0.2, 0.8, ..., 0.5] बन गया (←ये संख्याएं अमूर्त हैं)।
इसके अतिरिक्त, विशिष्ट शत्रुओं को अमूर्त प्रकारों में मैप करके शत्रुओं के समूह की शक्ति को कम किया गया। शुरुआत के लिए, इस तरह की मैपिंग ने एक निश्चित क्लस्टर को एक नया शत्रु सौंपना आसान बना दिया। इससे पैटर्न की इष्टतम संख्या को कम करना भी संभव हो गया और परिणामस्वरूप, पीढ़ी की सटीकता में वृद्धि हुई - लेकिन इस पर बाद में और अधिक जानकारी दी जाएगी।
क्लस्टरिंग एल्गोरिथम
कई क्लस्टरिंग एल्गोरिदम हैं: K-Means, DBSCAN, स्पेक्ट्रल, हाइरार्किकल, इत्यादि। ये सभी अलग-अलग विचारों पर आधारित हैं लेकिन इनका लक्ष्य एक ही है: डेटा में क्लस्टर ढूँढना। नीचे, आप चुने गए एल्गोरिदम के आधार पर एक ही डेटा के लिए क्लस्टर ढूँढने के अलग-अलग तरीके देख सकते हैं।
के-मीन्स एल्गोरिथ्म ने स्पॉन के मामले में सबसे अच्छा प्रदर्शन किया।
अब, उन लोगों के लिए एक छोटा सा विषयांतर जो इस एल्गोरिथ्म के बारे में कुछ नहीं जानते (इसमें कोई सख्त गणितीय तर्क नहीं होगा क्योंकि यह लेख गेम डेवलपमेंट के बारे में है और एमएल की मूल बातों के बारे में नहीं है)। K-Means प्रत्येक फीचर से वर्ग दूरी के योग को उसके निर्दिष्ट क्लस्टर के औसत मूल्य से कम करके डेटा को K क्लस्टर में विभाजित करता है। औसत को वर्ग दूरी के अंतर-क्लस्टर योग द्वारा व्यक्त किया जाता है।
इस विधि के बारे में निम्नलिखित बातें समझना महत्वपूर्ण है:
- यह क्लस्टरों का समान आकार सुनिश्चित नहीं करता है - हमारे लिए, यह कोई समस्या नहीं थी क्योंकि एक मिशन के भीतर क्लस्टरों का वितरण असमान हो सकता है।
- यह डेटा के अंदर क्लस्टर की संख्या निर्धारित नहीं करता है, लेकिन इसके लिए इनपुट के रूप में एक निश्चित K संख्या की आवश्यकता होती है, यानी क्लस्टर की वांछित संख्या। कभी-कभी, यह संख्या पहले से निर्धारित होती है, और कभी-कभी, यह नहीं होती है। इसके अलावा, क्लस्टर की "सर्वोत्तम" संख्या खोजने के लिए कोई आम तौर पर स्वीकृत विधि नहीं है।
आइये दूसरे बिन्दु पर थोड़ा और विस्तार से नजर डालें।
क्लस्टरों की संख्या
कोहनी विधि का उपयोग अक्सर क्लस्टर की इष्टतम संख्या का चयन करने के लिए किया जाता है। विचार बहुत सरल है: हम एल्गोरिथ्म चलाते हैं और 1 से N तक सभी K को आज़माते हैं, जहाँ N कुछ उचित संख्या है। हमारे मामले में, यह 10 था - अधिक क्लस्टर ढूँढना असंभव था। अब, आइए प्रत्येक क्लस्टर के भीतर वर्ग दूरी का योग ज्ञात करें (एक स्कोर जिसे WSS या SS के रूप में जाना जाता है)। हम यह सब एक ग्राफ पर प्रदर्शित करेंगे और एक बिंदु का चयन करेंगे जिसके बाद y-अक्ष पर मान महत्वपूर्ण रूप से बदलना बंद कर देता है।
उदाहरण के लिए, हम एक सुप्रसिद्ध डेटासेट का उपयोग करेंगे।
यदि आप कोहनी नहीं देख पा रहे हैं, तो आप सिल्हूट विधि का उपयोग कर सकते हैं, लेकिन यह लेख के दायरे से बाहर है।
ऊपर और नीचे दी गई सभी गणनाएँ पाइथन में एमएल और डेटा विश्लेषण के लिए मानक पुस्तकालयों का उपयोग करके की गई थीं: पांडा, न्यूमपी, सीबॉर्न और स्केलेर्न। मैं कोड साझा नहीं कर रहा हूँ क्योंकि लेख का मुख्य उद्देश्य तकनीकी विवरणों में जाने के बजाय क्षमताओं को चित्रित करना है।
प्रत्येक क्लस्टर का विश्लेषण
क्लस्टर की इष्टतम संख्या प्राप्त करने के बाद, उनमें से प्रत्येक का विस्तार से अध्ययन किया जाना चाहिए। हमें यह देखने की ज़रूरत है कि इसमें कौन से स्पॉन शामिल हैं और वे क्या मान लेते हैं। आइए आगे की पीढ़ी के उपयोग के लिए प्रत्येक क्लस्टर के लिए अपनी खुद की सेटिंग्स बनाएँ। मापदंडों में शामिल हैं:
- संभावना की गणना करने के लिए दुश्मन का वजन। उदाहरण के लिए, एक सामान्य ज़ोंबी = 5, और एक हेलमेट वाला ज़ोंबी = 1। इसलिए, एक सामान्य ज़ोंबी की संभावना 5/6 है, और एक हेलमेट वाला ज़ोंबी 1/6 है। वजन संचालित करने के लिए अधिक सुविधाजनक हैं।
- मान सीमाएँ, उदाहरण के लिए, ज़ोन या इसकी चौड़ाई के घूर्णन का न्यूनतम और अधिकतम कोण। प्रत्येक पैरामीटर को उसके अपने खंड द्वारा वर्णित किया जाता है, जिसका कोई भी मान समान रूप से संभावित होता है।
- श्रेणीबद्ध मान, उदाहरण के लिए, दीवार टैग या बिंदु दृश्यता, को शत्रु सेटिंग्स के रूप में वर्णित किया जाता है, और यह भार के माध्यम से होता है।
आइए क्लस्टर सेटिंग्स पर विचार करें, जिसे मौखिक रूप से "खिलाड़ी के पास कहीं कम दूरी पर और, सबसे अधिक संभावना है, दृश्य बिंदुओं में सरल दुश्मनों का पैदा होना" के रूप में वर्णित किया जा सकता है।
क्लस्टर 1 तालिका
दुश्मन | प्रकार | आर | आर-डेल्टा | ROTATION | चौड़ाई | दृश्यता |
---|---|---|---|---|---|---|
ज़ॉम्बी_कॉमन_3_5=4, ज़ॉम्बी_भारी=1 | खिलाड़ी | 10-12 | 1-2 | 0-30 | 30-45 | दृश्यमान=9, अदृश्य=1 |
यहां दो उपयोगी तरकीबें दी गई हैं:
- यह दुश्मनों की कोई निश्चित संख्या नहीं है जिसे निर्दिष्ट किया जाता है, बल्कि एक खंड होता है जिसमें से उसकी संख्या का चयन किया जाएगा। यह अलग-अलग समूहों में लेकिन अलग-अलग मात्रा में एक ही दुश्मन के साथ काम करने में मदद करता है।
- यह बाहरी त्रिज्या (R) नहीं है जिसे निर्दिष्ट किया गया है, बल्कि आंतरिक त्रिज्या (r) के सापेक्ष डेल्टा (R-डेल्टा) है, ताकि नियम R > r का सम्मान किया जा सके। इस प्रकार, R-डेल्टा को यादृच्छिक r में जोड़ा जाता है, r+R-डेल्टा > r किसी भी R-डेल्टा > 0 के लिए, जिसका अर्थ है कि सब कुछ ठीक है।
यह कार्य प्रत्येक क्लस्टर के साथ किया गया, तथा इनकी संख्या 10 से भी कम थी, इसलिए इसमें अधिक समय नहीं लगा।
क्लस्टरिंग के बारे में कुछ रोचक बातें
हमने इस विषय पर अभी तक बहुत कम चर्चा की है, लेकिन अध्ययन के लिए अभी भी बहुत सारी रोचक चीजें हैं। यहाँ संदर्भ के लिए कुछ लेख दिए गए हैं; वे डेटा के साथ काम करने, क्लस्टरिंग और परिणामों का विश्लेषण करने की प्रक्रियाओं का अच्छा विवरण प्रदान करते हैं।
पोकमीन - पोकेडेक्स में केमीन क्लस्टिंग लीग ऑफ लीजेंड्स गेम्स का क्लस्टरिंग FIFA20 फील्ड प्लेयर्स क्लस्टरिंग
मिशन का समय
स्पॉन पैटर्न के अतिरिक्त, हमने एक मिशन के भीतर दुश्मनों के कुल स्वास्थ्य की उसके पूरा होने के अपेक्षित समय पर निर्भरता का अध्ययन करने का निर्णय लिया, ताकि जनरेशन के दौरान इस पैरामीटर का उपयोग किया जा सके।
मैन्युअल मिशन बनाने की प्रक्रिया में, कार्य अध्याय के लिए एक समन्वित गति का निर्माण करना था - मिशनों का एक क्रम: छोटा, लंबा, छोटा, फिर से छोटा, और इसी तरह। यदि आप खिलाड़ी की अपेक्षित DPS और उसका समय जानते हैं तो आप किसी मिशन के भीतर दुश्मनों का कुल स्वास्थ्य कैसे प्राप्त कर सकते हैं?
💡 रैखिक प्रतिगमन एक विधि है जिसमें एक चर की दूसरे या कई अन्य चर पर निर्भरता को एक रैखिक निर्भरता फ़ंक्शन के साथ फिर से बनाया जाता है। नीचे दिए गए उदाहरण केवल एक चर से रैखिक प्रतिगमन पर विचार करेंगे: f(x) = wx + b.
आइये निम्नलिखित शब्दों से परिचय करें:
- एचपी मिशन में दुश्मनों का कुल स्वास्थ्य है
- डीपीएस प्रति सेकंड अपेक्षित खिलाड़ी क्षति है
- एक्शन टाइम वह सेकण्ड की संख्या है जो खिलाड़ी मिशन में दुश्मनों को नष्ट करने में खर्च करता है
- खाली समय वह अतिरिक्त समय है जिसके भीतर खिलाड़ी, उदाहरण के लिए, लक्ष्य बदल सकता है
- अपेक्षित मिशन समय कार्रवाई और खाली समय का योग है
तो, HP = DPS * कार्रवाई का समय + खाली समय। मैन्युअल चैप्टर बनाते समय, हमने प्रत्येक मिशन का अपेक्षित समय रिकॉर्ड किया; अब, हमें कार्रवाई का समय ढूँढना होगा।
यदि आप अपेक्षित मिशन समय जानते हैं, तो आप कार्रवाई के समय की गणना कर सकते हैं और इसे अपेक्षित समय से घटा कर खाली समय प्राप्त कर सकते हैं: खाली समय = मिशन समय - कार्रवाई का समय = मिशन समय - HP * DPS। इस संख्या को फिर मिशन में दुश्मनों की औसत संख्या से विभाजित किया जा सकता है, और आपको प्रति दुश्मन खाली समय मिलता है। इसलिए, जो कुछ भी बचता है वह केवल अपेक्षित मिशन समय से प्रति दुश्मन खाली समय तक एक रैखिक प्रतिगमन बनाना है।
इसके अतिरिक्त, हम मिशन समय से कार्रवाई समय के हिस्से का प्रतिगमन भी तैयार करेंगे।
आइए गणनाओं का एक उदाहरण देखें और देखें कि इन प्रतिगमनों का उपयोग क्यों किया जाता है:
- दो संख्याएं दर्ज करें: मिशन समय और DPS 30 और 70
- मिशन समय से कार्रवाई समय के हिस्से का प्रतिगमन देखें और उत्तर प्राप्त करें, 0.8
- कार्रवाई समय की गणना 30*0.8=6 सेकंड के रूप में करें
- HP की गणना 6*70=420 के रूप में करें
- मिशन समय से प्रति शत्रु खाली समय का प्रतिगमन देखें और उत्तर प्राप्त करें, जो 0.25 सेकंड है।
यहाँ एक सवाल है: हमें दुश्मन के लिए खाली समय जानने की आवश्यकता क्यों है? जैसा कि पहले उल्लेख किया गया है, स्पॉन समय के अनुसार व्यवस्थित होते हैं। इसलिए, i-वें स्पॉन के समय की गणना (i-1)वें स्पॉन के एक्शन समय और उसके भीतर खाली समय के योग के रूप में की जा सकती है।
और यहां एक और प्रश्न उठता है: क्रिया समय और खाली समय का हिस्सा स्थिर क्यों नहीं है?
हमारे खेल में, किसी मिशन की कठिनाई उसकी अवधि से संबंधित होती है। यानी, छोटे मिशन आसान होते हैं, और लंबे मिशन ज़्यादा कठिन होते हैं। कठिनाई मापदंडों में से एक प्रति दुश्मन खाली समय है। ऊपर दिए गए ग्राफ़ में कई सीधी रेखाएँ हैं और उनका ढलान गुणांक (w) समान है, लेकिन ऑफ़सेट (b) अलग है। इस प्रकार, कठिनाई को बदलने के लिए, ऑफ़सेट को बदलना ही काफ़ी है: b को बढ़ाने से खेल आसान हो जाता है, घटाने से यह ज़्यादा कठिन हो जाता है, और नकारात्मक संख्याओं की अनुमति होती है। ये विकल्प आपको अध्याय दर अध्याय कठिनाई बदलने में मदद करते हैं।
मेरा मानना है कि सभी डिजाइनरों को रिग्रेशन की समस्या पर गहराई से विचार करना चाहिए, क्योंकि यह अक्सर अन्य परियोजनाओं को विघटित करने में मदद करता है:
रैखिक प्रतिगमन ट्यूटोरियल मशीन लर्निंग प्रोजेक्ट बेसिक - लीनियर रिग्रेशन शुरुआती Scikit-learn रैखिक प्रतिगमन
नये मिशन तैयार करना
तो, हम जनरेटर के लिए नियमों को खोजने में कामयाब रहे, और अब हम उत्पादन प्रक्रिया पर आगे बढ़ सकते हैं।
यदि आप अमूर्त रूप से सोचते हैं, तो किसी भी मिशन को संख्याओं के अनुक्रम के रूप में दर्शाया जा सकता है, जहाँ प्रत्येक संख्या एक विशिष्ट स्पॉन क्लस्टर को दर्शाती है। उदाहरण के लिए, मिशन: 1, 2, 1, 1, 2, 3, 3, 2, 1, 3। इसका मतलब है कि नए मिशन बनाने का कार्य नए संख्यात्मक अनुक्रम बनाने पर निर्भर करता है। जनरेशन के बाद, आपको क्लस्टर सेटिंग्स के अनुसार प्रत्येक संख्या को व्यक्तिगत रूप से "विस्तारित" करना होगा।
मूल दृष्टिकोण
यदि हम अनुक्रम उत्पन्न करने की एक तुच्छ विधि पर विचार करते हैं, तो हम किसी अन्य स्पॉन के बाद किसी विशेष स्पॉन की सांख्यिकीय संभावना की गणना कर सकते हैं। उदाहरण के लिए, हमें निम्नलिखित आरेख मिलता है:
आरेख का शीर्ष वह क्लस्टर है जिसकी ओर यह जाता है, एक शीर्ष है, तथा किनारा भार क्लस्टर के अगले होने की संभावना है।
ऐसे ग्राफ के माध्यम से चलते हुए, हम एक अनुक्रम उत्पन्न कर सकते हैं। हालाँकि, इस दृष्टिकोण में कई नुकसान हैं। इनमें, उदाहरण के लिए, स्मृति की कमी (यह केवल वर्तमान स्थिति को जानता है) और एक स्थिति में "फंसने" की संभावना है यदि इसके अपने आप में बदल जाने की उच्च सांख्यिकीय संभावना है।
✍🏻 यदि हम इस ग्राफ को एक प्रक्रिया के रूप में मानते हैं, तो हमें एक सरल मार्कोव श्रृंखला मिलती है।
आवर्तक तंत्रिका नेटवर्क
आइए हम न्यूरल नेटवर्क की ओर मुड़ें, अर्थात आवर्ती नेटवर्क क्योंकि उनमें मूल दृष्टिकोण के नुकसान नहीं हैं। ये नेटवर्क प्राकृतिक भाषा प्रसंस्करण कार्यों में वर्णों या शब्दों जैसे अनुक्रमों को मॉडलिंग करने में अच्छे हैं। इसे बहुत सरल शब्दों में कहें तो नेटवर्क को पिछले तत्वों के आधार पर अनुक्रम के अगले तत्व की भविष्यवाणी करने के लिए प्रशिक्षित किया जाता है।
ये नेटवर्क कैसे काम करते हैं, इसका विवरण इस लेख के दायरे से बाहर है, क्योंकि यह एक बहुत बड़ा विषय है। इसके बजाय, आइए देखें कि प्रशिक्षण के लिए क्या आवश्यक है:
- L लंबाई के N अनुक्रमों का एक सेट
- N अनुक्रमों में से प्रत्येक का उत्तर है
एक-गर्म वेक्टर, अर्थात C लंबाई का एक वेक्टर जिसमें C-1 शून्य और एक 1 शामिल है, जो उत्तर को इंगित करता है। - C उत्तरों के समूह की घात है।
N=2, L=3, C=5 के साथ एक सरल उदाहरण। आइए अनुक्रम 1, 2, 3, 4, 1 लें और इसके अंदर L+1 लंबाई के उप-अनुक्रमों की तलाश करें: [1, 2, 3, 4], [2, 3, 4, 1]। आइए अनुक्रम को L वर्णों के इनपुट और एक उत्तर (लक्ष्य) - (L+1)वें वर्ण* में विभाजित करें। उदाहरण के लिए, [1, 2, 3, 4] → [1, 2, 3] और [4]। हम उत्तरों को वन-हॉट वेक्टर, [4] → [0, 0, 0, 0, 1] में एनकोड करते हैं।
इसके बाद, आप टेंसरफ्लो या पाइटॉर्च का उपयोग करके पायथन में एक सरल न्यूरल नेटवर्क का स्केच बना सकते हैं। आप नीचे दिए गए लिंक का उपयोग करके देख सकते हैं कि यह कैसे किया जाता है। बस इतना ही बाकी है कि ऊपर वर्णित डेटा पर प्रशिक्षण प्रक्रिया शुरू करें, प्रतीक्षा करें, और... फिर आप उत्पादन में जा सकते हैं!
मशीन लर्निंग मॉडल में कुछ मेट्रिक्स होते हैं, जैसे सटीकता। सटीकता सही तरीके से दिए गए उत्तरों का अनुपात दिखाती है। हालाँकि, इसे सावधानी से देखा जाना चाहिए क्योंकि डेटा में वर्ग असंतुलन हो सकता है। यदि कोई नहीं है (या लगभग कोई नहीं है), तो हम कह सकते हैं कि मॉडल अच्छी तरह से काम करता है यदि यह यादृच्छिक रूप से उत्तरों की तुलना में बेहतर भविष्यवाणी करता है, यानी सटीकता > 1/C; यदि 1 के करीब है, तो यह बहुत अच्छा काम करता है।
हमारे मामले में, मॉडल ने अच्छी सटीकता दिखाई। इन परिणामों का एक कारण क्लस्टरों की छोटी संख्या है जो दुश्मनों को उनके प्रकार और उनके संतुलन के अनुसार मैप करने के कारण प्राप्त हुई थी।
रुचि रखने वालों के लिए RNN पर अधिक सामग्री यहां उपलब्ध है:
LSTM का उपयोग करके टेक्स्ट जेनरेशन के लिए शुरुआती गाइड केरास का उपयोग करके विषाक्तता से निपटना गेमबॉय एडवांस्ड गेम्स की खोज
पीढ़ी प्रक्रिया
जनरेटर सेटअप
प्रशिक्षित मॉडल आसानी से
मॉडल के साथ इंटरैक्ट करने के लिए, यूनिटी में एक कस्टम विंडो बनाई जाती है जहां गेम डिजाइनर सभी आवश्यक मिशन पैरामीटर सेट कर सकते हैं:
- नाम
- अवधि
- उपलब्ध शत्रु, जैसे-जैसे शत्रु धीरे-धीरे प्रकट होते हैं
- मिशन में तरंगों की संख्या और उनमें स्वास्थ्य का वितरण
- शत्रु-विशिष्ट भार संशोधक, जो कुछ शत्रुओं को अधिक बार चुनने में मदद करते हैं, उदाहरण के लिए, नए शत्रु
- और इसी तरह
सेटिंग्स में जाने के बाद, बस एक बटन दबाना है और एक फ़ाइल प्राप्त करनी है जिसे यदि आवश्यक हो तो संपादित किया जा सकता है। हाँ, मैं पहले से ही मिशन बनाना चाहता था, न कि खेल के दौरान, ताकि उन्हें बदला जा सके।
पीढ़ी के चरण
आइये पीढ़ी प्रक्रिया पर नजर डालें:
- मॉडल इनपुट के रूप में एक अनुक्रम प्राप्त करता है और एक उत्तर तैयार करता है - संभावनाओं का एक वेक्टर कि i-th क्लस्टर अगला होगा। एल्गोरिथ्म पासा घुमाता है, यदि संख्या त्रुटि संभावना से अधिक है, तो हम सबसे संभावित एक लेते हैं, अन्यथा यादृच्छिक। यह तरकीब थोड़ी रचनात्मकता और विविधता जोड़ती है।
- यह प्रक्रिया एक निश्चित संख्या में पुनरावृत्तियों तक जारी रहती है। यह मैन्युअल रूप से बनाए गए किसी भी मिशन में स्पॉन की संख्या से अधिक है।
- यह क्रम चलता रहता है; अर्थात्, प्रत्येक संख्या क्लस्टर के सहेजे गए डेटा तक पहुंचती है और उनसे यादृच्छिक मान प्राप्त करती है।
- डेटा के अंदर स्वास्थ्य का सारांश निकाला जाता है, तथा अपेक्षित स्वास्थ्य से अधिक होने वाली हर चीज को अनुक्रम से बाहर निकाल दिया जाता है (इसकी गणना ऊपर चर्चा की गई थी)
- स्पॉन्स को निर्दिष्ट स्वास्थ्य वितरण के आधार पर तरंगों में विभाजित किया जाता है और फिर समूहों में विभाजित किया जाता है (ताकि कई दुश्मन एक साथ दिखाई दें), और उनके प्रकट होने का समय स्पॉन्स के पिछले समूह की कार्रवाई और खाली समय के योग के रूप में दिया जाता है।
- मिशन तैयार है!
निष्कर्ष
तो, यह एक अच्छा उपकरण है जिसने हमें मिशनों के निर्माण को कई गुना तेज़ करने में मदद की। इसके अतिरिक्त, इसने कुछ डिजाइनरों को "लेखक के अवरोध" के डर को दूर करने में मदद की, क्योंकि अब आप कुछ सेकंड में तैयार समाधान प्राप्त कर सकते हैं।
लेख में, मिशन जनरेशन के उदाहरण का उपयोग करते हुए, मैंने यह प्रदर्शित करने का प्रयास किया कि कैसे क्लासिकल मशीन लर्निंग विधियाँ और न्यूरल नेटवर्क गेम डेवलपमेंट में मदद कर सकते हैं। इन दिनों जनरेटिव AI की ओर बहुत ज़्यादा रुझान है - लेकिन मशीन लर्निंग की अन्य शाखाओं के बारे में मत भूलिए, क्योंकि वे भी बहुत कुछ करने में सक्षम हैं।
इस लेख को पढ़ने के लिए समय निकालने के लिए धन्यवाद! मुझे उम्मीद है कि आपको जेनरेट किए गए स्थानों में मिशनों के दृष्टिकोण और मिशनों की पीढ़ी दोनों का विचार मिल गया होगा। नई चीजें सीखने से न डरें, खुद को विकसित करें और अच्छे गेम बनाएं!
चित्रण: shabbyrtist