paint-brush
BlobGAN: GANs के लिए एक बड़ा कदमद्वारा@whatsai
1,420 रीडिंग
1,420 रीडिंग

BlobGAN: GANs के लिए एक बड़ा कदम

द्वारा Louis Bouchard5m2022/05/14
Read on Terminal Reader
Read this story w/o Javascript

बहुत लंबा; पढ़ने के लिए

BlobGAN छवियों के अवास्तविक हेरफेर की अनुमति देता है, जिससे सरल ब्लॉब्स को आसानी से नियंत्रित किया जा सकता है। ये सभी छोटी बूँदें एक वस्तु का प्रतिनिधित्व करती हैं, और आप उन्हें इधर-उधर घुमा सकते हैं या उन्हें बड़ा, छोटा बना सकते हैं, या यहाँ तक कि उन्हें हटा भी सकते हैं, और इसका छवि में प्रतिनिधित्व की गई वस्तु पर समान प्रभाव पड़ेगा। आप दो सीलिंग पंखे वाले कमरे की तरह डेटासेट में अनदेखी छवियों को बनाकर, ब्लॉब्स को डुप्लिकेट करके उपन्यास छवियां भी बना सकते हैं। वीडियो में और जानें! यहां देखें वीडियो!

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - BlobGAN: GANs के लिए एक बड़ा कदम
Louis Bouchard HackerNoon profile picture

BlobGAN छवियों के अवास्तविक हेरफेर की अनुमति देता है, जिससे सरल ब्लॉब्स को आसानी से नियंत्रित किया जा सकता है। ये सभी छोटी बूँदें एक वस्तु का प्रतिनिधित्व करती हैं, और आप उन्हें इधर-उधर घुमा सकते हैं या उन्हें बड़ा, छोटा बना सकते हैं, या यहाँ तक कि उन्हें हटा भी सकते हैं, और इसका छवि में प्रतिनिधित्व की गई वस्तु पर समान प्रभाव पड़ेगा। यह बहुत अच्छा है!

जैसा कि लेखकों ने अपने परिणामों में साझा किया है, आप बूँदों की नकल करके, डेटासेट अनदेखी छवियां बनाकर भी उपन्यास छवियां बना सकते हैं! अगर मैं गलत हूं तो मुझे सुधारें, लेकिन मेरा मानना है कि यह छवियों के संशोधन को सरल बनाने के लिए पेपर में से एक है, जो कि चारों ओर घूमने और संपादन के लिए अनुमति देता है जो प्रशिक्षण डेटासेट में अनदेखी थी।

और आप वास्तव में कुछ कंपनियों की तुलना में इसके साथ खेल सकते हैं जिन्हें हम सभी जानते हैं! उन्होंने अपना कोड सार्वजनिक रूप से साझा किया और एक Colab डेमो जिसे आप तुरंत आज़मा सकते हैं। इससे भी अधिक रोमांचक यह है कि BlobGAN कैसे काम करता है। वीडियो में और जानें!

वीडियो देखना

संदर्भ

►पूरा लेख पढ़ें: https://www.louisbouchard.ai/blobgan/
एपस्टीन, डी।, पार्क, टी।, झांग, आर।, शेचमैन, ई। और एफ्रोस, एए, 2022।
BlobGAN: स्थानिक रूप से विच्छेदित दृश्य प्रतिनिधित्व। arXiv प्रीप्रिंट
arXiv:2205.02837.
प्रोजेक्ट लिंक: https://dave.ml/blobgan/
कोड: https://github.com/dave-epstein/blobgan
►Colab डेमो: https://colab.research.google.com/drive/1clvh28Yds5CvKsYYENGLS3iIIrlZK4xO?usp=sharing#scrollTo=0QuVIyVplOKu
►माई न्यूज़लेटर (आपके ईमेल को साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!): https://www.louisbouchard.ai/newsletter/

वीडियो प्रतिलेख

0:00

अगर आपको लगता है कि बंदूकों के साथ प्रगति

0:02

खत्म हो गया था आप अधिक गलत नहीं हो सकते

0:04

यहाँ ब्लॉब गन है और यह नया पेपर है

0:07

बस अविश्वसनीय बूँद बंदूक के लिए अनुमति देता है

0:09

छवियों के अवास्तविक हेरफेर ने सुपर बनाया

0:12

सरल ब्लॉब्स को आसानी से नियंत्रित करना

0:14

ये छोटी बूँदें एक वस्तु का प्रतिनिधित्व करती हैं

0:17

और आप उन्हें इधर-उधर घुमाकर बना सकते हैं

0:19

बड़ा छोटा या उन्हें हटा भी दें

0:22

पर समान प्रभाव पड़ेगा

0:24

वस्तु यह छवि में प्रतिनिधित्व करता है यह

0:26

बहुत अच्छा है जैसा कि लेखकों ने साझा किया है

0:29

उनके परिणाम आप उपन्यास भी बना सकते हैं

0:31

ब्लब्स बनाने की नकल करके छवियां

0:34

इस तरह डेटा सेट में अनदेखी छवियां

0:37

दो छत वाले पंखे वाला कमरा मुझे सही करे अगर

0:40

मैं गलत हूँ लेकिन मेरा मानना है कि यह if . में से एक है

0:42

बनाने वाला पहला पेपर नहीं

0:44

छवियों के रूप में सरल के रूप में संशोधन

0:46

चारों ओर घूमना और अनुमति देना

0:49

संपादन जो प्रशिक्षण में नहीं देखे गए थे

0:51

डेटासेट और आप वास्तव में साथ खेल सकते हैं

0:53

यह अन्य कंपनियों की तुलना में हम

0:55

सभी जानते हैं कि उन्होंने साझा किया सार्वजनिक रूप से कहा जाता है

0:58

और एक कोलाब डेमो जिसे आप तुरंत आज़मा सकते हैं

1:00

इससे भी अधिक रोमांचक यह है कि ब्लॉगर कैसे काम करता है

1:03

जिसे हम कुछ ही सेकंड में समझेंगे

1:05

एक उत्कृष्ट पेपर प्रकाशित करने के लिए जैसे

1:07

ब्लॉबगन शोधकर्ताओं को चलाने की जरूरत है

1:09

कई मशीनों पर कई प्रयोग

1:12

बंदूकों से खेलने वाले जानते हैं कब तक

1:14

और दर्दनाक यह प्रक्रिया प्लस हो सकती है

1:16

उनका कोड जीथब पर उपलब्ध है और

1:18

google कोलाब इसका मतलब है कि उनका कोड है

1:21

मज़ेदार रूप से प्रतिलिपि प्रस्तुत करने योग्य होने के लिए यह

1:24

इसका एक बहुत मजबूत बिंदु भी है

1:26

एपिसोड के प्रायोजक वजन और पूर्वाग्रह

1:28

भार और पूर्वाग्रह मेरे जीवन को बदल देते हैं जैसे a

1:30

शोधकर्ता यह आपकी जरूरत की हर चीज को ट्रैक करता है

1:32

आपके कोड को प्रतिलिपि प्रस्तुत करने योग्य होने के लिए

1:34

हाइपर पैरामीटर जीथब प्रतिबद्ध

1:36

हार्डवेयर उपयोग मेट्रिक्स और पायथन

1:38

संस्करण आपको बिना सिरदर्द के छोड़ रहा है ठीक है

1:41

कुछ अभी भी के कारण प्रकट हो सकते हैं

1:43

समय सीमा या बग लेकिन कोशिश करने से कोई नहीं

1:45

प्रयोगों के वजन को पुन: पेश करने के लिए और

1:47

पक्षपात भी अति सहायक होता है जब

1:49

के साथ अपने प्रयोग के परिणाम साझा करना

1:51

आपके सहकर्मी इसके लिए एक महान उपकरण हैं

1:53

रिपोर्ट के लिए वे डैशबोर्ड के रूप में कार्य कर सकते हैं

1:56

पर्यवेक्षक पीआईएस या प्रबंधकों की जाँच करने के लिए कैसे

1:59

प्रयोग अधिक अर्थपूर्ण हो रहा है

2:01

अपने में सुधार करते हुए शोध के लिए समय

2:03

प्रतिक्रिया की गुणवत्ता कृपया पसंद न करें

2:06

अधिकांश शोधकर्ता जो अपना कोड रखते हैं a

2:08

गुप्त और वज़न और पूर्वाग्रहों का उपयोग करने का प्रयास करें

2:10

नीचे दिए गए पहले लिंक के साथ

2:13

अब चलिए अपने पेपर ब्लब गन पर वापस आते हैं

2:16

स्थानिक रूप से विच्छेदित दृश्य

2:18

प्रतिनिधित्व शीर्षक इसे इटैलिक कहता है

2:21

ब्लोविकियन ब्लॉब्स का उपयोग नापसंद करने के लिए करता है

2:23

एक दृश्य में वस्तुओं का अर्थ है कि

2:25

मॉडल प्रत्येक बूँद को संबद्ध करना सीखता है

2:28

दृश्य में एक विशिष्ट वस्तु जैसे a

2:30

एक बार प्रशिक्षित होने के बाद बिस्तर की खिड़की या छत का पंखा

2:33

आप बूँदें और वस्तुओं को स्थानांतरित कर सकते हैं

2:35

चारों ओर व्यक्तिगत रूप से उन्हें बड़ा बनाते हैं या

2:37

छोटे उन्हें डुप्लिकेट करें या हटा भी दें

2:40

उन्हें निश्चित रूप से तस्वीर से

2:42

परिणाम पूरी तरह से यथार्थवादी नहीं हैं लेकिन

2:44

जैसा कि एक महान व्यक्ति कहेगा बस कल्पना करो

2:47

इस दृष्टिकोण की संभावना दो और

2:49

कागज नीचे लाइन

2:51

इससे भी अच्छी बात यह है कि यह प्रशिक्षण

2:53

एक पर्यवेक्षित योजना में होता है यह

2:55

इसका मतलब है कि आपको हर एक की जरूरत नहीं है

2:57

छवि उदाहरण इसे प्रशिक्षित करने के लिए जैसा कि आप करेंगे

3:00

पर्यवेक्षित सीखने में एक त्वरित उदाहरण

3:02

क्या पर्यवेक्षित प्रशिक्षण की आवश्यकता होगी

3:05

आप सभी वांछित प्राप्त करने के लिए

3:06

आपकी छवि में हेरफेर जो सेट हैं

3:08

उन्हें सीखने के लिए बूँद सिखाने के लिए

3:10

परिवर्तन जबकि अनुपयोगी में

3:13

सीखने के लिए आपको इस व्यापक की आवश्यकता नहीं है

3:15

डेटा और मॉडल हासिल करना सीखेंगे

3:17

यह कार्य अपने आप में झांसा देकर

3:20

वस्तुओं के लिए अपने आप पर स्पष्ट के बिना

3:22

लेबल हम मॉडल को प्रशिक्षित करते हैं a

3:24

बंदूक में जनरेटर और भेदभाव करने वाला

3:27

फैशन मैं बस एक जल्दी करूँगा

3:28

सिंहावलोकन के रूप में मैंने बंदूकें कवर की हैं

3:30

बंदूकों में हमेशा की तरह पहले के कई वीडियो

3:33

भेदभाव करने वाले की जिम्मेदारी है

3:35

यथार्थवादी बनाने के लिए जनरेटर को प्रशिक्षित करें

3:38

छवियों का सबसे महत्वपूर्ण हिस्सा

3:40

वास्तुकला हमारे साथ जनरेटर है

3:42

बूँदें और एक स्टाइल गन 2 जैसे डिकोडर i

3:45

कवर्ड स्टाइल गन आधारित जेनरेटर

3:48

अन्य वीडियो में यदि आप के बारे में उत्सुक हैं

3:50

यह कैसे काम करता है लेकिन संक्षेप में हम पहले

3:52

हमारे बूँदें बनाएँ यह लेने के द्वारा किया जाता है

3:55

अधिकांश जनरेटर के रूप में यादृच्छिक शोर

3:57

नेटवर्क और इसका उपयोग करके ब्लॉब्स में मैप करना

4:00

यह पहला तंत्रिका नेटवर्क होगा

4:02

प्रशिक्षण के दौरान सीखा तो आपको चाहिए

4:05

असंभव को पूरा करो इस बूँद को ले लो

4:07

प्रतिनिधित्व और एक वास्तविक छवि बनाएँ

4:10

इसमें से यह वह जगह है जहाँ गण जादू

4:12

ऐसा होता है क्योंकि आप अभी भी सुन रहे हैं

4:14

कृपया सदस्यता लेने पर विचार करें

4:16

चैनल और वीडियो को पसंद करने का मतलब है a

4:18

बहुत कुछ और मुफ्त में भी मेरे काम का समर्थन करता है

4:21

हमारे पास एक समुदाय है जिसे लर्न एआई कहा जाता है

4:23

विनिमय सीखने के लिए कलह पर एक साथ

4:26

साथी एआई उत्साही के साथ मैं आश्वस्त हूँ

4:28

आप इसे वहां पसंद करेंगे और मुझे खुशी होगी

4:30

तुमसे मिलने के लिए

4:32

हमें आर्किटेक्चर जैसी स्टार गन चाहिए

4:34

इन बूँदों से हमारी छवियां बनाएं

4:37

बेशक हमने लेने के लिए वास्तुकला को जोड़ा

4:39

बूँदें हमने अभी-अभी इनपुट के रूप में बनाई हैं

4:41

सामान्य यादृच्छिक शोर के बजाय

4:43

फिर हम का उपयोग करके अपने मॉडल को चालू करते हैं

4:45

उत्पन्न करने के लिए सीखने के लिए भेदभाव करने वाला

4:47

यथार्थवादी चित्र एक बार हमारे पास अच्छा है

4:50

पर्याप्त परिणाम इसका मतलब है कि हमारा मॉडल कर सकता है

4:52

के बजाय बूँद प्रतिनिधित्व पर ले लो

4:54

शोर और छवियां उत्पन्न करते हैं लेकिन हम अभी भी

4:57

एक समस्या है हम कैसे अलग कर सकते हैं

4:59

वे बूँदें और उन्हें वस्तुओं से मेल खाते हैं

5:02

अच्छा यह हमारी सुंदरता है

5:04

अनुपयोगी दृष्टिकोण मॉडल होगा

5:06

पुनरावृत्त रूप से सुधार करें और यथार्थवादी बनाएं

5:08

परिणाम यह भी सीखते हैं कि कैसे

5:11

इन छवियों को a . के रूप में निरूपित करें

5:13

ब्लॉब्स की निश्चित संख्या आप यहां देख सकते हैं

5:15

कैसे ब्लब्स का उपयोग अक्सर प्रतिनिधित्व करने के लिए किया जाता है

5:17

समान वस्तुएं या बहुत समान वस्तुएं

5:20

यहाँ के दृश्य में आप यह भी देख सकते हैं कि कैसे

5:22

एक ही दस्ताने का प्रतिनिधित्व करने के लिए उपयोग किया जाता है

5:24

या तो एक खिड़की या एक पेंटिंग जो

5:26

बहुत मायने रखता है वैसे ही आप कर सकते हैं

5:29

देखें कि प्रकाश लगभग हमेशा होता है

5:31

फोर्ट ब्लब में इसी तरह दर्शाया गया है

5:33

आप देख सकते हैं कि ब्लब्स अक्सर कैसे होते हैं

5:35

में समान क्षेत्रों का प्रतिनिधित्व करते हैं

5:37

दृश्य सबसे निश्चित रूप से आपको ले जाता है

5:39

डेटासेट में छवियों की समानता

5:42

इस प्रयोग के लिए उपयोग किया जाता है और इसे देखा जाता है

5:45

यह है कि कैसे ब्लॉबगन हेरफेर करना सीखता है

5:47

एक बहुत ही सहज बूँद का उपयोग करते हुए दृश्य

5:50

प्रतिनिधित्व मैं देखने के लिए उत्साहित हूँ

5:52

परिणामों का यथार्थवाद a . रखने में सुधार करता है

5:54

ऐसी तकनीक का उपयोग करके समान दृष्टिकोण

5:57

हम सरल इंटरैक्टिव ऐप्स डिज़ाइन कर सकते हैं

5:59

डिजाइनरों और किसी को भी अनुमति देने के लिए

6:01

छवियों में आसानी से हेरफेर करें जो काफी है

6:04

निश्चित रूप से रोमांचक यह सिर्फ एक था

6:06

इस नए पेपर का अवलोकन और मैं

6:08

उनके पेपर को पढ़ने की जोरदार सलाह देते हैं

6:10

एक बेहतर समझ और बहुत कुछ के लिए

6:12

उनके दृष्टिकोण पर अधिक विवरण

6:13

कार्यान्वयन और परीक्षण उन्होंने i . के रूप में किए

6:16

वीडियो में पहले कहा था कि वे भी

6:18

सार्वजनिक रूप से अपना कोड और एक रंग साझा किया

6:20

डेमो आप तुरंत सभी कोशिश कर सकते हैं

6:22

लिंक नीचे विवरण में हैं

6:24

अंत तक देखने के लिए धन्यवाद और

6:27

मैं आपको अगले सप्ताह दूसरे के साथ देखूंगा

6:28

अद्भुत कागज

[संगीत]