paint-brush
पीएसजी एआई के लिए एक नया कार्य है जिसके लिए उच्च स्तर की समझ की आवश्यकता होती हैद्वारा@whatsai
1,091 रीडिंग
1,091 रीडिंग

पीएसजी एआई के लिए एक नया कार्य है जिसके लिए उच्च स्तर की समझ की आवश्यकता होती है

द्वारा Louis Bouchard6m2022/09/03
Read on Terminal Reader
Read this story w/o Javascript

बहुत लंबा; पढ़ने के लिए

पैनोप्टिक दृश्य ग्राफ़ जनरेशन, या पीएसजी, एक नया समस्या कार्य है जिसका लक्ष्य बाउंडिंग बॉक्स के बजाय पैनोप्टिक विभाजन के आधार पर एक छवि या दृश्य का अधिक व्यापक ग्राफ़ प्रतिनिधित्व उत्पन्न करना है। इसका उपयोग छवियों को समझने और जो हो रहा है उसका वर्णन करने वाले वाक्यों को उत्पन्न करने के लिए किया जा सकता है। एआई के लिए यह सबसे चुनौतीपूर्ण कार्य हो सकता है! वीडियो में और जानें...

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - पीएसजी एआई के लिए एक नया कार्य है जिसके लिए उच्च स्तर की समझ की आवश्यकता होती है
Louis Bouchard HackerNoon profile picture

पैनोप्टिक दृश्य ग्राफ पीढ़ी, या पीएसजी, एक नया समस्या कार्य है जिसका लक्ष्य बाउंडिंग बॉक्स के बजाय पैनोप्टिक विभाजन के आधार पर एक छवि या दृश्य का अधिक व्यापक ग्राफ प्रतिनिधित्व उत्पन्न करना है। इसका उपयोग छवियों को समझने और जो हो रहा है उसका वर्णन करने वाले वाक्यों को उत्पन्न करने के लिए किया जा सकता है। एआई के लिए यह सबसे चुनौतीपूर्ण कार्य हो सकता है! वीडियो में और जानें...

संदर्भ

►पूरा लेख पढ़ें: https://www.louisbouchard.ai/psg/
यांग, जे।, एंग, वाईजेड, गुओ, जेड।, झोउ, के।, झांग, डब्ल्यू। और लियू, जेड।, 2022।
पैनोप्टिक सीन ग्राफ जनरेशन। arXiv प्रीप्रिंट arXiv:2207.11247.
कोड: https://github.com/Jingkang50/OpenPSG
प्रोजेक्ट पेज (PSG डेटासेट): https://psgdataset.org/
इसे आज़माएं: https://replicate.com/cjwbw/openpsg , https://huggingface.co/spaces/ECCV2022/PSG
►माई न्यूज़लेटर (आपके ईमेल को साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!): https://www.louisbouchard.ai/newsletter/

वीडियो प्रतिलेख

0:00

आप ai का उपयोग यह पहचानने के लिए कर सकते हैं कि an . में क्या है

0:02

छवि यह पता लगाने की तरह है कि क्या कोई है

0:04

इस दृश्य में बिल्ली है या नहीं, अगर कोई है

0:07

आप किसी अन्य एआई का उपयोग यह पता लगाने के लिए कर सकते हैं कि यह कहाँ है

0:10

छवि में है और आप इसे बहुत ढूंढ सकते हैं

0:12

ठीक इन कार्यों को छवि कहा जाता है

0:15

वर्गीकरण वस्तु का पता लगाने और

0:17

अंत में उदाहरण विभाजन तो आप

0:20

निकालने के लिए कूल एप्लिकेशन बना सकते हैं

0:23

एक छवि से अपनी बिल्ली और इसे एक में डाल दिया

0:25

मजेदार उपहार कार्ड या एक मेम लेकिन क्या होगा यदि आप

0:27

एक ऐसा एप्लिकेशन चाहते हैं जो को समझता हो

0:29

दृश्य और छवि न केवल करने में सक्षम है

0:32

पहचानें कि क्या कोई वस्तु है और

0:34

यह कहाँ है लेकिन आपको क्या हो रहा है

0:36

पहचान नहीं करना चाहता अगर वहाँ एक है

0:38

ग्राहक या आपकी दुकान में नहीं लेकिन आप

0:40

ग्राहक की पहचान करना चाह सकते हैं

0:42

प्रश्न में आपको चुरा रहा है कि क्या

0:44

ऐसी निगरानी का उपयोग करना नैतिक रूप से है

0:46

सही है या नहीं यह एक और सवाल है

0:49

आपको अभी भी विचार करने की आवश्यकता है मान लीजिए

0:51

हम यह पता लगाने पर ध्यान केंद्रित करते हैं कि क्या हो रहा है

0:53

एक दृश्य या उसमें एक विशेष छवि में

0:56

यदि आप एक कार्य का उपयोग करना चाहते हैं जिसे कहा जाता है

0:58

दृश्य ग्राफ पीढ़ी जहां वस्तुएं हैं

1:01

दिखाए गए अनुसार बाउंडिंग बॉक्स का उपयोग करके निर्देशित किया गया

1:04

पहले वस्तु का पता लगाने के साथ जो

1:06

तब प्रत्येक के साथ एक ग्राफ बनाने के लिए उपयोग किया जाता है

1:09

एक दूसरे से वस्तु का संबंध

1:11

वस्तु यह मूल रूप से करने की कोशिश करेगा

1:13

समझें कि सब से क्या हो रहा है

1:15

दृश्य की प्रमुख वस्तुएं यह काम करती हैं

1:17

काफी अच्छी तरह से और इन मुख्य का पता लगाता है

1:19

छवि की विशेषताएं लेकिन वहाँ है

1:21

एक बड़ी समस्या यह संबंध पर निर्भर करती है

1:23

बॉक्स सटीकता और पूरी तरह से अवहेलना

1:26

पृष्ठभूमि जो अक्सर महत्वपूर्ण होती है

1:28

समझ क्या हो रहा है या पर

1:30

कम से कम अधिक यथार्थवादी सारांश देना

1:33

इसके बजाय आप इस नए का उपयोग करना चाह सकते हैं

1:35

पैनोप्टिक दृश्य ग्राफ नामक कार्य

1:38

पीढ़ी या psg psg एक नई समस्या है

1:42

अधिक उत्पन्न करने का लक्ष्य कार्य

1:43

एक का व्यापक ग्राफ प्रतिनिधित्व

1:46

पैनोप्टिक पर आधारित छवि या दृश्य

1:49

बंधन बक्से के बजाय विभाजन

1:52

कुछ और अधिक सटीक में लेना

1:54

एक छवि के सभी पिक्सेल खाते जैसा हमने देखा

1:57

और इस कार्य के निर्माता नहीं थे

1:58

केवल इसका आविष्कार किया लेकिन उन्होंने एक भी बनाया

2:01

डेटा सेट के साथ-साथ बेसलाइन मॉडल भी

2:03

अपने परिणामों का परीक्षण करें जिसके विरुद्ध है

2:05

वास्तव में अच्छा है इस कार्य में बहुत कुछ है

2:07

क्या है को समझने की क्षमता

2:09

एक छवि में हो रहा अविश्वसनीय है

2:11

मशीनों के लिए भी उपयोगी और जटिल

2:14

हालांकि मनुष्य इसे स्वचालित रूप से करते हैं

2:16

किसी प्रकार की आवश्यक बुद्धि लाता है

2:18

अंतर करने वाली मशीनों के लिए

2:20

जैसे कूल फनी ऐप होने के बीच

2:23

उस उत्पाद के लिए स्नैपचैट जिसे आप सहेजने के लिए उपयोग करेंगे

2:25

समय या किसी आवश्यकता को पूरा करें जैसे

2:27

समझना जब आपकी बिल्ली चाहती है

2:29

खेलते हैं और इसके साथ खेलने के लिए रोबोट का उपयोग करते हैं

2:31

स्वचालित रूप से तो यह सब ऊब नहीं है

2:33

समय

2:34

एक दृश्य को समझना वाकई अच्छा है लेकिन

2:36

एक मशीन वह अच्छी तरह से कैसे कर सकती है जिसकी आपको आवश्यकता है

2:39

दो चीजें एक डेटा सेट और एक शक्तिशाली

2:42

मॉडल हम जानते हैं कि हमारे पास पहले से ही है

2:44

डेटा सेट क्योंकि उन्होंने इसे अभी हमारे लिए बनाया है

2:47

दूसरी बात इससे कैसे सीखे

2:50

डेटा सेट जिसका अर्थ है कि इसे कैसे बनाया जाए

2:52

एआई मॉडल और इसे वहां क्या करना चाहिए

2:55

इस समस्या से निपटने के कई तरीके

2:58

और मैं आपको उनका पेपर पढ़ने के लिए आमंत्रित करता हूं

3:00

अधिक जानकारी प्राप्त करें लेकिन यहाँ एक तरीका है

3:02

यह

3:03

इसमें जाने से पहले मुझे कुछ दे दो

3:05

मेरा खुद का प्रायोजक बनने और बात करने के लिए सेकंड

3:07

हमारे समुदाय के बारे में जब से आप हैं

3:09

इस वीडियो को देखकर मुझे पता है कि आप प्यार करेंगे

3:11

यह मूल रूप से आपके लिए बनाया गया था

3:13

बेशक हमारे पास youtube समुदाय है

3:15

जिससे आपको जरूर जुड़ना चाहिए

3:17

थोड़ा सब्सक्राइब बटन पर क्लिक करें और

3:19

उदाहरण के लिए नीचे टिप्पणी करना मुझे अच्छा लगेगा

3:21

यह जानने के लिए कि आप इस कार्य के बारे में क्या सोचते हैं

3:23

और अगर यह दिलचस्प है या नहीं ai

3:25

समुदाय मैं भी हमारे साझा करना चाहता था

3:28

कलह समुदाय एआई एक साथ सीखता है यह

3:31

साथी ai . के साथ जुड़ने के लिए एक जगह

3:33

किसी भी कौशल स्तर के उत्साही खोजें

3:35

लोगों के साथ सीखने के लिए लोगों को काम करने के लिए खोजें

3:37

अपने प्रश्न पूछें या यहां तक कि ढूंढें

3:40

दिलचस्प नौकरी के प्रस्ताव हम आयोजित कर रहे हैं

3:42

बहुत अच्छी घटनाएँ और q जैसा पसंद है

3:44

जिसके साथ हम वर्तमान में चल रहे हैं

3:46

डीपमाइंड से माइन आरएल आयोजकों और

3:49

openai लिंक विवरण में है

3:51

नीचे और मुझे आपको एक में शामिल होते हुए देखना अच्छा लगेगा

3:53

हमारे साथ विनिमय करें

3:55

जैसा कि हमने कहा कि मॉडल को खोजने की जरूरत है

3:57

छवि के प्रत्येक पिक्सेल के लिए वर्ग

3:59

जिसका अर्थ है कि इसे प्रत्येक की पहचान करनी है

4:01

छवि का पिक्सेल का पहला चरण

4:04

इसके लिए मॉडल जिम्मेदार होगा

4:06

यह पैनोप्टिक fpn . नामक एक मॉडल होगा

4:09

प्रत्येक पिक्सेल को वर्गीकृत करने के लिए पहले से ही प्रशिक्षित

4:12

ऐसा मॉडल पहले से ही ऑनलाइन उपलब्ध है

4:14

और काफी शक्तिशाली यह एक छवि लेगा

4:17

और जिसे हम प्रत्येक के साथ एक मुखौटा कहते हैं उसे वापस कर दें

4:19

पिक्सेल किसी मौजूदा वस्तु से मेल खाता है जैसे

4:22

एक गेंद मानव या घास इस मामले में आप

4:25

अब विभाजन है और आप जानते हैं

4:28

छवि में क्या है और यदि आप हैं तो क्या है

4:30

इस तरह का मॉडल कैसे काम करता है, इससे परिचित नहीं हैं

4:32

मैं आपको एक वीडियो देखने के लिए आमंत्रित करता हूं

4:34

मैंने इसी तरह के दृष्टिकोणों को कवर किया है जैसे

4:36

यह पता लगाने के लिए अगला कदम है

4:38

उन वस्तुओं के साथ क्या हो रहा है

4:41

यहाँ आप पहले से ही जानते हैं कि यह एक आदमी खेल रहा है

4:43

मैदान पर फुटबॉल लेकिन मशीन

4:45

वास्तव में केवल एक चीज का पता नहीं है

4:48

जानता है कि एक आदमी एक गेंद है और

4:50

बहुत आत्मविश्वास वाला क्षेत्र लेकिन यह

4:53

कुछ समझ में नहीं आता और नहीं कर सकता

4:55

डॉट्स कनेक्ट करें जैसा कि हम आसानी से करते हैं हम

4:58

सिर्फ लेने के लिए प्रशिक्षित एक दूसरे मॉडल की जरूरत है

5:00

उन वस्तुओं और पता लगाएं कि वे क्यों

5:03

एक ही तस्वीर में हैं यह

5:05

दृश्य ग्राफ़ जनरेशन चरण जहाँ a

5:07

मोडल सीखेगा कि कैसे मिलान करें a

5:09

शब्दों और अवधारणाओं का शब्दकोश

5:12

कई संभावित वस्तु को कवर करना

5:13

एक दृश्य में वस्तुओं के संबंध का उपयोग कर

5:16

पहले से निकाली गई जानकारी

5:19

स्टेज सीखना कि कैसे संरचना करना है

5:21

एक दूसरे के साथ वस्तुएँ वस्तु और वॉयला

5:25

आप एक स्पष्ट ग्राफ के साथ समाप्त होते हैं कि आप

5:27

कवरिंग वाक्य बनाने के लिए उपयोग कर सकते हैं

5:29

आपकी छवि में क्या हो रहा है आप कर सकते हैं

5:31

अब इस दृष्टिकोण का उपयोग अपने अगले में करें

5:32

आवेदन करें और कुछ बुद्धि अंक दें

5:35

आपका दृष्टिकोण इसे करीब ले जा रहा है

5:37

कुछ बुद्धिमान अगर आप करना चाहते हैं

5:39

इस नए कार्य के बारे में अधिक जानें i

5:41

पेपर पढ़ने के लिए आपको पुरजोर तरीके से आमंत्रित करते हैं

5:43

नीचे लिंक किया गया देखने के लिए धन्यवाद

5:45

अंत तक और मैं आपको आगे देखूंगा

एक और अद्भुत पेपर के साथ सप्ताह