paint-brush
डैल · ई मिनी कैसे काम करता है?द्वारा@whatsai
24,742 रीडिंग
24,742 रीडिंग

डैल · ई मिनी कैसे काम करता है?

द्वारा Louis Bouchard3m2022/06/19
Read on Terminal Reader
Read this story w/o Javascript

बहुत लंबा; पढ़ने के लिए

डैल मिनी एक स्वतंत्र, ओपन-सोर्स एआई है जो टेक्स्ट इनपुट से अद्भुत छवियां तैयार करता है। AI को DALL·E मिनी कहा जाता है और इसका उपयोग Dall-e Mini की छवियों को उत्पन्न करने की क्षमता के बारे में आपके ज्ञान का परीक्षण करने के लिए किया जा सकता है। डैल मिनी एक ओपन सोर्स एआई है जिसे DALimini नामक एक साधारण सरल टूल के साथ चलाया जा सकता है। DALImini पिछले एक साल में openai द्वारा बनाई गई एक समुदाय निर्मित परियोजना है और तब से अविश्वसनीय परिणामों के साथ विकसित होती रही है।

Company Mentioned

Mention Thumbnail
featured image - डैल · ई मिनी कैसे काम करता है?
Louis Bouchard HackerNoon profile picture

डेल मिनी अद्भुत है - और आप इसका उपयोग कर सकते हैं!

मुझे यकीन है कि आपने पिछले कुछ दिनों में अपने ट्विटर फीड में ऐसी तस्वीरें देखी होंगी। यदि आप सोच रहे हैं कि वे क्या थे, तो वे DALL·E मिनी नामक AI द्वारा उत्पन्न छवियां हैं। यदि आपने उन्हें कभी नहीं देखा है, तो आपको यह वीडियो देखने की आवश्यकता है क्योंकि आप गायब हैं। यदि आप सोच रहे हैं कि यह कैसे संभव है, तो आप एकदम सही वीडियो पर हैं और पांच मिनट से भी कम समय में आपको इसका उत्तर पता चल जाएगा।

डैल मिनी एक स्वतंत्र, ओपन-सोर्स एआई है जो टेक्स्ट इनपुट से अद्भुत छवियां तैयार करता है। यहां देखिए यह कैसे काम करता है:

वीडियो देखना

सन्दर्भ:

►पूरा लेख पढ़ें: https://www.louisbouchard.ai/dalle-mini/
DALL·E मिनी बनाम DALL·E 2: https://youtu.be/0Eu9SDd-95E
अजीब/सबसे मजेदार DALL·E मिनी परिणाम: https://youtu.be/9LHkNt2cH_w
DALL·E मिनी के साथ खेलें: https://huggingface.co/spaces/dalle-mini/dalle-mini
DALL·E मिनी कोड: https://github.com/borisdayma/dalle-mini
बोरिस डेमा का ट्विटर: https://twitter.com/borisdayma
बोरिस डेमा एट अल द्वारा शानदार और पूर्ण तकनीकी रिपोर्ट: https://wandb.ai/dalle-mini/dalle-mini/reports/DALL-E-Mini-Explained-with-Demo--Vmlldzo4NjIxODA#the-clip- तंत्रिका-नेटवर्क-मॉडल
तनिष्क मैथ्यू अब्राहम द्वारा दल-ए मिनी के बारे में शानदार सूत्र:
https://twitter.com/iScienceLuvr/status/1536294746041114624/photo/1?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1536294746041114624%7Ctwgr%5E%7Ctwcon%5Es1_&3Atf_url कॉम% 2Fmediaembed% 2Fvbqh2s%3Fresponsive%3Dtrueis_nightmode%3Dtrue
►VQGAN ने समझाया: https://youtu.be/JfUTd8fjtX8
►माई न्यूज़लेटर (आपके ईमेल पर साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!): https://www.louisbouchard.ai/newsletter/

वीडियो प्रतिलेख

0:00

मुझे यकीन है कि आपने ऐसी तस्वीरें देखी होंगी

0:02

पिछले कुछ समय में आपके ट्विटर फीड में

0:04

दिन अगर आपको आश्चर्य है कि वे क्या पहनते हैं

0:06

एक एआई द्वारा उत्पन्न छवियां हैं जिन्हें कहा जाता है

0:08

डाली मिनी अगर आपने उन्हें कभी नहीं देखा है

0:11

इस वीडियो को देखने की जरूरत है क्योंकि आप हैं

0:12

याद आ रही है अगर आपको आश्चर्य है कि यह कैसा है

0:14

संभव है कि आप बिल्कुल सही हों

0:16

वीडियो और कम में जवाब जानेंगे

0:18

5 मिनट से अधिक यह नाम डाली चाहिए

0:21

पहले से ही एक घंटी बजाओ क्योंकि मैंने दो को कवर किया है

0:23

openai द्वारा बनाए गए इस मॉडल के संस्करण

0:26

पिछले साल अविश्वसनीय परिणामों के साथ

0:28

लेकिन यह एक अलग है

0:31

ओपन सोर्स कम्युनिटी क्रिएटेड प्रोजेक्ट

0:33

दिल्ली के पहले संस्करण से प्रेरित

0:35

और तब से विकसित होता रहा है

0:38

अब अविश्वसनीय परिणाम बोरिस के लिए धन्यवाद

0:41

दाइमा और सभी योगदानकर्ता हाँ यह

0:43

इसका मतलब है कि आप इसके साथ तुरंत खेल सकते हैं

0:46

चेहरे को गले लगाने के लिए धन्यवाद लिंक में है

0:48

नीचे विवरण लेकिन इसे दें

0:49

वीडियो चलाने से कुछ सेकंड पहले

0:51

इसके साथ यह इसके लायक होगा और आप करेंगे

0:54

इस ai के बारे में और अधिक जानें

0:55

कोर दल में आपके आस-पास के सभी लोग

0:58

मिनी दिल्ली से काफी मिलती-जुलती है इसलिए my

1:00

मॉडल पर प्रारंभिक वीडियो बहुत अच्छा है

1:02

इसका परिचय इसके दो मुख्य हैं

1:04

घटकों के रूप में आपको एक भाषा पर संदेह है और

1:07

एक छवि मॉड्यूल पहले इसे करना होगा

1:10

टेक्स्ट प्रॉम्प्ट को समझें और फिर

1:12

इसके बाद दो बहुत ही छवियों को उत्पन्न करें

1:14

अलग-अलग चीजों के लिए दो की आवश्यकता होती है

1:17

विभिन्न मॉडल मुख्य अंतर

1:18

दिल्ली के साथ मॉडल में झूठ

1:20

वास्तुकला और प्रशिक्षण डेटा लेकिन

1:22

एंड-टू-एंड प्रक्रिया बहुत अधिक है

1:24

वही यहाँ हमारे पास एक भाषा मॉडल है

1:27

बार्ट बार्ट नामक एक मॉडल है जिसे प्रशिक्षित किया जाता है

1:29

टेक्स्ट इनपुट को भाषा में बदलना

1:32

के दौरान अगले मॉडल के लिए समझ में आता है

1:34

प्रशिक्षण हम छवियों के जोड़े को खिलाते हैं

1:36

कैप्शन to dalemini bart टेक्स्ट लेता है

1:39

कैप्शन और इसे असतत में बदल देता है

1:42

टोकन जो द्वारा पठनीय होंगे

1:44

अगला मॉडल और हम इसे इसके आधार पर समायोजित करते हैं

1:46

उत्पन्न छवि के बीच अंतर

1:48

और छवि इनपुट के रूप में भेजी गई लेकिन फिर

1:51

यह यहाँ क्या है जो उत्पन्न करता है

1:54

वह छवि जिसे हम इसे एक डिकोडर कहते हैं,

1:57

नया कैप्शन प्रतिनिधित्व लें

1:59

बार्ट द्वारा निर्मित जिसे हम an . कहते हैं

2:01

एन्कोडिंग और इसे एक में डीकोड करेगा

2:04

इस मामले में छवि छवि विकोडक है

2:07

vqgan एक मॉडल जिसे मैंने पहले ही कवर कर लिया है

2:10

चैनल इसलिए मैं आपको निश्चित रूप से आमंत्रित करता हूं

2:11

वीडियो देखें अगर आप में रुचि रखते हैं

2:14

लघु vkugen एक महान वास्तुकला है

2:16

इसके विपरीत करो यह सीखता है कि कैसे जाना है

2:19

इस तरह की एक एन्कोडिंग मैपिंग और एक उत्पन्न करें

2:22

इसमें से छवि के रूप में आपको gpt3 पर संदेह है और

2:25

अन्य भाषा जनरेटिव मॉडल करते हैं a

2:27

बहुत समान चीज़ एन्कोडिंग टेक्स्ट और

2:29

नव निर्मित मानचित्रण को डिकोड करना

2:32

एक नए पाठ में जो यह आपको वापस भेजता है

2:35

यहाँ यह वही बात है लेकिन पिक्सेल के साथ

2:37

अक्षरों के बजाय एक छवि बनाना

2:40

एक वाक्य बनाना जिसके माध्यम से वह सीखता है

2:42

से लाखों एन्कोडिंग छवि जोड़े

2:45

इंटरनेट तो मूल रूप से आपका प्रकाशित

2:47

कैप्शन के साथ चित्र और अंत में

2:50

पुनर्निर्माण में बहुत सटीक

2:52

प्रारंभिक छवि तो आप इसे नया खिला सकते हैं

2:54

कूटलेखन जो इनमें से किसी की तरह दिखते हैं

2:56

प्रशिक्षण लेकिन थोड़ा अलग हैं और यह

2:59

पूरी तरह से नया उत्पन्न करेगा लेकिन

3:01

समान छवि इसी तरह हम आमतौर पर जोड़ते हैं

3:04

इन एन्कोडिंग के लिए बस थोड़ा सा शोर

3:06

का प्रतिनिधित्व करने वाली एक नई छवि उत्पन्न करने के लिए

3:08

वही टेक्स्ट प्रॉम्प्ट और वॉइला यह है कैसे

3:12

डाली मिनी छवियों को उत्पन्न करना सीखती है

3:14

जैसा कि मैंने उल्लेख किया है, आपके टेक्स्ट कैप्शन

3:17

खुला स्रोत और आप इसके साथ भी खेल सकते हैं

3:19

यह तुरंत चेहरे को गले लगाने के लिए धन्यवाद

3:22

बेशक यह सिर्फ एक साधारण था

3:24

सिंहावलोकन और मैंने कुछ महत्वपूर्ण छोड़ दिया

3:26

स्पष्टता के लिए कदम यदि आप और अधिक चाहते हैं

3:29

मैंने जो मॉडल लिंक किया है उसके बारे में विवरण बढ़िया

3:31

नीचे दिए गए विवरण में संसाधन i

3:34

हाल ही में दो लघु वीडियो भी प्रकाशित किए

3:36

कुछ मज़ेदार परिणाम दिखाने के साथ-साथ

3:38

दैनिक 2 के साथ तुलना परिणाम

3:40

वही पाठ संकेत देता है कि यह बहुत अच्छा है

3:42

देखने के लिए मुझे आशा है कि आपको यह वीडियो पसंद आया होगा

3:45

और यदि ऐसा है तो कृपया कुछ सेकंड का समय लें

3:47

मुझे टिप्पणियों में बताएं और छोड़ दें a

3:50

जैसे मैं आपको अगले हफ्ते नहीं बल्कि में देखूंगा

3:52

एक और अद्भुत पेपर के साथ दो सप्ताह

3:55

[संगीत]

4:14

[संगीत]