डेल मिनी अद्भुत है - और आप इसका उपयोग कर सकते हैं!
मुझे यकीन है कि आपने पिछले कुछ दिनों में अपने ट्विटर फीड में ऐसी तस्वीरें देखी होंगी। यदि आप सोच रहे हैं कि वे क्या थे, तो वे DALL·E मिनी नामक AI द्वारा उत्पन्न छवियां हैं। यदि आपने उन्हें कभी नहीं देखा है, तो आपको यह वीडियो देखने की आवश्यकता है क्योंकि आप गायब हैं। यदि आप सोच रहे हैं कि यह कैसे संभव है, तो आप एकदम सही वीडियो पर हैं और पांच मिनट से भी कम समय में आपको इसका उत्तर पता चल जाएगा।
डैल मिनी एक स्वतंत्र, ओपन-सोर्स एआई है जो टेक्स्ट इनपुट से अद्भुत छवियां तैयार करता है। यहां देखिए यह कैसे काम करता है:
►पूरा लेख पढ़ें: https://www.louisbouchard.ai/dalle-mini/
DALL·E मिनी बनाम DALL·E 2: https://youtu.be/0Eu9SDd-95E
अजीब/सबसे मजेदार DALL·E मिनी परिणाम: https://youtu.be/9LHkNt2cH_w
DALL·E मिनी के साथ खेलें: https://huggingface.co/spaces/dalle-mini/dalle-mini
DALL·E मिनी कोड: https://github.com/borisdayma/dalle-mini
बोरिस डेमा का ट्विटर: https://twitter.com/borisdayma
बोरिस डेमा एट अल द्वारा शानदार और पूर्ण तकनीकी रिपोर्ट: https://wandb.ai/dalle-mini/dalle-mini/reports/DALL-E-Mini-Explained-with-Demo--Vmlldzo4NjIxODA#the-clip- तंत्रिका-नेटवर्क-मॉडल
तनिष्क मैथ्यू अब्राहम द्वारा दल-ए मिनी के बारे में शानदार सूत्र:
https://twitter.com/iScienceLuvr/status/1536294746041114624/photo/1?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1536294746041114624%7Ctwgr%5E%7Ctwcon%5Es1_&3Atf_url कॉम% 2Fmediaembed% 2Fvbqh2s%3Fresponsive%3Dtrueis_nightmode%3Dtrue
►VQGAN ने समझाया: https://youtu.be/JfUTd8fjtX8
►माई न्यूज़लेटर (आपके ईमेल पर साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!): https://www.louisbouchard.ai/newsletter/
0:00
मुझे यकीन है कि आपने ऐसी तस्वीरें देखी होंगी
0:02
पिछले कुछ समय में आपके ट्विटर फीड में
0:04
दिन अगर आपको आश्चर्य है कि वे क्या पहनते हैं
0:06
एक एआई द्वारा उत्पन्न छवियां हैं जिन्हें कहा जाता है
0:08
डाली मिनी अगर आपने उन्हें कभी नहीं देखा है
0:11
इस वीडियो को देखने की जरूरत है क्योंकि आप हैं
0:12
याद आ रही है अगर आपको आश्चर्य है कि यह कैसा है
0:14
संभव है कि आप बिल्कुल सही हों
0:16
वीडियो और कम में जवाब जानेंगे
0:18
5 मिनट से अधिक यह नाम डाली चाहिए
0:21
पहले से ही एक घंटी बजाओ क्योंकि मैंने दो को कवर किया है
0:23
openai द्वारा बनाए गए इस मॉडल के संस्करण
0:26
पिछले साल अविश्वसनीय परिणामों के साथ
0:28
लेकिन यह एक अलग है
0:31
ओपन सोर्स कम्युनिटी क्रिएटेड प्रोजेक्ट
0:33
दिल्ली के पहले संस्करण से प्रेरित
0:35
और तब से विकसित होता रहा है
0:38
अब अविश्वसनीय परिणाम बोरिस के लिए धन्यवाद
0:41
दाइमा और सभी योगदानकर्ता हाँ यह
0:43
इसका मतलब है कि आप इसके साथ तुरंत खेल सकते हैं
0:46
चेहरे को गले लगाने के लिए धन्यवाद लिंक में है
0:48
नीचे विवरण लेकिन इसे दें
0:49
वीडियो चलाने से कुछ सेकंड पहले
0:51
इसके साथ यह इसके लायक होगा और आप करेंगे
0:54
इस ai के बारे में और अधिक जानें
0:55
कोर दल में आपके आस-पास के सभी लोग
0:58
मिनी दिल्ली से काफी मिलती-जुलती है इसलिए my
1:00
मॉडल पर प्रारंभिक वीडियो बहुत अच्छा है
1:02
इसका परिचय इसके दो मुख्य हैं
1:04
घटकों के रूप में आपको एक भाषा पर संदेह है और
1:07
एक छवि मॉड्यूल पहले इसे करना होगा
1:10
टेक्स्ट प्रॉम्प्ट को समझें और फिर
1:12
इसके बाद दो बहुत ही छवियों को उत्पन्न करें
1:14
अलग-अलग चीजों के लिए दो की आवश्यकता होती है
1:17
विभिन्न मॉडल मुख्य अंतर
1:18
दिल्ली के साथ मॉडल में झूठ
1:20
वास्तुकला और प्रशिक्षण डेटा लेकिन
1:22
एंड-टू-एंड प्रक्रिया बहुत अधिक है
1:24
वही यहाँ हमारे पास एक भाषा मॉडल है
1:27
बार्ट बार्ट नामक एक मॉडल है जिसे प्रशिक्षित किया जाता है
1:29
टेक्स्ट इनपुट को भाषा में बदलना
1:32
के दौरान अगले मॉडल के लिए समझ में आता है
1:34
प्रशिक्षण हम छवियों के जोड़े को खिलाते हैं
1:36
कैप्शन to dalemini bart टेक्स्ट लेता है
1:39
कैप्शन और इसे असतत में बदल देता है
1:42
टोकन जो द्वारा पठनीय होंगे
1:44
अगला मॉडल और हम इसे इसके आधार पर समायोजित करते हैं
1:46
उत्पन्न छवि के बीच अंतर
1:48
और छवि इनपुट के रूप में भेजी गई लेकिन फिर
1:51
यह यहाँ क्या है जो उत्पन्न करता है
1:54
वह छवि जिसे हम इसे एक डिकोडर कहते हैं,
1:57
नया कैप्शन प्रतिनिधित्व लें
1:59
बार्ट द्वारा निर्मित जिसे हम an . कहते हैं
2:01
एन्कोडिंग और इसे एक में डीकोड करेगा
2:04
इस मामले में छवि छवि विकोडक है
2:07
vqgan एक मॉडल जिसे मैंने पहले ही कवर कर लिया है
2:10
चैनल इसलिए मैं आपको निश्चित रूप से आमंत्रित करता हूं
2:11
वीडियो देखें अगर आप में रुचि रखते हैं
2:14
लघु vkugen एक महान वास्तुकला है
2:16
इसके विपरीत करो यह सीखता है कि कैसे जाना है
2:19
इस तरह की एक एन्कोडिंग मैपिंग और एक उत्पन्न करें
2:22
इसमें से छवि के रूप में आपको gpt3 पर संदेह है और
2:25
अन्य भाषा जनरेटिव मॉडल करते हैं a
2:27
बहुत समान चीज़ एन्कोडिंग टेक्स्ट और
2:29
नव निर्मित मानचित्रण को डिकोड करना
2:32
एक नए पाठ में जो यह आपको वापस भेजता है
2:35
यहाँ यह वही बात है लेकिन पिक्सेल के साथ
2:37
अक्षरों के बजाय एक छवि बनाना
2:40
एक वाक्य बनाना जिसके माध्यम से वह सीखता है
2:42
से लाखों एन्कोडिंग छवि जोड़े
2:45
इंटरनेट तो मूल रूप से आपका प्रकाशित
2:47
कैप्शन के साथ चित्र और अंत में
2:50
पुनर्निर्माण में बहुत सटीक
2:52
प्रारंभिक छवि तो आप इसे नया खिला सकते हैं
2:54
कूटलेखन जो इनमें से किसी की तरह दिखते हैं
2:56
प्रशिक्षण लेकिन थोड़ा अलग हैं और यह
2:59
पूरी तरह से नया उत्पन्न करेगा लेकिन
3:01
समान छवि इसी तरह हम आमतौर पर जोड़ते हैं
3:04
इन एन्कोडिंग के लिए बस थोड़ा सा शोर
3:06
का प्रतिनिधित्व करने वाली एक नई छवि उत्पन्न करने के लिए
3:08
वही टेक्स्ट प्रॉम्प्ट और वॉइला यह है कैसे
3:12
डाली मिनी छवियों को उत्पन्न करना सीखती है
3:14
जैसा कि मैंने उल्लेख किया है, आपके टेक्स्ट कैप्शन
3:17
खुला स्रोत और आप इसके साथ भी खेल सकते हैं
3:19
यह तुरंत चेहरे को गले लगाने के लिए धन्यवाद
3:22
बेशक यह सिर्फ एक साधारण था
3:24
सिंहावलोकन और मैंने कुछ महत्वपूर्ण छोड़ दिया
3:26
स्पष्टता के लिए कदम यदि आप और अधिक चाहते हैं
3:29
मैंने जो मॉडल लिंक किया है उसके बारे में विवरण बढ़िया
3:31
नीचे दिए गए विवरण में संसाधन i
3:34
हाल ही में दो लघु वीडियो भी प्रकाशित किए
3:36
कुछ मज़ेदार परिणाम दिखाने के साथ-साथ
3:38
दैनिक 2 के साथ तुलना परिणाम
3:40
वही पाठ संकेत देता है कि यह बहुत अच्छा है
3:42
देखने के लिए मुझे आशा है कि आपको यह वीडियो पसंद आया होगा
3:45
और यदि ऐसा है तो कृपया कुछ सेकंड का समय लें
3:47
मुझे टिप्पणियों में बताएं और छोड़ दें a
3:50
जैसे मैं आपको अगले हफ्ते नहीं बल्कि में देखूंगा
3:52
एक और अद्भुत पेपर के साथ दो सप्ताह
3:55
[संगीत]
4:14
[संगीत]