1859 में, फ्रांसीसी कवि
1906 में,
पिछली सदी में,
2023 तक तेजी से आगे बढ़ते हुए, हमारे पास तथाकथित कृत्रिम बुद्धिमत्ता है। यह सहजता से और सेकंड के भीतर टेक्स्ट संकेतों से टेक्स्ट, चित्र, वीडियो और संगीत उत्पन्न कर सकता है। कई कलाकार चिंतित हैं.
तीन स्वतंत्र दृश्य कलाकार - सारा एंडरसन, केली मैकर्नन, और कार्ला ऑर्टिज़ - दाखिल करने तक चले गए हैं
मैथ्यू बटरिक पहले से ही "एआई के खिलाफ कानूनी कॉपीराइट लड़ाई" में एक ज्ञात व्यक्ति हैं
हालाँकि, वादी की शिकायत एक व्यापक दायरे में तैयार की गई है और अनिवार्य रूप से कॉपीराइट डेटा पर प्रशिक्षित प्रत्येक जेनरेटर एआई मॉडल पर आधारित है - जो कि सभी बड़े हैं, और भारी मात्रा में हैं।
वास्तव में, यदि सैन फ्रांसिस्को संघीय अदालत 19 जुलाई को मामले की सुनवाई करने का निर्णय लेती है, इसके बावजूद
कुल मिलाकर, क्लास-एक्शन मुकदमे के पीछे कलाकारों की तिकड़ी दो कठिन कॉपीराइट प्रश्नों पर "हां" थोपने की कोशिश कर रही है, जो जेनरेटर एआई मॉडल उत्पन्न करते हैं - एक इनपुट से संबंधित और दूसरा आउटपुट से संबंधित:
मैं अमेरिकी कॉपीराइट कानून का विशेषज्ञ नहीं हूं, सिर्फ सवालों पर तटस्थ रुख रखने वाला एक पर्यवेक्षक हूं। अपने शोध के आधार पर, मेरा मानना है कि पहले प्रश्न का उत्तर "नहीं" है, जबकि दूसरे प्रश्न का उत्तर देना अधिक समस्याग्रस्त है, और यह मामला-दर-मामला मूल्यांकन पर निर्भर हो सकता है।
मुझे अत्यधिक संदेह है कि यह वर्ग-कार्रवाई मुकदमा हमें कोई उत्तर प्रदान करेगा।
स्टेबल डिफ्यूजन द्वारा छवियों के उपयोग और वितरण से संबंधित एक और लंबित कॉपीराइट मामला
मेरे विचार में गेटी इमेजेज का मुकदमा अदालत में जाने और कॉपीराइट बनाम जेनरेटिव एआई की कानूनी समझ में योगदान देने का एक बेहतर मौका है।
एक वाक्य में मुख्य अंतर: गेटी इमेजेज़ मुकदमा बेहतर ढंग से प्रलेखित है। गेटी इमेजेज़ अपने अधिकारों को साबित कर सकते हैं और उनके अधिकारों के विशिष्ट उल्लंघन की ओर इशारा कर सकते हैं, जबकि क्लास-एक्शन मुकदमे के पीछे के कलाकार ऐसा नहीं कर सकते।
कलाकारों की क्लास-एक्शन शिकायत दुर्भाग्य से अल्पविकसित गलतियों और गलत धारणाओं से भरी हुई है कि स्टेबल डिफ्यूजन को कैसे प्रशिक्षित किया गया और मॉडल कैसे छवियां उत्पन्न करता है।
तकनीकी उत्साही लोगों के एक समूह ने एक वेबसाइट http://www.stabledifusingfrivolous.com/ बनाई है जहां वे शिकायत में कुछ तकनीकी अशुद्धियों की ओर इशारा करते हैं।
यहां, मैं इस बात पर ध्यान केंद्रित करूंगा कि कलाकार ऊपर बताए गए दो कानूनी प्रश्नों को कैसे संबोधित करते हैं, या संबोधित करने में विफल रहते हैं।
यहां शिकायत का एक उद्धरण है (¶57-58), जहां कलाकार इनपुट प्रश्न पर अपने विचार प्रस्तुत करते हैं:
“स्थिरता को खत्म कर दिया गया, और इस तरह वेबसाइटों से पांच अरब से अधिक छवियों की प्रतिलिपि बनाई गई, क्योंकि प्रशिक्षण छवियों का उपयोग स्थिर प्रसार के लिए प्रशिक्षण डेटा के रूप में किया गया था।
स्थिरता ने प्रशिक्षण छवियों के रचनाकारों या उन्हें होस्ट करने वाली वेबसाइटों से सहमति नहीं मांगी, जहां से उन्हें स्क्रैप किया गया था।
स्थिरता ने किसी भी प्रशिक्षण छवि के लिए लाइसेंस पर बातचीत करने का प्रयास नहीं किया। स्थिरता ने उन्हें बस ले लिया। स्थिरता ने स्थिर प्रसार के भीतर प्रशिक्षण छवियों की संपीड़ित प्रतियों को एम्बेड और संग्रहीत किया है।
स्थिर प्रसार के पहले संस्करण को "के साथ प्रशिक्षित किया गया था"
LAION-5B में लगभग 5.85 बिलियन छवियों की जानकारी है और यह अपनी तरह का सबसे बड़ा डेटाबेस है। इसे जर्मन गैर-लाभकारी संगठन LAION (बड़े पैमाने पर आर्टिफिशियल इंटेलिजेंस ओपन नेटवर्क का संक्षिप्त रूप) द्वारा विकसित किया गया था, और स्टेबिलिटी AI ने इसके विकास को वित्तपोषित करने में मदद की।
यह ध्यान रखना महत्वपूर्ण है कि LAION-5B में कोई वास्तविक छवियाँ संग्रहीत नहीं हैं। इसके बजाय, प्रत्येक छवि के बारे में जानकारी संग्रहीत की जाती है और इसमें निम्न शामिल हैं:
इसलिए कलाकारों का दावा है कि स्टेबल डिफ्यूज़न उनकी कला की "संपीड़ित प्रतियों को संग्रहीत करता है" एक मिथ्या नाम है। वास्तव में, स्टेबल डिफ्यूजन के प्रशिक्षण डेटासेट में कुछ कलाकारों की छवियों के बारे में मेटाडेटा शामिल है, और वह मेटाडेटा अपने आप में कॉपीराइट संरक्षित नहीं है।
उसी तरह Spotify पर एक गाना कॉपीराइट-सुरक्षित है, लेकिन इसके बारे में मेटाडेटा जैसे कलाकार का नाम, गीत का शीर्षक, निर्माता, रिलीज़ की तारीख, शैली और ट्रैक अवधि नहीं है। ऐसा इसलिए है क्योंकि इस डेटा को पुनः प्राप्त करना पूरी तरह से एक यांत्रिक प्रक्रिया है जिसके लिए किसी रचनात्मक प्रयास की आवश्यकता नहीं होती है।
एक सार्वजनिक डेटासेट के रूप में, LAION-5B की जांच कोई भी इच्छुक व्यक्ति कर सकता है। कंपनी
तीन कलाकारों, सारा एंडरसन, केली मैककर्नन और कार्ला ऑर्टिज़ ने यही किया, और उन्होंने क्रमशः 200 से अधिक, 30 से अधिक और अपने काम के 12 से अधिक प्रतिनिधित्व पाए।
विशेष रूप से, प्रारंभ में स्थिर प्रसार था
स्टेबल डिफ्यूज़न प्रशिक्षण डेटा के आकार को ध्यान में रखते हुए, तीन कलाकारों द्वारा किया गया अनजाने योगदान विशाल महासागर में छोटी बूंदें हैं।
इसकी तुलना में, गेटी इमेजेज ने स्टेबिलिटी एआई के खिलाफ मुकदमा दायर किया है
सभी कलाकारों के कार्यों में से केवल 16 छवियों को सारा एंडरसन द्वारा अमेरिकी कॉपीराइट कार्यालय में पंजीकृत किया गया है।
यह 17 यूएससी § 411(ए) का अनुसरण करता है, कि " किसी भी संयुक्त राज्य अमेरिका के काम में कॉपीराइट के उल्लंघन के लिए कोई नागरिक कार्रवाई तब तक शुरू नहीं की जाएगी जब तक कि कॉपीराइट दावे का पूर्व-पंजीकरण या पंजीकरण नहीं किया गया हो (..)"।
दूसरे शब्दों में, यदि कोई कार्य अमेरिकी कॉपीराइट कार्यालय में पंजीकृत नहीं है, तो अधिकार धारक आम तौर पर नागरिक मुकदमे में उल्लंघन का दावा नहीं कर सकता है। इसका मतलब यह है कि कलाकार केवल सारा एंडरसन के स्वामित्व और पंजीकृत 16 कार्यों की ओर से दावा कर सकते हैं।
यदि कलाकार यह साबित कर सकें कि स्टेबल डिफ्यूजन कभी-कभी ऐसे आउटपुट उत्पन्न कर सकता है जो इन 16 छवियों में से किसी एक से मिलता जुलता हो, तो कलाकार शायद "आउटपुट प्रश्न" से संबंधित मामला बना सकते हैं। लेकिन जैसा कि हम देखेंगे, वे ऐसा करने में असमर्थ हैं।
आउटपुट प्रश्न के संबंध में, कलाकारों का सुझाव है कि स्टेबल डिफ्यूजन द्वारा उत्पन्न प्रत्येक आउटपुट अनिवार्य रूप से उसके प्रशिक्षण डेटा से प्राप्त होता है और इस प्रकार कॉपीराइट का उल्लंघन होता है (देखें ¶94-95)। यह कानूनी सिद्धांत अत्यंत दूरगामी है।
नीचे कानून के प्रोफेसर मैथ्यू सैग के पेपर का एक उदाहरण दिया गया है "
दाईं ओर की छवियां स्टेबल डिफ्यूजन द्वारा टेक्स्ट प्रॉम्प्ट "सफेद पृष्ठभूमि पर कॉफी कप" के साथ तैयार की गई थीं। कलाकारों के तर्क के अनुसार, दाईं ओर की सभी छवियां बाईं ओर की छवियों के कॉपीराइट का उल्लंघन करेंगी।
हालाँकि छवियाँ स्पष्ट रूप से काफी हद तक समान नहीं दिखती हैं।
कुछ दुर्लभ परिस्थितियों में, यह सिद्ध हो चुका है कि स्टेबल डिफ्यूजन वास्तव में आउटपुट छवियां उत्पन्न कर सकता है जो इसके प्रशिक्षण डेटासेट से छवियों के समान दिखती हैं।
ऐसा विशेष रूप से तब होने की संभावना है जब इनपुट प्रशिक्षण छवि इंटरनेट पर व्यापक रूप से वितरित की जाती है और स्टेबल डिफ्यूजन के प्रशिक्षण डेटा में बार-बार दिखाई देती है।
शीर्षक वाले एक हालिया पेपर में
इसके बाद, उन्होंने प्रत्येक प्रशिक्षण डेटा छवि से जुड़े पाठ विवरण के समान पाठ संकेतों के साथ स्थिर प्रसार के माध्यम से 500 नई छवियां तैयार कीं।
जैसा कि यह निकला, 175 मिलियन छवियों (350.000*500) में से, केवल 109 छवियों (0.03%) को उचित रूप से "निकट-प्रतिलिपि" माना जा सकता है।
जिससे, कॉपीराइट का उल्लंघन हो सकता है, लेकिन कलाकार इस बात का कोई उदाहरण नहीं देते हैं कि स्टेबल डिफ्यूजन ने उनके काम की नकल कैसे की है। इसके विपरीत, वे शिकायत ¶ 93 में लिखते हैं:
“सामान्य तौर पर, किसी विशेष टेक्स्ट प्रॉम्प्ट के जवाब में प्रदान की गई स्थिर प्रसार आउटपुट छवियों में से कोई भी प्रशिक्षण डेटा में किसी भी विशिष्ट छवि के साथ करीबी मैच होने की संभावना नहीं है। ”
कलाकार दावा करते हैं कि स्टेबल डिफ्यूजन उनकी व्यक्तिगत कलात्मक शैलियों की नकल करने में सक्षम है। आम तौर पर, एक "कलात्मक शैली" कॉपीराइट संरक्षण के अधीन नहीं हो सकती। उल्लंघन के दावों को हमेशा विशिष्ट कार्यों के उल्लंघन से जोड़ा जाना चाहिए।
हालाँकि, यहाँ एक वैध मुद्दा है जो प्राप्त हुआ है
इस समस्या को हल करने के लिए, स्टेबिलिटी एआई ने अपने डेटासेट में लेबल से प्रसिद्ध कलाकारों के नाम हटा दिए
उदाहरण के लिए, यदि आप स्टेबल डिफ्यूजन को पिकासो या रेम्ब्रांट की शैली में एक छवि बनाने के लिए कहते हैं तो यह अब ऐसा करने में सक्षम नहीं है। यह बदलाव क्लास-एक्शन शिकायत से दो महीने पहले शुरू किया गया था।
कुल मिलाकर, यह स्पष्ट नहीं है कि कलाकार कैसे और क्यों मानते हैं कि स्टेबल डिफ्यूज़न उनके काम की नकल करता है। कलाकार इस बात से अधिक चिंतित हैं कि स्टेबल डिफ्यूज़न भविष्य में उनकी नौकरियों को कैसे खतरे में डाल सकता है , और इस बात से कम चिंतित हैं कि स्टेबल डिफ्यूज़न वास्तव में अब कैसे काम करता है।
तीन कलाकारों में से एक, सारा एंडरसन ने लिखा
"मैं कई जनरेटरों के साथ खेल रहा हूं, और अब तक किसी ने भी मेरी शैली की इस तरह से नकल नहीं की है जो सीधे तौर पर मेरे करियर को खतरे में डाल सके, यह तथ्य लगभग निश्चित रूप से बदल जाएगा क्योंकि एआई में सुधार जारी रहेगा।"
नीचे लेख से दो चित्रण हैं, एक सारा एंडरसन द्वारा और एक स्टेबल डिफ्यूजन द्वारा। आप शायद अनुमान लगा सकते हैं कि कौन सा किसने बनाया था।
दिसंबर 2022 में,
हालाँकि पहल
वर्ग-कार्रवाई मुकदमे से पहले,
"केवल एक चीज जो Stability.AI कर सकता है वह है एल्गोरिथम डिस्गोर्जमेंट जहां वे अपने डेटाबेस को पूरी तरह से नष्ट कर देते हैं और वे उन सभी मॉडलों को भी पूरी तरह से नष्ट कर देते हैं जिनमें हमारा सारा डेटा होता है"
यह कथन बहुत ही अर्थपूर्ण है. क्लास-एक्शन कानून के पीछे के तीन कलाकार, मैथ्यू बटरिक और उनके बाकी कानूनी प्रतिनिधित्व के साथ, कलाकार के अधिकारों के लिए खड़े होने का दिखावा करते हैं, लेकिन वे वास्तव में आधुनिक हैं