paint-brush
एआई कंपनियों, मॉडर्न-डे लुडाइट्स और अन्य कंपनियों के खिलाफ क्लास-एक्शन मुकदमेद्वारा@futuristiclawyer
186 रीडिंग

एआई कंपनियों, मॉडर्न-डे लुडाइट्स और अन्य कंपनियों के खिलाफ क्लास-एक्शन मुकदमे

द्वारा Futuristic Lawyer9m2023/06/23
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

पेसिमिस्टिक आर्काइव पुराने अखबारों की कतरनों पर आधारित एक समाचार पत्र है। पिछली पीढ़ियाँ भविष्य और नई प्रौद्योगिकियों के बारे में अपनी चिंताएँ व्यक्त करती हैं। तीन स्वतंत्र दृश्य कलाकार स्टेबल डिफ्यूजन के खिलाफ क्लास-एक्शन मुकदमा दायर करने तक पहुंच गए हैं। मुकदमा अनिवार्य रूप से कॉपीराइट डेटा पर प्रशिक्षित प्रत्येक जेनरेटर एआई मॉडल पर चल रहा है।
featured image - एआई कंपनियों, मॉडर्न-डे लुडाइट्स और अन्य कंपनियों के खिलाफ क्लास-एक्शन मुकदमे
Futuristic Lawyer HackerNoon profile picture

परिचय

निराशावादी पुरालेख पुराने अख़बारों की कतरनों पर आधारित एक न्यूज़लेटर है जहाँ पिछली पीढ़ियाँ भविष्य और नई तकनीकों के बारे में अपनी चिंताएँ व्यक्त करती हैं।


1859 में, फ्रांसीसी कवि चार्ल्स बौडेलेरे ने फोटोग्राफी का वर्णन किया जैसा कि *"हर भावी चित्रकार का आश्रय, प्रत्येक चित्रकार अपनी पढ़ाई पूरी करने के लिए बहुत कम संपन्न या बहुत आलसी होता है"* और इसे अपनाना "अंधापन" और "बेवकूफी" का संकेत था।


1906 में, एक लेखक ने टाइपराइटर से लिखे गए प्रेम पत्रों को प्रेम पत्र कहा सबसे " निर्दयी, यांत्रिक, अरोमांटिक उत्पादन जिसकी कल्पना की जा सकती है ", जबकि एक अन्य लेखक ने कहा कि " जो लड़की टाइप किया हुआ प्रेम पत्र सहन करेगी वह कुछ भी सहन करेगी । "


पिछली सदी में, ध्यान खींचने वाली अखबारों की सुर्खियाँ बिस्तर में पढ़ने, रोलर-स्केटिंग की बुराइयों, "साइकिल चेहरे" के खिलाफ चेतावनी दी गई थी, जिसके लिए " सवार पर अपना संतुलन बनाए रखने में होने वाले तंत्रिका तनाव" को जिम्मेदार ठहराया गया था, और अमेरिकन सोसाइटी ऑफ कंपोजर्स, ऑथर्स एंड पब्लिशर्स ने चार्ट के साथ साबित किया कि कैसे " बोलती तस्वीरों, रेडियो और फोनोग्राफ " ने संगीत की "हत्या" कर दी है।


2023 तक तेजी से आगे बढ़ते हुए, हमारे पास तथाकथित कृत्रिम बुद्धिमत्ता है। यह सहजता से और सेकंड के भीतर टेक्स्ट संकेतों से टेक्स्ट, चित्र, वीडियो और संगीत उत्पन्न कर सकता है। कई कलाकार चिंतित हैं.


तीन स्वतंत्र दृश्य कलाकार - सारा एंडरसन, केली मैकर्नन, और कार्ला ऑर्टिज़ - दाखिल करने तक चले गए हैं स्टेबल डिफ्यूजन के खिलाफ एक वर्ग-कार्रवाई मुकदमा वकील मैथ्यू बटरिक और जोसेफ सेवेरी लॉ फर्म के वादकारियों की मदद से।


मैथ्यू बटरिक पहले से ही "एआई के खिलाफ कानूनी कॉपीराइट लड़ाई" में एक ज्ञात व्यक्ति हैं जीथब के सह-पायलट के खिलाफ एक और वर्ग-कार्रवाई मुकदमा , कोड जनरेशन के लिए एक जेनरेटिव एआई टूल।

क्लास-एक्शन मुकदमा

मेरी नवीनतम पोस्ट में , मैंने ओपन-सोर्स एआई इमेज जनरेटर, स्टेबल डिफ्यूजन के बारे में लिखा। क्लास-एक्शन मुकदमा स्टेबल डिफ्यूजन, स्टेबिलिटी एआई, एक अन्य प्रसिद्ध एआई छवि कंपनी, मिडजर्नी और ऑनलाइन कला समुदाय, डेवियनआर्ट के मालिक के खिलाफ लक्षित है।


हालाँकि, वादी की शिकायत एक व्यापक दायरे में तैयार की गई है और अनिवार्य रूप से कॉपीराइट डेटा पर प्रशिक्षित प्रत्येक जेनरेटर एआई मॉडल पर आधारित है - जो कि सभी बड़े हैं, और भारी मात्रा में हैं।


वास्तव में, यदि सैन फ्रांसिस्को संघीय अदालत 19 जुलाई को मामले की सुनवाई करने का निर्णय लेती है, इसके बावजूद प्रतिवादियों के ख़ारिज करने के प्रस्ताव , अदालत का फैसला व्यापक रूप से प्रभावित कर सकता है बहु-खरबों डॉलर का उद्योग .


कुल मिलाकर, क्लास-एक्शन मुकदमे के पीछे कलाकारों की तिकड़ी दो कठिन कॉपीराइट प्रश्नों पर "हां" थोपने की कोशिश कर रही है, जो जेनरेटर एआई मॉडल उत्पन्न करते हैं - एक इनपुट से संबंधित और दूसरा आउटपुट से संबंधित:


  1. इनपुट प्रश्न : क्या डेवलपर्स को एआई की प्रशिक्षण प्रक्रिया में अपनी कॉपीराइट सामग्री का उपयोग करने के लिए अनुमति लेनी चाहिए और/या सही धारकों को लाइसेंस का भुगतान करना चाहिए?


  1. आउटपुट प्रश्न : यदि कोई जेनेरिक एआई उत्पाद ऐसा आउटपुट उत्पन्न करता है जो मानव कलाकार द्वारा बनाए गए काम के समान दिखता है, तो क्या सही धारक प्रदाता के खिलाफ उल्लंघन का दावा कर सकता है?


मैं अमेरिकी कॉपीराइट कानून का विशेषज्ञ नहीं हूं, सिर्फ सवालों पर तटस्थ रुख रखने वाला एक पर्यवेक्षक हूं। अपने शोध के आधार पर, मेरा मानना है कि पहले प्रश्न का उत्तर "नहीं" है, जबकि दूसरे प्रश्न का उत्तर देना अधिक समस्याग्रस्त है, और यह मामला-दर-मामला मूल्यांकन पर निर्भर हो सकता है।


मुझे अत्यधिक संदेह है कि यह वर्ग-कार्रवाई मुकदमा हमें कोई उत्तर प्रदान करेगा।


स्टेबल डिफ्यूजन द्वारा छवियों के उपयोग और वितरण से संबंधित एक और लंबित कॉपीराइट मामला स्टॉक इमेज दिग्गज गेटी इमेजेज़ द्वारा दायर किया गया था इसी साल फरवरी में.


मेरे विचार में गेटी इमेजेज का मुकदमा अदालत में जाने और कॉपीराइट बनाम जेनरेटिव एआई की कानूनी समझ में योगदान देने का एक बेहतर मौका है।


एक वाक्य में मुख्य अंतर: गेटी इमेजेज़ मुकदमा बेहतर ढंग से प्रलेखित है। गेटी इमेजेज़ अपने अधिकारों को साबित कर सकते हैं और उनके अधिकारों के विशिष्ट उल्लंघन की ओर इशारा कर सकते हैं, जबकि क्लास-एक्शन मुकदमे के पीछे के कलाकार ऐसा नहीं कर सकते।


कलाकारों की क्लास-एक्शन शिकायत दुर्भाग्य से अल्पविकसित गलतियों और गलत धारणाओं से भरी हुई है कि स्टेबल डिफ्यूजन को कैसे प्रशिक्षित किया गया और मॉडल कैसे छवियां उत्पन्न करता है।


तकनीकी उत्साही लोगों के एक समूह ने एक वेबसाइट http://www.stabledifusingfrivolous.com/ बनाई है जहां वे शिकायत में कुछ तकनीकी अशुद्धियों की ओर इशारा करते हैं।


यहां, मैं इस बात पर ध्यान केंद्रित करूंगा कि कलाकार ऊपर बताए गए दो कानूनी प्रश्नों को कैसे संबोधित करते हैं, या संबोधित करने में विफल रहते हैं।

इनपुट प्रश्न

यहां शिकायत का एक उद्धरण है (¶57-58), जहां कलाकार इनपुट प्रश्न पर अपने विचार प्रस्तुत करते हैं:


“स्थिरता को खत्म कर दिया गया, और इस तरह वेबसाइटों से पांच अरब से अधिक छवियों की प्रतिलिपि बनाई गई, क्योंकि प्रशिक्षण छवियों का उपयोग स्थिर प्रसार के लिए प्रशिक्षण डेटा के रूप में किया गया था।


स्थिरता ने प्रशिक्षण छवियों के रचनाकारों या उन्हें होस्ट करने वाली वेबसाइटों से सहमति नहीं मांगी, जहां से उन्हें स्क्रैप किया गया था।


स्थिरता ने किसी भी प्रशिक्षण छवि के लिए लाइसेंस पर बातचीत करने का प्रयास नहीं किया। स्थिरता ने उन्हें बस ले लिया। स्थिरता ने स्थिर प्रसार के भीतर प्रशिक्षण छवियों की संपीड़ित प्रतियों को एम्बेड और संग्रहीत किया है।


स्थिर प्रसार के पहले संस्करण को "के साथ प्रशिक्षित किया गया था" क्लिप-फ़िल्टर किया गया सार्वजनिक डेटाबेस LAION-5B से छवि-पाठ जोड़े।


LAION-5B में लगभग 5.85 बिलियन छवियों की जानकारी है और यह अपनी तरह का सबसे बड़ा डेटाबेस है। इसे जर्मन गैर-लाभकारी संगठन LAION (बड़े पैमाने पर आर्टिफिशियल इंटेलिजेंस ओपन नेटवर्क का संक्षिप्त रूप) द्वारा विकसित किया गया था, और स्टेबिलिटी AI ने इसके विकास को वित्तपोषित करने में मदद की।


यह ध्यान रखना महत्वपूर्ण है कि LAION-5B में कोई वास्तविक छवियाँ संग्रहीत नहीं हैं। इसके बजाय, प्रत्येक छवि के बारे में जानकारी संग्रहीत की जाती है और इसमें निम्न शामिल हैं:


  • छवि की वेबसाइट का एक यूआरएल लिंक
  • छवि क्या दर्शाती है इसका एक संक्षिप्त पाठ विवरण
  • छवि की ऊंचाई और चौड़ाई
  • अन्य छवियों से कथित समानता
  • यह कितनी संभावना है कि छवि "असुरक्षित" है (अश्लील/NSFW) का संभाव्यता स्कोर
  • यह कितनी संभावना है कि छवि पर वॉटरमार्क है, इसका संभाव्यता स्कोर


इसलिए कलाकारों का दावा है कि स्टेबल डिफ्यूज़न उनकी कला की "संपीड़ित प्रतियों को संग्रहीत करता है" एक मिथ्या नाम है। वास्तव में, स्टेबल डिफ्यूजन के प्रशिक्षण डेटासेट में कुछ कलाकारों की छवियों के बारे में मेटाडेटा शामिल है, और वह मेटाडेटा अपने आप में कॉपीराइट संरक्षित नहीं है।


उसी तरह Spotify पर एक गाना कॉपीराइट-सुरक्षित है, लेकिन इसके बारे में मेटाडेटा जैसे कलाकार का नाम, गीत का शीर्षक, निर्माता, रिलीज़ की तारीख, शैली और ट्रैक अवधि नहीं है। ऐसा इसलिए है क्योंकि इस डेटा को पुनः प्राप्त करना पूरी तरह से एक यांत्रिक प्रक्रिया है जिसके लिए किसी रचनात्मक प्रयास की आवश्यकता नहीं होती है।


एक सार्वजनिक डेटासेट के रूप में, LAION-5B की जांच कोई भी इच्छुक व्यक्ति कर सकता है। कंपनी उत्पन्न करने वाला ने एक खोज उपकरण बनाया है hasibeentrained.com जहां लोग LAION-5B के माध्यम से खोज कर देख सकते हैं कि क्या उनकी छवियां डेटासेट में शामिल हैं।


तीन कलाकारों, सारा एंडरसन, केली मैककर्नन और कार्ला ऑर्टिज़ ने यही किया, और उन्होंने क्रमशः 200 से अधिक, 30 से अधिक और अपने काम के 12 से अधिक प्रतिनिधित्व पाए।


विशेष रूप से, प्रारंभ में स्थिर प्रसार था 2.3 बिलियन छवियों के साथ प्रशिक्षित LAION-5B के एक उपसमूह से जिसे LAION-2B-EN कहा जाता है, जिसमें केवल अंग्रेजी में पाठ विवरण वाली छवियां शामिल हैं।


स्टेबल डिफ्यूज़न प्रशिक्षण डेटा के आकार को ध्यान में रखते हुए, तीन कलाकारों द्वारा किया गया अनजाने योगदान विशाल महासागर में छोटी बूंदें हैं।


इसकी तुलना में, गेटी इमेजेज ने स्टेबिलिटी एआई के खिलाफ मुकदमा दायर किया है उनके संग्रह से 12 मिलियन से अधिक तस्वीरें जो अभी भी संपूर्ण डेटासेट का एक छोटा सा हिस्सा है।


सभी कलाकारों के कार्यों में से केवल 16 छवियों को सारा एंडरसन द्वारा अमेरिकी कॉपीराइट कार्यालय में पंजीकृत किया गया है।


यह 17 यूएससी § 411(ए) का अनुसरण करता है, कि " किसी भी संयुक्त राज्य अमेरिका के काम में कॉपीराइट के उल्लंघन के लिए कोई नागरिक कार्रवाई तब तक शुरू नहीं की जाएगी जब तक कि कॉपीराइट दावे का पूर्व-पंजीकरण या पंजीकरण नहीं किया गया हो (..)"।


दूसरे शब्दों में, यदि कोई कार्य अमेरिकी कॉपीराइट कार्यालय में पंजीकृत नहीं है, तो अधिकार धारक आम तौर पर नागरिक मुकदमे में उल्लंघन का दावा नहीं कर सकता है। इसका मतलब यह है कि कलाकार केवल सारा एंडरसन के स्वामित्व और पंजीकृत 16 कार्यों की ओर से दावा कर सकते हैं।


यदि कलाकार यह साबित कर सकें कि स्टेबल डिफ्यूजन कभी-कभी ऐसे आउटपुट उत्पन्न कर सकता है जो इन 16 छवियों में से किसी एक से मिलता जुलता हो, तो कलाकार शायद "आउटपुट प्रश्न" से संबंधित मामला बना सकते हैं। लेकिन जैसा कि हम देखेंगे, वे ऐसा करने में असमर्थ हैं।

आउटपुट प्रश्न

आउटपुट प्रश्न के संबंध में, कलाकारों का सुझाव है कि स्टेबल डिफ्यूजन द्वारा उत्पन्न प्रत्येक आउटपुट अनिवार्य रूप से उसके प्रशिक्षण डेटा से प्राप्त होता है और इस प्रकार कॉपीराइट का उल्लंघन होता है (देखें ¶94-95)। यह कानूनी सिद्धांत अत्यंत दूरगामी है।


नीचे कानून के प्रोफेसर मैथ्यू सैग के पेपर का एक उदाहरण दिया गया है " जेनरेटिव एआई के लिए कॉपीराइट सुरक्षा बाईं ओर की 15 छवियां "सफेद", "कॉफी" और "कप" टैग के साथ स्टेबल डिफ्यूजन प्रशिक्षण डेटा से हैं।


दाईं ओर की छवियां स्टेबल डिफ्यूजन द्वारा टेक्स्ट प्रॉम्प्ट "सफेद पृष्ठभूमि पर कॉफी कप" के साथ तैयार की गई थीं। कलाकारों के तर्क के अनुसार, दाईं ओर की सभी छवियां बाईं ओर की छवियों के कॉपीराइट का उल्लंघन करेंगी।


हालाँकि छवियाँ स्पष्ट रूप से काफी हद तक समान नहीं दिखती हैं।

कुछ दुर्लभ परिस्थितियों में, यह सिद्ध हो चुका है कि स्टेबल डिफ्यूजन वास्तव में आउटपुट छवियां उत्पन्न कर सकता है जो इसके प्रशिक्षण डेटासेट से छवियों के समान दिखती हैं।


ऐसा विशेष रूप से तब होने की संभावना है जब इनपुट प्रशिक्षण छवि इंटरनेट पर व्यापक रूप से वितरित की जाती है और स्टेबल डिफ्यूजन के प्रशिक्षण डेटा में बार-बार दिखाई देती है।


शीर्षक वाले एक हालिया पेपर में प्रसार मॉडल से प्रशिक्षण डेटा निकालना, निकोलस कार्लिनी और उनके सह-लेखकों ने स्टेबल डिफ्यूज़न प्रशिक्षण डेटा में सबसे अधिक डुप्लिकेट की गई 350,000 छवियों की पहचान की।


इसके बाद, उन्होंने प्रत्येक प्रशिक्षण डेटा छवि से जुड़े पाठ विवरण के समान पाठ संकेतों के साथ स्थिर प्रसार के माध्यम से 500 नई छवियां तैयार कीं।


जैसा कि यह निकला, 175 मिलियन छवियों (350.000*500) में से, केवल 109 छवियों (0.03%) को उचित रूप से "निकट-प्रतिलिपि" माना जा सकता है।


जिससे, कॉपीराइट का उल्लंघन हो सकता है, लेकिन कलाकार इस बात का कोई उदाहरण नहीं देते हैं कि स्टेबल डिफ्यूजन ने उनके काम की नकल कैसे की है। इसके विपरीत, वे शिकायत ¶ 93 में लिखते हैं:


“सामान्य तौर पर, किसी विशेष टेक्स्ट प्रॉम्प्ट के जवाब में प्रदान की गई स्थिर प्रसार आउटपुट छवियों में से कोई भी प्रशिक्षण डेटा में किसी भी विशिष्ट छवि के साथ करीबी मैच होने की संभावना नहीं है।


कलाकार दावा करते हैं कि स्टेबल डिफ्यूजन उनकी व्यक्तिगत कलात्मक शैलियों की नकल करने में सक्षम है। आम तौर पर, एक "कलात्मक शैली" कॉपीराइट संरक्षण के अधीन नहीं हो सकती। उल्लंघन के दावों को हमेशा विशिष्ट कार्यों के उल्लंघन से जोड़ा जाना चाहिए।


हालाँकि, यहाँ एक वैध मुद्दा है जो प्राप्त हुआ है उचित मात्रा में जनता का ध्यान। जेनरेटिव एआई मॉडल प्रसिद्ध कलाकारों की विशिष्ट शैलियों को सेकंडों में, अनिश्चित काल तक और लगभग शून्य लागत के साथ कॉपी कर सकते हैं।


इस समस्या को हल करने के लिए, स्टेबिलिटी एआई ने अपने डेटासेट में लेबल से प्रसिद्ध कलाकारों के नाम हटा दिए पिछले साल नवंबर अपग्रेड के एक भाग के रूप में . इसका मतलब यह है कि स्टेबल डिफ्यूजन अब लोगों की कलात्मक शैलियों की नकल नहीं कर सकता है।


उदाहरण के लिए, यदि आप स्टेबल डिफ्यूजन को पिकासो या रेम्ब्रांट की शैली में एक छवि बनाने के लिए कहते हैं तो यह अब ऐसा करने में सक्षम नहीं है। यह बदलाव क्लास-एक्शन शिकायत से दो महीने पहले शुरू किया गया था।


कुल मिलाकर, यह स्पष्ट नहीं है कि कलाकार कैसे और क्यों मानते हैं कि स्टेबल डिफ्यूज़न उनके काम की नकल करता है। कलाकार इस बात से अधिक चिंतित हैं कि स्टेबल डिफ्यूज़न भविष्य में उनकी नौकरियों को कैसे खतरे में डाल सकता है , और इस बात से कम चिंतित हैं कि स्टेबल डिफ्यूज़न वास्तव में अब कैसे काम करता है।


तीन कलाकारों में से एक, सारा एंडरसन ने लिखा एनवाई टाइम्स का एक लेख पिछले साल दिसंबर से:


"मैं कई जनरेटरों के साथ खेल रहा हूं, और अब तक किसी ने भी मेरी शैली की इस तरह से नकल नहीं की है जो सीधे तौर पर मेरे करियर को खतरे में डाल सके, यह तथ्य लगभग निश्चित रूप से बदल जाएगा क्योंकि एआई में सुधार जारी रहेगा।"


नीचे लेख से दो चित्रण हैं, एक सारा एंडरसन द्वारा और एक स्टेबल डिफ्यूजन द्वारा। आप शायद अनुमान लगा सकते हैं कि कौन सा किसने बनाया था।

समापन विचार

दिसंबर 2022 में, स्थिरता एआई की घोषणा की गई उन्होंने इसके पीछे की कंपनी स्पॉनिंग के साथ साझेदारी की थी hasibeentrained.com , और अब कलाकारों को स्टेबल डिफ्यूजन के अगले संस्करण के लिए प्रशिक्षण सामग्री के रूप में अपने काम का उपयोग करने या उससे बाहर निकलने का विकल्प प्रदान करेगा।


हालाँकि पहल पूर्ण नहीं हो सकता , यह किसी भी कलाकार के लिए सही दिशा में एक कदम माना जा सकता है जो अपने काम को बड़े फाउंडेशन मॉडलों को खिलाने के बारे में चिंतित है।


वर्ग-कार्रवाई मुकदमे से पहले, कार्ला ऑर्टिज़ ने एमआईटी टेक्नोलॉजी रिव्यू से बात की नए ऑप्ट-आउट फ़ंक्शन के बारे में, और उसने नहीं सोचा था कि स्थिरता AI बहुत आगे तक गई है:


"केवल एक चीज जो Stability.AI कर सकता है वह है एल्गोरिथम डिस्गोर्जमेंट जहां वे अपने डेटाबेस को पूरी तरह से नष्ट कर देते हैं और वे उन सभी मॉडलों को भी पूरी तरह से नष्ट कर देते हैं जिनमें हमारा सारा डेटा होता है"


यह कथन बहुत ही अर्थपूर्ण है. क्लास-एक्शन कानून के पीछे के तीन कलाकार, मैथ्यू बटरिक और उनके बाकी कानूनी प्रतिनिधित्व के साथ, कलाकार के अधिकारों के लिए खड़े होने का दिखावा करते हैं, लेकिन वे वास्तव में आधुनिक हैं Luddites .