Năm 1859, nhà thơ Pháp
Năm 1906,
Trong thế kỷ qua,
Tua nhanh đến năm 2023, chúng ta có cái gọi là trí tuệ nhân tạo. Nó có thể tạo văn bản, hình ảnh, video và nhạc từ lời nhắc văn bản một cách liền mạch và trong vài giây. Nhiều nghệ sĩ lo ngại.
Ba nghệ sĩ thị giác độc lập – Sarah Andersen, Kelly Mckernan và Karla Ortiz – đã tiến xa đến mức nộp hồ sơ
Matthew Butterick đã là một nhân vật được biết đến trong “cuộc chiến bản quyền hợp pháp chống lại AI” từ
Tuy nhiên, khiếu nại của nguyên đơn được xây dựng trên phạm vi rộng và về cơ bản là tiếp nhận mọi mô hình AI tổng quát được đào tạo dựa trên dữ liệu có bản quyền - tất cả đều là những mô hình lớn và với số lượng khổng lồ.
Trên thực tế, nếu tòa án liên bang San Francisco quyết định xét xử vụ án vào ngày 19 tháng 7, bất chấp
Nhìn chung, bộ ba nghệ sĩ đứng sau vụ kiện tập thể đang cố gắng đưa ra câu trả lời "có" cho hai câu hỏi khó về bản quyền mà các mô hình AI tổng quát đưa ra - một liên quan đến đầu vào và một liên quan đến đầu ra:
Tôi không phải là chuyên gia về luật bản quyền của Hoa Kỳ, chỉ là một người quan sát có quan điểm trung lập về các câu hỏi. Dựa trên nghiên cứu của mình, tôi tin rằng câu trả lời cho câu hỏi đầu tiên là "không", trong khi câu hỏi thứ hai khó trả lời hơn và có thể phụ thuộc vào đánh giá từng trường hợp.
Tôi thực sự nghi ngờ rằng vụ kiện tập thể này sẽ cung cấp cho chúng tôi bất kỳ câu trả lời nào.
Một trường hợp bản quyền đang chờ xử lý khác liên quan đến việc sử dụng và phân phối hình ảnh của Stable Diffusion
Theo quan điểm của tôi, vụ kiện từ Getty Images có cơ hội tốt hơn nhiều để ra tòa và góp phần hiểu biết pháp lý về bản quyền so với AI tổng quát.
Sự khác biệt chính trong một câu: vụ kiện Getty Images được ghi lại tốt hơn. Getty Images có thể chứng minh quyền của họ và chỉ ra những vi phạm cụ thể đối với quyền của họ, trong khi các nghệ sĩ đứng sau vụ kiện tập thể thì không thể.
Rất tiếc, khiếu nại về vụ kiện tập thể của các nghệ sĩ chứa đầy những lỗi cơ bản và những giả định sai lầm về cách Đào tạo Khuếch tán Ổn định và cách mô hình tạo ra hình ảnh.
Một nhóm những người đam mê công nghệ đã tạo một trang web http://www.stablediffusionfrivolous.com/ nơi họ chỉ ra một số điểm không chính xác về kỹ thuật trong đơn khiếu nại.
Ở đây, tôi sẽ tập trung vào cách các nghệ sĩ giải quyết, hay đúng hơn là không giải quyết được hai câu hỏi pháp lý như đã nêu ở trên.
Đây là một trích dẫn từ đơn khiếu nại (¶57-58), trong đó các nghệ sĩ đưa ra quan điểm của họ về câu hỏi đầu vào:
“Tính ổn định đã được loại bỏ và do đó đã sao chép hơn năm tỷ hình ảnh từ các trang web dưới dạng Hình ảnh đào tạo được sử dụng làm dữ liệu đào tạo cho Khuếch tán ổn định.
Sự ổn định đã không tìm kiếm sự đồng ý từ những người tạo Hình ảnh đào tạo hoặc các trang web lưu trữ chúng mà chúng được lấy từ đó.
Sự ổn định đã không cố gắng đàm phán giấy phép cho bất kỳ Hình ảnh đào tạo nào. Sự ổn định chỉ đơn giản là lấy chúng. Tính ổn định đã nhúng và lưu trữ các bản sao nén của Hình ảnh Huấn luyện trong Khuếch tán Ổn định.”
Phiên bản đầu tiên của Khuếch tán ổn định đã được huấn luyện với “
LAION-5B chứa thông tin về 5,85 tỷ hình ảnh và là cơ sở dữ liệu lớn nhất thuộc loại này. Nó được phát triển bởi tổ chức phi lợi nhuận LAION của Đức (từ viết tắt của Mạng mở trí tuệ nhân tạo quy mô lớn) và AI ổn định đã giúp tài trợ cho sự phát triển của nó.
Điều quan trọng cần lưu ý là không có bất kỳ hình ảnh thực tế nào được lưu trữ trong LAION-5B. Thay vào đó, thông tin về mỗi hình ảnh được lưu trữ và bao gồm:
Do đó, tuyên bố của các nghệ sĩ rằng Stable Diffusion “lưu trữ các bản sao nén” tác phẩm nghệ thuật của họ là một cách gọi sai. Trên thực tế, bộ dữ liệu đào tạo của Stable Diffusion bao gồm siêu dữ liệu về một số hình ảnh của nghệ sĩ và bản thân siêu dữ liệu đó không được bảo vệ bản quyền.
Tương tự, một bài hát trên Spotify được bảo vệ bản quyền nhưng siêu dữ liệu về bài hát đó như tên nghệ sĩ, tên bài hát, nhà sản xuất, ngày phát hành, thể loại và thời lượng bản nhạc thì không. Đó là bởi vì việc truy xuất dữ liệu này là một quá trình hoàn toàn máy móc, không đòi hỏi bất kỳ nỗ lực sáng tạo nào.
Là một bộ dữ liệu công khai, LAION-5B có thể được kiểm tra bởi bất kỳ ai quan tâm. Công ty
Đây là điều mà ba nghệ sĩ, Sarah Andersen, Kelly McKernan và Karla Ortiz đã làm, và họ lần lượt tìm thấy hơn 200, hơn 30 và hơn 12 bản trình bày tác phẩm của họ.
Cụ thể, khuếch tán ổn định ban đầu được
Xem xét kích thước của dữ liệu đào tạo Khuếch tán ổn định, những đóng góp vô tình của ba nghệ sĩ chỉ là những giọt nước nhỏ trong một đại dương rộng lớn.
Để so sánh, vụ kiện Getty Images chống lại Stability AI có liên quan
Trong số tất cả các tác phẩm của các nghệ sĩ, chỉ có 16 hình ảnh đã được đăng ký với văn phòng bản quyền Hoa Kỳ bởi Sarah Andersen.
Nó tuân theo 17 USC § 411(a), rằng “ không có vụ kiện dân sự nào đối với hành vi vi phạm bản quyền đối với bất kỳ tác phẩm nào của Hoa Kỳ sẽ được tiến hành cho đến khi việc đăng ký trước hoặc đăng ký khiếu nại bản quyền được thực hiện (..)”.
Nói cách khác, nếu một tác phẩm không được đăng ký với văn phòng bản quyền Hoa Kỳ, chủ sở hữu quyền nói chung không thể khiếu nại hành vi vi phạm trong một vụ kiện dân sự. Điều này có nghĩa là các nghệ sĩ chỉ có thể đưa ra yêu cầu thay mặt cho 16 tác phẩm do Sarah Andersen sở hữu và đăng ký.
Giá mà các nghệ sĩ có thể chứng minh rằng Stable Diffusion đôi khi có thể tạo ra đầu ra giống với bất kỳ hình ảnh nào trong số 16 hình ảnh này, thì có lẽ các nghệ sĩ có thể đưa ra một trường hợp liên quan đến “câu hỏi về đầu ra”. Nhưng như chúng ta sẽ thấy, họ không thể làm như vậy.
Liên quan đến câu hỏi đầu ra, các nghệ sĩ gợi ý rằng mọi đầu ra mà Stable Diffusion tạo ra về cơ bản đều bắt nguồn từ dữ liệu đào tạo của nó và do đó vi phạm bản quyền (xem ¶94-95). Lý thuyết pháp lý này là vô cùng xa vời.
Dưới đây là hình minh họa từ bài báo của giáo sư luật Matthew Sag “
Các hình ảnh bên phải được tạo bởi Khuếch tán ổn định với lời nhắc văn bản "cốc cà phê trên nền trắng". Theo logic của các nghệ sĩ, tất cả các hình ảnh bên phải sẽ vi phạm bản quyền của các hình ảnh bên trái.
Mặc dù các hình ảnh rõ ràng trông không giống nhau về cơ bản.
Trong một số điều kiện hiếm gặp nhất định, trên thực tế, người ta đã chứng minh rằng Khuếch tán ổn định có thể tạo ra hình ảnh đầu ra trông rất giống với hình ảnh từ tập dữ liệu đào tạo của nó.
Điều này đặc biệt có thể xảy ra khi hình ảnh đào tạo đầu vào được phân phối rộng rãi trên internet và lặp đi lặp lại trong dữ liệu đào tạo của Khuếch tán ổn định.
Trong một bài báo gần đây có tiêu đề
Sau đó, họ đã tạo 500 hình ảnh mới thông qua Khuếch tán ổn định với lời nhắc văn bản giống hệt với mô tả văn bản được liên kết với từng hình ảnh dữ liệu đào tạo.
Hóa ra, trong số 175 triệu ảnh (350.000*500), chỉ có 109 ảnh (0,03%) có thể được coi là "gần như bản sao".
Do đó, vi phạm bản quyền có thể xảy ra, nhưng các nghệ sĩ không đưa ra bất kỳ ví dụ nào về việc Stable Diffusion đã sao chép tác phẩm của họ như thế nào. Ngược lại, họ viết trong đơn khiếu nại ¶ 93:
“ Nói chung, không có hình ảnh đầu ra Khuếch tán ổn định nào được cung cấp để phản hồi một Lời nhắc văn bản cụ thể có khả năng phù hợp chặt chẽ với bất kỳ hình ảnh cụ thể nào trong dữ liệu đào tạo. ”
Các nghệ sĩ khẳng định rằng Stable Diffusion có thể bắt chước phong cách nghệ thuật cá nhân của họ. Thông thường, một “phong cách nghệ thuật” không thể được bảo vệ bản quyền. Khiếu nại vi phạm luôn phải gắn với hành vi xâm phạm tác phẩm cụ thể.
Tuy nhiên, có một vấn đề chính đáng ở đây đã nhận được
Để giải quyết vấn đề này, Stability AI đã xóa tên của các nghệ sĩ nổi tiếng khỏi nhãn trong tập dữ liệu của họ
Ví dụ: nếu bạn yêu cầu Stable Diffusion tạo một hình ảnh theo phong cách của Picasso hoặc Rembrandt thì bạn không thể làm như vậy nữa. Sự thay đổi đã được bắt đầu hai tháng trước khi khiếu nại tập thể.
Nhìn chung, không rõ làm thế nào và tại sao các nghệ sĩ tin rằng Stable Diffusion sao chép tác phẩm của họ. Các nghệ sĩ dường như quan tâm nhiều hơn đến việc Khuếch tán ổn định có thể đe dọa công việc của họ như thế nào trong tương lai và ít quan tâm hơn đến việc Khuếch tán ổn định thực sự hoạt động như thế nào ở hiện tại.
Một trong ba nghệ sĩ, Sarah Andersen, đã viết trong
“Tôi đã thử nghiệm với một số máy phát điện và cho đến nay chưa có máy nào bắt chước phong cách của tôi theo cách có thể đe dọa trực tiếp đến sự nghiệp của tôi, một thực tế gần như chắc chắn sẽ thay đổi khi AI tiếp tục được cải thiện.”
Dưới đây là hai hình minh họa từ bài viết, một của Sarah Andersen và một của Stable Diffusion. Bạn có thể đoán cái nào được tạo ra bởi ai.
Vào tháng 12 năm 2022,
Mặc dù sáng kiến
Trước vụ kiện tập thể,
“Điều duy nhất mà Stability.AI có thể làm là phân rã theo thuật toán, nơi chúng phá hủy hoàn toàn cơ sở dữ liệu của chúng và chúng phá hủy hoàn toàn tất cả các mô hình có tất cả dữ liệu của chúng tôi trong đó”
Tuyên bố này là rất nói. Ba nghệ sĩ đứng sau luật khởi kiện tập thể, cùng với Matthew Butterick và phần còn lại của đại diện pháp lý của họ, giả vờ bảo vệ quyền lợi của nghệ sĩ, nhưng thực tế họ là người thời hiện đại.