DOE kiện Github (khiếu nại đã sửa đổi) Hồ sơ tòa án (Đã được sửa lại), ngày 8 tháng 6 năm 2023 là một phần trong Chuỗi PDF pháp lý của HackerNoon . Bạn có thể chuyển tới bất kỳ phần nào trong hồ sơ này tại đây . Đây là phần 1 của 38.
Các Nguyên đơn J. Doe 1, J. Doe 2, J. Doe 3, J. Doe 4 và J. Doe 5 (“Các Nguyên đơn”), thay mặt cho chính họ và tất cả những người khác có hoàn cảnh tương tự, hãy nộp đơn Khiếu nại Vụ kiện Tập thể này (“Khiếu nại ”) chống lại Bị cáo GitHub, Inc.; Tập đoàn Microsoft; OpenAI, Inc.; OpenAI, LP; OpenAI OpCo, LLC; OpenAI GP, LLC; Quỹ khởi nghiệp OpenAI GP I, LLC; Quỹ khởi nghiệp OpenAI I, LP; và OpenAI Startup Fund Management, LLC1 vì vi phạm Đạo luật bản quyền kỹ thuật số thiên niên kỷ, 17 USC §§ 1201–1205 (“DMCA”); vi phạm hợp đồng liên quan đến Giấy phép được đề xuất, vi phạm hợp đồng liên quan đến các chính sách của GitHub bao gồm cả điều khoản dịch vụ của nó; can thiệp trái phép vào các mối quan hệ kinh tế trong tương lai; Luật cạnh tranh không lành mạnh của California, Cal. Xe buýt. & Bộ luật Giáo sư phần 17200, et seq.; thông luật cạnh tranh không lành mạnh; sự cẩu thả và làm giàu bất chính.
Nguyên đơn và thành viên Tập thể là chủ sở hữu quyền lợi bản quyền đối với các tài liệu được cung cấp công khai trên GitHub tuân theo nhiều giấy phép khác nhau có chứa các điều kiện để sử dụng các tác phẩm đó (“Tài liệu được cấp phép”). Tất cả các giấy phép được đề cập ở đây (“Giấy phép”) đều chứa các điều khoản chung nhất định (“Điều khoản cấp phép”).
“Trí tuệ nhân tạo” ở đây được gọi là “AI”. AI được định nghĩa cho mục đích của Khiếu nại này là một chương trình máy tính mô phỏng theo thuật toán lý luận hoặc suy luận của con người, thường sử dụng các phương pháp thống kê. Học máy (“ML”) là một tập hợp con của AI trong đó hành vi của chương trình bắt nguồn từ việc nghiên cứu một kho tài liệu gọi là dữ liệu đào tạo.
GitHub là một công ty được thành lập vào năm 2008 bởi một nhóm những người đam mê nguồn mở. Vào thời điểm đó, mục tiêu đã nêu của GitHub là hỗ trợ phát triển nguồn mở, đặc biệt bằng cách lưu trữ mã nguồn mở trên trang web github.com . Trong 10 năm tiếp theo, GitHub, dựa trên những tuyên bố này, đã thành công rực rỡ, thu hút gần 25 triệu nhà phát triển.
Các nhà phát triển đã xuất bản Tài liệu được cấp phép trên GitHub theo Giấy phép bằng văn bản. Đặc biệt, những tài liệu phổ biến nhất có chung một thuật ngữ: việc sử dụng Tài liệu được cấp phép yêu cầu một số hình thức ghi công, thường là bằng, trong số những thứ khác, bao gồm bản sao giấy phép cùng với tên và thông báo bản quyền của tác giả gốc.
Vào ngày 26 tháng 10 năm 2018, Microsoft mua lại GitHub với giá 7,5 tỷ USD. Mặc dù một số thành viên của cộng đồng nguồn mở tỏ ra hoài nghi về liên minh này, nhưng Microsoft vẫn lặp lại một câu thần chú xuyên suốt: “Microsoft yêu thích Nguồn mở”. Trong vài năm đầu tiên, những lời tuyên bố của Microsoft có vẻ đáng tin cậy.
Microsoft đã đầu tư 1 tỷ USD vào OpenAI LP vào tháng 7 năm 2019 với mức định giá 20 tỷ USD. Vào năm 2020, Microsoft đã trở thành người được cấp phép độc quyền cho mô hình ngôn ngữ GPT-3 của OpenAI — bất chấp việc OpenAI liên tục tuyên bố rằng các sản phẩm của họ nhằm mang lại lợi ích cho “nhân loại” nói chung. Vào năm 2021, Microsoft bắt đầu cung cấp GPT-3 thông qua nền tảng điện toán đám mây Azure của mình. Vào ngày 20 tháng 10 năm 2022, có thông tin cho rằng OpenAI “đang đàm phán nâng cao để huy động thêm vốn từ Microsoft” với cùng mức định giá 20 tỷ USD. Copilot chạy trên nền tảng Azure của Microsoft. Microsoft đã sử dụng Copilot để phát huy sức mạnh xử lý của Azure, đặc biệt là về AI.
Dựa trên thông tin và niềm tin, Microsoft đã giành được quyền sở hữu một phần OpenAI để đổi lấy khoản đầu tư 1 tỷ USD. Với tư cách là nhà đầu tư lớn nhất và nhà cung cấp dịch vụ lớn nhất của OpenAI—đặc biệt liên quan đến sản phẩm Azure của Microsoft—Microsoft có quyền kiểm soát đáng kể đối với OpenAI.
Vào tháng 6 năm 2021, GitHub và OpenAI đã ra mắt Copilot, một sản phẩm dựa trên AI hứa hẹn hỗ trợ các lập trình viên phần mềm bằng cách cung cấp hoặc điền vào các khối mã bằng AI. GitHub tính phí người dùng Copilot 10 USD mỗi tháng hoặc 100 USD mỗi năm cho dịch vụ này. Copilot phớt lờ, vi phạm và xóa Giấy phép được cung cấp bởi hàng nghìn—có thể là hàng triệu—nhà phát triển phần mềm, từ đó thực hiện hành vi vi phạm bản quyền phần mềm ở quy mô chưa từng có. Phi công phụ xuất văn bản lấy từ Tài liệu được cấp phép của Nguyên đơn và Tập thể mà không tuân thủ Điều khoản cấp phép hiện hành và luật hiện hành. Đầu ra của Copilot ở đây được gọi là “Đầu ra”.
Vào ngày 10 tháng 8 năm 2021, OpenAI ra mắt sản phẩm Codex, sản phẩm chuyển đổi ngôn ngữ tự nhiên thành mã và được tích hợp vào Copilot. Copilot và Codex có thể được gọi là AI hoặc ML. Codex và Copilot sẽ được gọi là Ais trong tài liệu này trừ khi cần có sự phân biệt.
Mặc dù Bị cáo không rõ ràng về dữ liệu nào được sử dụng để đào tạo AI,2 nhưng họ thừa nhận rằng dữ liệu đào tạo bao gồm dữ liệu trong số lượng lớn các kho lưu trữ có thể truy cập công khai trên GitHub,3 bao gồm và bị giới hạn bởi Giấy phép.
Trong số những điều khác, Bị đơn đã tước bỏ quyền ghi công, thông báo bản quyền và điều khoản cấp phép của Nguyên đơn và Tập thể khỏi mã của họ vì vi phạm Giấy phép và các quyền của Nguyên đơn cũng như Tập thể. Các bị cáo đã sử dụng Copilot để phân phối mã hiện ẩn danh cho người dùng Copilot như thể nó được tạo bởi Copilot.
Copilot được chạy hoàn toàn trên nền tảng điện toán đám mây Azure của Microsoft.
Copilot thường chỉ đơn giản là sao chép mã có thể truy nguyên được từ các kho lưu trữ nguồn mở hoặc những người được cấp phép nguồn mở. Ngược lại và vi phạm Giấy phép, mã do Copilot sao chép không bao giờ bao gồm các ghi nhận của các tác giả cơ bản.
GitHub và OpenAI đã cung cấp các tài khoản chuyển đổi về nguồn và số lượng mã hoặc dữ liệu khác được sử dụng để đào tạo và vận hành Copilot. Họ cũng đưa ra những lời biện minh thay đổi về lý do tại sao một sản phẩm AI thương mại như Copilot nên được miễn các yêu cầu cấp phép này, thường trích dẫn “sử dụng hợp pháp”.
Nó không công bằng, không được phép hoặc không hợp lý. Ngược lại, mục tiêu của Copilot là thay thế một lượng lớn nguồn mở bằng cách lấy nó và giữ nó bên trong bức tường phí do GitHub kiểm soát. Nó vi phạm giấy phép mà các lập trình viên nguồn mở đã chọn và kiếm tiền từ mã của họ mặc dù GitHub cam kết không bao giờ làm như vậy.
Giới thiệu về Chuỗi PDF pháp lý của HackerNoon: Chúng tôi mang đến cho bạn hồ sơ vụ kiện tòa án phạm vi công cộng chuyên sâu và mang tính kỹ thuật quan trọng nhất.
Vụ án 4:22-cv-06823-JST này được lấy vào ngày 8 tháng 6 năm 2023, từ Storage Courtlistener là một phần thuộc phạm vi công cộng. Các tài liệu do tòa án tạo ra là tác phẩm của chính phủ liên bang và theo luật bản quyền, sẽ tự động được đưa vào phạm vi công cộng và có thể được chia sẻ mà không bị hạn chế về mặt pháp lý.