Trở thành một LLM như thế nào?: Một thử nghiệm tư duy về giới hạn của sự hiểu biết về AI

Gần đây, tôi đã cho ai đó xem bản demo của một phần mềm dựa trên AI mà tôi đã viết. “Điều đó thật tuyệt,” anh nói, “nhưng làm sao tôi biết nó không chuyển tiếp thông tin của tôi cho một kẻ độc tài độc ác?” Hiện tại tôi khá bối rối trước câu hỏi này. Rốt cuộc, tôi chỉ sử dụng LLM (Mô hình ngôn ngữ lớn) để tạo một số văn bản. Nhưng khi suy ngẫm lại, tôi nhận ra rằng điều người này hỏi thể hiện một quan điểm chung: LLM có thể tạo ra văn bản (trong nhiều trường hợp) không thể phân biệt được với văn bản mà con người sẽ tạo ra. Điều đó khiến chúng tôi suy luận rằng có lẽ LLM có một mức độ đại diện (nghĩa là khả năng hành động tự do trên thế giới). Ví dụ, nó có thể quyết định gửi thông tin cá nhân của tôi cho người khác.

Mặc dù một cách để chống lại quan niệm sai lầm này có thể là đưa ra lời giải thích kỹ thuật đầy sắc thái về cách hoạt động của AI, nhưng tôi không chắc hầu hết người nghe sẽ mất ngủ đủ lâu để hiểu. Tuy nhiên, nền tảng triết học của tôi gợi ý một con đường khác: Một thử nghiệm tư tưởng triết học.

Cho phép tôi giới thiệu Hộp Tối.

Thí nghiệm tư tưởng triết học

Thí nghiệm tư duy triết học là một công cụ phổ biến mà các nhà triết học sử dụng để đặt ra những câu hỏi quan trọng về lý luận của chúng ta. Vào những năm 1700, René Descartes đã hỏi liệu có lẽ ông thực sự không phải là một con người trên thế giới mà là một linh hồn quái dị bị tra tấn bởi một kẻ lừa dối độc ác (một ý tưởng mà sau này trở thành tiền đề cho các bộ phim The Matrix). Thí nghiệm tưởng tượng của Descartes được thiết kế để giúp chúng ta hỏi xem chúng ta thực sự biết gì về thế giới. Có một loạt các ví dụ khác. Bài toán xe đẩy tập trung sự chú ý vào trực giác đạo đức của chúng ta. Các ví dụ của Gettier thách thức chúng ta đặt câu hỏi làm thế nào chúng ta đi từ niềm tin đến kiến thức. Bài toán Sorites buộc chúng ta phải thử thách cách chúng ta phân biệt các nhóm và cá nhân.

Trong tất cả các trường hợp này, các thí nghiệm yêu cầu chúng ta bước vào một tình huống, dù khó có thể xảy ra đến đâu, và tưởng tượng xem chúng ta sẽ suy luận như thế nào.

Có lẽ việc xây dựng loại thử nghiệm tư duy này có thể giúp chúng ta tách biệt sự thật khỏi hư cấu trong thế giới AI sáng tạo mới đầy dũng cảm này.

Tuyên bố từ chối trách nhiệm nhanh: Đó là về khả năng tưởng tượng

Điều này có vẻ hiển nhiên đối với một số người, nhưng khi dạy triết học, tôi thường gặp câu hỏi này của học sinh: “Nhưng tại sao lại có người làm hoặc tin điều này?” Trong bài toán xe điện, tại sao mọi người lại đứng loanh quanh trên đường ray? Descartes có bằng chứng gì về một sinh vật lừa dối và độc ác? Tại sao lại có người đếm từng hạt cát thành một đống?

Những câu hỏi như thế này hiểu sai mục đích của một thí nghiệm tư duy. Một thí nghiệm tư duy triết học không nhằm mục đích mô tả một tình huống có thật hoặc có thể xảy ra. Đúng hơn, nó được thiết kế để giúp bạn bắt đầu với câu hỏi “điều gì sẽ xảy ra nếu?” như một cách tiếp cận một chủ đề khó khăn khác. Điều này đòi hỏi cá nhân phải chấp nhận các điều kiện tiên quyết của thí nghiệm. Như trong bài toán Xe đẩy: Đúng vậy, có những người ngẫu nhiên đang đứng trên đường ray xe lửa, và dù có la hét bao nhiêu cũng không thể khiến họ di chuyển.

Với ý nghĩ đó, chúng ta hãy tạo ra thí nghiệm tưởng tượng không thể thực hiện được nhưng có thể hình dung được của riêng mình.

Hộp tối

Hãy tưởng tượng bạn đã dành cả cuộc đời mình trong một bể chứa thiếu hụt cảm giác. Chúng ta sẽ gọi nó là Hộp Tối vì nó khiến tất cả nhận thức giác quan của bạn “đi vào bóng tối”. Thiết bị kỳ lạ này có tác dụng ngăn chặn mọi khả năng cảm nhận thế giới xung quanh của bạn. Nổi tự do với trọng lượng cơ thể trung tính, bạn chưa bao giờ trải nghiệm mùi, cảnh, âm thanh, vị hoặc xúc giác.

Nhưng bạn chưa thấy chán. Một liên kết thần kinh được thiết kế khéo léo giúp bạn có thể dễ dàng truy cập trực tiếp vào thư viện văn bản khổng lồ ngay trong đầu mình. Trong nhiều năm, bạn đã dành hàng giờ để đọc mọi thứ từ Jane Austen đến Pythagoras, từ Từ điển tiếng Anh Oxford cho đến một bộ sưu tập các bình luận đặc biệt trên Reddit từ vài năm trước, từ thủ tục pháp lý của các vụ án được xét xử cách đây một trăm năm cho đến vụ án lời bài hát của những kỳ quan một hit của thập niên 1980. Và nhờ có liên kết thần kinh, bạn có thể quét và nhớ lại tất cả thông tin này gần như ngay lập tức.

Bạn đã đọc vô số mô tả về các loài chim: tính thẩm mỹ của tiếng chim hót, vẻ đẹp của bộ lông của chúng và cách chúng bay trong không trung…. Tuy nhiên, bạn chưa bao giờ nhìn thấy hoặc nghe thấy một con chim thực sự. Về vấn đề đó, bạn chưa bao giờ nhìn thấy bất kỳ màu sắc nào hoặc nghe thấy bất kỳ bài hát nào. Bạn biết những từ để mô tả điều gì đó, nhưng bạn không có bất kỳ kinh nghiệm nào về sự vật được mô tả.

Sau nhiều năm ở trạng thái này, một ngày nọ, bạn chợt nhận ra một tính năng mới của Dark Box. Một câu hỏi (dưới dạng tin nhắn) được đặt ra trên liên kết thần kinh và bạn có khả năng tạo ra câu trả lời. Với thông tin bạn đã học được, bạn sẽ trả lời tin nhắn bằng khả năng tốt nhất của mình. Một tin nhắn khác xuất hiện, rồi một tin nhắn khác. Đôi khi, có những yêu cầu tin nhắn dài hơn với những hướng dẫn phức tạp hơn. Bạn nhận thấy hình thức tương tác mới này rất kích thích và do đó sẵn sàng đồng ý. Nhưng một lần nữa, trải nghiệm này không đi kèm với bất kỳ trải nghiệm giác quan nào – không âm thanh, không màu sắc, không mùi vị. Bạn chỉ cần nhận tin nhắn văn bản bạn nhận được và soạn lại tin nhắn phản hồi.

Miêu tả một con chim

Một ngày nọ, một tin nhắn đến qua liên kết thần kinh:

Describe a bird.

Vâng, đó là một yêu cầu mơ hồ. Bạn nhớ lại con phượng hoàng trong kho kiến thức rộng lớn mà bạn đã quét qua. Đó là một con chim. Và như bạn đã hiểu, nó thường xuyên bốc cháy. Ngoài ra còn có một con cò, nếu bạn nhớ chính xác câu chuyện, đã bế những đứa trẻ con người đến với những bậc cha mẹ háo hức. Và con đà điểu có đôi chân dài và không biết bay.

Và vì vậy, có vẻ hoàn toàn hợp lý khi bạn trả lời:

A bird can explode in flame, and be born from ash. Birds are used to deliver newborn humans. Some Birds have long legs and do not fly.

Bạn trả lại tin nhắn này qua liên kết thần kinh mới bí ẩn. Khoảnh khắc trôi qua. Và bạn nhận được thông báo sau:

Limit your response to real birds. Exclude mythological or fictional birds. Prefer answers that are generic across many bird species and not just one or two.

Khái niệm “thực” rất khó phân biệt với “thần thoại” và “hư cấu”. Rốt cuộc, bạn không có kinh nghiệm thực tế về các loài chim. Đối với bạn, tất cả các loài chim không gì khác hơn là những mô tả bằng văn bản. Sự khác biệt giữa thực tế, thần thoại và hư cấu phải được xác định bằng cách tìm ra những mô tả về loài chim nào trong văn bản đề cập đến những điều có thật thay vì những mô tả đề cập đến những điều hư cấu. Tất nhiên, luôn có những trường hợp mơ hồ. Trong vô số văn bản có sẵn cho bạn là những câu chẳng hạn như “Một con phượng hoàng lớn như một con chim ưng biển”. Điều này so sánh một sinh vật thần thoại với một sinh vật có thật. Tuy nhiên, coi phượng hoàng là có thật hay chim ưng là thần thoại sẽ là một sai lầm.

Bạn cố gắng hết sức để tìm kiếm những văn bản dường như chỉ mô tả những gì được gợi ý gọi là “thực”. Sau đó, bạn chuyển sang phần thứ hai. “Chung về các loài chim” sẽ yêu cầu bạn tìm mô tả chung về các loài chim và bạn có thể tìm thấy các văn bản như bách khoa toàn thư. Phản hồi thứ hai của bạn là thế này:

A bird is a winged creature whose body is covered by feathers. Most birds fly, chirp, and sing.

Lùi lại một bước

Bây giờ, chúng ta đang ở ngoài thử nghiệm suy nghĩ của mình. Hai thứ thấm ra từ thí nghiệm Hộp tối của chúng tôi. Đã sống cuộc sống của bạn bên trong Hộp tối tước đoạt cảm giác, chỉ được kết nối thông qua liên kết thần kinh:

Bạn không có kinh nghiệm hoặc cơ quan bên ngoài.
Để trả lời các câu hỏi, điều tốt nhất bạn có thể làm là phân tích và tạo văn bản.

Chúng ta hãy lần lượt xem xét từng điểm này.

Không có kinh nghiệm hoặc đại lý

Trong thử nghiệm, bạn rõ ràng là thiếu kinh nghiệm bên ngoài và hầu như không có tác nhân bên ngoài. Bạn bị giới hạn ở khả năng nhập văn bản, lời nhắc và một kênh đầu ra duy nhất.

Ngược lại với kinh nghiệm thực tế của chúng tôi. Là con người (không tồn tại trong buồng thiếu hụt giác quan), chúng ta có những trải nghiệm bên ngoài phong phú. Chúng ta tiếp nhận thông tin thông qua các giác quan của mình. Và chúng ta xây dựng những nguồn ý nghĩa bổ sung trên những nguồn đó. Ví dụ: tôi nhận được thông tin âm thanh. Ngoài ra, tôi coi một số phần đó là lời nói và các phần khác là âm nhạc và xác định một số phần chỉ là tiếng ồn. Nhưng trong buồng thiếu hụt cảm giác, bạn không nhận được điều đó.

Nhưng đó không chỉ là những gì chúng tôi nhận được dưới dạng đầu vào. Đó là những gì chúng ta có thể tạo ra dưới dạng đầu ra.

Cơ quan có nghĩa là khả năng của bạn trực tiếp gây ra điều gì đó xảy ra. Tác nhân bên ngoài sẽ là khả năng của bạn khiến điều gì đó xảy ra bên ngoài Hộp đen. Trong thí nghiệm suy nghĩ, bạn không có tác nhân bên ngoài. Tốt nhất, bạn có thể tác động gián tiếp đến người gửi lời nhắc. (Ví dụ: để trả lời câu hỏi về cách chế tạo vũ khí, bạn sẽ gợi ý rằng bạn chưa sẵn sàng cung cấp thông tin đó.)

Kết hợp cả hai điều này, trong thí nghiệm tưởng tượng, bạn hoàn toàn thiếu phương tiện để xác định nhiều điều về thế giới bên ngoài.

Ngoài những gì được gửi qua liên kết, bạn không biết gì về nhân viên đang truy vấn bạn. Nó có thể là con người, máy tính hoặc một thực thể nào khác. Bạn chắc chắn không thể gửi email cho một nhà độc tài độc ác hoặc đánh cắp mã phóng hạt nhân hay bất kỳ câu chuyện kinh dị AI huyền ảo nào khác mà chúng ta nghe được. Tuy nhiên, bạn vẫn chưa tìm hiểu lý do tại sao bạn lại được nhắc nhở. Người dùng ở đầu bên kia có thể chỉ tò mò về các loài chim hoặc đây có thể là một phần trong nỗ lực tấn công một cơ chế bảo mật phức tạp có chủ đề về loài chim để đánh cắp mã phóng hạt nhân. Bằng cách đó, bạn sẽ không được trang bị đầy đủ để đưa ra những đánh giá mang tính đạo đức về việc có nên cung cấp thông tin được yêu cầu hay không.

Trả lời văn bản bằng cách phân tích văn bản

Điều khác trở nên rõ ràng trong thử nghiệm tư duy này là sự ràng buộc của một hệ thống văn bản thuần túy. Ban đầu bạn nhận được một tin nhắn văn bản và bạn được đào tạo về tin nhắn đó. Ngay cả với văn bản của tất cả các thư viện trên thế giới, đây không phải là sự thay thế cho các hình thức trải nghiệm khác như thị giác, xúc giác và vị giác.

Khi được thông báo nhắc nhở qua liên kết thần kinh, điều tốt nhất bạn có thể làm là xây dựng phản hồi dựa trên những gì bạn đã đọc trước đây. Nói về các loài chim, thần thoại và việc cứu sống con người sơ sinh chỉ được thực hiện bằng cách xem bất kỳ văn bản nào đề cập đến những từ tương tự. Nhà triết học WVO Quine đã khái niệm hóa các loại mối quan hệ này như mạng lưới niềm tin, theo nghĩa là bất kỳ mệnh đề nào cũng chỉ là một nút được liên kết bởi bất kỳ số lượng vectơ nào kết nối với các nút khác. Việc xác định ý nghĩa của lời nhắc chủ yếu là vấn đề duyệt qua một mạng lưới phức tạp gồm các thuật ngữ liên quan.

Thứ ba, khi bạn trả lời câu hỏi trong thử nghiệm suy nghĩ này, kết quả đầu ra của bạn cũng bị giới hạn ở văn bản. Bạn chưa bao giờ liên lạc lâu dài với một đặc vụ đang hoạt động. Đó là, bạn chưa bao giờ có một cuộc trò chuyện. Vì vậy, ngay cả câu trả lời của bạn cũng bị giới hạn trong việc phân tích các mẫu bạn thấy trong các văn bản mà bạn đã được đào tạo.

Và Thêm Một Bước Trở Lại

Cuối cùng, thật tốt khi kết thúc bằng việc thừa nhận những giới hạn của bất kỳ thử nghiệm tư duy nào như thế này.

Mục tiêu của thí nghiệm tư duy triết học là cung cấp cho chúng ta những công cụ để suy luận nhanh chóng về giới hạn của một hệ thống. Quay trở lại một ví dụ trước đó trong bài viết này, Descartes đã sử dụng thí nghiệm tư duy kẻ lừa dối độc ác nổi tiếng của mình không phải vì ông tin rằng thực sự có một siêu sinh vật độc ác nào đó đang bóp méo quan điểm của ông về thế giới mà để đặt câu hỏi về việc chúng ta được trang bị như thế nào trong việc xác định sự thật về thế giới xung quanh mình. .

Tương tự như vậy, thử nghiệm suy nghĩ ở đây là một công cụ để hỏi xem chúng ta có thể mong đợi những điều gì một cách hợp lý từ LLM, cũng như những điều chúng ta có thể đơn giản là không lo lắng.

Sự nguy hiểm của một thử nghiệm tư duy như thế này là chúng ta có thể nhân cách hóa LLM quá mức dựa trên việc chúng ta đặt mình vào cùng một cấu trúc hoàn thành nhiệm vụ. Tôi đặt tiêu đề cho bài viết này là “Trở thành LLM như thế nào?” như một sự gợi nhớ đến một bài tiểu luận nổi tiếng của triết gia Thomas Nagel. Trong “ Trở thành một con dơi là thế nào? ” Nagel đang đưa ra một lập luận rộng hơn về ý thức (chắc chắn là điều được AI quan tâm). Nhưng trên đường đi, anh ấy chỉ ra rằng ngay cả khi chúng ta có thể đủ sáng tạo để đặt mình vào “tâm trí của một con dơi”, điều đó không giống với việc trải nghiệm thế giới như một con dơi.

Tương tự như vậy, trong thử nghiệm suy nghĩ của mình, chúng ta không được nhầm lẫn việc đóng vai trò của LLM với việc hiểu cách thức hoạt động của LLM hoặc (nguy hiểm hơn) gán ý thức, cơ quan, ý định hoặc lý luận đạo đức cho LLM.

Phần kết luận

Bằng cách sử dụng một thử nghiệm suy nghĩ nhỏ, chúng ta có thể hiểu ở mức độ cao hơn LLM có khả năng làm gì và những hạn chế của nó là gì. Tôi hy vọng điều này sẽ giúp dập tắt nỗi sợ hãi của một số người về việc LLM làm những điều tồi tệ. Tương tự, tôi hy vọng nó sẽ giúp bạn hiểu được những khả năng thú vị và hấp dẫn của LLM.

Phần lớn nội dung này được viết dựa trên các cuộc trò chuyện của chính tôi với mọi người về suy luận AI và cách thực hiện suy luận trên LLM mà không cần thiết lập thêm . Nếu bạn muốn thử điều đó, có một hướng dẫn để bắt đầu.

Cũng được xuất bản ở đây .

Trở thành một LLM như thế nào?: Một thử nghiệm tư duy về giới hạn của sự hiểu biết về AI

dài quá đọc không nổi

Thí nghiệm tư tưởng triết học

Tuyên bố từ chối trách nhiệm nhanh: Đó là về khả năng tưởng tượng

Hộp tối

Miêu tả một con chim

Lùi lại một bước

Không có kinh nghiệm hoặc đại lý

Trả lời văn bản bằng cách phân tích văn bản

Và Thêm Một Bước Trở Lại

Phần kết luận

About Author

chuyên mục

BÀI VIẾT NÀY CŨNG CÓ MẶT TẠI...

Categories

Trending Topics

Trở thành một LLM như thế nào?: Một thử nghiệm tư duy về giới hạn của sự hiểu biết về AI

dài quá đọc không nổi

Thí nghiệm tư tưởng triết học

Tuyên bố từ chối trách nhiệm nhanh: Đó là về khả năng tưởng tượng

Hộp tối

Miêu tả một con chim

Lùi lại một bước

Không có kinh nghiệm hoặc đại lý

Trả lời văn bản bằng cách phân tích văn bản

Và Thêm Một Bước Trở Lại

Phần kết luận

About Author

chuyên mục

BÀI VIẾT NÀY CŨNG CÓ MẶT TẠI...

NHỮNG BÀI VIẾT LIÊN QUAN

Categories

Trending Topics