Các chuyên gia tự hỏi liệu AI có đang tạo ra ngôn ngữ riêng của mình không

Mục lục:

Các chuyên gia tự hỏi liệu AI có đang tạo ra ngôn ngữ riêng của mình không
Các chuyên gia tự hỏi liệu AI có đang tạo ra ngôn ngữ riêng của mình không
Anonim

Bài học rút ra chính

  • Hệ thống AI được gọi là DALL-E2 dường như đã tạo ra hệ thống giao tiếp bằng văn bản của riêng nó.
  • Một số chuyên gia nói rằng ngôn ngữ rõ ràng có thể chỉ là vô nghĩa.
  • Đó là một ví dụ về mức độ khó diễn giải kết quả của các hệ thống AI tiên tiến.
Image
Image

Có vẻ như Trí tuệ nhân tạo (AI) đã phát triển ngôn ngữ riêng của mình, nhưng một số chuyên gia nghi ngờ tuyên bố này.

Hệ thống AI chuyển văn bản thành hình ảnh củaOpenAI được gọi là DALL-E2 dường như đã tạo ra hệ thống giao tiếp bằng văn bản của riêng mình. Đó là một ví dụ về mức độ khó diễn giải kết quả của các hệ thống AI tiên tiến.

"Do kích thước và độ sâu của các mô hình lớn, rất khó giải thích hành vi của mô hình", Teresa O'Neill, giám đốc kiến trúc giải pháp hiểu ngôn ngữ tự nhiên tại iMerit, nói với Lifewire trong một cuộc phỏng vấn qua email. "Đây là một trong những thách thức cốt lõi và trong một số trường hợp là các vấn đề đạo đức với các mô hình ngày càng mạnh mẽ. Nếu chúng ta không thể giải thích lý do tại sao họ cư xử như họ làm, liệu chúng ta có thể dự đoán hành vi của họ hoặc giữ nó phù hợp với các chuẩn mực và kỳ vọng của chúng ta?"

AI Trò chuyện

Sinh viên Khoa học Máy tính Giannis Daras gần đây đã lưu ý rằng hệ thống DALLE-2, tạo ra hình ảnh dựa trên nhập văn bản, sẽ trả về các từ vô nghĩa dưới dạng văn bản trong một số trường hợp nhất định.

"Một hạn chế đã biết của DALLE-2 là nó phải vật lộn với văn bản," ông viết trong một bài báo được xuất bản trên máy chủ in sẵn Arxiv. "Ví dụ: các lời nhắc văn bản như: 'Hình ảnh của từ máy bay' thường dẫn đến các hình ảnh được tạo mô tả văn bản vô nghĩa."

Nhưng, Daras đã viết, có thể có một phương pháp đằng sau sự vô nghĩa rõ ràng. "Chúng tôi phát hiện ra rằng văn bản được tạo ra này không phải là ngẫu nhiên, mà là tiết lộ một vốn từ vựng ẩn mà mô hình dường như đã phát triển bên trong," ông tiếp tục. "Ví dụ: khi được cung cấp bằng văn bản vô nghĩa này, mô hình thường tạo ra máy bay."

Trong tweet của mình, Daras chỉ ra rằng khi DALLE-2 được yêu cầu làm phụ đề cho một cuộc trò chuyện giữa hai người nông dân, nó cho thấy họ đang nói chuyện, nhưng bong bóng lời thoại chứa đầy những thứ trông giống như những từ vô nghĩa. Nhưng Daras phát hiện ra rằng những từ này dường như có ý nghĩa riêng đối với AI: những người nông dân đang nói về rau và chim.

Nicola Davolio, Giám đốc điều hành của công ty công nghệ Hupry, công ty làm việc với AI, đã giải thích với Lifewire trong một cuộc phỏng vấn qua email rằng ngôn ngữ dựa trên các ký hiệu mà hệ thống DALL-E2 đã học được để liên kết với các khái niệm nhất định. Ví dụ: biểu tượng cho "con chó" có thể liên quan đến hình ảnh của một con chó, trong khi biểu tượng cho "con mèo" có thể liên quan đến hình ảnh một con mèo. DALL-E2 đã tạo ra ngôn ngữ của mình vì nó cho phép nó giao tiếp hiệu quả hơn với các hệ thống AI khác.

Những câu đố như từ vựng có vẻ ẩn của DALL-E2 rất thú vị để đấu vật, nhưng chúng cũng làm nổi bật những câu hỏi nặng hơn…

"Ngôn ngữ này bao gồm các ký hiệu trông giống như chữ tượng hình của Ai Cập và dường như không có bất kỳ ý nghĩa cụ thể nào," ông nói thêm. "Các biểu tượng có thể vô nghĩa đối với con người, nhưng chúng có ý nghĩa hoàn hảo đối với hệ thống AI vì nó đã được đào tạo trên hàng triệu hình ảnh."

Các nhà nghiên cứu tin rằng hệ thống AI đã tạo ra ngôn ngữ để giúp nó hiểu rõ hơn mối quan hệ giữa hình ảnh và từ ngữ, Davolio nói.

"Họ không chắc tại sao hệ thống AI lại phát triển ngôn ngữ của nó, nhưng họ nghi ngờ nó có thể liên quan đến cách nó học cách tạo ra hình ảnh", Davolio nói thêm. "Có thể hệ thống AI đã phát triển ngôn ngữ của nó để giúp giao tiếp giữa các phần mạng khác nhau hiệu quả hơn."

AI Bí ẩn

DALL-E2 không phải là hệ thống AI duy nhất đã phát triển ngôn ngữ nội bộ của nó, Davolio chỉ ra. Vào năm 2017, hệ thống AutoML của Google đã tạo ra một dạng kiến trúc thần kinh mới được gọi là 'mạng con' sau khi được để lại để quyết định cách tốt nhất để hoàn thành một nhiệm vụ nhất định. Mạng con này không thể được hiểu bởi những người tạo ra nó.

Image
Image

"Những ví dụ này chỉ là một vài trường hợp trong đó các hệ thống AI đã phát triển những cách thức hoạt động mà chúng tôi không thể giải thích", Davolio nói. "Đó là một hiện tượng mới nổi hấp dẫn và đáng báo động ở mức độ bình đẳng. Khi các hệ thống AI ngày càng trở nên phức tạp và tự chủ hơn, chúng ta có thể ngày càng cảm thấy mình không hiểu chúng hoạt động như thế nào".

O'Neill nói rằng cô ấy không nghĩ rằng DALL-E2 đang tạo ra ngôn ngữ của riêng mình. Thay vào đó, cô ấy nói lý do cho phát minh ngôn ngữ rõ ràng có lẽ hơi tục tĩu hơn một chút.

"Một lời giải thích hợp lý là một cơ hội ngẫu nhiên - trong một mô hình lớn, một chút Định luật Murphy có thể áp dụng: nếu một điều kỳ lạ có thể xảy ra, nó có thể sẽ xảy ra," O'Neill nói thêm. Một khả năng khác được nhà phân tích nghiên cứu Benjamin Hilton đề xuất trong một chủ đề trên Twitter thảo luận về phát hiện của Daras là dạng của cụm từ "apoploe vesrreaitais" bắt chước dạng tên Latinh của một loài động vật. Vì vậy, hệ thống đã tạo ra một đơn hàng mới của Aves, O'Neill nói thêm.

"Các câu đố như từ vựng có vẻ ẩn của DALL-E2 rất thú vị khi đấu vật, nhưng chúng cũng làm nổi bật các câu hỏi nặng nề hơn xung quanh rủi ro, thành kiến và đạo đức trong hành vi thường khó hiểu của những người mẫu lớn", O'Neill nói.

Đề xuất: