Bài học rút ra chính
- Một nhóm các nhà phát triển mới đang xây dựng các mô hình AI mã nguồn mở.
- Nhóm sử dụng các mô hình đào tạo ngôn ngữ khổng lồ mà nhóm sẽ phát hành theo giấy phép mở.
- AI nguồn mở có thể giúp làm cho sức mạnh có khả năng thay đổi trò chơi của công nghệ mới ít bị thành kiến và sai sót hơn.
Có rất nhiều nghiên cứu về trí tuệ nhân tạo của các công ty lớn (AI), nhưng một nhóm trực tuyến muốn dân chủ hóa quá trình này.
EleutherAI là một tập hợp các nhà nghiên cứu, kỹ sư và nhà phát triển tình nguyện được thành lập gần đây tập trung vào nghiên cứu AI nguồn mở. Tổ chức sử dụng cơ sở mã GPT-Neo và GPT-NeoX để đào tạo các mô hình ngôn ngữ lớn mà tổ chức dự kiến phát hành theo giấy phép mở.
"Dữ liệu nguồn mở mang lại lợi ích cho các nhà nghiên cứu vì các nhà khoa học có nhiều tài nguyên miễn phí hơn để sử dụng để đào tạo các mô hình và hoàn thành nghiên cứu", Edward Cui, Giám đốc điều hành của công ty AI Graviti, nói với Lifewire trong một cuộc phỏng vấn qua email. Công ty của anh ấy không liên quan đến EueutherAI. "Chúng tôi biết rằng điểm số của các dự án AI được tăng lên do thiếu dữ liệu chất lượng cao từ các trường hợp sử dụng thực tế, vì vậy điều quan trọng là phải thiết lập hướng dẫn đảm bảo chất lượng dữ liệu, với sự giúp đỡ của cộng đồng tham gia."
Đây là cách
Sự khởi đầu của EleutherAI rất khiêm tốn. Năm ngoái, một nhà nghiên cứu AI độc lập có tên Connor Leahy đã đăng thông báo sau trên máy chủ Discord: "Này các bạn, hãy để [SIC] cung cấp cho OpenAI để kiếm tiền của họ như những ngày đẹp trời."
Và như vậy, nhóm được thành lập. Nó hiện có hàng trăm cộng tác viên đăng mã của họ trên kho phần mềm trực tuyến GitHub.
Nỗ lực AI tìm nguồn mở không phải là mới. Trên thực tế, nền tảng quản lý luồng công việc Airflow của Airbnb và công cụ khám phá dữ liệu của Lyft là kết quả của việc sử dụng các công cụ nguồn mở để cho phép các nhóm dữ liệu làm việc tốt hơn với dữ liệu, Ali Rehman, giám đốc dự án của công ty phần mềm CloudiTwins chỉ ra trong một cuộc phỏng vấn qua email với Lifewire.
"Cũng giống như cuộc cách mạng mã nguồn mở đã dẫn đến sự thay đổi phát triển phần mềm, thì nó cũng thúc đẩy sự phát triển và dân chủ hóa của khoa học dữ liệu và trí tuệ nhân tạo," Rehman nói. "Nguồn mở đã trở thành một yếu tố quan trọng của các giải pháp khoa học dữ liệu doanh nghiệp, với phần lớn các nhà khoa học dữ liệu sử dụng các công cụ nguồn mở".
Mở Cửa
Phát triển AI mã nguồn mở có thể giúp làm cho sức mạnh thay đổi cuộc chơi tiềm tàng của công nghệ mới ít bị thành kiến và sai sót hơn, một số nhà quan sát lập luận.
Kush Varshney, một nhà nghiên cứu AI tại IBM, nói với Lifewire trong một cuộc phỏng vấn qua email.
"Cộng đồng mở này rất cần thiết, vì nó cung cấp các cấp độ kiểm tra và cân bằng nâng cao để đảm bảo AI đang được nghiên cứu, tạo, triển khai và ứng dụng một cách có trách nhiệm", Varshney nói thêm. "Điều này đặc biệt quan trọng trong các tình huống mà các hệ thống này có thể ảnh hưởng đến cuộc sống của những thành viên dễ bị tổn thương nhất trong xã hội của chúng ta. Tính cởi mở này không chỉ áp dụng cho các thuật toán máy học và học sâu nói chung mà còn cho các yếu tố của AI đáng tin cậy."
Rehman nói rằng một trong những điểm khác biệt quan trọng giữa phần mềm nguồn mở và độc quyền là tính linh hoạt và khả năng tùy biến. Nghiên cứu AI độc quyền sẽ có các vấn đề về bảo mật, cập nhật và tối ưu hóa.
"Điều này là do cách tiếp cận dựa trên cộng đồng nguồn mở nhận được thông tin đầu vào có giá trị từ hàng nghìn chuyên gia trong ngành để xác định các lỗ hổng bảo mật tiềm ẩn và sau đó được khắc phục nhanh hơn", Rehman nói thêm."Sự đồng thuận của cộng đồng có nghĩa là chất lượng được đảm bảo và các cơ hội mới được xác định dễ dàng hơn."
Một vấn đề khác là nghiên cứu AI độc quyền sẽ không thể tương tác, có nghĩa là nó không thể hoạt động với các định dạng dữ liệu khác nhau và có khả năng sẽ bị khóa nhà cung cấp, điều này ngăn các công ty kiểm tra và thử phần mềm trước khi cam kết đưa ra giải pháp, Rehman nói.
Nhưng không phải mọi khía cạnh của nghiên cứu AI đều cần phải là nguồn mở, Chris Kent, Giám đốc điều hành của công ty AI y tế Reveal Phẫu thuật, nói với Lifewire trong một cuộc phỏng vấn qua email. "Điều quan trọng là phải bảo vệ các động lực kinh tế thúc đẩy sự phát triển thương mại của các ứng dụng chính của AI", ông nói.
Tuy nhiên, nghiên cứu về AI cần một thành phần mã nguồn mở mạnh mẽ, Kent nói. Ông nói thêm rằng mã nguồn mở hoạt động để xây dựng lòng tin và sử dụng các bộ dữ liệu không được hoặc không được kiểm soát bởi các tổ chức hoặc công ty duy nhất.
"Phương pháp tiếp cận mã nguồn mở là cách tốt nhất để xác định và bù đắp cho thành kiến cơ bản có thể tồn tại trong các tập huấn luyện và sẽ dẫn đến các ứng dụng toàn diện, sáng tạo và đáng tin cậy hơn của AI", Kent nói.