Bài học rút ra chính
- Một mô hình học máy mới tạo ảo giác hình ảnh xuất hiện của một câu trong một ngôn ngữ để hỗ trợ việc dịch.
- Hệ thống AI, được gọi là VALHALLA, được thiết kế để bắt chước cách con người nhận thức ngôn ngữ.
- Hệ thống mới là một phần của phong trào ngày càng tăng sử dụng AI để hiểu ngôn ngữ.
Phương pháp hình dung hình ảnh của con người trong khi dịch từ có thể giúp trí tuệ nhân tạo (AI) hiểu bạn hơn.
Một mô hình học máy mới tạo ảo giác hình ảnh một câu trông như thế nào trong một ngôn ngữ. Theo một bài báo nghiên cứu gần đây, kỹ thuật này sau đó sử dụng trực quan và các manh mối khác để hỗ trợ dịch thuật. Đó là một phần của phong trào ngày càng tăng sử dụng AI để hiểu ngôn ngữ.
"Cách mọi người nói và viết là duy nhất bởi vì tất cả chúng ta đều có giọng điệu và phong cách hơi khác nhau", Beth Cudney, giáo sư phân tích dữ liệu tại Đại học Maryville, người không tham gia nghiên cứu, nói với Lifewire trong một cuộc phỏng vấn qua email. "Hiểu ngữ cảnh rất khó vì nó giống như xử lý dữ liệu phi cấu trúc. Đây là lúc xử lý ngôn ngữ tự nhiên (NLP) rất hữu ích. NLP là một nhánh của AI nhằm giải quyết những khác biệt trong cách chúng ta giao tiếp bằng cách sử dụng khả năng đọc hiểu của máy. Sự khác biệt chính trong NLP, với tư cách là một nhánh của AI, không chỉ tập trung vào nghĩa đen của những từ chúng ta nói hoặc viết. Nó xem xét ý nghĩa."
Đi Hỏi Alice
Hệ thống AI mới, được gọi là VALHALLA, được tạo ra bởi các nhà nghiên cứu từ MIT, IBM và Đại học California tại San Diego, được thiết kế để bắt chước cách con người nhận thức ngôn ngữ. Theo các nhà khoa học, việc sử dụng thông tin giác quan, chẳng hạn như đa phương tiện, được ghép nối với những từ mới và không quen thuộc, như thẻ nhớ có hình ảnh, cải thiện khả năng tiếp thu và lưu giữ ngôn ngữ.
Các hệ thống này đang tăng sức mạnh của các chatbot hiện chỉ được đào tạo và có khả năng trò chuyện cụ thể…
Nhóm tuyên bố rằng phương pháp của họ cải thiện độ chính xác của bản dịch máy so với bản dịch chỉ có văn bản. Các nhà khoa học đã sử dụng kiến trúc bộ mã hóa-giải mã với hai máy biến áp, một loại mô hình mạng nơ-ron phù hợp với dữ liệu phụ thuộc vào trình tự, như ngôn ngữ, có thể chú ý đến từ khóa và ngữ nghĩa của câu. Một máy biến áp tạo ra ảo giác thị giác và máy biến áp kia thực hiện dịch đa phương thức bằng cách sử dụng đầu ra từ máy biến áp đầu tiên.
"Trong các tình huống thực tế, bạn có thể không có hình ảnh liên quan đến câu nguồn," Rameswar Panda, một trong những thành viên nhóm nghiên cứu, cho biết trong một thông cáo báo chí. "Vì vậy, động cơ của chúng tôi về cơ bản là: Thay vì sử dụng hình ảnh bên ngoài trong quá trình suy luận làm đầu vào, chúng tôi có thể sử dụng ảo giác thị giác-khả năng tưởng tượng ra các cảnh trực quan-để cải thiện hệ thống dịch máy không?"
AI Hiểu
Nghiên cứu đáng cân nhắc tập trung vào việc thúc đẩy NLP, Cudney chỉ ra. Ví dụ: Elon Musk đồng sáng lập Open AI, đang làm việc trên GPT-3, một mô hình có thể trò chuyện với con người và đủ hiểu biết để tạo mã phần mềm bằng Python và Java.
Google và Meta cũng đang làm việc để phát triển AI đàm thoại với hệ thống của họ có tên là LAMDA. Cudney nói: “Các hệ thống này đang tăng sức mạnh của các chatbot hiện chỉ được đào tạo và có khả năng trò chuyện cụ thể, điều này có thể sẽ thay đổi bộ mặt của bộ phận hỗ trợ khách hàng và trợ giúp”.
Aaron Sloman, đồng sáng lập CLIPr, một công ty công nghệ AI, cho biết trong một email rằng các mô hình ngôn ngữ lớn như GPT-3 có thể học hỏi từ rất ít ví dụ đào tạo để cải thiện tóm tắt văn bản dựa trên phản hồi của con người. Ông nói, chẳng hạn, bạn có thể đưa ra một mô hình ngôn ngữ lớn một bài toán và yêu cầu AI suy nghĩ từng bước.
"Chúng tôi có thể mong đợi những hiểu biết sâu sắc hơn và lý luận được trích xuất từ các mô hình ngôn ngữ lớn khi chúng tôi tìm hiểu thêm về khả năng và hạn chế của chúng", Sloman nói thêm. "Tôi cũng mong đợi những mô hình ngôn ngữ này sẽ tạo ra nhiều quy trình giống con người hơn khi người lập mô hình phát triển các cách tốt hơn để tinh chỉnh mô hình cho các nhiệm vụ cụ thể mà bạn quan tâm."
Giáo sư máy tính Công nghệ Georgia Diyi Yang đã dự đoán trong một cuộc phỏng vấn qua email rằng chúng ta sẽ thấy việc sử dụng nhiều hơn các hệ thống xử lý ngôn ngữ tự nhiên (NLP) trong cuộc sống hàng ngày của chúng ta, từ trợ lý được cá nhân hóa dựa trên NLP đến trợ giúp với email và cuộc gọi điện thoại, đến các hệ thống đối thoại hiểu biết để tìm kiếm thông tin trong du lịch hoặc chăm sóc sức khỏe."Cũng như các hệ thống AI công bằng có thể thực hiện các nhiệm vụ và hỗ trợ con người một cách có trách nhiệm và không thiên vị", Yang nói thêm.
Các mô hình AI khổng lồ sử dụng hàng nghìn tỷ tham số như GPT-3 và DeepText sẽ tiếp tục hướng tới một mô hình duy nhất cho tất cả các ứng dụng ngôn ngữ, Stephen Hage, một kỹ sư máy học tại Dialexa, dự đoán trong một cuộc phỏng vấn qua email. Ông nói rằng cũng sẽ có nhiều loại mô hình mới được tạo ra cho các mục đích sử dụng cụ thể, chẳng hạn như mua sắm trực tuyến bằng giọng nói.
"Một ví dụ có thể là một người mua hàng nói" Cho tôi xem loại phấn mắt này có màu xanh dương nửa đêm với nhiều quầng sáng hơn ", để hiển thị bóng râm đó trên mắt của người đó với một số kiểm soát về cách áp dụng", Hage nói thêm.