Trợ lý kỹ thuật số trong Metaverse có thể trở thành người đàm thoại tốt hơn

Mục lục:

Trợ lý kỹ thuật số trong Metaverse có thể trở thành người đàm thoại tốt hơn
Trợ lý kỹ thuật số trong Metaverse có thể trở thành người đàm thoại tốt hơn
Anonim

Bài học rút ra chính

  • Meta đang đặt cược lớn vào AI để cung cấp Metaverse.
  • Project CAIRaoke là một khuôn khổ sẽ giúp các nhà phát triển xây dựng các trợ lý kỹ thuật số nhận biết ngữ cảnh tốt hơn.
  • Meta hình dung các trợ lý được hỗ trợ bởi Project CAIRaoke được tích hợp trong tai nghe VR và kính AR.

Image
Image

Nếu Meta có con đường của mình, cuộc đấu tranh của chúng tôi với trợ lý kỹ thuật số có thể là dĩ vãng.

Trong một sự kiện ảo vào tháng 2, Meta đã giới thiệu một mô hình thần kinh mới cho trợ lý kỹ thuật số có tên là Project CAIRaoke, nó tuyên bố sẽ có khả năng trò chuyện theo ngữ cảnh tốt hơn nhiều.

"Vấn đề chính với trợ lý kỹ thuật số là [chúng] phải thích ứng với hành vi và môi trường của người dùng, nhưng chúng hoạt động theo cách khác", Vivek Khurana, Trưởng phòng Kỹ thuật, Knot Office, nói với Lifewire qua email. "Project CAIRoke dường như là một bước đi đúng đắn trong việc định hướng một trợ lý thích ứng với hành vi và điều kiện của người dùng."

Trợ lý thực sự

Trong một bài đăng kỹ thuật, trưởng nhóm công nghệ AI của Meta, Alborz Geramifard, lập luận rằng thế hệ trợ lý kỹ thuật số hiện tại, cả dựa trên văn bản hoặc giọng nói, vẫn còn nhiều điều mong muốn vì chúng thiếu nhận thức về ngữ cảnh.

Mặc dù có bộ não phức tạp được hỗ trợ bởi AI, chúng không thể hiểu được những yêu cầu đơn giản có thể có ý nghĩa đối với một đứa trẻ 10 tuổi. Ví dụ: yêu cầu "tắt tiếng tất cả các thông báo trừ trường hợp đó là cuộc gọi từ mẹ tôi" sẽ khiến bất kỳ trợ lý kỹ thuật số hiện tại nào bị ảnh hưởng.

Để vượt qua rào cản này, Geramifard cho biết họ đang xây dựng Dự án CAIRaoke như sự kết hợp của bốn mô hình giọng nói Trí tuệ nhân tạo (AI) được sử dụng trong trợ lý ngày nay. Ông viết rằng, không giống như hầu hết các trợ lý được lập trình để phản ứng với một số từ và cụm từ nhất định, Project CAIRaoke được thiết kế để hiểu ngữ cảnh tốt hơn và có khả năng nhận ra các cụm từ khác nhau được sử dụng để nói cùng một điều. Cách tiếp cận này giúp nó có một cuộc trò chuyện tự nhiên và trôi chảy hơn.

Đánh giá thông tin kỹ thuật trong bài đăng của Geramifard, Khurana nói rằng thông qua Dự án CAIRoke, các nhà phát triển sẽ có thể xây dựng các trợ lý có thể dễ dàng đối thoại với người dùng vì họ có thể đưa ra quyết định bằng cách xem nhiều thông tin, và không chỉ là mô hình mà họ đã được đào tạo.

Anh ấy đã minh họa việc bổ sung ngữ cảnh cho các cuộc trò chuyện thông qua ví dụ về một trợ lý kỹ thuật số nhận đơn đặt hàng thức ăn, có thể đề xuất các món mới được giới thiệu dựa trên sở thích của người dùng hoặc đơn đặt hàng trước đây. "Điều này mở ra một loạt các tùy chọn hoàn toàn mới cho nhà phát triển, để xây dựng các trợ lý tự phục vụ cho dịch vụ khách hàng", Khurana nói.

Góc nhìn thứ nhất

Meta đã đặt cược lớn vào AI để giúp mang lại tầm nhìn về Metaverse như sự phát triển của Internet mang tính tương tác và nhập vai hơn rất nhiều và Dự án CAIRoke là một thành phần chính của trải nghiệm đó.

Trong một bài thuyết trình video, Giám đốc điều hành Meta Mark Zuckerberg cho biết khung trợ lý kỹ thuật số mới và được cải tiến rất nhiều của nó kết hợp phương pháp đằng sau chatbot mã nguồn mở có tên BlenderBot, với AI hội thoại mới nhất để mang lại khả năng đối thoại tốt hơn.

Được cập nhật vào tháng 7 năm 2021, BlenderBot 2.0 là duy nhất cho khả năng ghi chú thông tin thích hợp trong một cuộc trò chuyện và lưu trữ nó trong bộ nhớ dài hạn, sau đó nó dựa vào đó để có những tương tác có ý nghĩa trong tương lai. Hơn nữa, "kiến thức" được lưu trữ riêng biệt cho từng người mà BlenderBot tương tác để mang lại trải nghiệm tùy chỉnh.

Image
Image

Theo Zuckerberg, Dự án CAIRaoke mở rộng công nghệ BlenderBot 2.0 để hỗ trợ các cuộc trò chuyện theo định hướng nhiệm vụ.

Hệ thống hiện đang được thử nghiệm với dòng thiết bị gọi điện video Portal của Meta, có camera thông minh hỗ trợ AI có thể xoay và phóng to để theo dõi người dùng khi họ di chuyển tự do. Portal cũng hoạt động như một trợ lý kỹ thuật số, hiện đang dựa vào Alexa của Amazon để giao tiếp với các phụ kiện nhà thông minh và cho các tác vụ khác.

Không có lịch trình về thời điểm Dự án CAIRaoke sẽ có sẵn trên các thiết bị Cổng thông tin, nhưng công ty cho biết họ hy vọng cuối cùng sẽ triển khai nó cho tai nghe thực tế ảo (VR) và kính Thực tế tăng cường (AR).

"Vấn đề chính với trợ lý kỹ thuật số là [chúng] phải thích ứng với hành vi và môi trường của người dùng…"

Geramifard hình dung kỷ nguyên mới của trợ lý kỹ thuật số sẽ có thể xác định lại các tương tác giữa con người và thiết bị. Ví dụ: bạn có thể yêu cầu một trợ lý được hỗ trợ bởi Project CAIRaoke được tích hợp trong kính AR để đưa ra các gợi ý về áo sơ mi đi với một chiếc quần cụ thể, dựa trên màu sắc yêu thích của bạn và thậm chí điều chỉnh các đề xuất của nó dựa trên sở thích hiện tại của bạn.

"Trên các thiết bị như tai nghe VR và kính AR, chúng tôi hy vọng loại giao tiếp này cuối cùng sẽ là phương pháp phổ biến, liền mạch để điều hướng và tương tác, giống như cách màn hình cảm ứng thay thế bàn phím trên điện thoại thông minh", Geramifard dự báo.

Đề xuất: