Công nghệ mới có thể cho phép các tiện ích hiểu cuộc trò chuyện của bạn

Mục lục:

Công nghệ mới có thể cho phép các tiện ích hiểu cuộc trò chuyện của bạn
Công nghệ mới có thể cho phép các tiện ích hiểu cuộc trò chuyện của bạn
Anonim

Bài học rút ra chính

  • Công nghệ mới có thể dẫn đến máy tính hiểu rõ hơn giọng nói của con người.
  • Microsoft và NVIDIA gần đây đã công bố một phương pháp mới dựa trên AI để diễn giải ngôn ngữ.
  • Điện toán lượng tử có thể là một cách khác để nâng cao lĩnh vực xử lý ngôn ngữ.
Image
Image

Ngày nay có rất nhiều tiện ích thông minh để đưa ra lệnh, nhưng chúng ta còn rất lâu mới có máy tính hiểu được giọng nói hội thoại.

Microsoft và NVIDIA gần đây đã công bố một phương pháp mới dựa trên AI để diễn giải giọng nói có thể biến đổi cách chúng ta trò chuyện với thiết bị điện tử của mình. Đó là một phần của phong trào đang phát triển nhằm thay đổi cách máy tính hiểu giọng nói, còn được gọi là Xử lý ngôn ngữ tự nhiên (NLP).

"Các mô hình cung cấp năng lượng cho NLP ngày càng trở nên lớn hơn, tiên tiến hơn và ngày càng gần hơn với sự hiểu biết của con người", chuyên gia AI Hamish Ogilvy nói với Lifewire trong một cuộc phỏng vấn qua email.

"Một trong những tiến bộ lớn là NLP vượt ra ngoài các từ khóa đơn giản. Ngày nay, bạn có thể quen với việc nhập hoặc nói một hoặc hai từ khóa để nhận kết quả tìm kiếm, nhưng các mô hình xử lý ngôn ngữ tự nhiên mới hơn sử dụng ngữ cảnh để cung cấp kết quả phong phú hơn."

Chat Bots

NVIDIA và Microsoft đã hợp tác để tạo ra mô hình Thế hệ ngôn ngữ tự nhiên Megatron-Turing (MTNLG), mà bộ đôi tuyên bố là "mô hình ngôn ngữ biến áp nguyên khối mạnh mẽ nhất được đào tạo cho đến nay." Mô hình AI chạy trên siêu máy tính.

Nhưng các nhà nghiên cứu phát hiện ra rằng mô hình MTNLG đã thu thập những thành kiến của con người khi nó chạy qua hàng núi mẫu giọng nói của con người.

"Trong khi các mô hình ngôn ngữ khổng lồ đang nâng cao trình độ của nghệ thuật tạo ngôn ngữ, chúng cũng gặp phải các vấn đề như sai lệch và độc tính," các nhà nghiên cứu viết trong một bài đăng trên blog. "Quan sát của chúng tôi với MT-NLG là mô hình chọn lọc các định kiến và thành kiến từ dữ liệu mà nó được đào tạo."

Máy tính hiểu rõ hơn lời nói sẽ không chỉ cải thiện loa thông minh như Alexa, Ogilvy cho rằng. Các trang web tìm kiếm dựa trên văn bản như Amazon cũng sẽ hiểu rõ hơn các truy vấn được nhập vào.

"Google đã dẫn đầu rõ ràng ở đây, nhưng công nghệ NLP sẽ có mặt ở khắp mọi nơi", Ogilvy nói. "Đối với các tìm kiếm dựa trên văn bản và giọng nói, người dùng có thể mô tả nhiều hơn vì NLP hiểu nhiều hơn là chỉ văn bản; nó hiểu ngữ cảnh của những gì bạn đang tìm kiếm để trả lại kết quả tốt hơn."

Trò chuyện lượng tử?

Điện toán lượng tử có thể là một cách để thúc đẩy lĩnh vực NLP. Hôm thứ Tư, công ty Cambridge Quantum đã công bố lambeq, mà họ tuyên bố là bộ công cụ lượng tử đầu tiên cho NLP.

… NLP hiểu nhiều hơn là chỉ văn bản; nó hiểu bối cảnh của những gì bạn đang tìm kiếm để trả lại kết quả tốt hơn.

Công ty cho biết công cụ này cho phép dịch các câu bằng ngôn ngữ tự nhiên bằng cách sử dụng các mạch lượng tử chạy trên máy tính lượng tử. Tính toán lượng tử là một loại tính toán sử dụng các đặc tính bất thường của trạng thái lượng tử, chẳng hạn như chồng chất, giao thoa và vướng víu, để thực hiện các phép tính.

"Cách máy tính lượng tử xử lý NLP rất khác với các máy cổ điển. Thực tế, NLP là 'bản địa lượng tử'", Bob Coecke, nhà khoa học chính tại Cambridge Quantum, nói với Lifewire trong một cuộc phỏng vấn qua email. "Điều này là do một khám phá mà chúng tôi đã thực hiện cách đây vài năm, rằng các câu điều chỉnh ngữ pháp và ý nghĩa có cấu trúc rất giống với các phép toán được sử dụng để lập trình máy tính lượng tử."

Coecke nói rằng NLP lượng tử có thể dẫn đến trợ lý giọng nói và công cụ dịch thuật tốt hơn.

Một cách tiếp cận đầy hứa hẹn khác để cải thiện khả năng nhận dạng giọng nói, được gọi là Zac Liu, một nhà khoa học dữ liệu tại công ty Hypergiant, đã nói với Lifewire trong một cuộc phỏng vấn qua email. "Nói tóm lại, khi các nhà khoa học dữ liệu cải thiện dữ liệu NLP, điều đó gần như đảm bảo rằng họ sẽ có một mô hình NLP tốt hơn và khả năng NLP tốt hơn."

Image
Image

Bước tiếp theo là tích hợp mô hình thị giác máy tính với NLP, chẳng hạn như đào tạo mô hình AI để xem video và tạo bản tóm tắt văn bản của video đó, Liu nói.

"Ứng dụng của tiến bộ này có thể là vô hạn, từ chăm sóc sức khỏe, đọc phim X quang và chẩn đoán sơ bộ, đến thiết kế nhà cửa, quần áo, đồ trang sức hoặc các vật dụng tương tự", ông nói thêm. "Khách hàng có thể giải thích các yêu cầu bằng lời nói hoặc bằng văn bản và mô tả này có thể được tự động chuyển đổi thành hình ảnh hoặc video để dễ hình dung hơn."

Đề xuất: