AI có thể theo dõi cuộc trò chuyện của bạn

Mục lục:

AI có thể theo dõi cuộc trò chuyện của bạn
AI có thể theo dõi cuộc trò chuyện của bạn
Anonim

Bài học rút ra chính

  • Ngày càng có nhiều chương trình có thể hiểu được bài phát biểu của bạn.
  • Công nghệ mới tạo ra tiếng ồn tùy chỉnh trong nền khi bạn nói chuyện để làm nhầm lẫn phần mềm có thể đang nghe.
  • Kỹ thuật mới đạt được hiệu suất trong thời gian thực bằng cách dự báo một cuộc tấn công vào tương lai của tín hiệu hoặc từ.

Image
Image

Nhiều chương trình có thể hiểu bài phát biểu của bạn trong khi gọi điện thoại hoặc gọi video và các chuyên gia cho rằng chúng có thể gây ra mối đe dọa về quyền riêng tư.

Một công nghệ mới được phát triển bởi các nhà nghiên cứu Đại học Columbia, được gọi là Ngụy trang bằng giọng nói thần kinh, có thể đưa ra biện pháp bảo vệ. Nó tạo ra tiếng ồn tùy chỉnh trong nền khi bạn nói chuyện, gây nhầm lẫn cho trí thông minh nhân tạo (AI) nghe và chép lại giọng nói.

"Sự hiện diện của phiên âm AI đặt ra các vấn đề về sự tin cậy", Michael Huth, đồng sáng lập của Xayn, một công cụ tìm kiếm bảo vệ quyền riêng tư và là trưởng khoa Máy tính tại Đại học Hoàng gia London, người không tham gia vào nghiên cứu, nói với Lifewire trong một cuộc phỏng vấn qua email. "Những người tham gia cuộc họp có thể cẩn thận hơn về những điểm họ nêu ra và cách phiên âm bài phát biểu của họ. Đây có thể là một điều tốt vì nó có thể cải thiện hành vi tôn trọng, nhưng nó cũng có thể là một điều xấu vì cuộc trò chuyện có thể ít cởi mở hơn vì đặt trước về công nghệ được sử dụng."

Nghe và Học

Các nhà nghiên cứu Columbia đã làm việc để thiết kế một thuật toán có thể phá vỡ mạng nơ-ron trong thời gian thực. Cách tiếp cận mới sử dụng "các cuộc tấn công dự đoán" - một tín hiệu có thể làm gián đoạn bất kỳ từ nào mà các mô hình nhận dạng giọng nói tự động được đào tạo để phiên âm. Ngoài ra, khi âm thanh tấn công được phát qua không trung, chúng cần phải đủ lớn để làm gián đoạn bất kỳ micrô "nghe trong" giả mạo nào có thể ở xa.

"Một thách thức kỹ thuật quan trọng để đạt được điều này là làm cho tất cả hoạt động đủ nhanh", Carl Vondrick, giáo sư khoa học máy tính tại Columbia và là một trong những tác giả của nghiên cứu mô tả cách tiếp cận mới, cho biết trong một bản tin. phóng thích. "Thuật toán của chúng tôi, quản lý để chặn một micrô giả mạo nghe chính xác lời nói của bạn 80% thời gian, là thuật toán nhanh nhất và chính xác nhất trên máy thử nghiệm của chúng tôi."

Kỹ thuật mới đạt được hiệu suất thời gian thực bằng cách dự báo một cuộc tấn công vào tương lai của tín hiệu hoặc từ. Nhóm đã tối ưu hóa cuộc tấn công để nó có âm lượng tương tự như tiếng ồn xung quanh thông thường, cho phép mọi người trong phòng trò chuyện một cách tự nhiên và không bị theo dõi thành công bởi hệ thống nhận dạng giọng nói tự động.

Những người tham gia cuộc họp có thể cẩn thận hơn về điểm họ nêu ra và cách phiên âm bài phát biểu của họ.

Các nhà khoa học cho biết kỹ thuật của họ hoạt động ngay cả khi bạn không biết gì về micrô giả mạo, chẳng hạn như vị trí của nó, hoặc thậm chí phần mềm máy tính đang chạy trên đó. Nó ngụy trang giọng nói của một người qua không khí, giấu nó khỏi các hệ thống nghe này và không gây bất tiện cho cuộc trò chuyện giữa những người trong phòng.

"Cho đến nay, phương pháp của chúng tôi hoạt động với phần lớn từ vựng tiếng Anh và chúng tôi dự định áp dụng thuật toán trên nhiều ngôn ngữ hơn, cũng như cuối cùng làm cho âm thanh thì thầm hoàn toàn không thể nhận ra", Mia Chiquier, tác giả chính của nghiên cứu và một nghiên cứu sinh tiến sĩ trong phòng thí nghiệm của Vondrick, cho biết trong bản tin.

Giữ các cuộc trò chuyện của bạn ở chế độ riêng tư

Như thể tất cả những điều đó vẫn chưa đủ, quảng cáo có thể nhắm mục tiêu bạn dựa trên âm thanh thu được từ điện thoại thông minh hoặc các thiết bị gia đình thông minh của bạn.

"Với các thiết bị như [Amazon Echo] và các đối tác của chúng, những thiết bị này không chỉ luôn ở trong nhà bạn, liên tục lắng nghe mọi điều bạn nói hoặc làm, mà còn qua nhiều năm thu thập dữ liệu từ người dùng của họ Xử lý ngôn ngữ tự nhiên hoàn hảo (biến lời nói thành văn bản / dữ liệu có thể sử dụng cho thiết bị thông qua sự kết hợp của micrô, phần mềm và AI) ", Erik Haig, cộng sự tại Harbour Research, một công ty tư vấn chiến lược và phát triển mạo hiểm, cho biết trong một email.

Image
Image

Phiên âm AI của giọng nói hội thoại hiện là một phần tiêu chuẩn của phần mềm thương mại tiêu chuẩn, Huth nói. Ví dụ: Microsoft Teams có tùy chọn ghi lại cuộc họp với các bản ghi AI được tích hợp sẵn để tất cả những người tham gia có thể nhìn thấy trong thời gian thực. Bản ghi đầy đủ có thể dùng như một bản ghi của cuộc họp. Thông thường, những bản ghi như vậy cho phép ghi lại từng phút (hay còn gọi là ghi chú), nơi biên bản sẽ được thông qua trong cuộc họp tiếp theo.

"Mọi người có thể lo lắng về việc bị theo dõi khi phiên âm AI đang bật", Huth nói thêm."Điều này có vẻ rất giống với lo ngại về việc một cuộc trò chuyện được ghi lại mà không có sự đồng ý hoặc bí mật."

Nhưng không phải ai cũng đồng ý rằng các thiết bị thông minh là một mối đe dọa. Hầu hết mọi người không cần phải lo lắng về các chương trình lắng nghe cuộc trò chuyện của bạn, Brad Hong, một trưởng nhóm thành công của khách hàng tại công ty an ninh mạng Horizon3, nói với Lifewire qua email. Anh ấy cho biết mối quan tâm lớn nhất bây giờ không phải là ai đang ghi lại bạn, mà là cách họ lưu trữ dữ liệu.

"Tất cả những câu chuyện mà người ta nghe được về việc một micrô trên máy tính hoặc thiết bị di động của họ được kích hoạt, Alexa hoặc Google Home nghe được, hoặc thậm chí là sự giám sát của chính phủ, tất cả những điều này đều khiến dạ dày của giáo dân sôi sục", Hong nói thêm. "Nhưng nhìn chung, mọi người hiếm khi ở trong tình huống thực sự cần phải ngụy trang giọng nói của mình."

Đề xuất: