Cách Nhận dạng giọng nói trôi chảy diễn ra nhanh chóng, chính xác và riêng tư

Mục lục:

Cách Nhận dạng giọng nói trôi chảy diễn ra nhanh chóng, chính xác và riêng tư
Cách Nhận dạng giọng nói trôi chảy diễn ra nhanh chóng, chính xác và riêng tư
Anonim

Bài học rút ra chính

  • Fluent là công cụ nhận dạng giọng nói siêu nhanh, tôn trọng quyền riêng tư không cần kết nối internet.
  • Nó có thể được nhúng vào hầu hết mọi thiết bị.
  • Nó hoạt động ở bất kỳ ngôn ngữ nào.
Image
Image

Fluent.ai là một công cụ nhận dạng giọng nói ảo không gửi lệnh của bạn tới Internet, hoạt động gần như ngay lập tức, có thể hoạt động bằng bất kỳ ngôn ngữ nào và nhỏ đến mức có thể được tích hợp vào -các thiết bị năng lượng như đồng hồ thể dục chẳng hạn.

Không giống như Siri và Alexa, Fluent là một trợ lý độc lập hiểu bạn ngay lập tức và học hỏi từ bạn để nó trở nên tốt hơn khi bạn sử dụng nó. Nó không có độ sâu của các trợ lý ảo thông thường, nhưng nó không phải vậy. Thay vào đó, nó nhanh hơn, chính xác hơn và riêng tư hơn những nỗ lực của Apple, Amazon và Google.

"Nói thành văn bản sử dụng xử lý ngôn ngữ tự nhiên và sau đó tạo ra ý định," Giám đốc điều hành thông thạo Probal Lala nói với Lifewire trong một cuộc phỏng vấn với Zoom. "Nó đòi hỏi nhiều dữ liệu và nhiều khả năng xử lý. Sự trôi chảy đi trực tiếp từ lời nói thành ý định, lấy giọng nói của bạn và chuyển trực tiếp thành hành động."

Bottom Line

Fluent là phần mềm điều khiển bằng giọng nói. Nó hoạt động bằng cách lắng nghe lệnh của bạn và loại bỏ tất cả các từ mà nó không cần, chỉ để lại các danh từ và động từ cần thiết. "Tắt đèn", trở thành chỉ tắt và sáng. Các yếu tố thiết yếu được tước bỏ từ một câu nói lộn xộn của con người và chuyển thành các bước. Nó gần giống như lập trình máy tính, biến một ý tưởng phức tạp thành một bộ hướng dẫn đơn giản nhất.

Nó có thể được sử dụng để làm gì?

Lưu loát có thể dùng cho bất cứ việc gì. Điều quan trọng là nó được đào tạo cho một tình huống cụ thể. Ví dụ: với một chiếc đồng hồ thông minh, nó có thể được huấn luyện về các lệnh để rèn luyện sức khỏe hoặc để tự động hóa ngôi nhà, tạo lịch và hẹn giờ, v.v. Giới hạn cơ sở dữ liệu làm cho mọi thứ tập trung hơn và giữ cho nó nhanh chóng.

"Sự thật của vấn đề là với thiết bị đeo được, bạn không muốn trò chuyện", Lala nói, "Tôi muốn có thể bắt đầu thói quen tập thể dục yêu thích của mình và muốn nó thật nhanh chóng."

Tốc độ và độ chính xác là toàn bộ điểm. Việc bật và tắt đèn mất vài mili giây, thay vì phải đợi Siri gửi giọng nói của bạn lên đám mây, hãy đợi nó được xử lý, sau đó vài giây đèn sẽ tắt.

Việc đào tạo hẹp này cũng làm giảm kích thước của ứng dụng. Năm ngoái, Google đã cung cấp phiên bản ngoại tuyến, có thể tải xuống của trợ lý của mình. Lala nói, 85 Megabyte, chỉ hoạt động bằng tiếng Anh và mất sáu tháng để đào tạo nó.

"Chúng tôi có một mô hình hoạt động với 13.000 lệnh và nó hoạt động trong 500 kilobyte", anh ấy nói.

Bottom Line

Ưu điểm khác của công cụ nhận dạng giọng nói ngoại tuyến là tính riêng tư. Ví dụ: trong đồng hồ thông minh của trẻ em, "bạn không muốn giọng nói của trẻ lên mây", Lala nói. Trên thực tế, Fluent có thể hoạt động bên trong các thiết bị không bao giờ kết nối Internet. Điều này không chỉ tốt cho quyền riêng tư mà còn cả bảo mật. Bạn có thể sử dụng công cụ nhận dạng giọng nói ngoại tuyến bên trong phòng nghiên cứu, cơ sở quân sự và những nơi khác cấm điện thoại di động và máy ảnh.

Giới hạn

Tất nhiên, có một số nhược điểm đối với mô hình này. Một là các lệnh không thể được thêm vào sau đó. Sau khi quá trình đào tạo ban đầu hoàn tất, vậy là xong. Trợ lý dựa trên Fluent của bạn cũng không thể tra cứu mọi thứ trên internet để biết điểm số môn thể thao của bạn, diễn viên bạn nhận ra trong bộ phim đó, nhưng chỉ không thể đặt, v.v.

Image
Image

Thay vào đó, hệ thống đủ thông minh để nhận biết khi nào nó không thể trợ giúp và nó sẽ chuyển yêu cầu đến thứ có thể. Nếu bạn hỏi đồng hồ để biết dự báo thời tiết, Fluent sẽ nhận ra rằng đồng hồ không hiểu. "Sau đó, nó sẽ gọi một dịch vụ được lập trình trước trong đồng hồ, cho dù đó là Alexa của Amazon hay Google, rồi thực hiện cuộc gọi tới đám mây", chuyển khẩu lệnh thô của bạn để nhận câu trả lời.

Phương pháp kết hợp này giữ tốc độ của một trợ lý cục bộ, ngoại tuyến, với sức mạnh của Alexa hoặc Trợ lý Google làm bản sao lưu.

Bạn có thể mua bất kỳ thiết bị thông thạo nào không?

Chưa. Công ty đang cấp phép công nghệ của mình và đào tạo cho các công ty khác. Nhờ COVID, hai vụ phóng lớn đã được lùi lại sang năm sau. Nhưng bạn có thể mong đợi thấy nó hiển thị trong đồng hồ và các thiết bị tập thể dục khác, loa, trung tâm tự động hóa tại nhà, v.v.

Sẽ thật tuyệt nếu tính năng này cũng được tích hợp trực tiếp vào điện thoại thông minh như iPhone, giúp thực hiện các tác vụ hàng ngày nhanh hơn và chỉ sử dụng Siri khi cần thiết. Đó sẽ là ứng dụng giết người thực sự.

Cập nhật: 22 tháng 10, 10:12 sáng. Đã thực hiện các thay đổi để coi Fluent là công cụ nhận dạng giọng nói chứ không phải là trợ lý giọng nói.

Đề xuất: