Cách hoạt động của tính năng Hum to Search của Google

Mục lục:

Cách hoạt động của tính năng Hum to Search của Google
Cách hoạt động của tính năng Hum to Search của Google
Anonim

Bài học rút ra chính

  • Google đã ra mắt một công cụ mới cho phép người dùng tìm kiếm các bài hát bằng cách ngâm nga, hát hoặc huýt sáo.
  • Công cụ mới sử dụng công nghệ máy học để khớp một bản nhạc được ngâm nga với cơ sở dữ liệu hơn nửa triệu bài hát được cập nhật liên tục.
  • Người dùng Google hỏi bài hát nào được phát gần 100 lần mỗi tháng.
Image
Image

Google đã ra mắt một tính năng mới có tên "Hum to Search" để giải quyết một vấn đề khó chịu: bạn bị mắc kẹt trong đầu và không thể tìm ra nó được gọi là gì.

Ý tưởng ngâm nga để tìm một bài hát có vẻ vô cùng đơn giản, vậy tại sao Google chỉ tung ra tính năng này vào năm 2020? Chà, hóa ra việc xác định các bài hát theo cách này thực sự khá phức tạp, một phần là do các phiên bản được ngâm nga của chúng tôi có xu hướng khá khác với bài hát gốc. Trong một bài đăng gần đây trên blog AI của mình, Google giải thích cách họ sử dụng công nghệ máy học để khắc phục sự cố này và cuối cùng giúp mọi người tìm thấy một bài hát bằng cách ngâm nga, huýt sáo hoặc hát giai điệu ngay cả khi bản trình diễn của chúng kém chính xác hơn.

"Trọng tâm của chúng tôi đối với Hum to Search là giúp mọi người xác định và tìm ra thứ âm nhạc bị mắc kẹt trong đầu", người phát ngôn của Google nói với Lifewire trong một email.

Just Start Humming

Người dùng Google hỏi bài hát nào được phát gần 100 triệu lần mỗi tháng, Aparna Chennapragada, phó chủ tịch kiêm tổng giám đốc mua sắm tiêu dùng của Google, cho biết một video giới thiệu một số tính năng tìm kiếm mới. Bây giờ có một cách để tìm hiểu.

Tính năng "Hum to Search" được tích hợp vào ứng dụng di động của Google, tiện ích Google Tìm kiếm và Trợ lý Google. Để truy cập nó thông qua ứng dụng, hãy nhấn vào biểu tượng micrô và nói "Đây là bài hát gì?" Chọn nút "Tìm kiếm bài hát" cũng hoạt động.

Để hoạt động chính xác, tính năng này yêu cầu bạn ngâm nga ít nhất 10-15 giây. Người dùng Android có thể ngâm nga để tìm các bài hát bằng hơn 20 ngôn ngữ, trong khi chỉ có các bài hát tiếng Anh hoạt động trên iPhone. Không phải lúc nào công cụ cũng có thể xác định một bài hát ngay lập tức, nhưng một khi xác định được bài hát, kết quả khá tốt.

"Hơn một nửa số bài hát thuộc một loạt các biến số (giai điệu, cao độ, âm lượng, v.v.) được các thuật toán của chúng tôi nhận dạng, nhưng tất nhiên, độ chính xác phụ thuộc vào chất lượng của tiếng vo ve, loại bài hát và hơn thế nữa, "người phát ngôn của Google nói với Lifewire trong một email. "Nhưng một khi nó được công nhận, khoảng 4/5 câu trả lời là đúng."

Tuy nhiên, đây không phải là lần đầu tiên tiếng vo ve được sử dụng trong một ứng dụng nhận dạng âm nhạc. Theo CNN Business, SoundHound cung cấp một tính năng tương tự và cũng có sẵn trên Android và iOS. Theo người phát ngôn của Google, tính năng mới không gây ra bất kỳ lo ngại nào về quyền riêng tư, cũng như không "thay đổi cách Google xử lý các tương tác dựa trên âm thanh", họ nói với Lifewire trong một email.

Học máy

Mặc dù khái niệm đơn giản nhưng việc ngâm nga một giai điệu để tìm bản thu trong phòng thu về mặt kỹ thuật là khá khó. Có một số lý do cho điều này, Christian Frank của Google Research giải thích trong một bài đăng trên blog ngày 12 tháng 11. Trước hết, một phiên bản ngâm nga của bài hát có thể khác rất nhiều so với bản thu âm thực tế, nên rất khó để phù hợp với cả hai. Vì vậy, mặc dù Shazam và một loạt các ứng dụng khác đã tồn tại để xác định bài hát mà bạn nghe thấy ở nhà hàng hoặc nơi công cộng khác, nhưng việc sử dụng giai điệu ngâm nga làm cơ sở cho việc tìm kiếm đó có thể phức tạp hơn.

"Với lời bài hát, giọng hát nền và nhạc cụ, âm thanh của một bản thu âm nhạc hoặc phòng thu có thể hoàn toàn khác với một giai điệu được ngâm nga," Frank viết."Do nhầm lẫn hoặc do thiết kế, khi ai đó ngâm nga diễn giải bài hát của họ, thường cao độ, phím, nhịp độ hoặc nhịp điệu có thể thay đổi một chút hoặc thậm chí đáng kể."

Image
Image

Vì các phiên bản được ngâm nga của bài hát có thể rất khác so với bản gốc, Frank lưu ý rằng nhiều phương pháp trước đây đã yêu cầu kết hợp tiếng ngân nga của một người với phiên bản bài hát chỉ có giai điệu hoặc một bản nhạc bao gồm tiếng ngân nga. Điều này khiến các trường hợp sử dụng trong thế giới thực trở nên khó khăn vì cơ sở dữ liệu với những bài hát đó có thể bị hạn chế và cần được cập nhật theo cách thủ công.

Google giải thích rằng đối với tính năng Hum to Search, nó sử dụng các mô hình máy học để biến âm thanh thành một "chuỗi dựa trên số" đại diện cho giai điệu của bài hát - những gì nó nói có thể được coi là "dấu vân tay."

Thân thiện hơn với người dùng

Việc sử dụng công nghệ máy học trong tính năng Hum to Search của Google cuối cùng làm cho công cụ này dễ sử dụng hơn rất nhiều trong thế giới thực. Vì Hum to Search khớp với giai điệu ngân nga của người tìm kiếm với bài hát thực tế, công cụ này có thể hoạt động với các bài hát mới khi chúng được phát hành thay vì cơ sở dữ liệu cần được cập nhật liên tục với các phiên bản ngâm nga của mỗi bài hát. Ngoài ra, bạn không cần quảng cáo chiêu hàng hoàn hảo để sử dụng nó.

"Hệ thống hiện tại đạt đến độ chính xác cao trên cơ sở dữ liệu bài hát chứa hơn nửa triệu bài hát mà chúng tôi liên tục cập nhật", Google cho biết trong thông báo Hum to Search của mình. "Kho ngữ liệu bài hát này vẫn còn nhiều chỗ để phát triển để đưa vào nhiều giai điệu của thế giới hơn."

Đề xuất: