Cómo funciona la función Hum to Search de Google

Tabla de contenido:

Cómo funciona la función Hum to Search de Google
Cómo funciona la función Hum to Search de Google
Anonim

Conclusiones clave

  • Google ha lanzado una nueva herramienta que permite a los usuarios buscar canciones tarareando, cantando o silbando.
  • La nueva herramienta utiliza el aprendizaje automático para relacionar una pista tarareada con una base de datos de más de medio millón de canciones que se actualiza continuamente.
  • Los usuarios de Google preguntan qué canción se reproduce casi 100 veces al mes.
Image
Image

Google ha lanzado una nueva función llamada "Hum to Search" para resolver un problema frustrante: tener una canción atascada en la cabeza y no saber cómo se llama.

La idea de tararear para encontrar una canción parece increíblemente simple, entonces, ¿por qué Google solo lanzará esta función en 2020? Bueno, resulta que identificar canciones de esta manera es bastante complicado, en parte porque nuestras versiones tarareadas tienden a ser bastante diferentes de la pista original. En una publicación reciente en su blog de IA, Google explica cómo usó el aprendizaje automático para solucionar este problema y, en última instancia, ayudar a las personas a encontrar una canción tarareando, silbando o cantando la melodía, incluso cuando su interpretación no es precisa.

"Nuestro objetivo para Hum to Search es ayudar a las personas a identificar y encontrar la música que se les ha quedado grabada en la cabeza", dijo un portavoz de Google a Lifewire en un correo electrónico.

Empieza a tararear

Los usuarios de Google preguntan qué canción se reproduce casi 100 millones de veces cada mes, dijo Aparna Chennapragada, vicepresidenta y gerente general de compras para el consumidor de Google, en un video que presenta varias funciones de búsqueda nuevas. Ahora hay una forma de averiguarlo.

La función "Hum to Search" está integrada en la aplicación móvil de Google, el widget de búsqueda de Google y el Asistente de Google. Para acceder a ella a través de la aplicación, toque el ícono del micrófono y diga "¿Qué es esta canción?" Seleccionar el botón "Buscar una canción" también funciona.

Para que funcione correctamente, la función requiere que tararees durante al menos 10-15 segundos. Los usuarios de Android pueden tararear para encontrar canciones en más de 20 idiomas, mientras que solo las canciones en inglés funcionan en los iPhone. La herramienta no siempre puede identificar una canción de inmediato, pero una vez que lo hace, los resultados son bastante buenos.

"Más de la mitad de las canciones de un amplio conjunto de variables (tono, tono, volumen, etc.) son reconocidas por nuestros algoritmos, pero por supuesto, la precisión depende de la calidad del tarareo, el tipo de la canción y más", dijo el portavoz de Google a Lifewire en un correo electrónico. "Pero una vez que se reconoce, aproximadamente cuatro de cada cinco respuestas son correctas".

Sin embargo, esta no es la primera vez que se utiliza el tarareo en una aplicación de identificación de música. SoundHound ofrece una función similar, como señaló CNN Business, y también está disponible en Android e iOS. Según el portavoz de Google, la nueva función no plantea ningún problema de privacidad, ni "cambia la forma en que Google maneja las interacciones basadas en audio", le dijeron a Lifewire en un correo electrónico.

Aprendizaje automático

A pesar de la simplicidad del concepto, tararear una melodía para encontrar la grabación de estudio es técnicamente bastante difícil. Hay varias razones para esto, explica Christian Frank de Google Research en una publicación de blog del 12 de noviembre. En primer lugar, una versión tarareada de la canción puede diferir mucho de la grabación real, lo que dificulta la combinación de las dos. Entonces, si bien Shazam y una serie de otras aplicaciones ya existen para identificar esa canción que escuchas en un restaurante u otro lugar público, usar una melodía tarareada como base para esa búsqueda puede ser más complicado.

"Con las letras, los coros y los instrumentos, el audio de un musical o una grabación de estudio puede ser bastante diferente de una melodía tarareada", escribe Frank."Por error o diseño, cuando alguien tararea su interpretación de una canción, a menudo el tono, la clave, el tempo o el ritmo pueden variar ligeramente o incluso significativamente".

Image
Image

Debido a que las versiones tarareadas de las canciones pueden ser muy diferentes de las originales, Frank señala que muchos métodos anteriores han requerido hacer coincidir el tarareo de una persona con una versión de la canción que solo tiene una melodía o una pista que incluye el tarareo. Esto ha hecho que los casos de uso del mundo real sean un desafío, ya que las bases de datos con esas canciones pueden ser limitadas y deben actualizarse manualmente.

Google explica que para la función Hum to Search, utiliza modelos de aprendizaje automático para convertir el audio en una "secuencia basada en números" que representa la melodía de la canción; lo que dice puede considerarse como una "huella digital".."

Más fácil de usar

El uso del aprendizaje automático en la función Hum to Search de Google finalmente hace que la herramienta sea mucho más fácil de usar en el mundo real. Debido a que Hum to Search hace coincidir la melodía tarareada por el buscador con la canción real, la herramienta puede trabajar con las nuevas canciones a medida que se lanzan en lugar de una base de datos que necesita actualizarse constantemente con versiones tarareadas de cada pista. Además, no necesitas un tono perfecto para usarlo.

"El sistema actual alcanza un alto nivel de precisión en una base de datos de canciones que contiene más de medio millón de canciones que estamos actualizando continuamente", dijo Google en su anuncio Hum to Search. "Este corpus de canciones todavía tiene espacio para crecer e incluir más melodías del mundo".

Recomendado: