Noticias

IBM rompe el récord de paridad humana en el reconocimiento de voz

IBM es una reconocida empresa tecnológica. Una de sus labores más prestigiosas y fructíferas es la de mejorar los sistemas de reconocimiento de voz que posteriormente se aplican en asistentes inteligentes mundialmente conocidos como Alexa o Siri. Mayor fidelidad de reconocimiento supone un ratio paridad humana mayor que se refleja con un menor índice de error por palabra. El año pasado IBM había logrado asentar un nuevo récord para el reconocimiento de voz alcanzando un índice de error por palabra de 6,9%. Un índice muy bajo pero que aún distaba de alcanzar el índice de paridad humana que alguna vez se estableció en 5,9%.

IBM continuó trabajando y parece que intensamente porque en menos de un año volvió a romper su propio récord: el nuevo récord de índice de error por palabra es de IBM y es de 5,5%. Sí, por debajo del índice necesario para ser considerado "paridad humana". Los humanos suelen, en promedio, no escuchar una o dos palabras de cada 20 que vienen en su dirección. En una conversación de cinco minutos esa cifra puede converger en 80 palabras no escuchadas. Si sumamos estas estadísticas y las comparamos con la tecnología desarrollada por IBM, eso quiere decir que el asistente inteligente que estuviese utilizando esta tecnología podría reconocer dictado de voz como un ser humano corriente (o incluso mejor, si nos guiamos por las cifras). Impresionante, ¿no es así?

Pero la novedad no termina allí. Después de haber roto su propio récord y de dar un gigantesco paso hacia las tecnologías que nos acercan a softwares lingüísticos y seres humanos, IBM confesó que creen que la paridad humana se alcanza con un índice de error por palabra del 5,1% y que es alcanzable. ¿Estarán a la vera de acabar por fin con las búsquedas erróneas y la repetición tediosa de nuestros pedidos a los asistentes inteligentes? Es posible, incluso, que estén cada vez más cerca de ayudar a construir el asistente inteligente perfecto.