Búsqueda multimedia

La función del reconocimiento de la voz es más eficaz en el momento de la búsqueda en contenidos multimedia. Gracias al reconocimiento automático de los textos de las grabaciones y su indexación usted gana acceso a la información contenida en las grabaciones sin tener que escucharlas enteras. Es una gran ventaja ya que hoy día hay que conseguir mucha información de muchas grabaciones en el tiempo muy restringido. Si tiene a su disposición un archivo de grabaciones procesadas de esta forma, no es necesario que las escuche todas, ni hace falta que limite su búsqueda a la información fragmentaria insertando manualmente las palabras claves. También puede encontrar la información cuyo papel en la grabación es solo marginal y no sería posible encontrarla tan solo con las palabras claves.

Parte lingüística

La presente tecnología combina el reconocedor de la voz con la función de la búsqueda full-text acompañada de otros instrumentos para la búsqueda morfológica, del diccionario de sinónimos o de un traductor. Es posible combinarla con la búsqueda de entradas creando así un sistema que busca por voz y que al mismo tiempo está dirigido por ella.

Soluciones de software

Igual que los demás sistemas de búsqueda, el primer paso del proceso es la indexación que sucesivamente permite una búsqueda efectiva a través de los índices creados.

El componente básico de esta tecnología es el reconocedor de la voz que transforma el sonido en el texto (en el caso del resultado ambiguo del reconocimiento, será ambiguo también el texto). Sigue el procesamiento del texto antes de la indexación (se crea el índice), por ejemplo, lematización (trasformación de la palabra a la forma base) para la búsqueda morfológica, eventualmente para la traducción al lenguaje del índice en el cual un mecanismo busca sucesivamente según las palabras insertadas. Las palabras insertadas se procesan también, puede realizarse, por ejemplo, la lematización o la expansión de las formas gramaticales (a una forma de la palabra se le añaden las demás y estas se buscan en el texto también), eventualmente pueden expandirse los sinónimos o realizarse la traducción al lenguaje del índice. 

El mecanismo de un reconocedor exige una gran cantidad de cálculos ajustados de forma que sea capaz de transformar rápidamente índices en los textos. El tiempo necesario para el procesamiento de la grabación es mínimo comparándolo con el tiempo de su reproducción. El número elevado de núcleos permite el procesamiento paralelo de más grabaciones a la vez. Es mejor colocar a los reconocedores en los servidores de parámetros equivalentes en el caso de la carga elevada. Otras actividades de la indexación son mucho más rápidas. La búsqueda puede ser limitada por la rapidez de la lectura del disco, lo que puede solucionarse empleando los discos más rápidos. Los mejores son los discos SSD, o su reflejo en otro disco, eventualmente otros servidores de búsqueda.