Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.uci.cu/jspui/handle/ident/8458
Título : Técnica Automática para la detección de Palabras Claves sobre Audio
Autor : Rodríguez López, Yanier
Fuentes Díaz, Adnan
Palabras clave : RECUPERACIÓN DE INFORMACIÓN;ACÚSTICA;PALABRA CLAVE
Fecha de publicación : 16-ene-2015
Resumen : Hoy en día la creciente disponibilidad y constante intercambio de información contenida en archivos audiovisuales genera el uso de mejores sistemas de recuperación de información. El presente trabajo tiene como objetivo proponer una técnica para el procesamiento de señales de audio con el propósito de recuperación de la información, utilizando la detección de palabras clave. Los sistemas para la detección de palabras clave procesan la señal de voz por medio de modelos del lenguaje (palabras, fonemas, sílabas) utilizando para esto una serie de descriptores que extraen las características particulares de la misma. Entre estos descriptores el más usado para describir las particularidades de la voz son los Coeficientes Cepstrales en escala Mel o Mel Frecuency Cepstral Coefficients (MFCC por sus siglas en inglés). Además se utilizó algoritmos y descriptores para la detección de extremos de la señal de voz. Esto es una fase muy útil en la cual se obtiene de una señal los segmentos que aportan información significativa. El modelado de las características fundamentales de la voz se realizó por medio de Modelos Ocultos de Markov o Hidden Markov Models (HMM por sus siglas en inglés) ya que constituyen un potente método estadístico para la modelación acústica del habla. Se confeccionó un modelo acústico basado en palabras. La herramienta de ensayo utilizada fue Matrix Laboratory (MATLAB por sus siglas en inglés) para la implementación de los procesos de tratamiento de la señal de audio. Se utilizaron medidas de eficiencia conocidas como Recall, Precision, Accuracy y la Tasa de Verdaderos Negativos o True Negative Rate (TNR por sus siglas en inglés) para el análisis de los resultados. Entre los resultados obtenidos se encuentran la implementación del algoritmo COPER para la detección de extremos de la señal de audio así como la utilización de la Energía y la Tasa de Cruces por Cero (Zero Crossing Rate ZCR por sus siglas en inglés) para la detección de extremos.
Descripción : Trabajo de Diploma para optar por el título de Ingeniero en Ciencias Informáticas
URI : https://repositorio.uci.cu/jspui/handle/ident/8458
Aparece en las colecciones: Trabajos de Diploma(Hasta Enero-2016)

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TD_07073_13.pdf
  Restricted Access
1.6 MBAdobe PDFVisualizar/Abrir


Los ítems del Repositorio están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.