Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.uci.cu/jspui/handle/ident/8458
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorRodríguez López, Yanier
dc.contributor.authorFuentes Díaz, Adnan
dc.date.accessioned2016-09-14T19:24:53Z-
dc.date.available2016-09-14T19:24:53Z-
dc.date.issued2015-01-16
dc.identifier.urihttps://repositorio.uci.cu/jspui/handle/ident/8458-
dc.descriptionTrabajo de Diploma para optar por el título de Ingeniero en Ciencias Informáticases_ES
dc.description.abstractHoy en día la creciente disponibilidad y constante intercambio de información contenida en archivos audiovisuales genera el uso de mejores sistemas de recuperación de información. El presente trabajo tiene como objetivo proponer una técnica para el procesamiento de señales de audio con el propósito de recuperación de la información, utilizando la detección de palabras clave. Los sistemas para la detección de palabras clave procesan la señal de voz por medio de modelos del lenguaje (palabras, fonemas, sílabas) utilizando para esto una serie de descriptores que extraen las características particulares de la misma. Entre estos descriptores el más usado para describir las particularidades de la voz son los Coeficientes Cepstrales en escala Mel o Mel Frecuency Cepstral Coefficients (MFCC por sus siglas en inglés). Además se utilizó algoritmos y descriptores para la detección de extremos de la señal de voz. Esto es una fase muy útil en la cual se obtiene de una señal los segmentos que aportan información significativa. El modelado de las características fundamentales de la voz se realizó por medio de Modelos Ocultos de Markov o Hidden Markov Models (HMM por sus siglas en inglés) ya que constituyen un potente método estadístico para la modelación acústica del habla. Se confeccionó un modelo acústico basado en palabras. La herramienta de ensayo utilizada fue Matrix Laboratory (MATLAB por sus siglas en inglés) para la implementación de los procesos de tratamiento de la señal de audio. Se utilizaron medidas de eficiencia conocidas como Recall, Precision, Accuracy y la Tasa de Verdaderos Negativos o True Negative Rate (TNR por sus siglas en inglés) para el análisis de los resultados. Entre los resultados obtenidos se encuentran la implementación del algoritmo COPER para la detección de extremos de la señal de audio así como la utilización de la Energía y la Tasa de Cruces por Cero (Zero Crossing Rate ZCR por sus siglas en inglés) para la detección de extremos.es_ES
dc.language.isoeses_ES
dc.subjectRECUPERACIÓN DE INFORMACIÓNes_ES
dc.subjectACÚSTICAes_ES
dc.subjectPALABRA CLAVEes_ES
dc.titleTécnica Automática para la detección de Palabras Claves sobre Audioes_ES
dc.typeThesisdipes_ES
dc.typebachelorThesis
dc.area.centroOtro Centroes_ES
dc.area.facultadFacultad 6es_ES
Aparece en las colecciones: Trabajos de Diploma(Hasta Enero-2016)

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TD_07073_13.pdf
  Restricted Access
1.6 MBAdobe PDFVisualizar/Abrir


Los ítems del Repositorio están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.