Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.uci.cu/jspui/handle/123456789/8042
Título : Subsistema de estandarización de documentos para el buscador Orión
Autor : Perera Pérez, Anietsy
Tutor: Hernández Luque, Eylín
Martínez Furones, Odisleysi
Rodríguez Leyva, Paúl
Palabras clave : ESTANDARIZACION DE DOCUMENTOS;BUSCADOR ORION;SISTEMAS DE RECUPERACION DE INFORMACION
Fecha de publicación : jun-2017
Editorial : Universidad de las Ciencias Informáticas. Facultad 1
Resumen : Internet constituye un importante medio de información usualmente recurrido por un gran número de usuarios, debido a la masividad y heterogeneidad de los contenidos que enlaza. El crecimiento acelerado de los datos provoca que los usuarios afronten dificultades para encontrar la información que realmente necesitan. Para contribuir a erradicar esta problemática se diseñaron los Sistemas de Recuperación de Información que permiten mostrar al usuario los contenidos más relevantes, mediante técnicas de rastreo, indexado y visualización de información. En la Universidad de las Ciencias Informáticas se desarrolló el buscador Orión, este presenta dificultades en el desempeño óptimo del proceso de estandarización de documentos. La investigación se centró en el desarrollo de un subsistema de estandarización de documentos para el buscador Orión. La propuesta de solución estuvo guiada por la metodología AUP-UCI y la modelación se realizó en la herramienta Visual Paradigm generando los artefactos afines a cada etapa del desarrollo. Durante la implementación se emplearon las tecnologías: Nutch como mecanismo para rastrear la Web, Solr como servidor de indexación, JSON como formato de intercambio de datos, XML como lenguaje para los ficheros de configuración en Solr y Java como lenguaje de programación para la implementación del plugin en Nutch. Para la validación del sistema se realizaron pruebas funcionales, de integración y aceptación, las cuales arrojaron un conjunto de no conformidades que fueron resueltas en iteraciones posteriores. El subsistema implementado presenta funcionalidades que favorecen la calidad de las búsquedas, mediante la estandarización de documentos en la integración de Nutch y Solr.
URI : https://repositorio.uci.cu/jspui/handle/123456789/8042
Aparece en las colecciones: Trabajos de Diploma

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TD_08802_17.pdf
  Restricted Access
2.24 MBAdobe PDFVisualizar/Abrir  Request a copy


Los ítems del Repositorio están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.