Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.uci.cu/jspui/handle/ident/8774
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.authorEstoque Cabrera, Evelyn
dc.contributor.authorBaró Galán, Lianet
dc.contributor.authorEscobar Pompa, Mailen Edith
dc.date.accessioned2016-09-14T19:25:17Z-
dc.date.available2016-09-14T19:25:17Z-
dc.date.issued2015-02-14
dc.identifier.urihttps://repositorio.uci.cu/jspui/handle/ident/8774-
dc.descriptionTrabajo de Diploma para optar por el título de Ingeniero en Ciencias Informáticas.es_ES
dc.description.abstractEn la actualidad es creciente la necesidad de las organizaciones de velar por la calidad de sus datos como fuente fundamental para los análisis en la toma de decisiones, por lo que es de vital importancia contar con procedimientos que ayuden en el proceso de limpieza de datos. Surge este trabajo como resultado de una investigación intensiva sobre el tema, el cual se basa en el análisis de la información de la base de datos del GESPRO, y la identificación de los problemas de calidad de datos que presentan. Para ello se estudian los principales conceptos relacionados con el tema, algoritmos y metodologías para realizar la limpieza de datos. Mediante el uso de la metodología propuesta por Leslie M. Tierstein se realiza el proceso de limpieza de datos. Se implementan las funciones de similitud de Jaro para la detección y corrección de duplicados y la distancia de edición para los errores ortográficos, no estandarización de cadenas e irregularidades. Implementados por medio de funciones SQL, estos métodos podrán ser corridos en la base de datos erradicándose estos errores de manera automática. Finalmente se valida la eficiencia de dichos métodos a través del cálculo de la complejidad y efectividad, definiéndose para ello un caso de estudio donde se miden en diferentes volúmenes de datos, el tiempo de ejecución y porciento de errores erradicados.es_ES
dc.language.isoeses_ES
dc.subjectINFORMÁTICAes_ES
dc.subjectBASES DE DATOSes_ES
dc.subjectALGORITMOSes_ES
dc.subjectCALIDAD DE DATOSes_ES
dc.subjectLIMPIEZA DE DATOSes_ES
dc.subjectTAXONOMÍASes_ES
dc.titleImplementación de algoritmos para la limpieza de datoses_ES
dc.typebachelorThesis
dc.area.facultadFacultad 3es_ES
Aparece en las colecciones: Trabajos de Diploma(Hasta Enero-2016)

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TD_06906_13.pdf
  Restricted Access
2.04 MBAdobe PDFVisualizar/Abrir


Los ítems del Repositorio están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.