Por favor, use este identificador para citar o enlazar este ítem:
https://repositorio.uci.cu/jspui/handle/123456789/7699
Título : | Componente para la limpieza de metadatos bibliográficos |
Autor : | García Palma, Yoandri |
Tutor: | Hidalgo Delgado, Yusniel Ortiz Muñoz, Ernesto |
Palabras clave : | LIMPIEZA DE DATOS;CALIDAD DE DATOS;PREPROCESAMIENTO DE DATOS |
Fecha de publicación : | jul-2016 |
Editorial : | Universidad de las Ciencias Informáticas. Facultad 3 |
Resumen : | Los procesos realizados en una biblioteca digital son altamente sensibles a la calidad de los metadatos que describen sus recursos. Ellos dependen de la precisión y exactitud de los datos, cuya degradación de la calidad conlleva a la realización de búsquedas y análisis erróneos por parte de los usuarios. Los metadatos de las bibliotecas digitales provienen de diversas fuentes y de diferentes ubicaciones geográficas que por lo general contienen errores, por ejemplo, las faltas de ortografía y convenciones inconsistentes a través de fuentes de datos. Cantidades significativas de tiempo y esfuerzo se emplean en la limpieza de datos y en tareas de detección y corrección de errores en los mismos. El objetivo de
la investigación es desarrollar un componente de software para incrementar la calidad de los metadatos bibliográficos en los repositorios de metadatos, aplicando técnicas de limpieza de datos y criterios para medir la calidad de los mismos en bibliotecas digitales. El componente propuesto utiliza elementos de los metadatos bibliográficos presentes en los repositorios digitales para establecer las relaciones entre los autores. Estos elementos son: autores, co-autores, afiliación, títulos de las publicaciones y lugares de publicación. The processes performed in a digital library are highly sensitive to the quality of the metadata that describes resources. They depend on the precision and accuracy of the data, whose degradation leads to searches and erroneous conclusions. The metadata of digital libraries usually come from different sources and from different geographical locations contain errors, such as misspellings and inconsistent conventions across data sources. Significant amounts of time and effort is spent on data cleaning, error detection and correction in data. The aim of this research is to develop a software component to increase the quality of bibliographic metadata in digital libraries, using data cleaning techniques and criteria for measuring quality of data in digital libraries. The proposed component uses some elements of bibliographic metadata present in digital repositories to establish the relationships between authors. These elements are: authors, co-authors, affiliation, titles of publications and publishing places. |
URI : | https://repositorio.uci.cu/jspui/handle/123456789/7699 |
Aparece en las colecciones: | Trabajos de Diploma |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
TD_08540_16.pdf Restricted Access | 1.91 MB | Adobe PDF | Visualizar/Abrir |
Los ítems del Repositorio están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.