Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.uci.cu/jspui/handle/123456789/7632
Título : Componente de software para la generación automática del cuadro de clasificación archivística
Autor : Molina Betancourt, Luis Miguel
Tutor: Cordero Morales, Dasiel
Palabras clave : ALGORITMO DE CLUSTERING JERARQUICO;ARCHIVO DIGITAL TEXTUAL;CLASIFICACION AUTOMATICA;CUADRO CLASIFICACION ARCHIVISTICA
Fecha de publicación : jun-2016
Editorial : Universidad de las Ciencias Informáticas. Facultad 2
Resumen : La clasificación y gestión de los archivos es tan antigua como la organización social de la humanidad. Con el auge de las Tecnologías de la Información y las Comunicaciones, estas actividades han cambiado en gran parte a archivos digitales. Los Sistemas de Gestión de Archivos permiten gestionar el contenido de los archivos estableciendo su estructura y funciones. Tales actividades corresponden a la clasificación archivística, constituyendo el cuadro de clasificación artefacto clave en estas acciones. Para la creación del cuadro de clasificación es necesario procesar las fuentes archivísticas de la organización. Para ello deben digitalizarse los archivos mediante técnicas de reconocimiento óptico de caracteres. Luego debe realizarse una extracción y representación del contenido de los archivos, para agrupar los archivos según características de su contenido. Uno de los procesos para el procesamiento de la información es el agrupamiento automático, de la Inteligencia Artificial, encargada de agrupar un conjunto de objetos en subconjuntos para una mejor organización. El objetivo de este trabajo es desarrollar un componente de software para generar automáticamente una primera aproximación del cuadro de clasificación archivística, para sistemas de gestión de archivos desarrollados en la plataforma Java, utilizando técnicas de agrupamiento jerárquico. Para ello fueron implementados los algoritmos los Single-Link, Complete-Link, UPGMA, WPGMA, UPGMC, WPGMC y Ward, utilizando las funciones de semejanza Dice, Jaccard y Coseno. Los resultados obtenidos fueron evaluados empleando las métricas Overall Similarity, Entropía y F-Measure; las cuales miden la calidad de agrupamiento tanto interna como externa. Esto fue posible mediante un caso de estudio, utilizando un conjunto de datos de prueba obtenidos de Reuters-21578; que permitió comparar los algoritmos utilizando la precisión como medida principal de la calidad de los agrupamientos. También fueron realizadas pruebas de software dividida en los niveles de unidad y sistema utilizándose pruebas unitarias y de aceptación como define la metodología XP, lográndose corregir todas las deficiencias detectadas en las iteraciones realizadas.
URI : https://repositorio.uci.cu/jspui/handle/123456789/7632
Aparece en las colecciones: Trabajos de Diploma

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
TD_08490_16.pdf
  Restricted Access
1.61 MBAdobe PDFVisualizar/Abrir  Request a copy


Los ítems del Repositorio están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.