Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.uci.cu/jspui/handle/123456789/10135
Título : Algoritmos de adaptación ML-C4.5 y RF-C4.5 para problemas de aprendizaje multi-etiquetas integrado a scikit-multilearn
Autor : Cardoso Bocourt, Raydel Barbaro
Tutor: Milián Núñez, Vladimir
Palabras clave : APRENDIZAJE AUTOMATICO;CLASIFICACION MULTI-LABEL;ARBOLES DE DECISION;PRUEBAS DE FRIEDMAN;PYTHON
Fecha de publicación : jun-2018
Editorial : Universidad de las Ciencias Informáticas . Facultad 2
Resumen : La minería de datos como disciplina intenta reducir la brecha existente entre el volumen de información almacenado y el conocimiento que es capaz de extraerse de esta información. Dentro de la minería de datos el aprendizaje automático (AA) emplea información histórica para, a través de modelos, predecir el comportamiento de nuevas variables asociadas al problema. En los últimos años han surgido problemas de la vida práctica relacionados con la necesidad de predecir valores de salidas, modelados a través de diferentes estructuras complejas. El presente trabajo se fundamenta en la implementación de los algoritmos de clasificación multi-etiqueta con enfoque de adaptación basado en arboles ML-C4.5 y RF-C4.5 en la herramienta computacional de Python scikit-multilearn. Ha surgido la necesidad de poder usar estos algoritmos en otras plataformas de desarrollo como es el caso de Python el cual es uno de los lenguajes más novedosos y competitivos de estos tiempos el cual posee una biblioteca especializada en la clasificación multi-etiqueta que es scikit-multilearn. Se describe el proceso de implementación e integración a la herramienta scikit-multilearn siguiendo las pautas dictadas por la metodología KDD. Se evalúan los resultados alcanzados aplicando la Prueba de Friedman y haciendo uso de métricas para evaluar el rendimiento de los clasificadores multi-etiqueta. Se obtiene como resultado que los algoritmos propuestos no presentan diferencias significativas con los algoritmos del estado de arte.
Data mining as a discipline seeks to reduce the existing gap between the volume of information stored and the knowledge that is able to be extracted from this information. Within data mining, machine learning (AA) uses historical information to predict, through models, the behavior of new variables associated with the problem. In recent years problems of practical life have arisen related to the need to predict output values, modeled through different complex structures. The present work is based on the implementation of multi-label classification algorithms with adaptation approach based on trees ML-C4.5 and RF-C4.5 in the Python computational tool scikit-multilearn. There has been a need to be able to use these algorithms in other development platforms, such as Python, which is one of the most innovative and competitive languages of these times, which has a specialized library in the multi-label classification that is scikit- multilearn The implementation and integration process to the scikit-multilearn tool is described following the guidelines dictated by the KDD methodology. The results achieved are evaluated by applying the Friedman Test and using metrics to evaluate the performance of the multi-label classifiers. It is obtained as a result that the proposed algorithms do not present significant differences with the algorithms of the state of art.
URI : https://repositorio.uci.cu/jspui/handle/123456789/10135
Aparece en las colecciones: Trabajos de Diploma

Ficheros en este ítem:
Fichero Tamaño Formato  
TD_09074_18.pdf
  Restricted Access
1.8 MBAdobe PDFVisualizar/Abrir


Los ítems del Repositorio están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.