Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.uci.cu/jspui/handle/123456789/9341
Título : Sistema Experto basado en modelos de rasgos bilineales de la matriz de proximidad para la predicción de propiedades biológicas en proteínas
Autor : Sánchez Rodriguez, Juan Carlos
Tutor: Contreras Torres, Ernesto
Palabras clave : CLASES ESTRUCTURALES DE PROTEINAS;RANDOM FOREST;REGRESION LINEAL MULTIPLE;SISTEMA EXPERTO;VELOCIDAD DE PLEGAMIENTO DE PROTEINAS
Fecha de publicación : jun-2017
Editorial : Universidad de las Ciencias Informáticas. Facultad de Ciencias y Tecnologías Computacionales.
Resumen : El desarrollo de fármacos es una tarea en extremo compleja, pero también muy apreciada por la sensibilidad que genera el impacto negativo de las enfermedades en la sociedad moderna. Dada la importancia que tiene para la industria farmacéutica la identificación de propiedades biológicas en proteínas, resulta necesario el desarrollo métodos que predigan sus atributos. En el presente trabajo se desarrolla un Sistema Experto basado en modelos de rasgos bilineales de la matriz de proximidad calculados con el software ToMoCoMD-CAMPS, para predecir la clase estructural y la velocidad de plegamiento de las proteínas. Para ello se realizó un estudio a partir del cual fueron desarrollados un grupo de modelos, de los cuales fueron seleccionados 2 para integrar al Sistema Experto, uno de clasificación, obtenido con la técnica Random Forest, que presenta una exactitud global en la serie de entrenamiento de 100% y un 98 % en la serie de predicción y uno de regresión, obtenido con la técnica Regresión Lineal Múltiple, que presenta valores de Q2loo=0.7612 y Q2ext=0.7263. Ambos son modelos robustos y con alto poder predictivo, aventajando a otros modelos reportados en investigaciones precedentes. Se anticipa la potencial aplicación del sistema desarrollado como una herramienta complementaria a los enfoques precedentes en la predicción de propiedades biológicas en proteínas.
The development of drugs is an extremely complex task, and at the same time highly appreciated due to the sensitivity caused by the negative impact of diseases in modern society. Given the importance to the pharmaceutical industry of the identification of biological properties in proteins, it is necessary to develop methods that predict their attributes. In the present work an Expert System was developed, based on models of bilinear features of the proximity matrix calculated with the software ToMoCoMD-CAMPS, to predict the structural class and folding rate of the proteins. A study was carried out from which a group of models were developed, two of them were selected to integrate the Expert System, one model obtained by the Random Forest technique, which has a global accuracy in the training series of 100 % and 98% in the prediction series, and a regression model obtained with the Multiple Linear Regression technique with values of Q2loo=0.7612 and Q2ext=0.7263. Both are robust models with high predictive levels, and they get better results than others previously reported findings. It is anticipated the potencial application of the developed system as a complementary tool to the existing approaches for the prediction of proteins biological properties.
URI : https://repositorio.uci.cu/jspui/handle/123456789/9341
Aparece en las colecciones: Trabajos de Diploma

Ficheros en este ítem:
Fichero Tamaño Formato  
TD_09004_17.pdf
  Restricted Access
2.17 MBAdobe PDFVisualizar/Abrir  Request a copy


Los ítems del Repositorio están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.