|
Título: Técnicas de minería de datos aplicadas
al diagnóstico de entidades clínicas.
Title: Data mining techniques aplied to diagnosys
of clinical entities.
Autores:
Frank Dávila Hernández1, Yovannys Sánchez
Corales2
1 CESIM. Departamento Atención Primaria de Salud.
Universidad de las Ciencias Informáticas, Carretera a San
Antonio de los Baños, km 2 ½, Torrens, Boyeros, La
Habana, CP. 19370. Cuba.
Email: fdavila@uci.cu
2 CESIM. Departamento Atención Primaria de Salud.
Universidad de las Ciencias Informáticas, Carretera a San
Antonio de los Baños, km 2 ½, Torrens, Boyeros, La
Habana, CP. 19370. Cuba.
Email: yscorales@uci.cu
Resumen
Disminuir el error médico y mejorar los procesos de salud
es prioridad de todo el personal sanitario. En este contexto surgen
los “Sistemas Clínicos de Soporte para la Toma de Decisiones”
(CDSS), los cuales son un componente fundamental en la informatización
de la capa clínica. Con la evolución de las tecnologías
gran cantidad de datos han podido ser estudiados y clasificados
a partir de la minería de datos. Una de las principales ventajas
de la utilización de esta, en los CDSS, ha sido su capacidad
de generar nuevos conocimientos. Con este fin se propone, mediante
la combinación de dos modelos matemáticos, cómo
se puede contribuir al diagnóstico de enfermedades usando
técnicas de minería de datos. Para mostrar los modelos
utilizados se tomó como caso de estudio la hipertensión
arterial. El desarrollo de la investigación se rige por la
metodología más utilizada actualmente en los procesos
de Descubrimiento de Conocimiento en Bases de Datos: CRISP-DM 1.0,
y se apoya en la herramienta de libre distribución WEKA 3.6.2,
de gran prestigio entre las utilizadas para el modelado de minería
de datos. Como resultados se obtuvieron diversos patrones de comportamiento
con relación a los factores de riesgo a sufrir hipertensión
mediante técnicas de minería de datos.
Palabras clave: CRISP-DM, hipertensión
arterial, KDD, minería de datos, diagnóstico clínico,
WEKA.
Abstract
Reduce medical errors and improve health processes is a priority
of all health personnel. In this context arise the “Clinical
Support Systems for Decision Making” (CDSS), which are a key
component in computerization of the clinical layer. With the evolution
of technologies, large amounts of data have been studied and classified
based on data mining. One of the main advantages of using this in
the CDSS, has been its ability to generate new knowledge. For this
purpose, this paper presents, by combining two mathematical models,
a way to contribute to the diagnosis of diseases using data mining
techniques. Hypertension was taken as a case study to show the models
used. The research development methodology follows the most used
processes of knowledge discovery in databases: CRISP-DM 1.0, and
relies on the free distribution tool WEKA 3.6.2. We obtained different
patterns of behavior in relation to risk factors for developing
hypertension using data mining techniques.
Key words: CRISP-DM, Data mining,
Arterial hypertension, KDD, Clinical diagnosys, WEKA.
|