Título:
Componente web para el análisis de información clínica usando la técnica de Minería de Datos por agrupamiento


Title: Web component for the analysis of clinical information using the technique of clustering data mining

 

 

 

Autores:

Ing. Alexeis Joel Ochoa Reyes1, Ing. Arturo Orellana García2, Ing. Yovannys Sánchez Corales3, Ing. Frank Davila Hernández4

1Ingeniero en Ciencias Informáticas. Centro de Informática Médica, Universidad de las Ciencias Informáticas. Carretera San Antonio de los Baños Km 2 ½, Boyeros, La Habana, Cuba.
E-mail: ajochoa@uci.cu

2Ingeniero en Ciencias Informáticas. Centro de Informática Médica, Universidad de las Ciencias Informáticas, La Habana, Cuba.
E-mail: aorellana@uci.cu

3Ingeniero en Ciencias Informáticas. Centro de Informática Médica, Universidad de las Ciencias Informáticas, La Habana, Cuba.
E-mail: yscorales@uci.cu

4Ingeniero en Ciencias Informáticas. Centro de Informática Médica, Universidad de las Ciencias Informáticas, La Habana, Cuba.
E-mail: fdavila@uci.cu

 

 


Resumen

La digitalización de los diferentes procesos y la automatización de los servicios generan grandes volúmenes de información. La Minería de Datos (MD) es una técnica de Inteligencia Artificial que permite encontrar la información no trivial que reside en los datos almacenados. La presente investigación pretende desarrollar una vista de análisis para el Sistema Integral para la Atención Primaria de Salud (SIAPS), usando la técnica de agrupamiento enmarcada en el algoritmo Simple K-Means, con el objetivo de realizar un análisis de la información clínica de los pacientes; para ello se plantea la extracción del conocimiento del almacén de datos alimentado del repositorio de historias clínicas electrónicas. La investigación se sustenta en la herramienta de libre distribución WEKA, esta funciona de forma aislada al SIAPS; la interfaz, así como las vistas, modelos e informes generados por WEKA en ocasiones resultan de difícil comprensión por los profesionales de la salud, los que no necesariamente tienen que poseer conocimientos avanzados de las nuevas tecnologías de la información. Para el desarrollo de la solución se empleó el lenguaje de programación Java 1.6, como servidor de aplicación JBoss 4.2 y Eclipse 3.4 como plataforma de desarrollo, como Sistema Gestor de Bases de Datos PostgreSQL 8.4 y SEAM como framework de integración. Durante todo el proceso se hizo uso de la plataforma Java Enterprise Edition 5.0. Como resultado se espera obtener una vista de análisis que facilite la comprensión de los modelos generados, apoyando de esta forma el proceso de toma de decisiones clínicas.

Palabras clave: almacén de datos, extracción del conocimiento, inteligencia artificial, minería de datos, Simple K-Means, vista de análisis.

 

Abstract

The digitization of the different processes and automation services generate large volumes of information. Data mining (DM) is an artificial intelligence technique that allows finding non-trivial information residing in stored data. This research aims to develop a view of analysis for the Integral System for Primary Health Care (SIAPS), using grouping technique framed on Simple K-Means
algorithm, with the goal of completing an analysis of the patients' clinical information, for it raises the extraction of knowledge from data warehouse powered by the repository of electronic medical records. The research is based on the free distribution tool WEKA, it works in isolation of SIAPS, the interface, as well as the views, models and reports generated by WEKA are sometimes difficult to understand by health professionals, who do not necessarily have to possess advanced knowledge of new information technologies. For the development of the solution was used Java 1.6 as a programming language, JBoss 4.2 as the application Server and Eclipse 3.4 as a development platform. PostgreSQL 8.4 was used as Database Management System and the integration framework SEAM. Java Enterprise Edition 5.0 platform was used during the whole process. An analysis view to facilitate the understanding of the generated models is expected as a result, to support the process of making clinical decisions.

Key words: data warehouse, knowledge extraction, artificial intelligence, data mining, Simple K-Means, analysis view.

 


Arriba

 

 

WWW:CECAM.SLD.CU