Abstract:
El índice de deserción estudiantil en el Ecuador es un problema que afecta a la sociedad, a la economía y a la Universidad por lo tanto este proyecto se enfoca en el desarrollo de un modelo que permita predecir la posibilidad que tiene un alumno de reprobar una materia o finalmente desertar, de tal forma que se pueda crear estrategias y tomar decisiones que lo solventen utilizando la minería de datos que es un conjunto de técnicas que permiten descubrir patrones de comportamiento a partir de un gran conjunto de datos. Se recuperó la información personal y académica de los alumnos de la Universidad de las Fuerzas Armadas – ESPE Matriz durante los últimos cinco años. Para el desarrollo del proceso de minería de datos se ha utilizado la metodología CRISP-DM que está constituida por seis etapas: Comprensión del Negocio, Comprensión de los Datos, Preparación de los Datos, Modelado, Evaluación y Despliegue. En las dos primeras etapas se utilizó las herramientas Pentaho Data Integration para la creación del Data Warehouse y R Studio para la exploración estadística de los datos, en la tercera etapa se utilizó Open Refine y Pentaho Data Integration y finalmente en las dos últimas etapas la herramienta WEKA que permite la extracción del conocimiento utilizando distintas técnicas de minería de datos.