• Propuesta de un modelo predictivo para efectivizar el proceso de validación de la información de los sistemas de agua y saneamiento de los centros poblados del Perú

      Medina La Plata, Edison Humberto; Cueva Sánchez, Jean Marcos; Elguera Meza, Paul Eugenio; Vilela Girón, Guillermo Daniel (Universidad Peruana de Ciencias Aplicadas (UPC), 2019-01-25)
      El Sistema de Agua y Saneamiento en el Perú es esencial para el desarrollo de la población rural. Para el año 2030, el gobierno peruano tiene proyectado cubrir al 100% de agua potable y saneamiento al ámbito rural. El Ministerio de Vivienda, Construcción y Saneamiento – MCVS, a través del Programa Nacional de Saneamiento Rural – PNSR, promueve la aplicación de las políticas de agua y saneamiento rural, en coordinación con los Gobiernos Regionales. El proceso de Diagnóstico de Agua y Saneamiento del MVCS, recopila la información de los centros poblados y luego esta información debe ser validada. En la validación de la información, se selecciona a los centros poblados a validar de manera aleatoria, debido a que no pueden identificar realmente a los centros poblados que ingresan información inconsistente. Esto afecta negativamente a la toma de decisiones para la priorización de los proyectos de construcción y mejoramiento de los sistemas de agua y saneamiento. En nuestra investigación, con las técnicas de minería de datos hemos identificado los perfiles de los centros poblados que deben ser considerados para la validación de su información, es decir los centros poblados que cuentan con información inconsistente y por tal razón deben ser validados y subsanados. Para probar lo antes mencionado, hemos considerado los 9,937 centros poblados de la región del Cusco, aplicando la metodología CRISP-DM y los algoritmos naive bayes, vecinos cercanos, árbol de decisión (Clasificación) y simple k-means (Agrupamiento) que nos han permitido obtener los modelos (predictivos y descriptivo) mediante el software WEKA.
      Acceso abierto