Maestría en Data Science
Recent Submissions
-
Reducción de la subjetividad en el proceso de clasificación de color de teñido de lotes de producción textil mediante machine learning(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2023-09-08)Uno de los principales retos en la producción textil es reproducir lo mejor posible la tonalidad del color en la tela, tonalidad que se obtiene a partir de una muestra dada por el cliente. El procedimiento de evaluación del color normalmente tiene mucha subjetividad debido a la apreciación visual que hace el analista humano de calidad al evaluar un lote de teñido. Cuando se rechaza un lote de teñido y la diferencia de color no es muy evidente, se producen demoras en la decisión final, esta es la problemática en la empresa EcoTextil. Se investigó flujos de trabajo incluyendo algoritmos de aprendizaje supervisado para la clasificación de las partidas de teñido según tonalidad, reduciendo la subjetividad humana en la evaluación de la tonalidad del color. Para el diseño de los flujos de trabajo de clasificación se utilizó la Metodología Fundamental para la Ciencia de Datos de IBM (Rollins, 2015). Los flujos de trabajo automatizados propuestos fueron clasificados en flujos de alto, regular y bajo rendimiento, los flujos de alto rendimiento tienen en promedio un valor F1 de 0.92 que es mayor al valor F1 del flujo de trabajo actual, evaluación humana, que es de 0.82. La utilización de los flujos de trabajo automatizados propuestos significa un ahorro de 30,000 soles al año por reducción de horas hombre, unos 60,000 soles al año por reducción de reprocesos innecesarios, 144,000 soles al año por reducción de tiempos muertos y unos 30,000 soles al año por reducción de saldos de producción.Acceso abierto
-
Modelo predictivo de clasificación de pagos Fraudulentos para el área de prevención del fraude del Banco de Lima Metropolitana(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2022-10-02)La presente tesis muestra la aplicación de la Metodología Fundamental de Ciencia de Datos de IBM en conjunto con el marco de trabajo SCRUM para poder Analizar, modelar e implementar un modelo predictivo que permita asignar probabilidades a las transacciones bancarias y establecer cuáles son probablemente fraudulentas. Con tal objeto, se identificará al mejor modelo luego de ejecutar la validación cruzada con Kfold igual a 10 y calcular los indicadores de Área bajo la curva de la Precisión y Exhaustividad (AUC-PR) y Lift ya que nos encontramos ante un problema de datos desbalanceados donde las transacciones fraudulentas representan el 0.13% y las no fraudulentas el 99.87%. Como resultado se obtiene el mejor modelo a Gradient Boosting Classifier del que se obtuvieron los resultados con un Área bajo la curva de la Precisión y Exhaustividad (AUC-PR) de 0.036 y Lift de 3.629%; estos indicadores permitirán a la oficina de Prevención de Fraudes del Banco establecer un margen de alerta y tomar acción cuando las transacciones sean identificadas como fraudulentas.Acceso abierto
-
Identificación del estado de las vías vecinales mediante analítica geoespacial(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2023-07-15)La situación actual de las vías vecinales del Perú es crítica, solo el 2% se encuentra pavimentado y en su mayoría presentan un muy mal estado. Las municipalidades distritales, los responsables de dirigir los estudios y obras de conservación vial, no cuentan con recursos de información del sistema vial competente, capacidades de sustentación técnica y presupuesto, prueba de ello es que se realizan muy pocas inspecciones del estado de las vías. Esta investigación busca implementar una solución automatizada que inicia con la adquisición de datos geoespaciales como ortofotos georreferenciadas, nube de puntos 3D y modelos digitales de superficie (MDS) de alta resolución, recopiladas a través de aeronaves no tripuladas (UAV) y técnicas de fotogrametría y estructuras a partir de movimiento (SFM). Con estos insumos geoespaciales adecuados para el objetivo de estudio, y a partir de arquitecturas existentes de redes convolucionales, se desarrollará un modelo que permita identificar vías asfaltadas y posibles deterioros. La solución automatizada también proporcionará las métricas necesarias como cantidades, metros lineales, áreas o perímetros a intervenir; permitiendo así; un diagnóstico temprano de la situación vial. Se busca que esta solución tenga alto impacto en términos económicos y técnicos, logrando buena aceptación por los municipios y consultores a cargo del mantenimiento periódico de las redes viales vecinales. La aspiración de este proyecto apunta a mejorar la infraestructura de transporte como base del desarrollo sostenible, aumentando el nivel y calidad de vida de los habitantes.Acceso abierto