Maestría en Data Science
Recent Submissions
-
Evaluación de técnicas de clasificación para la ejecución de mantenimientos predictivos de software en el proceso de atención de incidentes de estaciones base de telecomunicaciones en zonas rurales del Perú(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2025-09-30)Este trabajo aborda el problema de las interrupciones en el funcionamiento de antenas de telecomunicaciones en Perú, situación que impacta negativamente en lo económico y la calidad de servicio hacia los usuarios. Estas interrupciones, impactan en un promedio mensual de inactividad que se traduce en pérdidas estimadas de 28,000 gigabytes de datos y, 170,000 minutos de voz. El objetivo de la investigación es predecir fallos y optimizar el mantenimiento predictivo de las antenas para mitigar tiempos de inactividad por medio de la búsqueda del mejor modelo de clasificación. El estudio se centró en los problemas de software de antenas terrestres con tecnología 4G operadas por un proveedor, debido a su significativa participación en el mercado y consistencia de datos. Para abordar esta situación, se evaluaron clasificadores tales como Random Forest, Gradient Boosting, Bagging Decision Trees, entre otros. De estos se destacó Long Short-Term Memory (LSTM), el cual se optimizó durante el entrenamiento con datos históricos de la empresa. La implementación del modelo de LSTM en producción logró un Recall del 68.33%, disminuyendo de manera efectiva las interrupciones de servicio y sanciones regulatorias, lo que resultó en un ahorro neto superior a S/ 1,200,000. El uso del modelo LSTM mejoró la continuidad del servicio evitando interrupciones estimadas en 20 mil minutos en llamadas y 10 mil en minutos de datos. Por último, fortaleció el cumplimiento de normativas y políticas de calidad en la operadora evitando 11 multas de OSIPTEL en un mes.Acceso abierto
-
Modelo predictivo para el cálculo del engagement de música con tendencia al rock en YouTube aplicando Machine Learning(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2025-05-26)La industria musical se ha transformado drásticamente en la era digital, donde plataformas como YouTube han emergido como centros de consumo y descubrimiento de música. En este contexto, las productoras musicales enfrentan el desafío de no solo producir música de alta calidad, sino también de asegurar su éxito y alcance entre el público. Una productora que busque destacarse en este cambiante escenario y competitivo se beneficiaría una herramienta que le ayude a predecir el engagement de la música. Para garantizar el éxito de las producciones, sería esencial comprender y predecir cómo el público reaccionará ante nuevas canciones, especialmente en un entorno tan competitivo y saturado como YouTube. El engagement se define por una serie de métricas, incluyendo comentarios, visitas y likes, que reflejan la interacción y recepción de una canción por parte del público en la plataforma. El desafío de predecir patrones de engagement se complejiza por la diversidad de factores que influyen en la recepción de una canción. Además de aspectos musicales, como la letra y el título, factores externos como las etiquetas y el contexto del lanzamiento también juegan un papel crucial. Aunque existen métricas como número de vistas, likes, comentarios y tendencias que brindan una visión retrospectiva del desempeño de una canción, se aspira a una predicción más precisa y anticipada. Este estudio de tesis se enfocará en abordar este desafío mediante la creación de un modelo predictivo que utilice características textuales de las canciones, junto con datos disponibles en el API de YouTube, para prever el engagement de una canción. Al combinar análisis de texto con métricas de visualización, se busca proporcionar una herramienta para identificar el potencial éxito de una canción en YouTube antes de su lanzamiento.Acceso abierto
-
Modelo de precios dinámicos de créditos personales basado en la disposición de pago de clientes y en la optimización de rentabilidad(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2025-01-10)Este trabajo de investigación presenta un modelo de precios dinámicos para créditos personales, diseñado para optimizar la rentabilidad de las instituciones financieras. A diferencia de los modelos tradicionales de fijación de precios, este enfoque se basa en la disposición a pagar de los clientes, considerando tanto la probabilidad de aceptación de las tasas de interés ofrecidas como el riesgo crediticio asociado a cada prestatario. El modelo propuesto utiliza algoritmos de aprendizaje automático para predecir la probabilidad de que un cliente acepte una oferta de crédito en función de su comportamiento crediticio y las características del producto. La investigación se llevó a cabo utilizando un conjunto de datos históricos de cotizaciones de créditos personales vehiculares de una empresa financiera en línea de Estados Unidos. Se realizaron análisis exploratorios y se seleccionaron las variables más relevantes para el modelado, seguido de un proceso de validación cruzada anidada para la selección y optimización de los modelos predictivos. Los resultados demuestran que el modelo de precios dinámicos basado en LightGBM es capaz de mejorar significativamente la rentabilidad de la empresa al ajustar las tasas de interés de manera óptima, maximizando el valor presente neto de los ingresos por intereses y reduciendo el riesgo de pérdidas por incumplimiento. Este enfoque permite a las instituciones financieras ofrecer tasas de interés competitivas y personalizadas, aumentando la probabilidad de aceptación por parte de los clientes y mejorando la rentabilidad general del portafolio de créditos personales.Acceso abierto
-
Valorización de activos inmobiliarios en una entidad financiera peruana: modelo predictivo XGBoost usando las características de los inmuebles y variables geográficas(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2025-02-27)Este estudio se centra en el desarrollo de modelos de regresión utilizando técnicas avanzadas de aprendizaje automático para predecir el valor comercial de inmuebles en el contexto financiero peruano. Se exploran diversos modelos, como Random Forest, Support Vector Regression (SVR), Redes Neuronales, y XGBoost, siendo este último el que demostró mayor precisión al obtener un Error Porcentual Medio Absoluto de 17.89% y, por otra parte, una mayor flexibilidad al permitir controlar el comportamiento que debe tener cada variable independiente respecto a la variable objetivo. Además, se destaca la importancia de incluir variables como el área de construcción del bien inmueble y precio del metro cuadrado considerando su ubicación. Los resultados de este estudio proporcionan a las entidades financieras una herramienta robusta y eficiente para optimizar el proceso de tasación de inmuebles, reduciendo costos y tiempos asociados.Acceso abierto
-
Modelo de Segmentación de Riesgo de Lavado de Activos aplicado a personas naturales en una microfinanciera según regulación de la SBS, 2024(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2025-05-15)El presente trabajo de investigación tiene como objetivo desarrollar un modelo de segmentación de Riesgo de Lavado de activos aplicado a personas naturales en una microfinanciera, según regulación de la Superintendencia de Banca, Seguros y AFP (Resolución S.B.S. 2660-2015, 2015). El lavado de activos constituye un desafío crítico para las entidades financieras, ya que tiene repercusiones significativas en la estabilidad económica, afecta la productividad interna de las organizaciones y genera costos elevados al deterioro de la imagen institucional por la exposición a fraudes (LP Pasión por el Derecho, 2021). El estudio se enfocará en la recopilación y análisis de datos históricos de los clientes, incluyendo información demográfica, datos financieros y otros factores relevantes. Para ello, se aplicarán técnicas de minería de datos y aprendizaje automático, con el objetivo de identificar patrones y tendencias que puedan predecir la segmentación de riesgo de lavado de activos. El modelo resultante será validado mediante técnicas de análisis de agrupamiento y evaluación de la coherencia de los segmentos generados. Dado que no se cuenta con datos etiquetados, se aplicarán métodos no supervisados para identificar patrones y estructuras latentes dentro de los datos de los clientes, permitiendo una segmentación efectiva del riesgo de lavado de activos. Adicionalmente, se complementará el análisis con la validación de un experto en prevención de lavado de activos, quien evaluará la lógica y utilidad de los segmentos identificados en función de su experiencia y conocimiento del sector. Este estudio aportará al campo de la gestión de seguridad y operaciones, proporcionando a la empresa microfinanciera una valiosa herramienta estratégica para anticipar y abordar el problema del lavado de activos y garantizando el cumplimiento de las normativas establecidas por el estado peruano.Acceso abierto
-
Factores de la atención de cobranza que conduce a la generación de un compromiso de pago(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2025-05-14)El informe de investigación se enfoca en uno de los principales retos de una empresa de gestión de cobranzas el cual consiste en entender cómo mejorar la generación de compromisos de pago en las llamadas telefónicas a clientes deudores. Para esto se usan modelos predictivos aplicados a variables del entorno de la negociación en la llamada y variables de la segmentación, que luego se comparan sus desempeños predictivos. La realización de este objetivo se desarrolla bajo la metodología CRISP-DM para la estructuración del proyecto, así mismo se propuso un plan de trabajo para cumplir en 15 semanas el desarrollo del modelo de mejor desempeño. La empresa objeto de estudio es RECSA, una compañía con más de 30 años de experiencia en gestión de cobranza en América Latina. El trabajo investiga cómo mejorar la efectividad de las llamadas de cobranza y generar compromisos de pago, clave para el crecimiento y estabilidad de la cartera de clientes. El estudio emplea técnicas de machine learning para desarrollar un modelo predictivo que permita determinar si un cliente se comprometerá a pagar su deuda, analizando las conversaciones de las llamadas y el perfil de los clientes. También se emplea un LLM como otra herramienta más de predicción. Finalmente, se comparan los modelos para evaluar cuál tiene mejor desempeño predictivo.Acceso abierto
-
Modelo Predictivo de Clasificación de Clientes morosos de la cartera de créditos de ProEmpresa(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2025-04-08)El siguiente trabajo de investigación tiene como objetivo elaborar la implementación de un modelo analítico que permita predecir los potenciales clientes morosos de la cartera de créditos de una empresa de servicios financieros. Actualmente las financieras que ofrecen créditos a personas naturales, negocios pequeños y/o a la pequeña y mediana empresa enfrentan incertidumbre sobre el pago de los préstamos otorgados, cada retraso o impago genera menos ingresos y sobrecostos en la gestión de la cobranza,, por ello se busca implementar herramientas y mecanismos que permitan identificar anticipadamente y generar planes de acción en el proceso de otorgamiento de crédito así como el seguimiento de estos clientes con tendencia al impago de sus préstamos. El modelo a implementar permitirá brindar soporte al equipo de evaluación de clientes con el fin de proveer mecanismos de toma de decisión durante la evaluación de préstamos y el seguimiento de la cartera de clientes, para lograr esto se propone el uso de un modelo jerárquico que permita identificar claramente a los clientes que no tendrán problema alguno con los pagos, los clientes que pagaran con retraso y los que clientes que definitivamente no podrán pagar. En este proyecto está considerado el uso de principios ágiles usando SCRUM, acompañado de la metodología CRISP-DM para la elaboración de proyectos de Ciencia de Datos, combinamos ambas con el fin de poder obtener entregables más tempranos los cuales puedan ser evaluados y retroalimentar las siguientes etapas de la implementación.Acceso abierto
-
Medición y seguimiento de la calidad de llamadas de un Call Center usando técnicas de procesamiento de lenguaje natural (NLP) en una farmacia digital en el año 2024(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-11-14)El presente trabajo de investigación tiene como objetivo diseñar un dashboard de análisis de las llamadas del área de call center de una farmacia digital cuyos datos son extraídos a través de técnicas de Natural Language Processing (NLP), Machine Learning e ingeniería de datos sobre los audios de llamada que se generan durante la interacción entre el paciente y el asesor del área de contacto de la empresa. Para el desarrollo de este trabajo se ha propuesto presentarlo en cinco capítulos. En el primer capítulo se detalla la situación problemática de la empresa abordando puntos como la formulación del problema, los problemas y objetivos generales como específicos. Así también los alcances, limitaciones y la justificación del mismo en diferentes dimensiones como son la económica y operativa. En el segundo capítulo se desarrolla el marco teórico y estado del arte dando a conocer la teoría que argumenta el trabajo de investigación. Posteriormente en el tercer capítulo se presenta información general de la empresa de estudio y de los procesos de negocio del área de call center que están dentro del alcance de la investigación. Seguidamente, en el cuarto capítulo se presenta el desarrollo de la propuesta de solución en sus diferentes dimensiones como son la arquitectura de datos utilizada, tecnologías de analítica avanzada, recursos humanos, hitos y entregables Finalmente, en el quinto capítulo se conocen las conclusiones y recomendaciones obtenidas durante el desarrollo del presente.Acceso abierto
-
Implementación de un modelo de regresión de machine learning para mejorar la valoración de departamentos de Tempo Perú en Lima Centro y Lima Oeste(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2025-01-06)La investigación aplica técnicas avanzadas de aprendizaje automático, específicamente el modelo XGB Regressor, para mejorar la precisión y eficiencia en la valoración de propiedades inmobiliarias en Lima Centro y Lima Oeste. Enfocada en Tempo Perú, aborda los desafíos de los métodos tradicionales y subjetivos de valoración. El estudio identifica variables clave que influyen en la valoración de departamentos y construye un modelo de regresión utilizando XGB Regressor, implementado en la aplicación web Evaluator para automatizar el proceso y mejorar la eficiencia operativa. Se probaron cinco regresores lineales y ocho no lineales, determinando que el XGB Regressor ofrecía los mejores resultados en términos de precisión y robustez. La metodología integró CRISP-DM y SCRUM, abarcando desde la recolección y análisis de datos hasta la construcción del modelo y su implementación. Los datos incluyeron características del inmueble, proximidad a lugares de interés (empresas, lugares públicos, entretenimiento), nivel socioeconómico, información de DataCrim y Google Maps. Los resultados mostraron un R² de 95.16% y un MAPE de 7.219%, validando la efectividad del modelo. Las variables más influyentes fueron el área del inmueble, la latitud y la densidad de comercios cercanos. La implementación del modelo mejoró significativamente la precisión de las valoraciones, redujo tiempos y costos, y aumentó la satisfacción del cliente, fortaleciendo la posición de Tempo Perú en el mercado. Este estudio demuestra cómo el aprendizaje automático puede transformar la valoración inmobiliaria, ofreciendo mayor precisión y eficiencia, y proporcionando a Tempo Perú una herramienta robusta que optimiza sus procesos operativos y mejora su competitividad.Acceso abierto
-
Modelo de segmentación de carteras de clientes MYPE mediante el uso de modelos de machine learning para el otorgamiento de línea y/u ofertas de crédito de una caja municipal(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2025-01-23)El presente estudio comprende la segmentación de una cartera MYPE en una caja municipal con la finalidad de identificar grupos homogéneos según su comportamiento crediticio y perfil de riesgo; la segmentación se llevará a cabo utilizando datos que corresponden al año 2023, periodo adecuado que podría capturar el ciclo comercial y reflejarían las condiciones de mercado. El enfoque de la investigación fue de tipo exploratorio, orientado a analizar datos y patrones para identificar grupos o clusters de similitud dentro de la población de estudio. La entidad financiera tiene como Core de negocio a créditos MYPE (Microempresa + Pequeña empresa) que representa el 79.4% de toda su cartera de clientes. Para la identificación de resultados de segmentación del cliente MYPE se utilizaron 4 algoritmos de machinne learning (K-means, DBSCAN, Jerárquicos y Gausianos). Las cuales se logró obtener un clúster óptimo de 5, tomando en consideración el índice de silueta superior al 0.5 y complementado por las métricas de Calinski-Harabasz y Davies-Bouldin. Así mismo, los algoritmos de Cluster K-means tienen mejores resultados respecto a los algoritmos de Jerárquico Aglomerados, DBSCAN y GMM; estos 3 modelos tienen métricas muy similares, pero se diferencian por la cantidad de Cluster. Sin embargo, K- Means en métrica (Métrica de Davies Bouldin) un valor más elevado, un 3% o 6% adicional al de los otros 2 modelos. Concluyendo la importancia de una segmentación precisa y cómo los resultados pueden ser utilizados para desarrollar estrategias de crédito más efectivas.Acceso abierto
-
Propuesta de un modelo de clasificación para predecir la deserción de estudiantes en un ciclo académico en un Instituto Superior de Educación(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-12-05)Este trabajo presentó una propuesta de un modelo de clasificación para predecir la deserción de estudiantes en un ciclo académico en un Instituto Superior de Educación – Lima, Perú que pueda predecir en base a información del estudiante si este continuará sus estudios en el siguiente ciclo. En la construcción de los modelos se utilizó información como el promedio acumulado, la facultad, el tiempo desde la matrícula, la edad y el estatus de deserción o no deserción. Los datos de promedio acumulado, facultad y edad se etiquetaron con números por intervalos de valores. Se generarón modelos de clasificación a partir de seis algoritmos diferentes: Random Forest, Gradient Boosting, Redes Neuronales, Support Vector Machine, Regresión Logística y Árbol de Decisión. Se comparó el desempeño de estos modelos para definir el que proporcionó mejores resultados. El algoritmo de árbol de decisión presentó mejores medidas con respecto al resto, mostrando una precisión del modelo de 81.82%. Para mejorar las métricas de los modelos, se llevó a cabo un proceso de optimización de parámetros explorando combinaciones específicas que maximizan el desempeño. Como resultado, el modelo Support Vector Machine (SVM) incrementó su precisión de 79.94% a 81.92%, destacándose como el algoritmo con mejor rendimiento. Además, se identificó que la relación entre el promedio ponderado de un estudiante y la deserción es el factor más significativo. Finalmente, se elaboró un plan de trabajo para la implementación del modelo con el objetivo de mejorar las proyecciones de ingresos del Instituto Superior de Educación.Acceso abierto
-
Diseño de un Asistente Inteligente RAG para la Comisión de Eliminación de Barreras Burocráticas de INDECOPI - 2024(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-11-21)Durante las últimas décadas, las tecnologías de la información han irrumpido en casi todos los aspectos de la vida humana, lo que ha provocado una evolución significativa en la forma en que gestionamos la información. Este cambio ha llevado a un aumento exponencial en el almacenamiento de grandes volúmenes de datos, especialmente no estructurados. En el ámbito legal, este fenómeno no ha sido la excepción. La digitalización de documentos legales, la automatización de procesos judiciales y el uso de herramientas avanzadas de análisis de datos han mejorado la eficiencia en la gestión de casos, facilitando un acceso más rápido y organizado a la información jurídica. Sin embargo, uno de los mayores desafíos sigue siendo la identificación de información relevante y precisa para responder de manera eficaz a consultas legales o demandas complejas. Es en este punto donde la combinación de modelos de lenguaje de gran tamaño (LLMs) con agentes de recuperación aumentada (RAG) ha comenzado a transformar la práctica legal. Los LLMs, al ser capaces de generar texto y realizar análisis generales de datos, ofrecen una gran ventaja, pero los agentes RAG añaden una capa crucial al permitir la búsqueda directa en bases de datos jurídicas especializadas. Esto permite recuperar documentos específicos y datos relevantes de manera precisa y contextualizada, optimizando así la toma de decisiones legales con información más precisa y pertinente en un entorno cada vez más digital.Acceso abierto
-
Propuesta de un Esquema de Base de Datos Orientado a Grafos para Apoyar la Gestión Comercial en el Canal eCommerce de Grupo Santa Elena(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-10-30)La presente investigación propone la aplicación de la teoría de grafos en actividades comerciales del eCommerce de la empresa Grupo Santa Elena. La propuesta de la investigación es el diseño de un esquema de base de datos orientado a grafos, componente base para la implementación en una plataforma de Gestión de Base de Datos Orientada a Grafos como Neo4j. El esquema ha sido validado contra las preguntas de negocios denominados casos de usos, preguntas como: ¿Qué productos se asocian mejor con otros cuando el cliente realiza su compra? A diferencia de los esquemas de las bases de datos relacionales, la bondad de un modelo basado en grafos es la flexibilidad de su ampliación para responder nuevas preguntas de negocio sin impactar en el funcionamiento existente. La teoría de grafos se formalizó en el campo de las Matemáticas. Un grafo es un objeto matemático que tiene dos componentes base: los nodos y las aristas. Los nodos representan a la entidad de información como cliente o producto; las aristas son las relaciones o asociaciones entre nodos. La aplicación de los grafos se ha dado en múltiples disciplinas de estudio, sectores económicos y tipos de instituciones: desde la NASA hasta museos. La presente investigación ha seleccionados casos de éxito de la implementación de la teoría de grafos como grafos de conocimiento en plataformas de bases de datos orientadas a objetos. Un grafo de conocimiento dota al grafo con semántica y ontología. La semántica permite contextualizar y la ontología definir la arquitectura del grafo.Acceso abierto
-
IDENTIFICACIÓN DE ZONAS DE RIESGO ELÉCTRICO POTENCIAL EN REDES DE MEDIA TENSIÓN EN EL PERÚ EMPLEANDO ALGORITMOS DE VISIÓN POR COMPUTADORA Y APRENDIZAJE AUTOMÁTICO EN NUBES DE PUNTOS LIDAR 3D(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-09-13)En el Perú existe un riesgo poco difundido en la opinión pública que constituye una amenaza grave para la seguridad pública, especialmente en zonas urbanas. Este riesgo se refiere al incumplimiento de las distancias mínimas de seguridad (DMS) cerca de las redes de media tensión de tipo aéreo, lo que representa un riesgo eléctrico potencial y permanente si no se ejecutan acciones correctivas. Estos incidentes afectan a las personas con interrupciones del servicio, accidentes causados por elementos electrificados en espacios públicos, así como incendios por cortocircuitos. Además, afectan a las empresas eléctricas con pérdidas económicas por horas no facturadas, daños a su infraestructura, compensaciones a clientes y multas. La presencia de elementos cercanos a estas redes, como edificaciones, estructuras metálicas, árboles o cables de comunicaciones, obedece a una problemática compleja en nuestro país que involucra factores económicos, sociales, fiscalización ineficiente, planificación urbana nula o negligente, informalidad, cultura limitada sobre prevención de riesgos e incluso factores políticos o judiciales irregulares. Este proyecto se enfoca en la problemática dentro del marco del proceso de supervisión de OSINERGMIN a las empresas eléctricas donde se estipulan inspecciones en campo en las que se realizan tareas manuales que podrían optimizarse empleando tecnología y ciencia de datos. Para tal fin, se propone automatizar la identificación de zonas de riesgo eléctrico potencial empleando tecnología LiDAR móvil y aplicando algoritmos de visión por computadora y aprendizaje automático, se diseñará un modelo para identificar el cableado de media tensión y los objetos más cercanos. Los resultados se pueden complementar con fotografías y geolocalización de cada escena, lo que proporcionará evidencias más precisas y confiables.Acceso abierto
-
Detección de enfermedades y plagas en cultivos de tomate mediante el análisis de imágenes con Deep Learning(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-04-29)La agricultura en Perú enfrenta desafíos significativos debido a plagas y enfermedades, derivados en gran medida de limitaciones en el acceso a herramientas y tecnologías esenciales para monitorear y preservar la salud de los cultivos. Esta problemática se intensifica en un contexto global, especialmente ante el riesgo del fenómeno del Niño, que aumenta la necesidad de cuidado por parte de los agricultores. El presente estudio se enfoca en explorar diversos modelos de Deep Learning aplicados a un extenso conjunto de datos compuesto por fotografías de hojas de cultivo de tomate. Estas imágenes han sido meticulosamente categorizadas según el tipo de enfermedad y plaga que presentan. Además de este análisis, se examina detalladamente el costo de inversión del proyecto y se determina el punto de equilibrio necesario para su sostenibilidad a largo plazo. Un componente crucial de la investigación incluye un análisis exhaustivo de las ratios de precisión y pérdida obtenidos a través de la aplicación de estos modelos de Deep Learning. Este análisis no solo brinda insights valiosos sobre la eficacia de los modelos, sino que también sirve como base para una recomendación informada sobre la selección del modelo más adecuado para abordar las problemáticas específicas de los cultivos de tomate en el contexto agrícola peruano. En resumen, este estudio busca no solo comprender las complejidades de las enfermedades y plagas en los cultivos de tomate, sino también ofrecer soluciones prácticas respaldadas por análisis rigurosos y datos concretos.Acceso abierto
-
Modelo de segmentación de asegurados de salud(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-01-31)El propósito del presente trabajo es diseñar un modelo que permita segmentar y proyectar el nivel de riesgo de los asegurados, vigentes y nuevos prospectos, del negocio de salud de la aseguradora MAPFRE Perú. Actualmente, la suscripción de nuevos clientes y renovación de asegurados vigentes se realiza principalmente en función a las edades de los asegurados de acuerdo con el análisis y revisión actuarial anual del portafolio por producto y por cada rango etario, lo cual, si bien es técnicamente viable, comercialmente no permite un mayor grado de flexibilidad y perfilamiento de las primas que permitan ser competitivos en la captación y retención de clientes con un mejor perfil y proyección de riesgo. Hay esfuerzos aislados de aplicar ajustes de primas, tanto bonificaciones como recargos, en base a la declaración de enfermedades pre-existentes en la solicitud de afiliación, así como en el historial de siniestralidad; sin embargo, están sujetas a cierto grado de subjetividad por parte de cada suscriptor y no existe un seguimiento del impacto de estas políticas sobre el desarrollo del negocio. En adición, esta suscripción manual perjudica los tiempos de respuesta, siendo un problema generalizado en el mercado asegurador local para el ramo de salud y que contrasta con la fluidez y automatización en la cotización de otras líneas de negocio. Así, los puntos antes señalados, se traducen en un impacto negativo tanto en la evolución del número de asegurados, como en los márgenes de rentabilidad, que ya de por sí son bastante ajustados para el ramo de salud. El modelo propuesto en este trabajo busca segmentar el portafolio de clientes en función a características propias de cada asegurado, así como su historial de número y tipo de atenciones, en base a algoritmos de clasificación que permitan proyectar la siniestralidad y probabilidad de fuga de cada cliente, vigente o prospecto, para así optimizar la rentabilidad y nivel de retención en el negocio de salud.Acceso abierto
-
Solución Big Data para la integración de datos de contacto de clientes para una empresa financiera(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-04-05)El continuo incremento de datos dentro de las organizaciones abre nuevas oportunidades para inversiones que generen beneficios tangibles en el corto plazo. En este contexto, la gestión de los datos de contacto de los clientes emerge como un aspecto crítico para el éxito del negocio, demandando soluciones robustas, seguras y escalables. El presente proyecto aborda la problemática de obtener datos confiables y de alta calidad, reconociendo la importancia de integrar fuentes de datos valiosas y aplicar buenas prácticas en el desarrollo de plataformas de datos. Para ofrecer una solución efectiva, es imprescindible comprender los procesos de negocio, aprovechar las capacidades de las herramientas disponibles, reutilizar la infraestructura existente para optimizar costos, reducir la complejidad tecnológica y garantizar la seguridad de la información. El trabajo de investigación se origina en la necesidad de implementar una solución de big data para la integración de datos de contacto de clientes en una empresa del sector financiero. Este proyecto surge como respuesta a los bajos niveles de contactabilidad observados en las campañas comerciales, los cuales afectan directamente las colocaciones de créditos. Los resultados obtenidos demuestran que la propuesta ha sido altamente rentable para la entidad bancaria.Acceso abierto
-
Identificación de fibra textil natural mediante visión computacional y técnicas avanzadas de aprendizaje profundo(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-01-25)La crianza de camélidos en las regiones altoandinas de Perú es una actividad agropecuaria esencial. La alpaca, en particular, representa la principal fuente de ingresos para estas comunidades mayormente empobrecidas. En la actualidad, el comercio de productos textiles artesanales sustenta a cerca de 90,000 alpaqueros y 36,000 artesanos textiles. Sin embargo, la presencia de competencia desleal, que se ve fortalecida por las dificultades para garantizar la autenticidad de los productos textiles, genera desconfianza en los consumidores afectando negativamente a estos sectores económicos. Además, la identificación de fibras textiles, un proceso lento y costoso que garantiza la autenticidad del producto, requiere profesionales altamente cualificados. Esta situación dificulta a los productores textiles honestos garantizar estándares de valor y calidad de sus productos. Esta investigación desarrolla un modelo predictivo para facilitar la identificación de fibras en productos textiles utilizando imágenes microscópicas. Este modelo es un componente de un dispositivo llamado Fibroscopio, que permitirá capturar imágenes microscópicas y realizar predicciones en tiempo real sin necesidad de personal altamente cualificado. La investigación comienza con el diseño de un protocolo de captura de imágenes, seguido de la construcción de un conjunto de imágenes basado en dicho protocolo. Las muestras textiles son proporcionadas por instituciones especializadas del sector textil. Posteriormente, se selecciona el mejor modelo predictivo entre las arquitecturas CNN existentes. Este avance permitirá a los empresarios y artesanos textiles mejorar la confianza de los consumidores, democratizar la venta de productos textiles y aumentar los ingresos de uno de los sectores productivos con menores ingresos.Acceso abierto
-
Desarrollo de un software web para la clasificación, comparación, retroalimentación y predicción de pérdida de calorías de cinco ejercicios de calistenia(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2023-07-25)La actividad física es un pilar fundamental en la promoción de la salud y en el bienestar de las personas. Según la Organización Mundial de la Salud (OMS, 2020) se podrían evitar por lo menos 4 millones de muertes al año si la población mundial fuera más activa; porque, la actividad física ayuda a prevenir y tratar las enfermedades no transmisibles como las cardiovasculares, la diabetes de tipo 2 y algunos tipos de cáncer. Además, la actividad física también es beneficiosa para la salud mental, ayuda a mantener un peso saludable y contribuye al bienestar general. El aislamiento social debido al COVID-19 alteró, disminuyó e incluso eliminó la realización de ejercicios en gimnasios o en espacios abiertos. Asimismo, las políticas laborales impulsaron el trabajo remoto y con ello, las personas, eliminaron actividades físicas diarias con las cuales se ejercitaban de alguna forma. Por ejemplo, muchos dejaron de caminar algunos minutos en los que se trasladaban a sus oficinas. Es por todo ello que nuestro trabajo de investigación tiene la como objetivo brindar una herramienta de auto entrenamiento que mida la eficiencia de realización ciertas rutinas de calistenia, respecto a videos de expertos, y proporcionar una retroalimentación, en base a datos, para mejorar la realización de estos. Asimismo, pronosticar la quema de calorías respecto al historial de ejercicios realizados. Todo esto mediante una aplicación web que use técnicas de Machine Learning.Acceso abierto
-
Modelos de segmentación para la identificación de perfiles de Científicos de Datos en áreas o empresas de reclutamiento basado en la información de la plataforma Kaggle(Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2023-07-25)En la actualidad, la búsqueda de candidatos para una empresa es un proceso riguroso y minucioso debido a la gran demanda de un perfil ideal. Esto se puede evidenciar en empresas o áreas de reclutamiento, donde este tipo de búsquedas tiene un impacto un poco más significativo, ya que estas sirven como mediadores para la búsqueda del perfil ideal respecto un candidato para una empresa.Acceso abierto


















