Recent Submissions

  • DEEPHISTORY: OBRAS DE MUSEO ANIMADAS POR DEEP LEARNING

    Ugarte Rojas, Willy Gustavo; Mercado Chavez, Nilton Cesar; Ysique Neciosup, Jose Estanislao (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-06-28)
    En la actualidad, los museos peruanos presentan falencias para implementar medidas que fortalezcan el interés de los usuarios por asistir a sus instalaciones, ya sea porque carecen de la inversión económica necesaria o porque no aprovechan de manera eficiente los avances tecnológicos. Si bien es cierto que las opciones que disponen los museos para adaptarse a las necesidades de la sociedad actual pueden cumplir con el propósito de aprovechar la innovación tecnológica para captar la atención de los usuarios, estas requieren de una gran inversión de tiempo y de dinero para ser ejecutadas de manera correcta. El presente trabajo de investigación tiene como finalidad la implementación de una aplicación web capaz de generar videos de manera automática utilizando como datos de entrada una imagen objetivo y un video conductor. Es decir, la aplicación es capaz de prescindir de la contratación de expertos en animación, de la adquisición de equipo especializado costoso y de mucho tiempo de espera para la creación de piezas audiovisuales. Además, el desarrollo de esta aplicación estará acompañada de una investigación que de sustento científico y facilite su implementación. Dicha investigación se concentra principalmente en la comprensión de métodos actuales y modelos de deep learning enfocados en la tarea de animación de imágenes, con la finalidad de determinar oportunidades de mejora y desarrollar así un modelo que genere mejores resultados. Esta investigación tiene como alcance el desarrollo de una aplicación web capaz de sintetizar videos a partir de una imagen objetivo y un video conductor. Ello se logra gracias al uso de redes neuronales convolucionales, las cuales son capaces de detectar los puntos característicos entre los datos de entrada y luego transferir el movimiento del video conductor a la imagen objetivo.
    Acceso abierto
  • Estimación de Pose para prevenir trastornos musculoesqueléticos utilizando una Red recurrente de largo y corto plazo

    Ugarte Rojas, Willy; Bassino Riglos, Francesco; Mosqueira Chacon, Cesar Manuel (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-06-11)
    El trabajo de oficina se ha convertido en la ocupación más prevalente en la sociedad contemporánea, lo que requiere largas horas de comportamiento sedentario que puede conducir a la fatiga mental y física, incluyendo el riesgo de desarrollar trastornos musculoesqueléticos (TME). Para abordar este problema, hemos propuesto un sistema innovador que utiliza el robot NAO para las alertas posturales, YoloV7 para la extracción de puntos de referencia y una red recurrente LSTM para la predicción postural. En nuestra evaluación, el modelo obtuvo una exactitud del 85%, una sensibilidad del 93% y una puntuación F1 del 89%. Estas métricas proporcionan información valiosa sobre la eficacia del sistema y ponen de relieve las áreas en las que pueden introducirse nuevas mejoras. Al perfeccionar el modelo y aprovechar un conjunto de datos más amplio, pretendemos mejorar la exactitud y precisión de la detección de malas posturas, lo que permitirá a los trabajadores de oficina adoptar hábitos posturales más saludables y reducir el riesgo de desarrollar TME.
    Acceso abierto
  • Modelo de visión artificial basado en Deep Learning, para detectar actividades delictivas con pistola dentro de Lima Metropolitana

    ​​Montalvo Garcia, Peter​; Bazan Ardiles, Diego Andre; Casanova Infantes, Raul Andres (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-05-20)
    La investigación ha demostrado la ineficacia de los operadores de videovigilancia para detectar delitos a través de las cámaras de seguridad, lo que supone un reto debido a sus limitaciones físicas. Por otro lado, se ha demostrado que la visión por ordenador, aunque prometedora, se enfrenta a dificultades en la detección de delitos en tiempo real debido a la gran cantidad de datos necesarios para construir modelos fiables. Este estudio presenta tres innovaciones clave: un conjunto de datos de armas extraído del juego Grand Theft Auto V, un modelo de visión por ordenador entrenado con estos datos y una aplicación de videovigilancia que emplea el modelo para la detección automática de delitos con armas. El principal reto consistía en recopilar imágenes que representaran diversos escenarios y ángulos para reforzar el modelo de visión por ordenador. Se utilizó el editor de vídeo del juego Grand Theft Auto V para obtener las imágenes necesarias. Estas imágenes se utilizaron para entrenar el modelo, que se implementó en una aplicación de escritorio. Los resultados fueron muy prometedores, ya que el modelo demostró una gran precisión en la detección de delitos con armas de fuego en tiempo real. La aplicación de videovigilancia basada en este modelo fue capaz de identificar y alertar automáticamente sobre situaciones delictivas en las cámaras de seguridad.
    Acceso abierto
  • MAS4GAMES: Sistema multi-agente basado en q-learning para regular dinámicamente la dificultad de juegos de realidad virtual y mejorar la retención de los jugadores

    Ugarte Rojas, Willy Gustavo; Maury Castañeda, Natalia Melissa; Villarruel Vásquez, Sergio Enrique (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-06-28)
    A pesar de que la industria de los videojuegos ha crecido exponencialmente en los últimos años, la base de usuarios en dispositivos VR ha disminuido (International Data Corporation [IDC], 2023). Este artículo presenta un estudio de investigación centrado en la implementación de un sistema multiagente basado en Q-learning para el Ajuste Dinámico de la Dificultad (DDA) en un juego VR de lucha Unity 3D. El objetivo de este estudio es mejorar la experiencia de juego del jugador ajustando dinámicamente la dificultad del juego en respuesta a su rendimiento. La investigación utiliza la plataforma de desarrollo de juegos Unity, junto con el framework ML-Agents, para implementar el algoritmo Q-learning y entrenar agentes inteligentes capaces de adaptar el nivel de dificultad del juego. Nuestros resultados ponen de manifiesto el potencial del Q-learning y de los sistemas multiagentes para mejorar la DDA en los videojuegos. Basándonos en nuestras experiencias, prevemos futuros trabajos que impliquen probar y comparar métodos y enfoques alternativos para mejorar aún más las técnicas DDA, destacando su potencial para futuras investigaciones.
    Acceso abierto
  • PhotoRestorer: Restauración de retratos antiguos o dañados con Deep Learning

    ​​Montalvo Garcia, Peter​; Mendoza Davila, Christopher Andre; Porta Montes, David Obhed (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-03-18)
    Hace no muchos años, se solía tomar fotografías analógicas o tradicionales, las cuales terminaban en una foto impresa y estaban expuestas a diferentes tipos de daños. Por consiguiente, el objetivo de este proyecto es la construcción de una aplicación móvil que permita restaurar retratos de personas utilizando técnicas de Deep Learning. Si bien muchos estudios proponen diversas técnicas de restauración, estas se centran en un solo tipo de daño y si logran enfocarse en distintos tipos de daño, sus resultados no son del todo buenos y pueden tener tiempos de ejecución excesivos reflejando el margen de mejora. Por ese motivo, proponemos la creación de una Red Neuronal Convolucional (CNN) para clasificar el tipo de daño de una imagen y, en consecuencia, aplicar modelos de restauración pre entrenados. Para este clasificador utilizamos la técnica de Transfer Learning usando Inception V3 como base para la arquitectura. Asimismo, para el entrenamiento del clasificador, creamos nuestra propia fuente de datos a partir del dataset FFHQ, que contiene una gran variedad de rostros de personas al cual tuvimos que aplicar filtros y máscaras para simular imágenes dañadas o antiguas. Los resultados muestran que el uso del clasificador para que identifique el tipo de daño en imágenes antes de la restauración es una buena opción para reducir los tiempos de ejecución y mejorar los resultados de las imágenes restauradas, dado que se aplica el modelo correcto al retrato que lo necesite.
    Acceso abierto
  • Modelo de machine learning para predicción de brotes de leishmaniasis en la provincia de La Convención

    Montoya Cubas, Carlos Fernando; Baptista Ojeda, Ernie; Vigil Bravo, Franco Jair (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-05-13)
    La leishmaniasis forma parte de un grupo de enfermedades denominadas ETD (Enfermedades Tropicales Desatendidas) que afecta a comunidades pobres y olvidadas y reporta más de 5.000 casos en regiones como Brasil, Perú y Colombia categorizándose como endémicas en las regiones mencionadas. En este estudio, presentamos un modelo de aprendizaje automático (Random Forest) para predecir casos en el futuro y predecir posibles brotes utilizando datos meteorológicos y epidemiológicos de la provincia de la Convención (Cusco - Perú). Comprender cómo las variables climáticas afectan los brotes de leishmaniasis es un problema importante para ayudar a crear y generar nuevos sistemas de prevención. Se utilizaron varias técnicas para obtener mejores métricas y mejorar el rendimiento de nuestro modelo, entre ellos la generación de datos sintéticos y optimización de hiperparámetros. Los resultados mostraron dos factores climáticos importantes para analizar y ningún brote durante los primeros 3 meses de 2023 en la provincia de La Convención.
    Acceso abierto
  • TryOut: Generación de pruebas de ropa a partir de fotos

    Reyes Silva, Patricia Daniela; Contreras Rosas, Sebastian Wilder; Gallegos Quispe, Franco David (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-03-20)
    La venta en línea de prendas experimentó un notorio aumento en su crecimiento a partir del año 2020. No obstante, en este escenario, los usuarios se enfrentan a un desafío al momento de realizar sus compras. Específicamente, los usuarios experimentan una sensación de inseguridad debido a la falta de la opción de probarse las prendas antes de concretar la compra. El presente proyecto propone una forma de que los usuarios puedan probarse las prendas de manera online. De esta manera, se definió como objetivo desarrollar una aplicación web que permita a los usuarios probarse ropa de manera virtual. Para ello, se realizó una búsqueda de modelos VTO (Virtual Try On) que permiten generar imágenes de prueba de ropa. Se seleccionó el modelo VTO a partir de métricas de interés como el tiempo de inferencia y métricas que cuantifican la calidad de las imágenes generadas. Asimismo, se encontró limitaciones a estos modelos, los cuales la mayoría generaban imágenes de tamaño pequeño, en específico, 192 por 256 pixeles. Por lo que, se propuso a investigar sobre métodos que puedan aumentar el tamaño de la imagen sin perder significativamente la calidad de estas. A partir de ello, se desarrolló una API del modelo VTO para que pueda ser consumido por la aplicación web desarrollada y realizar una encuesta a un grupo de usuarios para evaluar el desempeño del modelo en un entorno real. Los resultados de la experiencia del modelo son positivos, ya que los usuarios muestran seguridad respecto a las imágenes generadas. De esta manera, se propone una solución a la necesidad que tiene el usuario de probarse las prendas de manera online antes de realizar la compra de éstas.
    Acceso abierto
  • NoHateS: Modelo de IA para la detección automática de contenido de odio en plataformas de interacción social

    Reyes Silva Patricia Daniela; Carhuancho Bazan, Alessandro David; Nuñez Lazo, Sergio Antonio (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-06-28)
    La detección de contenido de odio es una tarea desafiante, especialmente en el contexto del monitoreo en tiempo real en Internet. La detección manual resulta agotadora e impráctica debido al alto volumen y frecuencia de datos en línea. Esta tesis propone la creación de un nuevo sistema de Inteligencia Artificial llamado NoHateS (abreviado del inglés “No more Hate Speech for Spanish text”, traducido al español como “No más contenido de odio en textos en español”). Este sistema está compuesto por varios componentes, siendo el principal BETO-CNN, que es la combinación del modelo BETO, un modelo basado en Transformers entrenado en un corpus en español, y una red neuronal convolucional (CNN de sus siglas en inglés). El cuál está diseñado para detectar si un texto contiene o no contenido de odio. El segundo componente se desarrolla para garantizar la accesibilidad, lo cual incluye una interfaz de programación de aplicaciones (API de sus siglas en inglés) que permite la integración sin problemas del modelo en diversas aplicaciones, y un Bot de Discord desarrollado para facilitar la manipulación de la mencionada API y ayudar a los usuarios a detectar contenido de odio en los canales de texto. Esta tesis también incluye pruebas con datos desequilibrados y aplica técnicas de aumento de datos para abordar este desafío y crear modelos más robustos. Los resultados demuestran la efectividad de NoHateS en la detección de contenido de odio y proporcionan recomendaciones para investigaciones futuras en este campo.
    Acceso abierto
  • GamiHelper: Gamificación para aumentar la interacción de personas con otras que padecen de discapacidad motriz de los miembros superiores utilizando Deep Learning

    Valdivia Humareda, Luis Alberto; ; Aguirre Peralta, Joaquin; Rivas Zavala, Marek Joel (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2023-05-12)
    Habiendo investigado acerca de la discapacidad de personas en general, la cantidad de las personas que las poseen y los problemas a las que ellas se enfrentan, hemos decidido enfocar el proyecto en las personas con discapacidad motriz de los miembros superiores desarrollando un programa que permite a nuestro público objetivo, interactuar de una mejora manera con cualquier otra persona, mediante el uso de 3 mini videojuegos capaces de ser controlados por voz. El proyecto tuvo 4 etapas de desarrollo las cuales son: En su primera etapa, la elaboración de un benchmarking de los modelos, arquitecturas, red neuronal y género de videojuegos para poder interactuar con las personas con discapacidad motriz. En su segunda etapa, la descripción de la implementación de la red neuronal utilizada, basada en Redes Neuronales Concurrentes (CNN) para resolver la problemática. En su tercera etapa, se describieron los correspondientes minijuegos que componen al videojuego y sus características. Finalmente, en su última etapa, se validó la aplicación del videojuego con expertos del área de la medicina. Esperamos que en el futuro otros grupos continúen mejorando nuestros avances para así también otorgarles a nuestro público objetivo otras facilidades en campos como ofimática, ocio, etc.
    Acceso abierto
  • FaceCounter: Toma de asistencia masiva de personal en instituciones educativas por reconocimiento facial

    Ugarte Rojas, Willy Gustavo; Moscol Suarez, Adrian Gabriel (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-03-20)
    Este proyecto tiene como finalidad implementar un sistema de reconocimiento facial que mejorará la eficiencia al momento de tomar asistencia en institutos educativos, así como incrementar la seguridad en casos de suplantación de identidad. Para lograr nuestro objetivo, se creará un sistema de reconocimiento facial que al recibir una fotografía de los alumnos presentes en el aula, los identificará y confirmará su asistencia en la base de datos. Será importante la investigación de modelos pre entrenados utilizando la técnica ágil de benchmarking, los modelos analizados y comparados nos servirán como base para el desarrollo del sistema de reconocimiento facial. Este programa será conectado con una aplicación que utilizará una interfaz sencilla para que los profesores puedan ahorrar tiempo de la clase o evaluaciones en tomar asistencia o confirmar la identidad de los alumnos presentes. También, aumentará la seguridad evitando posibles suplantaciones de identidad con herramientas como moldes de huella dactilar falso (exámenes de admisión) o exámenes parciales y/o finales (DNI falso). El sistema creado será escalable, es decir que la base será fundamental para el desarrollo de un futuro proyecto más grande. El proyecto podría identificar incluso a más personas o ser implementado para un sistema de reconocimiento en tiempo real. A su vez, podría programarse para ser compatible con el sistema operativo MacOS, ampliando su uso a otros dispositivos. El alcance del proyecto ha sido contemplado para ser desarrollado a lo largo de las 28 semanas y probado en el semestre académico 2023-01 en la Universidad Peruana de Ciencias Aplicadas en Lima.
    Acceso abierto
  • Wawasimi: Clasificación de nivel de desarrollo de lenguaje e identificación de procesos fonológicos en niños de 3 a 5 años

    Ugarte Rojas, Willy Gustavo; Baldeón Albornoz, Braulio Sebastián; Ravelli Altamirano, Renzo Adriano (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2024-03-22)
    Los trastornos del lenguaje y habla dificultan el desarrollo de los niños en diferentes aspectos: educativos, sociales, emocionales, entre otros. Estas dificultades empeoran y son más difíciles de solucionar si el niño recibe un tratamiento tardío. Este es el motivo por el cual llevamos a cabo un estudio para desarrollar una aplicación móvil, capaz de predecir el nivel de desarrollo del lenguaje e identificar procesos fonológicos en el habla de niños de 3 a 5 años, con la finalidad de evitar detecciones tardías de trastornos; ya que estos pueden considerarse indicadores de la presencia de algún tipo de trastorno. Para el desarrollo de la aplicación, empleamos métodos y técnicas de aprendizaje automático como árboles de decisión, redes neuronales, conversión de voz; también, empleamos métodos tradicionales como la guía Portage y el test de palabras objetivos. Los resultados que obtuvimos muestran que es posible emplear el aplicativo para predecir el nivel de desarrollo de lenguaje e identificar procesos fonológicos.
    Acceso abierto
  • Desarrollo de aplicativo móvil para lectura de partituras utilizando ORM y Machine Learning

    Jara García, Carlos Alberto; Vasquez Leon, Miguel Arnaldo Martin (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2023-05-12)
    El presente proyecto tiene como finalidad desarrollar un aplicativo móvil que permita analizar partituras para poder convertirlas en música. Ello, con la finalidad de poder afrontar la carencia de educación musical presente en las escuelas de educación primaria y secundaria. Se plantea que, haciendo uso de este aplicativo, en primera instancia puedan aprender de una manera más interactiva las bases de lecturas de partituras, escuchar la tonalidad y el sonido que tienen. El proceso de desarrollo del proyecto consta de 4 pasos: Definición, Planificación, Experimentación y Resultados.
    Acceso abierto
  • NAOEMOTION: GENERACIÓN DE TEXTO A PARTIR DE UN SENTIMIENTO UTILIZANDO EL ROBOT NAO

    Canaval Sánchez, Luis Martín; Pautrat Lertora, Andres Alejandro; Perez Lozano, Renzo Reynaldo (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2023-07-13)
    La finalidad de este proyecto recae en la mejora de la interacción humano robot, mediante la generación de texto basados en sentimiento usando un modelo GAN, en donde se describe a lo largo del proyecto su utilidad, limitaciones y ventajas del uso de este tipo de redes. Empezando el trayecto de este documento el capítulo uno se plantean las bases para el proyecto, en este se define la problemática, junto al objetivo general como los específicos, además de plantear las restricciones, alcance y la organización. En el capítulo dos, se presenta en las técnicas usadas para el desarrollo en conjunto de las herramientas, de esta forma se recopila todo el conocimiento general para el desarrollo definiendo y explicando cada punto. En el capítulo tres, se detallan los objetivos específicos, junto a su cumplimiento a través del ciclo de vida del proyecto presentado en los 9 sprints, además de presentar el desarrollo del proyecto, explicando cómo se inicia con investigación para recolectar información necesaria para continuar con el diseño e implementación. En el capítulo cuatro, se revelan los resultados obtenidos mediante los experimentos con métricas cuantitativas y cualitativas, siendo estas métricas de calidad de texto, encuestas y entrevistas. En el capítulo cinco, se detalla la resolución de los planes realizados en los artefactos de gestión. Finalmente se presentan las conclusiones y recomendaciones del proyecto.
    Acceso abierto
  • MR MIME: detección y reproducción de movimientos usando simuladores de brazos robóticos

    Canaval Sanchez, Luis Martin; Johnson Yañez, Diego Alonso; Fernandez Ramos, Oscar Enrique (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2023-08-15)
    La enseñanza de los movimientos del robot siempre se ha considerado un tema complejo en el que hay mucho interés, ya que el más mínimo cambio en la programación del robot puede generar un alto tiempo de inactividad que puede durar más de un mes. En este trabajo, llevamos a cabo un estudio de los movimientos humanos para implementar un nuevo método de Programación de Robots por Demostración utilizando redes neuronales. Los métodos actuales requieren especialistas con altos conocimientos matemáticos y lógicos para enseñar los movimientos de los robots. Usando un famoso algoritmo de estimación de pose llamado Open Pose y un método de “lifting” 3D, obtenemos la pose estimada del brazo de la persona en un espacio 3D simulado. Luego, usamos varias herramientas de clasificación para traducir la pose predicha al robot. Los resultados muestran que es factible hacer que la programación de robots sea más accesible utilizando la estimación de pose.
    Acceso abierto
  • IA de la verdad

    Ugarte Rojas, Willy Gustavo; Rodriguez Meza, Bryan Alberto; Vargas Lopez-Lavalle, Renzo Nicolas (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2022-12-02)
    En nuestro día a día, detectar una mentira podría tener importantes implicaciones en distintas situaciones sociales. Si alguien responde a una pregunta con información falsa, es posible que tenga detalles que no quiera revelar. Esta información logra ser determinante en circunstancias que signifiquen consecuencias graves o moderadas; por ejemplo, para indagaciones de carácter legal sobre actividades delinquías. El siguiente trabajo de investigación tiene como finalidad implementar una aplicación para la detección de falsedades mediante el uso de una webcam. Es decir, se requiere detectar mentiras utilizando un video. Además, se busca realizar una investigación que permita facilitar el desarrollo del sistema previamente mencionado. Dicha investigación se centra en el entendimiento de metodologías o tecnologías de detección de mentiras actuales y en técnicas de machine learning para el mismo fin. En el trabajo siguiente, haremos referencia a la acción de decir un engaño como cualquier hecho cuya intención final es transmitir un enunciado falaz o engañoso, de manera intencional y cuyo fin sea despistar a los demás. Mediante el siguiente trabajo de investigación, se realizará la gestión e implementación de un proyecto cuya finalidad es el desarrollo de una aplicación con la capacidad de detectar la veracidad de diversos enunciados de una persona a través de la detección de micro-expresiones y su variación a través del tiempo. Esto se logrará mediante el uso de algoritmos de aprendizaje autónomo y visión computacional. Esta aplicación otorgará una nueva alternativa frente a las otras metodologías actuales para detección de mentiras que se basan en analizar el estado cerebral mediante equipamiento costoso y especialistas calificados, como el polígrafo o los ERP.
    Acceso abierto
  • Algoritmo de toma de decisiones para la generación de historias en videojuegos usando técnicas de machine learning

    Cueva Chávez, Walter Manuel; Guizado Díaz, Carlos; Fernández Samillán, Diego (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2022-06-27)
    La presente propuesta “Algoritmo de toma de decisiones para la generación de historias en videojuegos usando técnicas de machine learning”, tiene como intención diseñar y desarrollar un videojuego que posea múltiples caminos argumentales sin necesidad de que los desarrolladores tengan que implementarlos de forma manual. Automatizar el desarrollo de la historia de un videojuego ayuda a reducir costos y tiempos de desarrollo, ya que disminuye el trabajo del equipo desarrollador, además de que permite desarrollar un videojuego con miles de caminos argumentales diferentes. A pesar de que se ha logrado crear métodos para automatizar la generación de diferentes contenidos de videojuegos como niveles, mapas, personajes, melodías, gráficos, entre otros, aun no existe una forma comercialmente viable para generar historias de videojuegos. Nosotros planteamos una solución que podría usarse comercialmente. Para lograr esto, descomponemos las acciones posibles en acciones atómicas, y dotamos a cada personaje no jugable (NPC) un modelo de machine learning, para que sea capaz de tomar sus propias decisiones en el mundo del juego, para que cada uno decida como actuar de forma procedural. Si los NPC se comportan de forma diferente, entonces los sucesos ocurrirán de forma distinta. Para armar el modelo de machine learning con el que los NPCs tomaran decisiones hacemos uso de Q-Learning, un algoritmo perteneciente al paradigma de reinforcement learning. A diferencia de otros algoritmos, este es model-free, lo que significa que no requiere de un modelo del entorno para funcionar. Tampoco requiere que se le brinde de un dataset con anterioridad, solo necesita un conjunto de agentes (los NPCs), que estos puedan ejecutar acciones, y que reciban un feedback de su desempeño. Debido a todo esto, este algoritmo se adapta muy bien a nuestro caso.
    Acceso abierto
  • Serious Game para el aprendizaje de gestos estáticos del lenguaje de señas peruano mediante el uso de realidad virtual

    Canaval Sánchez, Luis Martín; Ramos Carrión, Cristopher Lizandro; Nureña Jara, Roberto Alonso (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2021-10-22)
    El presente proyecto tiene como objetivo el desarrollo de un juego serio para el aprendizaje de gestos básicos de la lengua de señas peruana en realidad virtual para personas que no padezcan de sordera, utilizando el dispositivo HTC Vive. El juego, al cual nombramos Sign Shooting, consta de 8 niveles en donde el jugador deberá aprender 3 gestos de letras por cada uno de éstos, y al final una prueba de los conocimientos aprendidos. Se implementó el Vive Hand Tracking SDK para la detección de las manos del usuario y sus características espaciales. Con esta información, generamos un dataset de los gestos a aprender, el cual utilizamos para entrenar un modelo de redes neuronales para el reconocimiento de señas, el cual fue validado con las métricas de bias y varianza. Para validar nuestra propuesta, se pidió a los usuarios completar el juego y a continuación responder una encuesta dividida en experiencia de juego y aprendizaje del usuario. Los resultados obtenidos muestran un puntaje promedio en la experiencia usuario mayor de 4 (de un máximo de 5) y que en toda la sesión de juego se aprenden un promedio de 17 gestos de letras (de un total de 24), significando que los usuarios consideran el juego entretenido, inmersivo y que cumple con su objetivo de enseñanza. Finalmente, se concluye que el uso de realidad virtual incentiva a que el usuario se sienta comprometido con el juego y busque llegar a su objetivo.
    Acceso abierto
  • Reconocimiento de gestos estáticos del abecedario de la lengua de señas peruana utilizando cámaras de baja resolución

    Gonzalez Valenzuela, Ricardo Eugenio; Berru Novoa, Bryan Jos (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2019-11-20)
    El reconocimiento de gestos del lenguaje de señas a través del procesamiento de imágenes y el aprendizaje automático han sido ampliamente estudiados en años recientes. En esta tesis se presenta un conjunto de datos que consta de 2400 imágenes de los gestos estáticos del lenguaje de señas peruano alfabeto, además de aplicarlo a un sistema de reconocimiento de gestos con cámaras de baja resolución. Para el reconocimiento de gestos, se utilizó el descriptor de características de Histograma de Gradientes Orientados, junto con 4 algoritmos de clasificación. Los resultados mostraron que utilizando el Histograma de Gradientes Orientados junto con el algoritmo de clasificación de Support Vector Machine, se obtuvo el mejor resultado con un accuracy de 89.46% y el sistema pudo reconocer los gestos con variaciones de traslación, rotación y escala.
    Acceso abierto
  • Desarrollo de aplicaciones biométricas y cognitivas para un modelo de espejo inteligente

    Burga Durango, Daniel Wilfredo; Araujo García, Ivette Cristina; Linares Salmón, Eduardo Rodrigo (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2018-05-01)
    En los últimos años el avance de las tecnologías de información y comunicación (TIC) han ayudado a mejorar la calidad de vida de las personas. El paradigma de internet de las cosas (IoT) plantea soluciones innovadoras que están cambiando nuestro estilo de vida, debido a esto se propone la implementación de un espejo inteligente, con el cual pretendemos optimizar el tiempo de las personas mientras se preparan para comenzar su día. Con el objetivo de proporcionar servicios de información como clima, información del tráfico, noticias, música y agenda; Ceccaroni implementó un prototipo de espejo inteligente llamado Magical Mirror , en donde las personas podían interactuar con el espejo mediante comandos de voz. En base a esto se ha construido un dispositivo a partir de un vidrio reflejante, monitor LCD, placa Raspberry Pi, cámara y una plataforma IoT orientada a cloud computing, en donde se obtiene la información para mostrar en el espejo mediante servicios web, los cuales son personalizables gracias a una aplicación móvil, que a su vez permite obtener las fotos del usuario para acceder al espejo, mediante reconocimiento facial. Además, para brindarle al usuario una experiencia personalizada, el espejo inteligente incorpora un sistema de recomendación de noticias, implementado utilizando un modelo predictivo, que a su vez usa el algoritmo naive Bayes.
    Acceso abierto