Recent Submissions

  • NAOEMOTION: GENERACIÓN DE TEXTO A PARTIR DE UN SENTIMIENTO UTILIZANDO EL ROBOT NAO

    Canaval Sánchez, Luis Martín; Pautrat Lertora, Andres Alejandro; Perez Lozano, Renzo Reynaldo (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2023-07-13)
    La finalidad de este proyecto recae en la mejora de la interacción humano robot, mediante la generación de texto basados en sentimiento usando un modelo GAN, en donde se describe a lo largo del proyecto su utilidad, limitaciones y ventajas del uso de este tipo de redes. Empezando el trayecto de este documento el capítulo uno se plantean las bases para el proyecto, en este se define la problemática, junto al objetivo general como los específicos, además de plantear las restricciones, alcance y la organización. En el capítulo dos, se presenta en las técnicas usadas para el desarrollo en conjunto de las herramientas, de esta forma se recopila todo el conocimiento general para el desarrollo definiendo y explicando cada punto. En el capítulo tres, se detallan los objetivos específicos, junto a su cumplimiento a través del ciclo de vida del proyecto presentado en los 9 sprints, además de presentar el desarrollo del proyecto, explicando cómo se inicia con investigación para recolectar información necesaria para continuar con el diseño e implementación. En el capítulo cuatro, se revelan los resultados obtenidos mediante los experimentos con métricas cuantitativas y cualitativas, siendo estas métricas de calidad de texto, encuestas y entrevistas. En el capítulo cinco, se detalla la resolución de los planes realizados en los artefactos de gestión. Finalmente se presentan las conclusiones y recomendaciones del proyecto.
    Acceso abierto
  • MR MIME: detección y reproducción de movimientos usando simuladores de brazos robóticos

    Canaval Sanchez, Luis Martin; Johnson Yañez, Diego Alonso; Fernandez Ramos, Oscar Enrique (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2023-08-15)
    La enseñanza de los movimientos del robot siempre se ha considerado un tema complejo en el que hay mucho interés, ya que el más mínimo cambio en la programación del robot puede generar un alto tiempo de inactividad que puede durar más de un mes. En este trabajo, llevamos a cabo un estudio de los movimientos humanos para implementar un nuevo método de Programación de Robots por Demostración utilizando redes neuronales. Los métodos actuales requieren especialistas con altos conocimientos matemáticos y lógicos para enseñar los movimientos de los robots. Usando un famoso algoritmo de estimación de pose llamado Open Pose y un método de “lifting” 3D, obtenemos la pose estimada del brazo de la persona en un espacio 3D simulado. Luego, usamos varias herramientas de clasificación para traducir la pose predicha al robot. Los resultados muestran que es factible hacer que la programación de robots sea más accesible utilizando la estimación de pose.
    Acceso abierto
  • IA de la verdad

    Ugarte Rojas, Willy Gustavo; Rodriguez Meza, Bryan Alberto; Vargas Lopez-Lavalle, Renzo Nicolas (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2022-12-02)
    En nuestro día a día, detectar una mentira podría tener importantes implicaciones en distintas situaciones sociales. Si alguien responde a una pregunta con información falsa, es posible que tenga detalles que no quiera revelar. Esta información logra ser determinante en circunstancias que signifiquen consecuencias graves o moderadas; por ejemplo, para indagaciones de carácter legal sobre actividades delinquías. El siguiente trabajo de investigación tiene como finalidad implementar una aplicación para la detección de falsedades mediante el uso de una webcam. Es decir, se requiere detectar mentiras utilizando un video. Además, se busca realizar una investigación que permita facilitar el desarrollo del sistema previamente mencionado. Dicha investigación se centra en el entendimiento de metodologías o tecnologías de detección de mentiras actuales y en técnicas de machine learning para el mismo fin. En el trabajo siguiente, haremos referencia a la acción de decir un engaño como cualquier hecho cuya intención final es transmitir un enunciado falaz o engañoso, de manera intencional y cuyo fin sea despistar a los demás. Mediante el siguiente trabajo de investigación, se realizará la gestión e implementación de un proyecto cuya finalidad es el desarrollo de una aplicación con la capacidad de detectar la veracidad de diversos enunciados de una persona a través de la detección de micro-expresiones y su variación a través del tiempo. Esto se logrará mediante el uso de algoritmos de aprendizaje autónomo y visión computacional. Esta aplicación otorgará una nueva alternativa frente a las otras metodologías actuales para detección de mentiras que se basan en analizar el estado cerebral mediante equipamiento costoso y especialistas calificados, como el polígrafo o los ERP.
    Acceso abierto
  • Algoritmo de toma de decisiones para la generación de historias en videojuegos usando técnicas de machine learning

    Cueva Chávez, Walter Manuel; Guizado Díaz, Carlos; Fernández Samillán, Diego (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2022-06-27)
    La presente propuesta “Algoritmo de toma de decisiones para la generación de historias en videojuegos usando técnicas de machine learning”, tiene como intención diseñar y desarrollar un videojuego que posea múltiples caminos argumentales sin necesidad de que los desarrolladores tengan que implementarlos de forma manual. Automatizar el desarrollo de la historia de un videojuego ayuda a reducir costos y tiempos de desarrollo, ya que disminuye el trabajo del equipo desarrollador, además de que permite desarrollar un videojuego con miles de caminos argumentales diferentes. A pesar de que se ha logrado crear métodos para automatizar la generación de diferentes contenidos de videojuegos como niveles, mapas, personajes, melodías, gráficos, entre otros, aun no existe una forma comercialmente viable para generar historias de videojuegos. Nosotros planteamos una solución que podría usarse comercialmente. Para lograr esto, descomponemos las acciones posibles en acciones atómicas, y dotamos a cada personaje no jugable (NPC) un modelo de machine learning, para que sea capaz de tomar sus propias decisiones en el mundo del juego, para que cada uno decida como actuar de forma procedural. Si los NPC se comportan de forma diferente, entonces los sucesos ocurrirán de forma distinta. Para armar el modelo de machine learning con el que los NPCs tomaran decisiones hacemos uso de Q-Learning, un algoritmo perteneciente al paradigma de reinforcement learning. A diferencia de otros algoritmos, este es model-free, lo que significa que no requiere de un modelo del entorno para funcionar. Tampoco requiere que se le brinde de un dataset con anterioridad, solo necesita un conjunto de agentes (los NPCs), que estos puedan ejecutar acciones, y que reciban un feedback de su desempeño. Debido a todo esto, este algoritmo se adapta muy bien a nuestro caso.
    Acceso abierto
  • Serious Game para el aprendizaje de gestos estáticos del lenguaje de señas peruano mediante el uso de realidad virtual

    Canaval Sánchez, Luis Martín; Ramos Carrión, Cristopher Lizandro; Nureña Jara, Roberto Alonso (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2021-10-22)
    El presente proyecto tiene como objetivo el desarrollo de un juego serio para el aprendizaje de gestos básicos de la lengua de señas peruana en realidad virtual para personas que no padezcan de sordera, utilizando el dispositivo HTC Vive. El juego, al cual nombramos Sign Shooting, consta de 8 niveles en donde el jugador deberá aprender 3 gestos de letras por cada uno de éstos, y al final una prueba de los conocimientos aprendidos. Se implementó el Vive Hand Tracking SDK para la detección de las manos del usuario y sus características espaciales. Con esta información, generamos un dataset de los gestos a aprender, el cual utilizamos para entrenar un modelo de redes neuronales para el reconocimiento de señas, el cual fue validado con las métricas de bias y varianza. Para validar nuestra propuesta, se pidió a los usuarios completar el juego y a continuación responder una encuesta dividida en experiencia de juego y aprendizaje del usuario. Los resultados obtenidos muestran un puntaje promedio en la experiencia usuario mayor de 4 (de un máximo de 5) y que en toda la sesión de juego se aprenden un promedio de 17 gestos de letras (de un total de 24), significando que los usuarios consideran el juego entretenido, inmersivo y que cumple con su objetivo de enseñanza. Finalmente, se concluye que el uso de realidad virtual incentiva a que el usuario se sienta comprometido con el juego y busque llegar a su objetivo.
    Acceso abierto
  • Reconocimiento de gestos estáticos del abecedario de la lengua de señas peruana utilizando cámaras de baja resolución

    Gonzalez Valenzuela, Ricardo Eugenio; Berru Novoa, Bryan Jos (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2019-11-20)
    El reconocimiento de gestos del lenguaje de señas a través del procesamiento de imágenes y el aprendizaje automático han sido ampliamente estudiados en años recientes. En esta tesis se presenta un conjunto de datos que consta de 2400 imágenes de los gestos estáticos del lenguaje de señas peruano alfabeto, además de aplicarlo a un sistema de reconocimiento de gestos con cámaras de baja resolución. Para el reconocimiento de gestos, se utilizó el descriptor de características de Histograma de Gradientes Orientados, junto con 4 algoritmos de clasificación. Los resultados mostraron que utilizando el Histograma de Gradientes Orientados junto con el algoritmo de clasificación de Support Vector Machine, se obtuvo el mejor resultado con un accuracy de 89.46% y el sistema pudo reconocer los gestos con variaciones de traslación, rotación y escala.
    Acceso abierto
  • Desarrollo de aplicaciones biométricas y cognitivas para un modelo de espejo inteligente

    Burga Durango, Daniel Wilfredo; Araujo García, Ivette Cristina; Linares Salmón, Eduardo Rodrigo (Universidad Peruana de Ciencias Aplicadas (UPC)PE, 2018-05-01)
    En los últimos años el avance de las tecnologías de información y comunicación (TIC) han ayudado a mejorar la calidad de vida de las personas. El paradigma de internet de las cosas (IoT) plantea soluciones innovadoras que están cambiando nuestro estilo de vida, debido a esto se propone la implementación de un espejo inteligente, con el cual pretendemos optimizar el tiempo de las personas mientras se preparan para comenzar su día. Con el objetivo de proporcionar servicios de información como clima, información del tráfico, noticias, música y agenda; Ceccaroni implementó un prototipo de espejo inteligente llamado Magical Mirror , en donde las personas podían interactuar con el espejo mediante comandos de voz. En base a esto se ha construido un dispositivo a partir de un vidrio reflejante, monitor LCD, placa Raspberry Pi, cámara y una plataforma IoT orientada a cloud computing, en donde se obtiene la información para mostrar en el espejo mediante servicios web, los cuales son personalizables gracias a una aplicación móvil, que a su vez permite obtener las fotos del usuario para acceder al espejo, mediante reconocimiento facial. Además, para brindarle al usuario una experiencia personalizada, el espejo inteligente incorpora un sistema de recomendación de noticias, implementado utilizando un modelo predictivo, que a su vez usa el algoritmo naive Bayes.
    Acceso abierto