Evaluacion de DATASETS para reconocimiento de emociones en robotica social

Fecha

2023-10

Formato del documento

Thesis

ORCID Autor

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad de Valparaíso

Ubicación

ISBN

ISSN

item.page.issne

item.page.doiurl

Facultad

Facultad de Ingeniería

Departamento o Escuela

Escuela de Ingeniería Informática

Determinador

Recolector

Especie

Nota general

Tıtulo de Ingeniero Civil en Informática

Resumen

El reconocimiento de emociones es un factor importante en la interacción humano-computador, dado que permite dirigir adecuadamente las acciones del robot en función del entorno que percibe. Los robots suelen utilizar sensores para capturar su entorno. Existen diversas propuestas notablemente en Deep Learning que han surgido para el reconocimiento de emociones. Como parte de la metodolog ́ıa se utilizan datasets para entrenar y construir modelos adecuados para el reconocimiento de emociones, sin embargo, estos datasets tienen problemas de calidad de los datos, no están balanceados, falta de modalidades y que se llevan a cabo en ambientes controlados. Lo cual no es lo más adecuado y similar al ambiente en donde ocurre la interacción humano-robot. Es por esto que en este trabajo de tÍtulo se evaluaron distintos datasets en una arquitectura con técnicas Deep Learning ya implementada para detectar las emociones de las personas a través de distintas modalidades y todo esto enfocado en el contexto de la robótica social. Para ir realizando un análisis de datos pertinente a cada dataset por sus modalidades a través de las métricas de evaluación ́F1 score y exactitud. Con el fin de ir comparando e interpretando los resultados obtenidos y tomar ciertas decisiones en el ámbito de la robótica que permitirán realizar diferentes tareas en nuestra sociedad a futuro. Como resultado de este trabajo se evaluaron 4 dataset el Iemocap, Sfew, Afew y el Meld pasando por la misma arquitectura y realizando las diferentes evaluaciones unimodales y multimodales, se puede decir que el dataset Meld se adecua de mejor manera a la arquitectura con respecto a sus resultados y la emoción más destacable es la neutral en texto con un F1 score del 66,0 % y la exactitud de un 72,0 %. Por otro lado, en su enfoque multimodal se encuentra la emoción joy en la modalidad de texto+rostro con un F1 score ́ de 56,0 % y una exactitud del 73,1 %.

Descripción

Lugar de Publicación

Valparaíso

Auspiciador

Palabras clave

ROBOT HUMANOIDE, ROBOTICA, HARDWARE

Licencia

Atribución-NoComercial-CompartirIgual 3.0 Chile (CC BY-NC-SA 3.0 CL)