Modelo de credibilidad extendido sobre T-CREO
Fecha
2023-01
Autores
Profesor Guía
Formato del documento
Thesis
ORCID Autor
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad de Valparaíso
Ubicación
ISBN
ISSN
item.page.issne
item.page.doiurl
Facultad
Facultad de Ingeniería
Departamento o Escuela
Escuela de Ingeniería Informática
Determinador
Recolector
Especie
Nota general
Tıtulo de Ingeniero Civil en Informática
Resumen
Actualmente, se produce una cantidad importante de información en la web. Las redes sociales son un ejemplo de ello, donde millones de usuarios generan e intercambian información de todo tipo. Si bien las redes sociales se han transformado en un medio ideal para compartir información con facilidad, también son un entorno óptimo para la propagación de información falsa. Dada esta situación, el desarrollo de herramientas automáticas de análisis de credibilidad para estas fuentes de información se ha vuelto un tema esencial.
En este contexto, el trabajo presentado a continuación tiene como objetivo principal extender el modelo de credibilidad del proyecto T-CREo, una extensión de Chrome para el cálculo de credibilidad de fuentes en internet instanciado para Twitter haciendo uso de factores como el textos del tweet, credibilidad de usuario y su impacto social dentro de la plataforma.
Se extiende este modelo incorporando detección de bots y análisis semántico de texto en posts de Twitter. Estas nuevas funcionalidades permiten detectar la confiabilidad de un usuario, basándose en la gramática utilizada en los textos, las características sociales de su cuenta y la coherencia entre los conceptos utilizados en la publicación, aportando para una evaluación más certera a la herramienta de credibilidad. Haciendo uso de algoritmos de aprendizaje, se logró entrenar un modelo de aprendizaje Random Forest, tanto para el idioma inglés y español, con una precisión sobre el 80 % tras hacer las pruebas necesarias de validación con información externa al dataset de entrenamiento, y el desarrollo de un algoritmo para calcular la credibilidad semántica del texto de un tweet, utilizando la similitud semántica y las definiciones de palabras clave; obteniendo resultados coherentes al comparar los resultados obtenidos con la nueva funcionalidad con los obtenidos con el modelo original.
Descripción
Lugar de Publicación
Valparaíso
Auspiciador
Palabras clave
WEB, REDES SOCIALES, SISTEMA INFORMATICO
Licencia
Atribución-NoComercial-CompartirIgual 3.0 Chile (CC BY-NC-SA 3.0 CL)