Modelo de credibilidad extendido sobre T-CREO

Fecha

2023-01

Formato del documento

Thesis

ORCID Autor

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad de Valparaíso

Ubicación

ISBN

ISSN

item.page.issne

item.page.doiurl

Facultad

Facultad de Ingeniería

Departamento o Escuela

Escuela de Ingeniería Informática

Determinador

Recolector

Especie

Nota general

Tıtulo de Ingeniero Civil en Informática

Resumen

Actualmente, se produce una cantidad importante de información en la web. Las redes sociales son un ejemplo de ello, donde millones de usuarios generan e intercambian información de todo tipo. Si bien las redes sociales se han transformado en un medio ideal para compartir información con facilidad, también son un entorno óptimo para la propagación de información falsa. Dada esta situación, el desarrollo de herramientas automáticas de análisis de credibilidad para estas fuentes de información se ha vuelto un tema esencial. En este contexto, el trabajo presentado a continuación tiene como objetivo principal extender el modelo de credibilidad del proyecto T-CREo, una extensión de Chrome para el cálculo de credibilidad de fuentes en internet instanciado para Twitter haciendo uso de factores como el textos del tweet, credibilidad de usuario y su impacto social dentro de la plataforma. Se extiende este modelo incorporando detección de bots y análisis semántico de texto en posts de Twitter. Estas nuevas funcionalidades permiten detectar la confiabilidad de un usuario, basándose en la gramática utilizada en los textos, las características sociales de su cuenta y la coherencia entre los conceptos utilizados en la publicación, aportando para una evaluación más certera a la herramienta de credibilidad. Haciendo uso de algoritmos de aprendizaje, se logró entrenar un modelo de aprendizaje Random Forest, tanto para el idioma inglés y español, con una precisión sobre el 80 % tras hacer las pruebas necesarias de validación con información externa al dataset de entrenamiento, y el desarrollo de un algoritmo para calcular la credibilidad semántica del texto de un tweet, utilizando la similitud semántica y las definiciones de palabras clave; obteniendo resultados coherentes al comparar los resultados obtenidos con la nueva funcionalidad con los obtenidos con el modelo original.

Descripción

Lugar de Publicación

Valparaíso

Auspiciador

Palabras clave

WEB, REDES SOCIALES, SISTEMA INFORMATICO

Licencia

Atribución-NoComercial-CompartirIgual 3.0 Chile (CC BY-NC-SA 3.0 CL)