Técnica de muestreo de valores extremos para el manejo de clases desbalanceadas para la identificación de operaciones bancarias fraudulentas usando machine learning
dc.contributor.advisor | Salas Fuentes, Rodrigo | |
dc.contributor.author | Saavedra Garrido, Jorge | |
dc.coverage.spatial | Valparaíso | |
dc.date.accessioned | 2025-07-17T16:44:47Z | |
dc.date.available | 2025-07-17T16:44:47Z | |
dc.date.issued | 2022 | |
dc.description.abstract | El fraude con tarjetas de crédito ha sido un problema que ha afectado a entidades financieras durante años, causando grandes pérdidas monetarias. Para detectar comportamientos anómalos o acciones sospechosas que incurren en pérdidas, el desarrollo de tecnologías de Machine Learning ha sido de gran importancia. Sin embargo, los conjuntos de datos disponibles para problemas de fraude bancario a menudo están altamente desbalanceados, lo que dificulta el aprendizaje de patrones de la clase minoritaria. Para abordar este problema, se han utilizado técnicas de submuestreo y sobremuestreo para equilibrar las clases. No obstante, a menudo se hace un equilibrio de clases en la fase de preprocesamiento antes de separar los datos en conjuntos de entrenamiento y test, lo que puede generar una correlación entre los datos y un rendimiento engañoso al evaluar los modelos. Por lo tanto, el objetivo de este trabajo es identificar errores en la implementación de técnicas de submuestreo y sobremuestreo para equilibrar clases en conjuntos de datos altamente desbalanceados y proponer una nueva técnica de submuestreo que considera los valores extremos de ambas clases utilizando la distancia de Mahalanobis. Esta medida de distancia tiene en cuenta la variabilidad de los datos y se utiliza comúnmente en problemas de clasificación para medir la similitud entre dos grupos. Nuestros resultados demuestran una mejora significativa en el rendimiento en comparación con las técnicas de balanceo de clases Smote, NearMiss y Submuestreo Aleatorio, alcanzando una precisión del 97% y un recall del 88%. | |
dc.facultad | Facultad de Ciencias | |
dc.identifier.uri | https://repositoriobibliotecas.uv.cl/handle/uvscl/16010 | |
dc.language.iso | es | |
dc.publisher | Universidad de Valparaíso | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/3.0/cl/ | |
dc.subject | OPERACIONES BANCARIAS | |
dc.subject | FRAUDE INFORMATICO | |
dc.title | Técnica de muestreo de valores extremos para el manejo de clases desbalanceadas para la identificación de operaciones bancarias fraudulentas usando machine learning | |
dc.type | Thesis | |
uv.colection | Tesis | |
uv.departamento | Facultad de Ciencias, Instituto de Estadística | |
uv.notageneral | Magíster en Estadística. Universidad de Valparaíso. 2022. |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- Técnica de muestreo de valores extremos para el manejo de clases desbalanceadas para la identificación de operaciones bancarias fraudulentas usando machine learning.pdf
- Tamaño:
- 7.57 MB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 349 B
- Formato:
- Item-specific license agreed upon to submission
- Descripción: