Deep learning aplicado a la segmentación semántica de imágenes aéreas

Fecha

2021-12-10

Profesor Guía

Formato del documento

Tesis

ORCID Autor

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad de Valparaíso

ISBN

ISSN

item.page.issne

item.page.doiurl

Departamento o Escuela

Instituto de Estadistica

Determinador

Recolector

Especie

Nota general

Resumen

En el presente trabajo se evalúa dos arquitecturas de segmentación que se implementan en imágenes aéreas obtenidas por drones y satélites, se utilizan características preentrenadas de una red convolucional para la detección de información como patrones, figuras, siluetas, etc. Estas arquitecturas se han popularizado entre desarrolladores por sus satisfactorios resultados, pero no se ha profundizado en la utilización de sus métodos de extracción y aplicación en imágenes aéreas. La segmentación semántica es un problema de la visión por computadora que se desarrolla en la comprensión del contexto de una imagen, la dificultad de este método se encuentra en el desarrollo de máscaras que son las encargadas de que objetos debe de entender un modelo, generar un conjunto de imágenes para entrenar modelos es una tarea complicada, ya que se debe de etiquetar cada objeto presente en la imagen, esto provoca conjuntos pequeños para entrenar. La utilización de redes convolucionales preentrenadas permite mejorar la precisión de los modelos a utilizar, transferir esta información, permite desarrollar modelos adecuados a la implementación de conjunto de imágenes aéreas. En este trabajo se implementan dos arquitecturas para la segmentación de imágenes aéreas que son la U-Net y DeepLab. Se definen ambas arquitecturas para conocer sus metodologías de segmentación y se aplican al conjunto de imágenes aéreas, estos se deben preprocesar para mejorar la precisión y evitar un sobreajuste, por ello se normalizan para evitar valores grandes, un mayor cálculo en funciones y reducir la potencia requerida para necesitar un menor tiempo en el entrenamiento. El desempeño de las arquitecturas es satisfactorio en ambos conjuntos de imágenes, en drones se logra clasificar cada objeto presente con una media por clase de al menos 50 %, esto quiere decir que m ́as de la mitad de pixeles en cada clase de las imágenes logra ser clasificado correctamente, la media es influenciada por valores peque ̃nos y grandes, porque pueden existir clases cuya clasificación sea precisa mientras que existen otras que inferiores (23 clases) y mientras que las imágenes captadas por satélites el desempeño es bajo, porque se aplica un método de clasificación multiclase, como el conjunto posee 8 clases al comparar las máscaras se visualizan 1, 2 o hasta 3 clases que segmentar, esto provoca que los modelos clasifiquen considerando el total de etiquetas del conjunto, pero el resultado es aceptable, ya que al observar la imagen original posee tales clases que las máscaras las definen con clase que predomina en la imagen, la razón de esto es por el conjunto de datos que está preparado para detectar las clases de interés.

Descripción

Lugar de Publicación

Auspiciador

Palabras clave

REDES NEURONALES, SEGMENTACION, IMAGENES DIGITALES, TEORIA DE LA CODIFICACION

Licencia

URL Licencia

Colecciones