Named entity recognition model based in convolutional neural networks for automatic processing of Chilean environmental legal text documents
Fecha
2022
Autores
Profesor Guía
Formato del documento
TMG
ORCID Autor
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad de Valparaíso
Ubicación
ISBN
ISSN
item.page.issne
item.page.doiurl
Facultad
Facultad de Ciencias
Departamento o Escuela
Instituto de Estadística
Determinador
Recolector
Especie
Nota general
Magíster en Estadística. Universidad de Valparaíso. 2022.
Resumen
Esta tesis se basa en un proyecto de técnicas aplicadas de Procesamiento del Lenguaje Natural (NLP) para procesar texto legal ambiental chileno. El proyecto se realizó en cooperación con PREVSIS, una empresa chilena de prevención de riesgos que ofrece a terceros software de gestión de riesgos. De sus actividades surge una situación común con los documentos legales, específicamente con el texto legal am- biental, que desafía a las empresas a mantenerse actualizadas con los nuevos textos legales que se publican. El trabajo ha buscado resolver el problema entrenando un modelo NER personalizado utilizando el framework spaCy y Gensim. El modelo re- sultante puede anotar 17 etiquetas relacionadas con: la estructura del texto legal, ac- ciones legales y acciones legales ambientales, entre otros. El corpus utilizado para entrenar el modelo personalizado se basó en las leyes ambientales chilenas, decretos y resoluciones publicadas a la fecha. Luego, el modelo NER fue empaquetado para ser utilizado en una aplicación web desarrollada con Streamlit como producto final de este trabajo.
Descripción
Lugar de Publicación
Valparaíso
Auspiciador
Palabras clave
PROCESAMIENTO DEL LENGUAJE NATURAL (CIENCIA DE LA COMPUTACION), MEDIO AMBIENTE, DERECHO AMBIENTAL, CHILE