Named entity recognition model based in convolutional neural networks for automatic processing of Chilean environmental legal text documents

Fecha

2022

Formato del documento

TMG

ORCID Autor

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad de Valparaíso

Ubicación

ISBN

ISSN

item.page.issne

item.page.doiurl

Facultad

Facultad de Ciencias

Departamento o Escuela

Instituto de Estadística

Determinador

Recolector

Especie

Nota general

Magíster en Estadística. Universidad de Valparaíso. 2022.

Resumen

Esta tesis se basa en un proyecto de técnicas aplicadas de Procesamiento del Lenguaje Natural (NLP) para procesar texto legal ambiental chileno. El proyecto se realizó en cooperación con PREVSIS, una empresa chilena de prevención de riesgos que ofrece a terceros software de gestión de riesgos. De sus actividades surge una situación común con los documentos legales, específicamente con el texto legal am- biental, que desafía a las empresas a mantenerse actualizadas con los nuevos textos legales que se publican. El trabajo ha buscado resolver el problema entrenando un modelo NER personalizado utilizando el framework spaCy y Gensim. El modelo re- sultante puede anotar 17 etiquetas relacionadas con: la estructura del texto legal, ac- ciones legales y acciones legales ambientales, entre otros. El corpus utilizado para entrenar el modelo personalizado se basó en las leyes ambientales chilenas, decretos y resoluciones publicadas a la fecha. Luego, el modelo NER fue empaquetado para ser utilizado en una aplicación web desarrollada con Streamlit como producto final de este trabajo.

Descripción

Lugar de Publicación

Valparaíso

Auspiciador

Palabras clave

PROCESAMIENTO DEL LENGUAJE NATURAL (CIENCIA DE LA COMPUTACION), MEDIO AMBIENTE, DERECHO AMBIENTAL, CHILE

Licencia

URL Licencia

Colecciones