Development of statistics for cultural concepts measured by linguistic changes

Fecha

2019

Profesor Guía

Formato del documento

Thesis

ORCID Autor

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad de Valparaíso

Ubicación

ISBN

ISSN

item.page.issne

item.page.doiurl

Facultad

Departamento o Escuela

Facultad de Ciencias. Instituto de Estadística

Determinador

Recolector

Especie

Nota general

Doctor en Estadística. Universidad de Valparaíso. 2019.

Resumen

Poca o casi nada de investigación existe sobre cambios ortográficos o variación lingüística de una lengua nativa y los pocos estudios que existen se basan en un volumen de análisis de datos de muchos corpus de periodo de tiempo, detectando diferencias frecuenciales pero para determinada cantidad de palabras. Nuestra tesis para su estudio se basó en el corpus histórico Nican Mopohua (relato Náhuatl-México) de Lasso(1649) y Rojas(1978) y nos enfocamos en la comparación de la ocurrencia de frecuencias de palabras y adherido a esto se utiliza métodos de similaridad o divergencia en dos distribuciones de probabilidad para modelar el comportamiento de los datos. Específicamente, nos enfocamos en determinar la estadística formal para medir la casi distancia entre dos versiones del corpus para poder evaluar los cambios lingüísticos de la lengua Náhuatl en el tiempo. Además ajustamos un modelo estadístico que detectan variantes lingüísticas históricas y verificamos por pruebas de bondad de ajuste la distribución Gama y Uniforme como una distribución estadística adecuada de algunas cuasi distancias. Recopilamos nuestros datos respectivamente a los diseños de tres experimentos: 111 palabras (todas las palabras claves), 35 palabras (Palabras de menor frecuencia) y 74 palabras (palabras de menor y mediana frecuencia). En el primer diseño del experimento la distribución empírica de las cuasi distancias se ajusta bien a una distribución Gama, con la excepción de la medida de similitud de Coseno (distribución Beta) y Confusión (distribución de Cauchy). En el segundo experimento la distribución empírica de las cuasi distancias se ajusta a la distribución Uniforme y en el último experimento, la distribución empírica de las cuasi distancias también se ajusta a la distribución Uniforme, con la excepción de la medida del Coseno que tiene una distribución Beta como el mejor ajuste. La no presencia de normas léxicas y la naturaleza aglutinante de la lengua Náhuatl son grandes obstáculos. Nuestros resultados indican una justificación empírica de la distribución gama generalizada como modelo adecuado de cambios semánticos entre los dos corpuses del Nican Mopohua estos son presentados y pueden ser usados como ayuda para trabajos futuros.

Descripción

Lugar de Publicación

Auspiciador

Palabras clave

LINGUISTICA, INTERPRETACION ESTADISTICA DE DATOS, FRECUENCIA, ORTOGRAFIA

Licencia

URL Licencia

Colecciones