Development of statistics for cultural concepts measured by linguistic changes
Fecha
2019
Autores
Profesor Guía
Formato del documento
Thesis
ORCID Autor
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad de Valparaíso
Ubicación
ISBN
ISSN
item.page.issne
item.page.doiurl
Facultad
Departamento o Escuela
Facultad de Ciencias. Instituto de Estadística
Determinador
Recolector
Especie
Nota general
Doctor en Estadística. Universidad de Valparaíso. 2019.
Resumen
Poca o casi nada de investigación existe sobre cambios ortográficos o variación lingüística
de una lengua nativa y los pocos estudios que existen se basan en un volumen de análisis de datos de muchos corpus de periodo de tiempo, detectando diferencias frecuenciales pero para determinada cantidad de palabras. Nuestra tesis para su estudio se basó en el corpus histórico Nican Mopohua (relato Náhuatl-México) de Lasso(1649) y Rojas(1978) y nos enfocamos en la comparación de la ocurrencia de frecuencias de palabras y adherido a esto se utiliza métodos de similaridad o divergencia en dos distribuciones de probabilidad para modelar el comportamiento de los datos. Específicamente, nos enfocamos en determinar la estadística formal para medir la casi distancia entre dos versiones del corpus para poder evaluar los cambios lingüísticos de la lengua Náhuatl en el tiempo. Además ajustamos un modelo estadístico que detectan variantes lingüísticas históricas y verificamos por pruebas de bondad de ajuste la distribución Gama y Uniforme como una distribución estadística adecuada de algunas cuasi distancias. Recopilamos nuestros datos respectivamente a los diseños de tres experimentos: 111 palabras (todas las palabras claves), 35 palabras (Palabras de menor frecuencia) y 74 palabras (palabras de menor y mediana frecuencia). En el primer diseño del experimento la distribución empírica de las cuasi distancias se ajusta bien a una distribución Gama, con la excepción de la medida de similitud de Coseno (distribución Beta) y Confusión (distribución de Cauchy). En el segundo experimento la distribución empírica de las cuasi distancias se ajusta a la distribución Uniforme y en el último experimento, la distribución empírica de las cuasi distancias también se ajusta a la distribución Uniforme, con la excepción de la medida del Coseno que tiene una distribución Beta como el mejor ajuste. La no presencia de normas léxicas y la naturaleza aglutinante de la lengua Náhuatl son grandes obstáculos. Nuestros resultados indican una justificación empírica de la distribución gama generalizada como modelo adecuado de cambios semánticos entre los dos corpuses del Nican Mopohua estos son presentados y pueden ser usados como ayuda para trabajos futuros.
Descripción
Lugar de Publicación
Auspiciador
Palabras clave
LINGUISTICA, INTERPRETACION ESTADISTICA DE DATOS, FRECUENCIA, ORTOGRAFIA