1. Introducción
Varias lenguas yumanas se destacan por una considerable variación dialectal que en algunas ocasiones impide establecer límites claros entre lenguas y sus dialectos (Langdon 1991). Es notable que ni siquiera hay uniformidad en la literatura acerca de la cantidad de lenguas que constituyen la familia. Golla (2011: 117) afirma que la familia yumana consta de 8 lenguas estrechamente emparentadas. Miller (2024: 1303-1304), en cambio, incluye más de 20 lenguas en su árbol genealógico de la familia yumana y argumenta que solo 10 de ellas han sido plenamente reconocidas. Es probable que algunas variantes lingüísticas que en la actualidad carecen de estudios descriptivos en realidad deberían ser consideradas lenguas individuales.1 La urgencia de estudios sobre las lenguas yumanas se debe a la alarmante situación de peligro de extinción en la que se encuentran todas las lenguas de esta familia (Caccavari 2014; Moctezuma 2015; Leyva 2021; Miller 2024).
El presente estudio retoma la problemática de la dialectología yumana en el contexto del subgrupo delta-californiano (Gil 2014; Miller 2018), con el fin de revisar y aclarar la posición de la lengua ku’alh que hasta la fecha sigue siendo la menos estudiada de todas las lenguas yumanas habladas en el territorio mexicano. Utilizando el enfoque comparativo, se pretende atender la siguiente pregunta de investigación: ¿Qué tan cercana es la relación filogenética entre el ku’alh y el kumiay? Por un lado, Miller (2018; 2024), con base en la evidencia de la fonología histórica, identifica el ku’alh como una lengua claramente distinta al kumiay. Por otro lado, la posibilidad de clasificar el ku’alh como uno de los dialectos del kumiay no se ha descartado por completo, tomando en cuenta que entre el ku’alh y el kumiay existe inteligibilidad parcial (Field 2012; Field & Meza Cuero 2012). Asimismo, llama la atención que una gran cantidad de lexemas del ku’alh que aparecen en el informe del INALI (2010) son idénticos a los que se registran en el kumiay: xa ‘agua’,2ʃeɬ ‘mano’, xpa ‘tuna’, aʃkaʈ ‘cortar (varias veces)’, mu ‘borrego’, prxaw ‘zorra’, entre otros.
El objetivo de este estudio es corroborar el estatus del ku’alh como una lengua independiente del kumiay. El estado de la descripción del ku’alh y kumiay se esboza en §2. El método principal que se emplea para la comparación es el análisis léxico-estadístico con base en el vocabulario básico de 110 ítems, como se detalla en §3. Para cada uno de los 110 ítems, se analiza si las palabras registradas sincrónicamente en kumiay y ku’alh pueden atribuirse al desarrollo diacrónico de un mismo lexema en la protolengua o si, por el contrario, se originaron de manera independiente (§4). En §5 se discuten algunas complicaciones en la identificación de cognados. La comparación léxica no da un resultado rotundo, ya que arroja el porcentaje de correspondencias que se ubica dentro del margen que permite considerar dos variantes lingüísticas comparadas tanto como dos dialectos como también dos lenguas distintas (§6). Por consiguiente, resulta necesario recurrir a argumentos adicionales de índole gramatical y sociolingüística, que en conjunto apuntan a que el kumiay y el ku’alh deben ser consideradas dos lenguas independientes (§7).
2. Ku’alh y kumiay: antecedentes
El ku’alh es una de las lenguas originarias de México menos conocidas que por mucho tiempo no ha sido objeto de estudios lingüísticos (Sánchez-Fernández 2022). Es hablado en el estado de Baja California por un número de hablantes muy limitado que no excede de 20 personas (Vinogradov & Sánchez-Fernández 2025: 258). Miller (2024: 1305) estima que este número se ubica en el rango entre 10 y 30 personas. La mayoría de los hablantes del ku’alh residen en la comunidad indígena de Santa Catarina, en donde convergen con otro grupo originario, los pa ipai.
El parentesco entre la lengua pa ipai y el ku’alh no es cercano, a pesar de pertenecer a la misma familia lingüística. El pa ipai forma parte del subgrupo pai, junto con varias lenguas que se hablan en el estado de Arizona en los Estados Unidos (Joël 1964; Miller 2024). El ku’alh y el pa ipai no son mutuamente inteligibles, pero han convivido en la misma región, presumiblemente desde la época de las misiones. En la actualidad, todos los hablantes del ku’alh son trilingües. La mayoría de la población se reconoce como pa ipai, lo que le ha otorgado mayor visibilidad y recono cimiento a esta identidad étnica. En contraste, la cantidad de hablantes de ku’alh es significativamente menor, y su identidad cultural ha sido malinterpretada con frecuencia. En efecto, la información errónea se mantiene vigente en la página web del Instituto Nacional de los Pueblos Indígenas donde se afirma que la lengua ku’alh “es genéticamente muy cercana” al pa ipai (INPI 2020). La compleja situación sociolingüística en la comunidad de Santa Catarina ha llevado a la invisibilización del ku’alh, tanto en términos de su lengua como de su legado cultural dentro de la comunidad. Aunque existen registros precisos desde la década de 1960 que documentan la presencia de esta lengua y la señalan abiertamente como distinta del pa ipai (Owen 1960; Joël 1964), no fue hasta principios del siglo XXI que comenzaron los esfuerzos por su reconocimiento.
Últimamente se han llevado a cabo, por lo menos, dos grandes proyectos de documentación lingüística del ku’alh, aunque los trabajos publicados todavía son escasos. El proyecto de Margaret Field y Amy Miller presenta el intento más sistemático de documentación del ku’alh y de los dialectos del kumiay hablados en el territorio mexicano (Field 2017; Field & Miller 2018). Los datos primarios en forma de grabaciones de audio y video se han depositado en los archivos electrónicos, y muchos de ellos están disponibles para el público general. Sin embargo, hasta la fecha no se ha publicado ningún análisis propiamente lingüístico.
El otro proyecto estuvo a cargo del Instituto Nacional de Lenguas Indígenas. Se publicó un reporte que describe el procedimiento de documentación que se llevó a cabo en Santa Catarina (INALI 2010). No obstante, los datos primarios que fueron recopilados no se incluyeron en el reporte y tampoco pueden ser consultados en ningún repositorio de acceso abierto. El análisis lingüístico preliminar se basa en parte en los datos obtenidos en el proyecto y en parte en lo que fue reportado por Mauricio Mixco en un manuscrito no publicado de los años 80 (Mixco s/f). De esta manera se crea un panorama heterogéneo sobre la estructura gramatical de la lengua. Es interesante notar que la información que proviene del mismo manuscrito de Mauricio Mixco también se utiliza en el estudio fonológico comparativo de Miller (2018), aunque la autora considera que esos datos en realidad corresponden a otra lengua, a la que le llama kʷʔaƚʸ, la cual es distinta al ku’alh.
El grado de relación filogenética entre el ku’alh y el kumiay no ha sido objeto de un estudio específico, a pesar de algunas breves menciones de la posible cercanía (Field 2012: 558). El kumiay no es una lengua homogénea, sino un continuo dialectal que se extiende desde el norte del estado de Baja California (La Huerta, San Antonio Necua, San José de la Zorra, Juntas de Nejí, Peña Blanca) hasta las áreas fronterizas en los Estados Unidos. De acuerdo con Gil & Vinogradov (2023: 50), “el kumiay pertenece al complejo diegueño-iipay-tiipay-kumiay, un cúmulo de variedades lingüísticas estrechamente relacionadas” que ha sido objeto de múltiples estudios dialectológicos (Hedges 1975; Langdon 1991; Field 2012).
Los dialectos del kumiay hablados en México no cuentan con una larga tradición descriptiva que caracteriza a algunos dialectos del mismo continuo en los Estados Unidos. Sobre todo, se destacan las descripciones gramaticales del diegueño de Mesa Grande (Langdon 1966) y del tiipay de Jamul (Miller 2001). En cuanto a la literatura sobre el kumiay de México, existen descripciones fonológicas del kumiay de San José de la Zorra (Gil 2016) y de Nejí (Mai et al. 2019), publicaciones de textos en los mismos dos dialectos (Carrillo & Acosta 2019; Meza & Fernández 2021; Gil & Vinogradov 2023), algunos trabajos sobre fenómenos gramaticales individuales (Hinton & Langdon 1976; Caballero & Cheng 2020; Vinogradov & Gil 2024) y una tesis sobre la interacción entre el kumiay y el español (Acosta 2022). Un panorama bibliográfico más completo se presenta en Sánchez-Fernández (2022).
3. Metodología
La distancia entre dos variantes lingüísticas se puede medir a partir del grado de la inteligibilidad mutua (Hammarström 2008) o con base en un cálculo que refleje la similitud estructural (Wichmann et al. 2010; Koryakov 2017; Wichmann 2020). En este estudio aplicamos el algoritmo más famoso y, también, más criticado que ha sido elaborado por Morris Swadesh con el fin de medir la similitud léxica (Swadesh 1952; 1955), por lo que recibió el nombre de método léxico-estadístico. El insumo para este algoritmo es una lista de 200 ítems léxicos básicos, seleccionados por su mayor resistencia a los cambios. En los trabajos posteriores esta lista fue reducida a la mitad, hasta llegar a 100 ítems.
El método léxico-estadístico de Morris Swadesh fue desarrollado con el objetivo principal de calcular el tiempo transcurrido desde la separación de una protolengua hasta la evolución de sus lenguas hijas en su estado actual. Aunque posteriormente se ha comprobado que este método no siempre da resultados confiables para los propósitos de la glotocronología, sí puede ser útil para demostrar la cercanía filogenética entre dos o más variantes lingüísticas y, en particular, puede proporcionar argumentos decisivos para definir si se trata de dos (o más) lenguas o de dos (o más) dialectos de la misma lengua (Heggarty 2010; Koryakov 2017). El método léxico-estadístico se ha aplicado a diferentes lenguas en diferentes partes del mundo; por ejemplo, a los dialectos del yoruba en África (Arokoyo & Lagunju 2019), a la familia tepehua-totonaca (Davletshin 2024) y a las variantes minoritarias del finlandés y estonio (Rozhanskiy & Zhivlov 2019).
El método léxico-estadístico es particularmente válido para una comparación entre el kumiay y el ku’alh, ya que las comunidades de habla están separadas geográficamente, lo que reduce la probabilidad de confundir cognados con préstamos. Entre el ku’alh y el kumiay no hay contacto cotidiano directo, aunque existen ciertas dinámicas de convivencia. Se mantiene la tradición yumana de matrimonios mixtos entre personas de comunidades distintas (Shipek 1982; Garduño 2005). Algunas per sonas se contactan esporádicamente en las reuniones de los grupos yumanos de Baja California o en los viajes a los Estados Unidos que se organizan con propósitos de intercambio cultural. En general, las dos lenguas están en contacto con el español, pero no entre ellas. El ku’alh, además, por su situación sociolingüística peculiar (§2), está sometido a una fuerte influencia del pa ipai (Sánchez-Fernández & Rojas-Berscia 2016).
En el presente estudio se emplea una lista adaptada de 110 palabras del léxico básico. La base de datos (Zhivlov 2015) incluye cinco lenguas yumanas, entre las cuales no están el kumiay ni tampoco el ku’alh, por lo que fue necesario recolectar los datos en campo. Para el kumiay, el estudio se llevó a cabo en San José de la Zorra donde la lengua es más vital que en otras comunidades (§2). Las palabras se elicitan en contexto, lo que, a diferencia de una elicitación de palabras aisladas, permite aclarar la semántica y garantiza la obtención del significado buscado (Kassian et al. 2010). Es importante apegarse a este procedimiento técnico, dado varios problemas semánticos con la lista de Swadesh que han sido reportados en la literatura (Campbell 1998; Kassian et al. 2010). La traducción al español del cuestionario para la elicitación puede encontrarse en Davletshin (2024). El único ajuste concierne a los verbos de posición ‘estar acostado’, ‘estar sentado’ y ‘estar parado’. Como los resultados obtenidos mediante la aplicación del cuestionario corresponden a los predicados dinámicos ‘acostarse’, ‘sentarse’ y ‘pararse’, fue necesario sustituirlos por los verbos estativos que son más estables diacrónicamente (Kassian et al. 2010: 66). La elicitación se realizó en junio de 2023 con dos hablantes para cada una de las lenguas. Las cuatro participantes eran mujeres de entre 60 y 70 años de edad. Aunque hubo diferencias entre las colaboradoras en cuanto a la estructura morfosintáctica de algunas oraciones, la elección de los lexemas buscados no presentó mayor variación. Los resultados de este ejercicio se incluyen en el anexo.
4. Comparación léxica
Cada par de lexemas obtenido en las sesiones de elicitación fue sometido a un análisis para determinar si son cognados o no. En teoría, esta decisión debe estar basada en las reglas de la fonología histórica del subgrupo delta-californiano. Aunque la fonología histórica de las lenguas yumanas está bastante bien desarrollada (Wares 1968; Mixco 1978; Miller 2018), un diccionario etimológico todavía no existe, lo que restringe la posibilidad de reconstruir los cambios diacrónicos con exactitud para algunos lexemas. En la mayoría de los casos los cambios que sucedieron desde la separación de la protolengua común no han influido demasiado en la apariencia de las palabras. Para el presente análisis se asume que la similitud superficial es suficiente para identificar los cognados, mientras que la ausencia de una similitud indica lo contrario.
Como se puede observar en el anexo, varios ítems léxicos son idénticos en las dos lenguas, por ejemplo: ʧam ‘todo’ (1),3tu ‘panza’ (4), ʃeɬ npul ‘uña’ (13), si ‘beber’ (19), jiw ‘ojo’ (25), ʃej ‘grasa’ (26), etc. En total son 26 ítems idénticos de los 110 que conforman la muestra, lo que constituye aproximadamente el 23.6%. A estos cognados se suman los ítems que no son idénticos, pero cuyo origen en el mismo lexema en la protolengua puede ser comprobado por los procesos fonológicos regulares en kumiay y ku’alh. Por ejemplo, la oclusiva retrofleja /ʈ/ en el repertorio fonémico del kumiay le corresponde a la africada retrofleja /ʈʃ/ en ku’alh. Esta correspondencia se observa en seis ítems de la muestra: ʃukaʈ / ʃukaʈʃ ‘frío’ (15), xaʈ / xaʈʃ ‘perro’ (18), xwaʈ / xwaʈʃ ‘rojo’ (66), entre otros.4
Otro proceso fonológico es la simplificación de secuencias consonánticas iniciales en kumiay mediante la elisión de alguno de los fonemas, que no ocurre con tanta sistematicidad en ku’alh. Por consiguiente, las raíces de tipo CCV(C) en kumiay a menudo corresponden a las raíces de forma CCCV(C) en ku’alh: tkar / txkar ‘pecho’ (11), psi / tpsi ‘hígado’ (48), mʃap / nmʃap ‘blanco’ (97),5 etc. Aunque no es un proceso predecible, no cabe duda de que en cada caso de elisión de una consonante se trata de dos cognados. Otro fenómeno fonológico bien difundido en las lenguas de la familia yumana es la metátesis (Wares 1968: 24-25; Langdon 1976). Dentro de la lista de los 110 ítems léxicos básicos se encuentran dos ejemplos: mxʔoɬ / xumʔuɬ ‘ceniza’ (2) y mɬʔaj / xʔɬaj ‘arena’ (70). Igual que la elisión de fonemas en secuencias consonánticas iniciales, la metátesis no es predecible, sino ocurre de manera esporádica (Langdon 1976).
Mientras algunos procesos fonológicos sugieren considerar el ku’alh como una variante lingüística conservadora con respecto a las variantes de kumiay habladas en Baja California, otros procesos apuntan hacia la dirección contraria. Una de las peculiaridades fonológicas del kumiay de San José de la Zorra es la pérdida de la /j/ al final de la palabra después de la vocal /i/ (Miller 2018: 400), como en kʷi / kʷij ‘nube’ (14) y wi / wij ‘piedra’ (81), aunque en el habla cuidadosa de algunas personas la /j/ al final se mantiene. En este sentido, el ku’alh presenta un estado más conservador, manteniendo la /j/ en la mayoría de los contextos.
Por otro lado, las consonantes laterales palatalizadas del proto-delta-californiano, /ʎ/ y /ɬj/, perdieron la palatalización en ku’alh, mientras que en el kumiay de San José de la Zorra este proceso todavía no se concluye por completo (Gil 2016), lo que se puede observar en ʎmatʲ / lnmaʧ ‘pequeño, pl.’ (77). Miller (2018: 420) relaciona la acelerada despalatalización de las laterales en ku’alh con la influencia del pa ipai. Asimismo, en ku’alh se observa la pérdida de la consonante oclusiva glotal en algunas palabras en posición intermedia antes de una consonante, lo que no suele ocurrir en kumiay: aɬʔmar / ɬimar ‘quemar’ (12), tiʔɲa / tiɲam ‘noche’ (60) y waʔɲa / waɲa ‘camino’ (67). Otros casos de pérdida de los cierres glotales parecen obedecer a tendencias idiolectales en ambas lenguas.
La correspondencia entre las vocales /a/ y /e/ hace la situación aún más complicada, ya que en algunas palabras /a/ en kumiay le corresponde a /e/ en ku’alh, pero en otras es al revés: sjal / sjel ‘corteza’ (3) y ujaw / ujew ‘saber’ (45), pero xilpej / xilpaj ‘cerca’ (103) y tipej / tipaj ‘persona’ (64). Estos datos comparativos abren espacio para futuros estudios de la fonología diacrónica de las dos lenguas, pero no causan duda de que en todos los casos mencionados arriba se trata de los cognados.
Un caso interesante presenta el verbo ‘morir’ (17) que tiene formas supletivas tanto en kumiay, como en ku’alh, dependiendo del número del sujeto: mspa (sg.) y ʃuwaʈ (pl.) en kumiay y mspa (sg.) y awim (pl.) en ku’alh. Las formas en singular son idénticas, pero las formas en plural ni siquiera son cognadas. Siguiendo el procedimiento descrito en Kassian et al. (2010: 48), se elige la forma más neutral y menos marcada que en este caso le corresponde al número singular. Por consiguiente, los lexemas para el verbo ‘morir’ se consideran cognados. Una situación opuesta se observa con el lexema ‘pequeño’ (77) que también tiene formas supletivas dependiendo del número, pero las formas cognadas son las que corresponden al número plural: ʎmatʲ / lnmaʧ. En singular, las palabras son diferentes: ʎpitʲ / lʔaw. Siguiendo el mismo principio, los lexemas para ‘pequeño’ no se consideran cognados.
Cabe admitir que existen dos pares de lexemas problemáticos que a pesar de su similitud superficial requieren un estudio etimológico más profundo y que por el momento clasificamos como cognados de manera tentativa. Para el ítem sʔay / sʔar ‘seco’ (20) el problema reside en la ausencia de una correspondencia sistemática entre /y/ en kumiay y /r/ en ku’alh.6 Aunque Zhivlov (2015: 14) no analiza como cognados los lexemas respectivos en las lenguas diegueñas (sʔaːy en tiipay de Jamul y saːy en ’iipay de Mesa Grande) y en el cocopa de Arizona (ʂʔar, ver Crawford 1989: 289), se necesitan argumentos de la fonología histórica para poder descartar la similitud superficial que existe entre estas dos palabras. Otro caso interesante presenta ɬmu / ɬumkur ‘cabeza’ (38), que corresponde a mkur en cocopa (Crawford 1989: 140). Es probable que se trate de una palabra compuesta en ku’alh que se haya simplificado, tomando dos rutas distintas en kumiay y en cocopa. Aunque la semántica de las raíces no está clara, tampoco hay suficientes argumentos para afirmar que los lexemas en kumiay y ku’alh no son cognados. De esta manera la cantidad total de cognados que pueden ser identificados llega a 91 ítems (ver el anexo).
Los ítems léxicos que representan préstamos o que no existen en alguna de las lenguas, deben ser excluidos de la comparación en conformidad con los procedimientos establecidos en la lingüística histórica. Así, en ku’alh no ha sido posible registrar ninguna palabra para ‘nuevo’ (59) más que el préstamo del español nuev. La palabra ‘piel’ (75) no existe en ninguna de las dos lenguas. La mayoría de los hablantes del kumiay no se acuerdan de la palabra ‘pez’ (29), y otros creen recordar que es xʧi, pero no están seguros. La partícula negativa (62) en ku’alh se registra como lʔax, con las formas idiolectales lʔa y ʔax. En kumiay se emplea la partícula diferente, xmow, que tiene desarrollos paralelos en otras lenguas emparentadas (Langdon 1966: 254; Miller 2001: 167-168). El escenario más probable es que la partícula lʔax en ku’alh en realidad sea un préstamo que proviene del cocopa (Miller 2018: 423). Crawford (1966: 85) registra el verbo negativo la:x en cocopa, que aparece inmediatamente después del predicado en construcciones negativas; compárese también la entrada lax ‘no ser, ser nada’ en el diccionario (Crawford 1989: 92).
Queda dudoso el estatus de la palabra ‘hoja’ (46), ya que algunos hablantes del ku’alh afirman que es waɬ, idéntico a la palabra registrada en kumiay, pero otros rechazan usar esta palabra por considerarla préstamo sin proporcionar ningún equivalente que sea propio del ku’alh. Finalmente, en ninguna de las dos lenguas existe la palabra para decir ‘árbol’ (90) y se usan diferentes estrategias para reemplazarla. Los hablantes del kumiay dicen sɲaw ‘encino’ o ʃiʔwiɬ ‘rama’, mientras que en ku’alh se emplea la palabra samaɬ para decir ‘planta’ en un sentido muy general para denotar cualquier tipo de vegetación. Aunque esta palabra tiene un cognado claro en kumiay, saʔmaɬ, su significado no es el que se busca para el ítem correspondiente.
De esta manera se descartan 6 ítems léxicos que no van a participar en el cálculo, ya que no son relevantes para la comparación. Dividiendo los 91 cognados entre 104 ítems léxicos comparables, se obtiene el resultado del 87.5%, lo que podemos caracterizar como la medida del grado de similitud léxica entre el kumiay y ku’alh. Esta cifra se va a interpretar en §6.
5. Algunos casos difíciles
Los 13 ítems que no fueron mencionados en la sección anterior no presentan cognados; es decir, la palabra que se registra en kumiay no tiene el mismo origen que la palabra que se registra en ku’alh para el significado correspondiente. Sin embargo, algunos de estos ítems merecen una discusión particular, dado sus peculiaridades semánticas y/o estructurales.
El ítem léxico ‘cerro’ (55) presenta un problema metodológico, ya que no coincide con una sola palabra en ninguna de las lenguas, sino con una combinación de palabras. Es decir, ni kumiay ni el ku’alh tienen una palabra que se refiriera específicamente al cerro. En cambio, utilizan expresiones descriptivas que son diferentes en las dos lenguas: maʈ kotaj con el significado literal “tierra grande” en kumiay y wi kpɬpuɬ “piedra encorvada” en ku’alh. Una opción válida sería excluir el ítem ‘cerro’ del cálculo, igual que ‘árbol’ y ‘hoja’, discutidos en §4. No obstante, si se introduce el requerimiento de que cada ítem necesariamente debe corresponder a un solo lexema en cada lengua y no a una combinación fija de dos o más lexemas, probablemente se tendrá que excluir del cálculo algunos otros ítems que presentan cognados, como mi npok / mi npuk ‘rodilla’ (44), por ejemplo.
Un caso interesante presenta la palabra ‘qué’ (96) que es me:tʲ en kumiay y ʧʔuʧ en ku’alh. Estos lexemas no son cognados. Sin embargo, los hablantes del kumiay se acuerdan de la palabra aʔutʲ que es sinónimo de me:tʲ, aunque no se utiliza frecuentemente y puede ser considerada arcaica. Las palabras aʔutʲ en kumiay y ʧʔuʧ en ku’alh muy probablemente son cognadas; sin embargo, conforme a la metodología de comparación, únicamente se considera la palabra más neutral que no debe ser sustituida por un sinónimo cuyo uso es menos frecuente.
Se destacan seis ítems que presentan lexemas distintos, pero las diferencias se deben al cambio semántico que sufrió el lexema cognado en una de las lenguas: ‘morder’ (7), ‘comer’ (23), ‘cabello’ (36), ‘corazón’ (40), ‘pluma’ (27) y ‘viento’ (108). La palabra saw significa ‘morder’ en ku’alh, y corresponde a ʧukow en kumiay. Sin embargo, la palabra saw también existe en kumiay, con el significado ‘comer’. El verbo ‘comer’ en ku’alh es ma, y esta palabra también existe en kumiay, pero con un significado más específico. Se emplea únicamente para comida blanda o medio líquida como sopa o atole, siendo saw el verbo más neutral.
La palabra ‘corazón’ en ku’alh es jej. En kumiay, se utiliza la palabra iʃeʃ para decir ‘corazón’, pero la palabra jej también existe y significa ‘estómago’, otro órgano interior del cuerpo humano. La palabra ‘pluma’ en ku’alh es wirwir, y la misma palabra en kumiay significa ‘ala’. Aquí la relación semántica es de meronimia, ya que una pluma es parte del ala. La palabra ‘cabello’ en ku’alh es muxʷaɬ, y la misma palabra en kumiay significa ‘frente’, mientras que para decir ‘cabello’ se utiliza la palabra ɬta que no es cognada. Un caso curioso presenta la palabra xjiw. En ku’alh, significa ‘viento’, mientras que en kumiay se emplea como un verbo con el significado de ‘hacer’, únicamente hablando del viento. La expresión “hace viento” en kumiay sería mtxa xjiw, donde la palabra xjiw no le corresponde al sustantivo, sino al verbo.
Estas diferencias son resultado del cambio semántico que es un proceso natural en el desarrollo diacrónico del léxico. La cercanía entre los conceptos de ‘corazón’ y ‘estómago’, ‘comer (en general)’ y ‘comer (comida de consistencia blanda)’ o ‘pluma’ y ‘ala’ se explica por la aplicación de patrones de cambio recurrentes en las lenguas del mundo (Traugott & Dasher 2001) y puede ser comprobada mediante procedimientos computacionales (ver Xu & Kemp 2015). No obstante, esto no puede ser un argumento para los propósitos de un estudio léxico-estadístico que pretende comparar las expresiones lingüísticas que codifican ciertos conceptos predeterminados y no los conceptos semánticos que están codificados por ciertas expresiones lingüísticas. A pesar de que algunos de los lexemas que no presentan cognados están más relacionados semántica- o históricamente que otros, el cálculo que respeta la rigurosidad metodológica no debe considerar los ítems mencionados en esta sección como cognados. Es decir, el sinónimo arcaico de la palabra ‘qué’ ni el otro verbo para ‘comer’ que se emplea para comida de consistencia blanda en kumiay no deben estar reflejados en el cálculo de similitud léxica entre las dos lenguas.
6. Análisis de los resultados
La comparación léxico-estadística del vocabulario básico en kumiay y ku’alh da el resultado del 87.5% de correspondencias (91/104, ver §4). Sin embargo, hay un problema con la interpretación de este porcentaje. No se ha elaborado una medida universalmente aceptada que podría marcar un tope, llegando al cual el porcentaje de correspondencias ya indicaría que se trata de dos dialectos de la misma lengua. En otras palabras, no se puede saber con exactitud si el 87.5% de correspondencias es mucho o poco. En diferentes trabajos se han propuesto diferentes cifras para determinar el límite entre dos lenguas y dos dialectos de la misma lengua; ver Koryakov (2017: 89).
Gudschinsky (1956), siguiendo a Morris Swadesh, calcula que dos variantes lingüísticas deben ser consideradas como dos dialectos a partir del 81% de cognados compartidos. Si aplicamos esta medida a los datos del kumiay y ku’alh, llegaremos a la conclusión de que son dialectos de la misma lengua. Otros investigadores han utilizado porcentajes similares o hasta menores; ver Dyen (1965) para las lenguas austronesias y Kaufman (1994) para las lenguas de Mesoamérica. En efecto, Terrence Kaufman deja un margen en el rango del 76% al 84% para lenguas “emergentes”; es decir, los dialectos que se encuentran en el estado transitorio de poder ser considerados una lengua.
A diferencia de los trabajos anteriores, Koryakov (2017), con base en su estudio tipológico más reciente que incluye lenguas y dialectos hablados en diferentes partes del mundo, propone un porcentaje más alto para distinguir entre dos lenguas y dos dialectos: el 91%. Si tomamos esta cifra como límite, veremos que el ku’alh y el kumiay son dos lenguas independientes (87.5 < 91). Para fines de comparación cabe mencionar que los porcentajes de correspondencias léxicas semejantes caracterizan, por ejemplo, los siguientes pares de lenguas: el español y el catalán, el sardo y el italiano, el ruso y el ucraniano, todos considerados actualmente como lenguas distintas.
Resumiendo, el grado de similitud léxica no permite definir de manera inequívoca si el kumaiy de San José de la Zorra y el ku’alh son dos lenguas diferentes o dos dialectos de la misma lengua. Lo que sí está claro es que son dos variantes lingüísticas muy cercanas filogenéticamente. La hipótesis de que pueden ser considerados dos dialectos se mantiene válida, si uno se apoya únicamente en los datos comparativos del léxico básico. Sin embargo, existen otros factores de índole gramatical y sociocultural que se suelen tomar en consideración para distinguir entre lenguas y dialectos. Como se plantea en §7, todos estos factores adicionales apuntan a favor de considerar el kumiay y el ku’alh dos lenguas independientes.
7. Consideraciones adicionales
Tanto el kumiay como el ku’alh carecen del estatus oficial y tampoco tienen una tradición escrita, por lo que muchos de los criterios usados comúnmente para distinguir entre lenguas y dialectos no son aplicables (Koryakov 2017). El principio de autoidentificación de hablantes aporta otro argumento a favor de identificar el ku’alh como una lengua independiente. Los hablantes del ku’alh no se identifican como parte del grupo étnico de los kumiay. Aunque muchos tienen familiares en las comunidades de habla kumiay, sobre todo, en La Huerta y en San José de la Zorra, reconocen que son dos lenguas parecidas, pero no interpretan las diferencias como resultado de la variación dialectal de una sola lengua. El hecho de que el kumiay y el ku’alh son dos lenguas distintas es muy claro para los hablantes de ambas lenguas.
Una comparación gramatical también puede servir como un argumento adicional a favor de diferenciar el kumiay y el ku’alh como dos lenguas independientes. En varios dominios de la gramática existen diferencias muy pronunciadas entre kumiay y ku’alh. El obvio problema metodológico es que no existe una sola manera de calcular el grado de semejanza entre dos variantes lingüísticas en el nivel de la gramática. Por esta razón las diferencias gramaticales a menudo se presentan como impresiones subjetivas de las y los investigadores y no se toman en cuenta en los estudios que pretenden operar con datos cuantitativos.
De manera preliminar, se puede mencionar las siguientes diferencias gramaticales más evidentes con base en los breves esbozos gramaticales en Gil & Vinogradov (2023) y Vinogradov & Sánchez-Fernández (2025), considerando que todavía no existen gramáticas de referencia para ninguna de las dos lenguas. En el ámbito nominal, el ku’alh tiene una marca específica del caso acusativo, el sufijo -k, mientras que en otras lenguas del subgrupo delta-californiano el acusativo es el caso no marcado morfológicamente (Gorbet 1976). En el ámbito verbal, las divergencias son más pronunciadas. La morfología flexiva en ku’alh en general es más regular que en kumiay. Por ejemplo, ello se manifiesta en el uso más sistemático de la marca de la tercera persona del sujeto u- que suele omitirse con frecuencia en kumiay. Así, el verbo jiw ‘venir’ en tercera persona es u-jiw en ku’alh y jiw en kumiay de San José de la Zorra, con una forma alternativa marginal u-jiw. Otro morfema con el uso más regular en ku’alh es el sufijo pluralizador -ʧ. Muchos verbos que toman este sufijo en ku’alh, en kumiay son verbos con morfología irregular. Así, el verbo ʃma ‘dormir’ tiene la forma plural ʃma-ʧ en ku’alh y ʃuma:p en kumiay, combinando tres exponentes de manera simultánea: el infijo -u-, el alargamiento de la vocal radical y el sufijo -p.
En las construcciones analíticas de aspecto imperfectivo en kumiay, el verbo auxiliar puede tomar el prefijo t-/ta- para denotar la falta de actualidad y/o continuidad del evento (Vinogradov & Gil 2023). El ku’alh también tiene este tipo de construcciones, pero el morfema t-/ta- no existe en esta lengua. Por otro lado, en ku’alh, los verbos auxiliares en estas construcciones toman el prefijo ʧ- cuando están en la tercera persona, mientras que en kumiay este morfema no existe. Por ejemplo, la frase “la mujer estaba cantando” se traduce a las dos lenguas de la siguiente manera: nʧʔak-ət j ʧjaw t-ak w a (en kumiay) y niʧʔak-əj ʧjaw ʧ-awa (en ku’alh). Es notable el contraste entre el material léxico y el material gramatical en este ejemplo. Las tres raíces, nʧʔak / niʧʔak ‘mujer’, ʧjaw ‘cantar’ y el verbo auxiliar ak w a / awa ‘ser audible’, son cognadas. En cambio, toda la morfología flexiva es diferente; tanto los sufijos del caso nominativo -ət j y -əj, como los prefijos presentados arriba que se añaden a los verbos auxiliares.
Tanto kumiay como ku’alh emplean el sufijo -x para marcar el modo irrealis; sin embargo, mientras en kumiay este morfema aparece de manera sistemática (Vinogradov & Gil 2024), en ku’alh, el sufijo -x se alterna con formas no marcadas o aparece sustituido por otros marcadores modales como, por ejemplo, -ka. Finalmente, el sistema de marcación morfológica de cambio de referencia es mucho más elaborado en kumiay, que en ku’alh. En kumiay, se registra un paradigma de cuatro sufijos diferentes, y su distribución depende del modo gramatical y del sujeto de la cláusula dependiente que puede ser el mismo que el de la cláusula principal o distinto. En ku’alh, todo el sistema de cambio de referencia se reduce al único sufijo -m que no es sensible al modo y que indica el significado más marcado desde el punto de vista semántico: la alternancia del sujeto entre la cláusula dependiente y la cláusula principal (Vinogradov & Sánchez-Fernández 2025: 260).
No cabe duda de que se requieren más estudios gramaticales en ambas lenguas. Sin embargo, las diferencias mencionadas arriba de manera tentativa ya pueden constituir un argumento adicional a favor de que el kumiay y el ku’alh son dos lenguas distintas.
8. Conclusión
El kumiay y el ku’alh son dos lenguas estrechamente emparentadas. Sin embargo, no deben ser considerados como dos dialectos de la misma lengua. Aunque el estudio comparativo del léxico básico deja cierto margen para la interpretación del cálculo, como se demuestra en §6, y no apunta de manera concluyente a que se trata de dos lenguas independientes, argumentos adicionales de índole gramatical y sociolingüística respaldan esta hipótesis.
En el marco del presente estudio se compararon solo 110 ítems del léxico básico que, a partir de los trabajos de Morris Swadesh (1952; 1955), se consideran más representativos y menos propensos a cambios, tanto internos como externos. Se espera que esta muestra léxica se amplíe en estudios futuros para establecer las correspondencias fonológicas con mayor claridad y proponer hipótesis del desarrollo y la agrupación de las dos lenguas que puedan sostenerse desde la perspectiva de la lingüística histórica. Las investigaciones enfocadas en la documentación y descripción de las lenguas yumanas que actualmente se están llevando a cabo, aportarán los datos empíricos necesarios. Un estudio que se centre en la comparación gramatical también queda pendiente.
Los experimentos de inteligibilidad mutua presentan una manera alternativa de medir la distancia entre dos variantes lingüísticas (Hammarström 2008; Gooskens 2024). Curiosamente, uno de los primeros estudios de inteligibilidad mutua se llevó a cabo por Biggs (1957) con base en el material de las lenguas yumanas, aunque habladas en el territorio estadounidense. Tanto el kumiay como el ku’alh se hablan principalmente por adultos mayores, y esto impone ciertas restricciones metodológicas; no obstante, algunas entrevistas todavía pueden ser realizadas con participación de los hablantes más jóvenes que pueden trasladarse entre comunidades. Se pueden hacer grabaciones en kumiay y llevar a cabo un ejercicio de escuchar e interpretarlas con hablantes del ku’alh, y viceversa. Un estudio de este tipo en un futuro podría aportar nuevos datos y complementar la comparación léxica cuantitativa que se presentó en este artículo.










nueva página del texto (beta)



