1. INTRODUCCIÓN
Recientemente, los estudios de disponibilidad léxica se han multiplicado y han encontrado distintas vertientes de investigación, tanto en el español peninsular como en Hispanoamérica. La disponibilidad léxica pretende identificar el vocabulario que los hablantes tienen incorporado en su lexicón mental en relación con diversos temas y, a la vez, determinar el grado en que las unidades léxicas están disponibles en la mente de los hablantes para ser usadas cuando la situación lo requiere (López Morales 1995). Este vocabulario se conoce como léxico disponible y se define como el conjunto de palabras que los hablantes tienen en el lexicón mental cuyo uso está condicionado por el tema concreto de comunicación. Para obtener este léxico disponible, se utilizan centros de interés como activadores de la información. Estos centros se ubican dentro de un cuestionario de disponibilidad léxica; la información obtenida de ellos es de naturaleza temática y gramatical diversa: nominales, verbos y adjetivos. Los compuestos sintagmáticos forman parte del grupo nominal (Bartol 2004) y serán considerados unidades de denominación. La unidad de denominación tiene un papel teórico central en la explicación del fenómeno real de la palabra y, con ello, en el reconocimiento de esta última en la lengua y en los cuestionarios de disponibilidad léxica (Lara 2006:37-51). Con los estudios del léxico disponible, se pretende descubrir qué palabras son capaces de usar los hablantes en determinados temas de comunicación y cuáles son empleados con mayor frecuencia por los informantes.
El objetivo de este trabajo consiste en demostrar que los compuestos sintagmáticos aparecidos en dos corpus de disponibilidad léxica mexicana: Culiacán, Sinaloa de 2007-2008 y San Luis Potosí de 2017 presentan mínima variación porcentual, a pesar de que existe una diferencia temporal de diez años entre cada uno de ellos. Ambos corpus pertenecen a dos zonas dialectales distintas, una, a la variante dialectal del noreste y otra a la zona de transición del habla chihuahuense (Lope 1989, apudMartín 2011). Estos corpus pertenecen a investigaciones anteriores ya publicadas o en vías de hacerlo, que sirven de base para el trabajo pretendido de corte diatópico y diacrónico. La metodología de este trabajo es de corte cuantitativo aplicado a dos distintos corpus de disponibilidad léxica mexicana, pertenecientes a dos variantes dialectales y épocas distintas. Para el análisis se localizaron los compuestos sintagmáticos de cada corpus, se contabilizaron de forma general y específica, se clasificaron según su estructura formal [N+A]N, [A+N]N, [N+prep+N]N y [N+N]N (Lang 1992; Val 1999; Varela 2009, 2018; Buenafuentes 2007; Felíu 2009; Real Academia Española 2009; Casado 2018). Finalmente, por cada centro de interés, se hizo el contraste por año y por posición del compuesto.
Esta investigación se desarrolló en torno a las siguientes preguntas: ¿cuáles son los compuestos sintagmáticos más disponibles por centro de interés? ¿cuáles son los compuestos sintagmáticos que después de una temporalidad se mantienen y cuáles no? y ¿cuáles son los compuestos sintagmáticos que más aparecen en los corpus? La hipótesis es que cuando se analizan los vocablos de dos corpus distintos y dos temporalidades totalmente distintas, la variación en los compuestos sintagmáticos es mínima en los centros de interés a pesar del tiempo de diferencia que existe entre una muestra y otra.
Desde el campo de estudio de la disponibilidad léxica, los compuestos sintagmáticos son considerados como una unidad léxica y sirven para incrementar el acervo léxico. Estos presentan la misma carga significativa que una palabra, tienen orden estructural, son frecuentes en la lengua y están aceptados por la comunidad lingüística. Por su parecido a otras estructuras en la lengua (composición, sintagmas libres y fraseológicos, locuciones y colocaciones), los compuestos sintagmáticos pueden ser fácilmente confundidos con las estructuras mencionadas (Val 1999; García 2011; Buenafuentes 2017). Por esta razón, los compuestos sintagmáticos muestran que establecer fronteras entre el léxico, la morfología y la sintaxis no es tarea fácil.
A pesar de la enorme cantidad de estudios de disponibilidad léxica existentes en el ámbito de la investigación internacional y nacional, no hay trabajos que analicen los compuestos sintagmáticos tanto por la cantidad de aparición porcentual como acumulativa, aun cuando presentan una frecuencia alta en los cuestionarios, 30% según López Chávez (1994), como por su estructura [N+A]N, [A+N]N, [N+prep+N]N y [N+N]N (Buenafuentes 2007) en los corpus de disponibilidad léxica. Este será el trabajo pionero que analice los compuestos sintagmáticos desde esta área de estudio.
2. ANTECEDENTES
En los estudios de disponibilidad léxica, se han identificado claramente trabajos de tipo semántico-cognitivos vs. lingüístico-formales (Mateus & Mahecha 2020), de tipo diacrónico (longitudinales) vs. sincrónico (Alba 2013; Hidalgo 2017) o de tipo contrastivo L1vs. L1 o L1 vs. L2 (Santos, Trigo & Romero 2020) enfocados principalmente en dos o varias comunidades de habla para realizar estudios de contraste.
Los trabajos del tipo semántico-cognitivos frente a los lingüísticos formales centran su atención en demostrar la existencia de mecanismos cognitivos y formales que están presentes en el léxico disponible. Los primeros han tratado de explicar cómo es que se activan los vocablos en el lexicón mental y cómo es que aparecen en la realidad lingüística del informante. En contraste, los estudios de corte formal analizan una categoría gramatical específica para contrastarla en relación con un grupo poblacional. La mayoría de los estudios se centra en el análisis del sustantivo como categoría gramatical y su estratificación en los listados de disponibilidad léxica, mientras que los otros se focalizan en las otras categorías gramaticales como verbos y adjetivos, pero se deja de lado la relevancia de otras construcciones de orden sintáctico que también sirven para denominar.
Los trabajos de tipo diacrónico (longitudinales) utilizan el mismo corpus en dos momentos distintos de su desarrollo (Alba 2013; Hidalgo 2017). La temporalidad es la clave del análisis y esta varía de acuerdo con el objetivo establecido en el proyecto. En términos generales, son trabajos cuya productividad es baja en cuanto a que se utiliza el mismo corpus para diferentes tomas de muestra. Los resultados en estos trabajos establecen dos posibles escenarios: la alta o la baja variabilidad léxica exhibida de acuerdo con los centros de interés utilizados en los periodos de contraste (Alba 2013). Con esta información se pueden llegar a conocer los vocablos que están presentes o no en una línea de tiempo, para que sus resultados puedan generar proyecciones léxicas con distintos fines a corto o mediano plazo.
Los estudios de tipo contrastivo entre L1 vs. L1 o L1 vs. L2 (Santos, Trigo & Romero 2020), enfocados principalmente en dos o varias comunidades de habla, son los más abundantes dentro de los trabajos de disponibilidad léxica. Estos toman como punto de inicio la enseñanza de la lengua a partir de la estratificación matemática del léxico, que, en un primer momento, se hacía a partir del análisis por frecuencia léxica y que después se hizo con base en la fórmula matemática de disponibilidad léxica. Los resultados han sido productivos en lo que se refiere a generar micro o macro planeaciones léxicas para mejorar la enseñanza de la lengua materna o segunda lengua. Sobre la disponibilidad léxica mexicana, los trabajos se pueden clasificar en semántico-cognitivos (López Chávez 1994; Guerra, et al. 2004; Frey 2006; Camarena 2010; Fuentes 2014; Reyes & Flores 2018; Pérez 2019; Fregoso & Aguilar 2019) o trabajos del tipo lingüístico-formales (Camarena 2010; Bernal 2011; Santos 2015; Pérez 2015; Oramas & García 2018).
Todos los proyectos de investigación que tienen como eje la disponibilidad léxica sin importar el tipo de proyecto se clasifican en dos líneas claramente establecidas: los trabajos que utilizan el Proyecto Panhispánico de Léxico Disponible o se encuentran vinculados con él, y los que no están vinculados con dicho proyecto. En el primer grupo se encuentran los trabajos chilenos, españoles y argentinos, principalmente, y en el otro grupo se encuentran los trabajos mexicanos. Desde una perspectiva metodológica, la diferencia principal radica en la temporalidad para obtener la muestra y en el grupo poblacional destinado para el estudio.
3. LA DISPONIBILIDAD LÉXICA Y LA COMPOSICIÓN MORFOLÓGICA: LOS COMPUESTOS SINTAGMÁTICOS
3.1 La disponibilidad léxica
El concepto de disponibilidad léxica se refiere al conjunto de palabras que los hablantes conocen y utilizan para comunicarse en un contexto determinado. Para obtener información sobre estas palabras, el investigador utiliza un cuestionario de disponibilidad léxica que se aplica a un grupo de informantes de una misma comunidad o de varias. Este cuestionario está integrado por 16 centros de interés. Inicialmente, estos centros fueron utilizados por los investigadores franceses y, desde entonces, son los que se emplean en la obtención del léxico. Los centros presentan características sociales, culturales y lingüísticas que permean el léxico en su totalidad y que se reflejan en la manera como el informante construye las respuestas, distribuye las palabras y estructuras léxicas, y llena los cuestionarios de disponibilidad léxica (Santos 2017). Tanto el tiempo como la naturaleza temática y gramatical son factores determinantes en la obtención de los datos léxicos individuales o colectivos de los informantes que sirven de base para el análisis del léxico disponible.
El léxico obtenido de estas pruebas forma parte del léxico fundamental, el cual se define como el conjunto de palabras que los miembros de una comunidad determinada conocen y utilizan para comunicarse. Está constituido por un léxico básico y uno disponible. Este último se refiere al conjunto de palabras conocidas pertenecientes o no al léxico fundamental que se activan al escuchar un tema, mientras que el léxico básico es el de uso constante en una comunidad lingüística, conformado por al menos cinco mil vocablos de mayor uso (López Chávez 1994). Entre sus características, destaca el valor atemático de los vocablos en oposición a lo temático del centro de interés.
La disponibilidad léxica presenta varias unidades de análisis, como las ocurrencias, los tipos y los vocablos. Cada aparición de una palabra en un texto será considerada como una ocurrencia, es decir, como las repeticiones que encontramos en un texto o en los cuestionarios de disponibilidad léxica. La noción de tipo se refiere a cada palabra encontrada una vez que se han eliminado sus repeticiones (Lara 2006). El vocablo es la forma representante de un paradigma de palabras y será la unidad del léxico. Pérez (2019) afirma que el vocablo es una unidad de análisis conceptual que tiene una representación en la realidad lingüística, y solo se obtiene cuando se aplica a un corpus cualquiera una fórmula matemática especializada. Sobre esto se expondrá más adelante.
Cuando se aplica la fórmula matemática de disponibilidad léxica al corpus, se obtienen los vocablos ordenados por su estratificación. La aplicación de esta fórmula es la que sirve para observar la disponibilidad del vocablo. La fórmula matemática fue creada para calcular el índice de disponibilidad léxica (IDL), la frecuencia relativa, la frecuencia acumulada, su porcentaje de aparición, el índice de cohesión, el promedio de palabras y la cantidad de palabras diferentes que aparecen en el cuestionario de disponibilidad léxica.
El IDL funciona como una guía que muestra cuáles son las palabras que un grupo de sujetos evoca de manera más rápida para utilizarlas en determinados momentos (Valencia 1997). Más aún, los resultados que se obtienen proporcionan un valor mediante el cual es posible ordenar las palabras según la frecuencia y el orden de aparición -el grado de “inmediatez”- con que los hablantes actualizan dichas palabras (Callealta & Gallego 2016). La frecuencia relativa representa el número de ocasiones en que aparece un término en relación con la totalidad de palabras. La aparición es el porcentaje de informantes que han mencionado la palabra dentro de los cuestionarios de disponibilidad léxica. La frecuencia acumulada será, pues, resultado de la suma de las frecuencias relativas.
El índice de cohesión (IdC) muestra el grado de coincidencia por parte del informante en las respuestas en un rango de 0 a 1. De modo que este índice permite conocer la homogeneidad o no del léxico procesado. El número total de palabras diferentes funciona como otro indicador porcentual y consiste en la cuantificación de los vocablos de los informantes. El promedio de palabras indica el número de vocablos que poseen los informantes en relación con el centro de interés. Este aparece cuando se divide el número de palabras totales entre la cantidad de informantes del corpus.
Los compuestos sintagmáticos se reconocen como vocablos porque presentan todas las características matemáticas de estas unidades lexicológicas y son considerados ítems léxicos que designan, precisamente, una realidad categorial como unidad semántica indisoluble que los informantes generan al estar expuestos a un tiempo de obtención de la muestra.
3.2 La composición morfológica
La composición morfológica es un proceso de formación de palabras que consiste en unir elementos, palabras, para formar una nueva unidad, o bien, son dos unidades con independencia sintáctica, pero con un sentido único y constante que funciona como una sola entidad indivisible y hace referencia al mismo objeto. Ambos casos de formación constituyen una palabra. Según Varela ([2009] 2018), Felíu (2009) y Casado (2018), se clasifican en compuestos grecolatinos propios y en impropios.
Para Casado (2018) son compuestos grecolatinos las formaciones en las que interviene al menos un tema grecolatino. Estos compuestos pueden ser del tipo 1) Tema + tema: hidrología, 2) Tema + palabra: hidromasaje y 3) Palabra + tema: flamencología. Los compuestos propios constituyen una unidad gráfica, pues se escriben como una sola palabra, presentan un solo acento principal y contiene marcas de flexión que se ubican en el extremo final del compuesto. Además, las palabras que lo integran generan un solo significado, evitando la modificación de sus constituyentes y la alteración del orden del núcleo del compuesto. De acuerdo con Varela ([2009] 2018), los constituyentes incluidos en el compuesto son entidades léxicas, no sintagmas. Los compuestos impropios o sintagmáticos son las unidades del lenguaje que se estudian en este trabajo.
Según sea su combinación gramatical, los compuestos pueden ser nominales del tipo: N+N: bocacalle, cineclub, etc., N+i+N (con vocal de enlace): coliflor, carricoche, etc., V+N: limpiabotas, sacaborrachos, etc., V+V: picapica. Este último grupo es de escasa productividad si se compara con el resto de los compuestos. De acuerdo con su frecuencia, los compuestos más productivos son V+N que forman nombres de agente y denotan oficios y ocupaciones o nombres de instrumento. Además, el elemento verbal y su complemento se encuentran en una relación asindética, sin especificar la relación gramatical existente entre ellos (Casado 2018).
Los compuestos adjetivos generan una palabra perteneciente a la misma categoría gramatical. Su característica principal es que el sustantivo determina al adjetivo, ya que este será el núcleo y el sustantivo posee valor de relación (Varela [2009] 2018; Casado 2018). Los compuestos de este tipo presentan los siguientes esquemas de formación: N+A: cariblanco, cejijunto; etc., A+A: sordomudo, etc., A+i+A (con vocal de enlace): rojiblanco, agridulce, etc., Adv+A o participio: bienvenido, malhablado, etc. Los compuestos verbales pueden ser del tipo Adv +V (o adjetivo en función adverbial): malbaratar, malcomer, etc. Este último grupo es el menos productivo en la composición morfológica.
3.3 Los compuestos sintagmáticos y la disponibilidad léxica
Desde el ámbito de la disponibilidad léxica, los compuestos sintagmáticos son unidades léxicas que han sido creadas a partir de la fijación de un sintagma, no presentan unión gráfica, su significado no es diferente del núcleo que aparece en las listas de disponibilidad léxica y, además, son frecuentes. Los compuestos sintagmáticos pueden analizarse desde diferentes criterios: morfológico, sintáctico y semántico, vinculados a la frecuencia de aparición en los corpora.
De acuerdo con Buenafuentes (2007), la composición sintagmática manifiesta una frontera borrosa entre la morfología, el léxico y la sintaxis. Un compuesto sintagmático es un elemento léxico complejo que ha sido creado a partir de la fijación de un sintagma y que, pese a ello, conserva la apariencia oracional y, por tanto, sus miembros no presentan una unión gráfica ni muestran una unidad acentual ni poseen juntura morfemática. Por estas razones, la composición sintagmática es problemática, pero muy productiva en el español.
3.4 Caracterización de los compuestos sintagmáticos
Autores como Lang (1992), Val (1999), Varela ([2009] 2018), Buenafuentes (2007), Felíu (2009), Real Academia Española 2009 y Casado (2018) coinciden en que los compuestos sintagmáticos presentan varias características, cada una de las cuales será desarrollada en esta parte de trabajo.
3.4.1 Criterio morfológico
Este criterio se refiere a la constitución de la estructura formal del compuesto; en este criterio se ubican las siguientes características:
Sobre la estructura de los compuestos existen tres grupos:
Compuestos preposicionales: ojo de buey, mar de fondo, agua de limón, máquina de escribir, etc. Su esquema morfológico es (N+PREP+N)N o (N+PREP+V)N. Según Val (1999), la ausencia de significado composicional es el factor fundamental para que puedan ser reinterpretados sintácticamente como nombres complejos. Entre los compuestos preposicionales existen diferentes tipos de construcciones: el tipo [N+de+N], el cual es el más prototípico, el tipo [N+de+artículo+N] o [N+de+ artículo lo+N], entre otros. Los compuestos preposicionales hacen uso de diferentes tipos de preposiciones: de (agua de horchata), en (leche en polvo), a (olla a presión), por (caridad por amor), sin (huevo sin yema), con (agua con azúcar), sobre (seguro sobre vida), etc. La selección del género y el número de estos compuestos se realiza a través del núcleo: abogado(a)(s) de oficio, licenciado(a) en Antropología, etc. Sobre los rasgos semánticos que aparecen en el núcleo, pueden ser (+/-) humano y (+/-) especificativos, como en agua de limón (-humano, +especificativo) en oposición a ingeniero en cómputo (+humano, + especificativo).
Compuestos de nombre y adjetivo: mala sombra, guerra civil, guerra santa, etc. Su esquema es (N+A) y es la estructura más productiva a diferencia del esquema (A+N). El compuesto de nombre y adjetivo se construye con un nominal que funciona como núcleo y un adjetivo que sirve de determinante o especificador del núcleo. El adjetivo incide en el comportamiento significativo del compuesto (X+x), donde la primera X, mayúscula, es el núcleo y la segunda es el subordinante x. Este tipo de estructura presenta dos posiciones: pospuesta (x+X) y antepuesta (X+x) al adjetivo. En la posición pospuesta [A+N], el primer constituyente se realiza por medio de una base cuantitativa, pobre hombre, que genera una debilidad semántica del adjetivo, lo que propicia que algunos compuestos sintagmáticos se conviertan en compuestos léxicos (Real Academia Española 2009). A diferencia de la estructura [A+N], la función del adjetivo antepuesta [N+A] genera la función clasificadora e intensificadora de lo expresado por el sustantivo, hombre pobre. Desde un aspecto morfológico, el género en [A+N] y [N+A] coincide con el nominal (núcleo) y presenta variabilidad genérica cuando el nominal se refiere a una entidad (+humana): medio hermano, buen amigo, entre otros. Acerca de este tipo de compuestos sintagmáticos, Buenafuentes (2017) menciona que la verdadera diferencia entre los compuestos se encuentra en el análisis semántico, porque los compuestos sintagmáticos con adjetivo antepuesto tienden a contar con el rasgo (+humano). Estos elementos son utilizados para caracterizar a los individuos en cuanto a su comportamiento o aspecto físico, siempre con un matiz valorativo, como en alto mando, gran buitre, etc. Por otro lado, los compuestos sintagmáticos del tipo [N+A] designan una realidad (-humana, +animada): pájaro carpintero, gato siamés, lobo marino; etc.
Compuestos yuxtapuestos: Estos compuestos se forman sin necesidad de un nexo que los una, o construcción asindética. La mayoría de los compuestos sintagmáticos responden al tipo [N+N]. Este tipo de compuesto tiene la apariencia de una aposición y no presenta un significado idiomático (Buenafuentes 2007). En el análisis realizado se han encontrado tres tipos de compuestos: [N+N] subordinativo, [N+N] cualitativo y [N+N] coordinativo. En el primer tipo de compuesto, el segundo elemento N es dependiente del primero, el cual presenta la marca de flexión gramatical: buque escuela/buques escuela, buque cisterna/buques cisterna, etc., por lo que es un subtipo de clasificador. En el compuesto [N+N] cualitativo, el primer nominal aporta carga descriptiva a partir de la adición de sus propiedades, mientras que el segundo N restringe el aspecto material o el comportamiento denotado por el primero, tal como lo explica Val (1999). Sumado a esto, el primer N presenta la marca de flexión: cama nido/ camas nido, ciudad dormitorio/ciudades dormitorio. En el compuesto coordinativo [N+N], este mismo autor afirma que este tipo de compuesto se consolida en la lengua oral con un orden fijo de sus integrantes para una detonación dada: falda pantalón, granja escuela. Sobre el criterio semántico, también presenta criterios (+/-) humano: hierba estrella, pájaro niño, etc.
El orden secuencial del compuesto: Los compuestos sintagmáticos presentan un orden secuencial inalterable en los elementos que lo integran. De tal manera que, si se perturba el orden, también se observa la ruptura del compuesto sintagmático. Obsérvense los siguientes ejemplos:
El morfema flexivo de pluralidad: En los compuestos sintagmáticos la aplicación de la flexión se da en el núcleo, que por lo regular aparecerá en primera posición (X-x)
La no fusión gráfica de sus constituyentes: Los compuestos sintagmáticos no presentan fusión gráfica entre sus elementos como los ortográficos (Val 1999).
La no conmutación de sus constituyentes: Al concebirse como unidades léxicas, los constituyentes de los compuestos sintagmáticos no se puede conmutar.
3.4.2 Criterio sintáctico
Los criterios sintácticos se utilizan para determinar el grado de cohesión semántica y el estatus léxico de una frase. En relación con este aspecto, existe un elemento nuclear y un elemento subordinado que se representa con la fórmula X+x. Cuando el constituyente nuclearse sustituye por otro, el sintagma no adquiere el estatus de compuesto ya que se rompe la cohesión sintáctica y la frecuencia de aparición es menor, lo que genera que el compuesto desaparezca al sustituir su núcleo:
La categoría gramatical del compuesto: El resultado de la combinación de los elementos gramaticales que conforman un compuesto sintagmático siempre es un sustantivo, lo que genera un compuesto sintagmático nominal (CSN).
La cohesión sintáctica interna de la frase: La cohesión sintáctica interna de la frase es otra prueba que puede aplicarse para averiguar el estatus léxico del compuesto. Según este principio de cohesión, no se pueden intercalar modificadores o determinantes a los constituyentes nominales, de hacerlo así el elemento sufriría una ruptura sintáctica y semántica. Este principio establece el carácter composicional de las unidades léxicas, lo que significa que no se pueden adicionar determinantes, modificadores o complementos que afecten el sentido del compuesto:
3.4.3 Criterio semántico
Los compuestos sintagmáticos deben respetar la coherencia en unidad semántica referida a nuevos conceptos u objetos, por ejemplo, mercado negro. La combinación de lexemas añade una nueva dimensión semántica no necesariamente deducible del significado de cada uno de sus componentes. No obstante, estos compuestos lexicalizados son los que presentan menos problemas porque su significado se construye de forma idiosincrática frente al significado de sus componentes.
3.4.4 Frecuencia de uso o aparición
Si los constituyentes que integran el compuesto no suelen aparecer frecuentemente en una misma estructura sintagmática, no pueden adquirir el estatus de compuesto sintagmático. Es decir, mientras más sean usados como tales, más serán reconocidos como unidades léxicas. Aunque semánticamente estén unidos, como ocurre en algunos casos, por ejemplo, libro de novedades, libro de piso, casa mercader, casa perrona, agua insana, restaurante espectáculo, etc., estos elementos no son frecuentes. Para determinar el grado de frecuencia del compuesto, el IDL es un factor decisivo.
4. DIFERENCIA DE LOS COMPUESTOS SINTAGMÁTICOS CON OTRAS ESTRUCTURAS PARECIDAS
La composición sintagmática es una unidad que presenta semejanza con otras unidades de la lengua. Dada su complejidad en los estudios lingüísticos, solo se mencionarán en esta parte las diferencias del compuesto sintagmático con los compuestos libres y fraseológicos, los sintagmas libres y fraseológicos, colocaciones y locuciones de manera breve, sin llegar a ser exhaustivo.1
Alonso (2012) analiza la diferencia entre la composición y el sintagma. El compuesto sintagmático es una unidad que contiene un radical (raíz) de las formas de palabra que constituyen la unidad léxica, y se define como una unidad léxica en sí. Además, un compuesto no es un sintagma, sino una formación de palabra. En este sentido, hay dos tipos de compuestos: los libres y los fraseológicos. Los primeros se forman a partir de la unión de las raíces que lo integran, siguiendo propiedades semánticas, fonéticas y combinatorias. Como ejemplo de esto se encuentra el concepto político-económico. En oposición a este grupo, se reconocen los compuestos fraseológicos: boquiabierto, cejijudo, etc. La diferencia radica en que el primero (político-económico) lo forma el hablante, quien sigue las reglas generales de la lengua, mientras que los compuestos fraseológicos no pueden ser seleccionados libremente (Alonso 2012). Su sentido presenta parecido con la unión del significado de sus constituyentes, por esa razón es considerado compuesto. El primero pertenece a la morfología y el segundo a la lexicología.
Sobre el sintagma, este pertenece al terreno de la sintaxis y se define como un conjunto de formas de palabras vinculadas por relaciones sintácticas. Por tanto, se trata de un concepto sintáctico y no de un concepto fraseológico. Para encontrar la diferencia, la noción de fraseologización (Alonso 2012) es fundamental. El proceso de fraseologización consiste en la adquisición de un significado externo adicional que adquiere un grupo de palabras, el cual no se desprende de sus constituyentes por separado, sino de la totalidad integrada de estos. Como ejemplo de esto se encuentran ojo de buey, conejillo de indias, etc. Son combinaciones que no están libres en cuanto a su significado; si alteramos alguno de sus constituyentes internos dejan de ser fraseologismos.
Del mismo modo que los compuestos, los sintagmas se clasifican en sintagmas libres y sintagmas no libres. Los sintagmas no libres se reconocen como aquellas estructuras en las que la selección de sus constituyentes no puede darse libremente. Son estructuras que están lexicalizadas en la lengua y solo presentan ese significado y no otro. Como ejemplo de esto están correo electrónico, redes sociales, fibra óptica, transferencia electrónica, ancho de banda, etc. Estas estructuras están más cercanas al terreno de la colocación o locución.
La diferencia entre el compuesto sintagmático y el sintagma libre es el criterio semántico. A partir de este criterio, el compuesto sintagmático se reconoce como una unidad semántica no transparente que responde a motivaciones metafóricas, por ejemplo, brazo del río es un camino del río que se opone a la extremidad del cuerpo como sintagma libre, o bien café con leche como unidad de sentido en oposición a café con leche fría como sintagma libre (Pacanigni 2003; Buenafuentes 2007; Varela 2018). Casado (2018) y Varela ([2009] 2018) afirman que el contenido significativo del compuesto sintagmático presenta cohesión semántica y sintáctica, lo que fortalece la unión entre las unidades que lo integran y permite la generación de nuevos compuestos a partir de la extensión semántica del núcleo que afecta directamente al adyacente.
Por otro lado, las colocaciones son combinaciones frecuentes y preferentes de dos o más palabras, cuya particularidad es constituir una categoría intermedia entre las combinaciones llamadas “libres” y las combinaciones “fijas” o fraseológicas de la lengua (Osorio & Serra 2012). Por su parte, Alonso (2012) menciona que en las colocaciones uno de los constituyentes se selecciona en función de su sentido y el otro es seleccionado por el primero. Ejemplos de estos vocablos que sirven de base son civil, hora, guardia, bomba, falda, etc. Alonso (2012) hace una clasificación de las colocaciones como cuasicolocaciones y semicolocaciones. En las primeras, el significado de una cuasilocución incluye el significado de las unidades léxicas constituyentes. Además, tiene un significado añadido, el cual constituye el núcleo semántico. Ejemplos de ello son pasta de dientes fin de semana, cuarto de baño, ciudad jardín, tela de araña, estrella de mar, etc. En cambio, en las semilocuciones, solo se considera el significado de uno de sus constituyentes para la generación de este tipo de estructuras y ese significado, por lo regular, no se encuentra en la posición de núcleo semántico. Ejemplos de semilocuciones son lobo de mar, corredor de la muerte, callejón de la amiba, lobo solitario, etc. En lo que respecta a las locuciones, su significado no contiene la carga de ninguno de sus constituyentes. Ejemplos de ello son media naranja, apretarse el cinturón, colgar los tenis, borrar del mapa, etc., que pertenecen a este tipo de estructuras. Para este trabajo, el compuesto sintagmático es una unidad frecuente que se puede clasificar desde tres criterios: morfológico, sintáctico y semántico, sustentados en la frecuencia del índice de disponibilidad léxica, que pertenece al terreno de la léxico-morfología.
5. METODOLOGÍA
La metodología de este trabajo es de tipo cuantitativo, aplicada a dos diferentes corpus de disponibilidad léxica mexicana. Para el análisis, se localizaron los compuestos sintagmáticos de dos corpus, se contabilizaron y se obtuvieron los cinco compuestos sintagmáticos nominales más disponibles por centro de interés de cada una de las muestras. Finalmente, se clasificaron siguiendo aspectos teóricos de la morfología en compuestos preposicionales (N+PREP+N)N o (N+PREP+V)N, compuestos de nombre y adjetivo (N+A)N y (A+N), y compuestos yuxtapuestos que pueden ser del tipo nominal coordinativo o nominal subordinativo o adjetival. Después, para su reconocimiento, se aplicaron criterios semánticos,2 sintácticos, morfológicos y la frecuencia de uso como medio para identificar el compuesto sintagmático dentro de ambos corpus de disponibilidad léxica. Como ejemplo se presenta el compuesto Licenciado en contabilidad3 estructurado en los criterios antes mencionados; obsérvese la Tabla 1.
COMPUESTO | CRITERIOS | ORGANIZACIÓN |
Licenciado en contabilidad | Criterio morfológico | Compuesto preposicional del tipo (N+PREP+N)N Orden secuencial N+prep+N y no otra cosa
Flexión de número: Licenciados en contabilidad - *licenciado en contabilidades o *licenciados en contabilidades La no fusión gráfica: *licenciados en contabilidades por Licenciados en contabilidad La no conmutación de sus constituyentes *Contabilidad en licenciados por Licenciados en contabilidad |
Criterio sintáctico | Es un compuesto sintagmático
La cohesión sintáctica de la frase: Licenciado en contabilidad - *licenciado en alta contabilidad, *licenciado muy contable *Antropólogo en contabilidad por Licenciado en contabilidad Presenta un núcleo (X+PREP+X) |
|
Criterio semántico | +Animado +Profesión |
|
Frecuencia de uso | Frecuencia alta4 |
Es necesario expresar que en este trabajo no se efectúa el análisis por variable de los compuestos, a pesar de que se realiza el comparativo por el número total de vocablos aparecidos en el corpus. El corpus de 2014, que se ha utilizado para el contraste, no presenta en sus resultados el análisis de los vocablos por variable. Solo aparecen los resultados generales, los cuales se han utilizado para el trabajo.
5.1 Sobre el corpus
El primer corpus que se toma para el análisis corresponde al Análisis de léxico disponible en hablantes escolares de Culiacán, Sinaloa, de secundaria, de Velarde de 2014. Este se obtuvo entre 2007-2008, pero no se publicó sino hasta 2014 como proyecto de tesis de maestría, razón por la cual usamos esta última fecha como referencia de este corpus. Entre las características metodológica destacan 1) se toman como muestra estudiantes de tercer año de secundaria de Culiacán, cuyas edades oscilan entre los 14 y 15 años, 2) participan 48 estudiantes, 24 mujeres y 24 hombres, 3) para la obtención de la muestra se seleccionaron dos escuelas, una pública y otra privada, ambas ubicadas en zonas urbanas de la ciudad de Culiacán, y 4) los informantes pertenecen a la variante del noroeste del país. En lo que respecta al segundo corpus de 2017, utilizado para el contraste, este corresponde al proyecto Léxico disponible de estudiantes de San Luis Potosí de Pérez Durán, que se encuentra en proceso de recolección de la muestra desde 2017 a la fecha.4
La metodología de análisis de este corpus se realiza de la siguiente manera: 1) se analizan las respuestas de los estudiantes de primero a tercer año de secundaria cuyas edades oscilan entre los 11 y los 16 años de edad, 2) el corpus está conformado por 300 informantes divididos en 150 hombres y 150 mujeres, 3) para construir la muestra se encuestaron 10 escuelas secundarias: 5 públicas y 5 privadas, todas localizadas en la zona urbana de la ciudad de San Luis Potosí, y 4) los informantes pertenecen a la variante denominada de transición del habla chihuahuense.
Para el trabajo contrastivo, se recurrió a las mismas características metodológicas utilizadas por Velarde Inzunza (2014), dado que sus investigaciones, al igual que esta, se han centrado en muestras de nivel secundaria. Además de ello, se ha considerado la diferencia temporal de los compuestos sintagmáticos entre un corpus y otro, que es de una década. Para hacer más notoria la diferencia entre variantes se presenta la Figura 1, donde se representan las dos variantes dialectales:
Además de lo anterior, ambos corpus forman parte de los estudios de disponibilidad léxica mexicana. En ellos, se utilizan los 16 centros de interés que se mencionan a continuación: #01# Partes del cuerpo, #02# La ropa: el vestido y el calzado, #03# La casa: el interior y sus partes, #04# Muebles y enseres domésticos, #05# Alimentos y bebidas, #06# Objetos colocados sobre la mesa, #07# La cocina y los utensilios, #08# La escuela, muebles y útiles, #09# Electricidad y aire acondicionado, #10# La ciudad, #11# La naturaleza, #12# Medios de transporte, #13# Trabajo de campo y jardinería, #14# Los animales, #15# Diversión y deportes y #16# Profesiones y oficios. En todos los casos, el tiempo de recolección de la información fue de tres minutos por centro de interés, lo que en suma genera 48 minutos efectivos. Para el procesamiento estadístico, ambas muestras han utilizado la fórmula matemática de disponibilidad léxica de López & Strassburger (2000). Además, geográficamente existe una distancia de 1000 kilómetros entre una muestra y otra.
6. ANÁLISIS DE LOS DATOS
Como ya se explicó en párrafos anteriores, el corpus de estudiantes de secundaria de Culiacán se obtuvo entre 2007-2008 y se presentaron los resultados hasta el 2014. Sobre el total de palabras recolectadas, este corpus generó 23 804 palabras distribuidas en dos variables claramente identificables: sexo y centro educativo. Sobre los resultados de la variable sexo en mujeres, se generaron 12 431 tipos, mientras que en hombres se obtuvieron 11 374 tipos. Referente a los resultados de los centros educativos, los hombres de la escuela privada generaron 6 849 tipos y en escuela pública 4 524, mientras que las mujeres en la escuela privada produjeron 7 369 tipos y en escuela pública, 5 062. En lo que respecta al corpus potosino, este fue aplicado a estudiantes de secundaria, además, la muestra se obtuvo en 2017.
El número total es de 22 893 tipos. Sobre el análisis por variables, los hombres generaron 12 799 tipos y las mujeres 10 094. Para el contraste, los hombres de la escuela privada produjeron 6 230 tipos y en escuela pública 6 569, y las mujeres de centros educativos privados generaron 4 899 tipos y en escuela pública 5 195. Al aplicar la fórmula matemática de disponibilidad léxica, aparecieron 13 779 vocablos distribuidos en 5 428 de Culiacán en comparación con 8 351 de San Luis Potosí. Para el análisis se toman en consideración los vocablos de los corpus. Su distribución se presenta por variable en las siguientes tablas:
CULIACÁN 2007-2008 Número total de vocablos 5 428 |
SAN LUIS POTOSÍ 2017 Número total de vocablos 8 351 |
||
Hombres | Mujeres | Hombres | Mujeres |
3 672 | 3 873 | 5 989 | 6 789 |
CULIACÁN 2007-2008 Número total de vocablos 5 428 |
SAN LUIS POTOSÍ 2017 Número total de vocablos 8 351 |
||
Escuela pública | Escuela privada | Escuela pública | Escuela privada |
2 616 | 4 341 | 3 989 | 5 899 |
Al comparar los resultados de los centros públicos y privados de ambos corpus, se observa que, en el corpus de San Luis Potosí, es más frecuente en 1 373 vocablos (9.9%) en escuela privada y en 1 558 (11.3%) en públicas. Sobre el total de los vocablos de los corpus y su distribución en los corpus encontrados, obsérvese la siguiente tabla comparativa.
CORPUS | NÚMERO TOTAL DE VOCABLOS | NOMINALES | % | COMPUESTOS SINTAGMÁTICOS NOMINALES | % | OTRAS CATEGORÍAS: VERBOS Y ADJETIVOS | % |
Secundaria San Luis Potosí 2017 | 8 351 | 6 767 | 81% | 795 | 13% | 789 | 6% |
Secundaria Culiacán 2007-2008 | 5 428 | 4 142 | 76% | 916 | 16% | 370 | 8% |
Totales | 13 779 | 10 909 | 1 711 | 1 159 |
Al analizar los resultados de los vocablos generales, se reconoce una diferencia de 2 923 vocablos más en la muestra de San Luis Potosí que en la de Culiacán, lo que representa un 21% de incremento. Se esperaría que, por la temporalidad entre los corpus, aparecieran más compuestos sintagmáticos en el corpus 2017. No obstante, hay un decremento de 121 compuestos (7%). Es decir, el total de compuestos sintagmáticos tuvo un fenómeno de constricción, en oposición a los resultados especulados.
Enseguida se presenta la distribución de los compuestos sintagmáticos por centros de interés: #01# Partes del cuerpo, #02# La ropa: el vestido y el calzado, #03# La casa: interior y sus partes, #04# Muebles y enseres domésticos, #05# Alimentos y bebidas, #06# Objetos colocados sobre la mesa, #07# La cocina y los utensilios, #08# La escuela, mueble y útiles, #09# Electricidad y aire acondicionado, #10# La ciudad, #11# La naturaleza, #12# Medios de transporte, #13# Trabajo de campo y jardinería, #14# Los animales, #15# Diversión y deportes y #16# Profesiones y oficios. Para comprender la tabla de información se usaron los siguientes criterios: (P) representa posición, (C.I.) centro de interés, (SC) secundaria en Culiacán y (SSLP) secundaria en San Luis Potosí.
P | C.I. | SC | P | C.I. | SSLP |
01 | #05# | 185 | 01 | #08# | 93 |
02 | #10# | 148 | 02 | #10# | 82 |
03 | #08# | 77 | 03 | #05# | 76 |
04 | #09# | 74 | 04 | #04# | 69 |
05 | #16# | 65 | 05 | #09# | 68 |
06 | #03# | 63 | 06 | #16# | 63 |
07 | #06# | 49 | 07 | #03# | 59 |
08 | #14# | 41 | 08 | #07# | 49 |
09 | #04# | 37 | 09 | #11# | 49 |
10 | #15# | 35 | 10 | #15# | 38 |
11 | #07# | 30 | 11 | #02# | 31 |
12 | #02# | 29 | 12 | #13# | 29 |
13 | #12# | 26 | 13 | #01# | 25 |
14 | #11# | 22 | 14 | #06# | 23 |
15 | #01# | 20 | 15 | #12# | 22 |
16 | #13# | 15 | 16 | #14# | 19 |
916 | 795 |
Al contrastar los centros de interés de las muestras, se observó que la distribución de los compuestos sintagmáticos en los centros de interés #05# Alimentos y bebidas, #08# La escuela, muebles y útiles y #16# Profesiones y oficios, aparecen entre los primeros seis lugares dada su naturaleza productiva. De estos, solamente el centro #05# Alimentos y bebidas apareció en el corpus de Culiacán en primer lugar y en tercer lugar en San Luis Potosí. Todo lo contrario, con el centro #08# La escuela, muebles y útiles que apareció en la muestra de Culiacán en tercer lugar y en San Luis Potosí en el primero. Solo un centro de interés se mantuvo en la segunda posición tanto en el primer corpus como en el segundo.
Si se considera que la primera muestra se obtuvo entre 2007-2008 y la segunda muestra en 2017, la relevancia del léxico disponible del centro #10# La ciudad ha permitido que se mantenga como un centro altamente productivo en la captación de compuestos sintagmáticos. Sobre el número de respuestas, solamente dos centros presentaron más de 100 vocablos: los centros #05# Alimentos y bebidas y #10# La ciudad, que pertenecen al corpus de Culiacán. De igual forma, sobre el resto de los centros y sus respuestas, quitando estos dos centros, la muestra es constante en el número de compuestos sintagmáticos aparecidos a lo largo de las tablas comparativas.
Los centros de interés que aparecieron en las últimas posiciones son #13# Trabajo de campo y jardinería, #01# Partes del cuerpo, #11# La naturaleza, #12# Medios de transporte y #02# La ropa: el vestido y el calzado en el corpus de Culiacán y el centro #14# Los animales, #12# Medios de transporte, #06# Objetos colocados sobre la mesa, #01# Partes del cuerpo y #13# Trabajo de campo y jardinería en el corpus de San Luis Potosí. Los resultados que presentan estos centros en cuanto a su posición se deben a dos factores. Por un lado, son centros que tradicionalmente acumulan un menor número de vocablos en este tipo de estudios. Por otro, sus respuestas tienden a ser vocablos simples como escoba, mano, tren, más que vocablos compuestos como tren bala, intestino grueso, etc.
Sin embargo, como lo establece Sánchez-Saus (2011), los centros de interés no son estructuras léxicas basadas en oposiciones paradigmáticas entre los significados de sus miembros, sino que se fundamentan en relaciones de tipo asociativo y, como tales, se vinculan muy estrechamente a la realidad y a la experiencia de los informantes. Esto ayuda a comprender la razón por la que centros de interés como La naturaleza y Trabajo de campo y jardinería se ubican en las últimas posiciones. Sobre esto, de manera puntual solo se dirá que estos dos centros recuperan vocablos verbales más que nominales, incluyendo los compuestos sintagmáticos. Las razones y el análisis de porqué suceden estos fenómenos en estos centros de interés quedan para futuras investigaciones.
Al contrastar los datos, los centros #13# Trabajo de campo y jardinería, #12# Los medios de transporte y #01# Partes del cuerpo aparecieron en los dos corpus solamente en posiciones distintas. El centro #13# apareció en último lugar en la muestra de Culiacán y en el puesto 12 en la muestra potosina, el centro #12# apareció en el lugar 13 en Culiacán y en la posición 15 en el corpus de San Luis. Se aprecia lo mismo con el centro #01# Partes del cuerpo, que apareció en el lugar 15 en Culiacán y en el 13 en San Luis. Estos tres centros son los que aparecen en las últimas posiciones dentro de la generación de compuestos sintagmáticos. Si se compara el número de compuestos aparecidos en el centro #13# Trabajo de campo y jardinería de la muestra de Culiacán, que es de 15 apariciones, con el centro #14# Animales, que obtuvo 19, su diferencia es de 4 compuestos más para los estudiantes de San Luis después de 10 años. En lo que se refiere a su clasificación se presenta la siguiente tabla:
CORPUS | TOTALES COMPUESTOS SINTAGMÁTICOS |
(San Luis Potosí, 2017) | 795 (46%) |
(Culiacán, 2007-2008) | 916 (53%) |
Totales | 1 711 |
CORPUS | N + p + N | N+N | N+A |
(San Luis Potosí, 2017) | 389 (22.5%) | 119 (6.9%) | 287 (16.7%) |
(Culiacán, 2007-2008) | 506 (29.5%) | 53 (3%) | 357 (20.8%) |
Totales | 895 | 172 | 644 |
Como se aprecia, los compuestos sintagmáticos del tipo (N + p + N)N: vestido de novia, cuello de tortuga, cuarto de televisión, frasco de pimienta, etc., y los compuestos del tipo (N+A)N: columna vertebral, extremidad superior, intestino delgado, etc., son los más productivos en ambos corpus. En lo referente al compuesto del tipo (N+N)N, este presenta el menor número de apariciones en el análisis.
Si se considera la temporalidad de obtención entre un corpus y otro, se puede observar una diferencia en la totalidad de elementos obtenidos: 121 compuestos más para la muestra de Culiacán. Esto representa 7% de diferencia entre un corpus y otro. Sobre la diferencia entre los corpus por la estructura (N + p + N)N, el corpus de Culiacán presentó mayor número de compuestos de este tipo que el de San Luis Potosí, lo que representa una disminución de 117 compuestos. Esto refleja una contracción de 7% sobre la totalidad. Sobre el análisis de los compuestos del tipo (N+A)N, también existe un decremento de 70 compuestos en la muestra de San Luis. Si se comparan los corpus por su temporalidad, la contracción es de 4%, un porcentaje bajo para 10 años de diferencia.
En contraste con lo anterior, el compuesto sintagmático (N+N)N aumentó 66 compuestos en la muestra de San Luis, lo que representa 3.8% de incremento sobre la totalidad de la muestra. Como dato general, el centro de interés #01# Partes del cuerpo, presenta menor número de compuestos sintagmáticos del tipo [N+p+N]N y [N+A]N en los corpus analizados. De igual forma, los centros #03# La casa: el interior y sus partes y #13# Trabajo de campo y jardinería, acumulan pocos compuestos sintagmáticos del tipo [N+N]N.
En lo que se refiere a los compuestos sintagmáticos del tipo [N+A]N, el primer constituyente es considerado el núcleo y el segundo el determinante, tal como se ha mencionado en párrafos anteriores. La posición del adjetivo (A) contiene una función clasificadora e intensificadora de lo que expresa el sustantivo, por ejemplo, en biólogo marino, marino aporta el sentido clasificador y, de cierta forma, especificativo del núcleo, lo mismo sucede con oso polar u oso blanco. Así, estos compuestos designan una realidad (+/-humana, +/-animada) que fortalece la cohesión semántica de estas estructuras. Como ejemplo de esto, se presenta la distribución de este tipo de compuestos en los centros de interés #01# Partes del cuerpo y #09# Electricidad y aire acondicionado.5
C.I. | [N+A]N | C.I. | [N+A]N |
#01# | Aparato reproductor Columna vertebral Intestino Delgado Intestino grueso Vello púbico | #09# | Aire acondicionado Corriente eléctrica Equilibrio térmico Juegos eléctricos Estufa eléctrica |
En lo que respecta a los compuestos [N+p+N]N, estos se reconocen como los más prototípicos que aparecen en las dos listas de disponibilidad léxica. Para su comprensión, la ausencia de significado composicional es el factor fundamental para que pueda ser reinterpretada sintácticamente como nombre complejo (Val 1999). El núcleo presenta características semánticas propias del compuesto, entre las que destacan +/-humano, que aparece en el núcleo y +/- especificativo, que aparece en el determinante. Además de lo anterior, los compuestos sintagmáticos presentan unicidad semántica y referencial que propician el funcionamiento como unidades simples y presentan frecuencia alta en los listados de disponibilidad léxica (Sánchez-Saus 2011). Como ejemplo de esto, se presenta la distribución de este tipo de compuestos en los centros de interés #13# Trabajo de campo y jardinería y #14# Los animales.6
C.I. | [N+p+N]N | C.I. | [N+p+N]N |
#13# | Granja de camarón Cría de ganado Probador de material Sistema de riego Crianza de animal | #14# | Caballito de mar Dragón de Komodo Tigre de bengala Conejillo de indias Rata de campo |
En relación con el compuesto sintagmático del tipo [N+N]N, su aparición en los corpus de disponibilidad es menor en comparación con los otros dos. Este está constituido por dos nominales que en apariencia forman una aposición y no presentan un significado idiomático. Entre sus características, el primer nominal es considerado el núcleo y el segundo restringe el aspecto material o el comportamiento denotado por el primero. El segundo nominal, que sirve de especificativo, brinda información adicional del sustantivo que funge como núcleo. Se representa así (X+x). Entre sus características semánticas, los dos nominales son congruentes semánticamente, ya que pertenecen a un mismo dominio conceptual, mostrando así un fuerte grado de cohesión semántica en el compuesto. Como ejemplo de esto, se presenta la distribución de este tipo de compuestos en los centros de interés #06# Objetos colocados sobre la mesa y #12# Medios de transporte.7
C.I. | [N+N]N | C.I. | [N+N]N |
#06# | Salsa guacamaya Jugo Maggy Paleta payaso Cuchara moca Plato plano | #12# | Jet esquí Jet avión Avión jumbo Tren bala Barco pirata |
Sobre el análisis por temporalidad y posición al interior de los centros de interés, se presenta la distribución de los cinco compuestos más disponibles: los centros #03# La casa: el interior y sus partes y #05# Alimentos y comidas. Tal como se ha hecho en los anteriores análisis, solo se ejemplifican dos centros. Para interpretar correctamente la información, se utiliza (P) para posición de aparición en el corpus, (V) para vocablo y (C) para compuesto, solo se presentarán dos centros para evidenciar lo que se menciona.8
CULIACÁN (2007-2008) |
SAN LUIS POTOSÍ (2017) |
||||||
Centro #3#. La casa: el interior y sus partes | |||||||
V Cuarto | P | C | p | V Cuarto | P | C | P |
07 | Cuarto de lavado | 32 | 01 | Cuarto de lavado | 23 | ||
07 | Cuarto de juegos | 42 | 01 | Cuarto de televisión | 26 | ||
07 | Cuarto de estudio | 48 | 01 | Cuarto de baño | 27 | ||
Sala | 05 | Sala de televisión | 57 | Sala | 03 | Sala de juegos | 34 |
Planta | 65 | Planta baja | 78 | 03 | Sala de televisión | 39 | |
Centro #5#. Alimentos y bebidas | |||||||
Jugo | 26 | Jugo de naranja | 99 | Enchilada | 29 | Enchilada potosina | 38 |
Frijol | 08 | Frijoles puercos | 102 | Agua | 01 | Agua fresca | 42 |
Carne | 10 | Carne asada | 103 | Agua | 01 | Agua de sabor | 45 |
Chile | 33 | Chile relleno | 105 | Chile | 33 | Chile relleno | 78 |
Huevo | 11 | Huevo ranchero | 113 | Carne | 18 | Carne asada | 82 |
Tal como se ha indicado, se presentan los resultados de acuerdo con la posición, el vocablo y el compuesto de los dos corpus. Cuarto, sala, planta, jugo, frijol, carne, chile, huevo, enchilada y agua son los vocablos que sirven de base para la creación de los compuestos sintagmáticos en estos dos centros. De estos, el corpus de Culiacán fue el más productivo con ocho vocablos mientras que el de San Luis solo obtuvo seis vocablos, ya que agua y cuarto se repitieron. Sobre el resto de los centros, en el anexo tres se puede consultar la distribución. Solo se menciona que el número total de vocablos es de 97 distribuidos en 62 para Culiacán y 59 para San Luis Potosí. Sobre los compuestos sintagmáticos, el número total de vocablos que constituyen el núcleo es de 87 y su distribución es de 62 para la muestra de Culiacán y 58 para la de San Luis. Si se contrasta el número de vocablos por temporalidad, hay una diferencia de 15 elementos que se han mantenido constantes a lo largo de 10 años, entre los que destacan agua, aire, camisa, carne, cuarto, cosecha, horno, ingeniero, intestino, licenciado, oso, pantalón, plato, sala y zapato.
7. REFLEXIONES FINALES
En este trabajo se han analizado los compuestos sintagmáticos pertenecientes a dos corpus de disponibilidad léxica mexicana, uno de Culiacán y otro de San Luis Potosí, de estudiantes de secundaria pública y privada de contextos urbanos. El foco de análisis se concentró en observar el comportamiento de aparición de los compuestos sintagmáticos al considerarlos como vocablos que forman parte de las respuestas de disponibilidad léxica. Debido a la naturaleza metodológica para su obtención y al comportamiento de aparición, estos compuestos se ubican como pertenecientes a la categoría gramatical de los nominales, con lo cual esta resulta la categoría que más aparece en los cuestionarios de disponibilidad léxica. Esta categoría constituye el 91.6% de la totalidad de los corpus analizados, el resto corresponde a otras categorías gramaticales: verbos y adjetivos. Sobre los compuestos sintagmáticos hace falta más investigación para explicar la razón por la que aparecen muy pocos compuestos sintagmáticos en los corpus de disponibilidad léxica. En ese sentido, solo se puede mencionar que el vocablo es una unidad léxica abarcadora de todos los referentes y es altamente productiva en el español, lo que imposibilita, por así decirlo, la elección del informante de utilizar un compuesto sintagmático. Además, por su estructura morfológica y por el tiempo que se requiere para el llenado de los cuestionarios de disponibilidad léxica, los informantes tienden a producir la mayor cantidad de vocablos que de compuestos sintagmáticos porque requerirán de mayor tiempo y de mayor número de combinaciones. Esto hace pensar en la posibilidad de incrementar el tiempo de obtención de datos entre un centro de interés y otro, a fin de permitir que el donante pueda proporcionar sus producciones sintagmáticas. Esto queda pendiente para futuras investigaciones.
Otro punto importante que se debe considerar en cuanto a la captación y posible aparición de compuestos sintagmáticos es la construcción cognitiva de los centros de interés. Muchos de ellos son centros que no permiten variación léxica y eso hace que la aparición de los compuestos se repita, como en el caso del centro de interés Partes del cuerpo, en otros. La variación en cuanto a la aparición de estas estructuras es baja, ya que más del 95% de los compuestos encontrados se repiten en los centros de interés y el resto son variaciones producto de los avances tecnológicos (Diversión y deportes, por ejemplo, o producto de nuevas áreas de estudio (como en Profesiones y oficios). Además de lo anterior, es relevante añadir que las respuestas que aparecen en los centros de interés tienden a marcar objetos concretos que son familiares al entorno de los informantes. Es muy común que, en los cuestionarios de disponibilidad, los vocablos más conocidos aparezcan en las primeras posiciones del cuestionario hasta llegar a los compuestos sintagmáticos.
Esto se debe a que la variación léxica no se obtiene ni se describe descontextualizada de un mecanismo de activación, sea éste el centro de interés o el discurso en general, tal como lo ha establecido Tarone (1997); el contexto social y las necesidades de interacción son factores que provocan que un hablante recupere una forma en lugar de otra, teniendo en cuenta que la variación social conduce a la variación de la atención y ésta, a la variación en los usos del hablante.
Sobre los resultados que arrojó este estudio en la parte cuantitativa, los compuestos del tipo[N+A]N, [N+p+N]N son los más productivos, y los del tipo [N+N]N son los menos productivos, estos resultados coinciden con los de Buenafuentes (2007), lo que responde la premisa inicial sobre la variación que pudiesen presentar los compuestos sintagmáticos en relación con los centros de interés y con la temporalidad. Como se ha demostrado, la variación es mínima en relación con los totales y su estructura. La muestra de San Luis Potosí presentó una disminución en los compuestos: (N + p + N) y (N+A) y un aumento en (N+N). La disminución de la muestra obedece a que los informantes tienden a utilizar más el vocablo que el compuesto para el llenado de las listas de disponibilidad, lo que se evidencia en su disminución. Por el otro lado, los informantes usan más la estructura (N+N) en centros que presentan rasgos semánticos +humanos, + específicos como en los centros profesiones y oficios y animales. Esto hace pensar en la posibilidad de incrementar el tiempo de obtención de datos entre un centro de interés y otro, a fin de permitir que el donante pueda proporcionar sus producciones de compuestos de forma menos condicionante. El desarrollo de la investigación y la reflexión de método queda pendiente para futuras investigaciones.