Introducción
En México el ganado bovino representa la cadena de producción pecuaria más grande, su cadena es compleja debido a que su ciclo de producción se extiende por más de un año e interactúa con el mercado nacional e internacional de carne, leche y granos (SAGARPA, 2009).
Entre 2007 y 2016 la producción nacional de carne de bovino ha presentado un continuo crecimiento, una tasa media anual de 1.6%, para ubicarse en 1.88 millones de toneladas de carne en canal. El consumo per cápita de carne de bovino en los mismos años pasó de 18.0 a 14.8 kilogramos por persona por año (FIRA, 2017). Es la principal fuente de proteína animal para la población, además de huevo, pollo y cerdo.
Dada la importancia del mercado de carne de bovino, es necesario plantear metodologías con el fin de identificar las variables que influyen sobre este y cuantificar su efecto en variables determinantes de la oferta, demanda y variables relacionadas.
Uno de los análisis usados por los encargados de formular las políticas públicas referentes al sector agropecuario en México es el escenario base, el cual tiene como propósito ser una herramienta técnica para la planeación y la toma de decisiones en el sector, además de capturar la interrelación que existe entre los diferentes subsectores agropecuarios nacionales e internacionales, la política pública y la economía en general. Se apoya por técnicas econométricas, para generar las proyecciones macroeconómicas del sector para el largo plazo e intenta evaluar y cuantificar los impactos de la política pública y cambios coyunturales en el sector, con el fin de poder tener una referencia de los impactos de la política pública en el largo plazo, el periodo de proyección que comprende 10 años. Dicho análisis presenta las proyecciones de las variables más importantes en el sector que determinan la oferta, la demanda, el comercio internacional y los precios de los productos incorporados en el modelo.
El escenario base al igual que análisis similares podrían tener limitaciones propias del método econométrico usado; en este sentido, cabe resaltar la importancia del uso de herramientas de análisis que permitan identificar las variables con mayor influencia en el mercado con una mayor precisión.
Uno de las herramientas ampliamente usadas para hacer análisis econométricos es el método de MC2E, que consiste en un procedimiento para la estimación de los parámetros de los sistemas de ecuaciones simultáneas. Este método utiliza el conjunto de variables exógenas existentes en el sistema como instrumentos para la estimación, sin embargo, puede contener variables que están débilmente correlacionadas con las variables endógenas. Cuando existe una baja correlación entre la variable endógena y la variable instrumental se dice que se tienen “instrumentos débiles”. Stock y Watson (2011) definen un instrumento débil como aquella variable que explica poco de la variación de la variable endógena.
El objetivo principal en este trabajo fue usar regresión LASSO (Least Absolute Shrinkage and Selection Operator) (Tibshirani, 1996) como método de selección de instrumentos en la estimación de mínimos cuadrados en dos etapas (mc2E).
LASSO es un método de regresión restringida que además de estimar los parámetros de un modelo, selecciona las variables que más influyen en la variable respuesta, estableciendo algunos coeficientes en cero. Mediante este procedimiento se busca un conjunto de instrumentos “fuerte”, que proporcione la mayor cantidad de información sobre las variables endógenas en la primera etapa de la estimación.
Este es un estudio económico con una aplicación econométrica, donde se aplicó dicho método a datos reales en la estimación en el sistema de ecuaciones simultáneas propuesto para el mercado de carne de bovino en México en el periodo 1972-2011 (Cruz, 2013). Posteriormente los resultados obtenidos son comparados con la estimación mediante MC2E.
En el trabajo se muestra una revisión de literatura y posteriormente se presenta la metodología, donde se describe el modelo de sistema de ecuaciones simultáneas, los Instrumentos Válidos y los métodos de selección de estos instrumentos, incluyendo LASSO.
Posteriormente, se analiza el sistema de ecuaciones simultáneas para el mercado de carne de bovino en México. Se utilizó principalmente estimación de mínimos cuadrados en dos etapas y la estimación utilizando LASSO en la selección de Instrumentos y finaliza con la discusión de los instrumentos seleccionados.
Como hallazgos principales se tienen la selección de variables “relevantes” dada la evidencia de mayor correlación de las variables endógenas con los instrumentos seleccionados mediante regresión LASSO, obteniendo instrumentos más fuertes.
En la comparación de las estimaciones de MC2E y las estimaciones obtenidas haciendo uso de LASSO se encontró que los coeficientes estimados son menores y presentan mayor correlación con las variables endógenas. Adicionalmente se muestra que los errores estándar de las estimaciones usando LASSO disminuyen moderadamente en comparación con el uso de M2E de forma tradicional, por estas razones se recomienda el uso de la estimación LASSO en la interpretación de los parámetros estimados.
Revisión de literatura
Modelo de sistema de ecuaciones simultáneas
Las ecuaciones que integran los sistemas de ecuaciones simultáneas se conocen como ecuaciones estructurales y muestran la estructura de un modelo económico, una economía o el comportamiento de un agente económico.
Los coeficientes βi y πi que deben estimarse se denominan parámetros o coeficientes estructurales.
Donde Y y X1 son variables endógenas, X2 y Z son variables exógenas y Z es un instrumento.
Cuando se tienen variables endógenas en un modelo de regresión existe una probable correlación entre estas variables y el término de error de la ecuación en la cual aparecen como explicativas, lo cual viola uno de los supuestos de método de Mínimos Cuadrados, provocando estimadores sesgados e inconsistentes.
El método de mínimos cuadrados en dos etapas (MC2E) es usado para dar solución a los sistemas de ecuaciones simultáneas proporcionando estimadores sesgados pero consistentes. Esencialmente MC2E consiste en sustituir las variables endógenas por variables “representantes” (con valores cercanos), que sirven como instrumentos en la estimación de la primera etapa, esto proporciona una solución al problema típico en los sistemas de ecuaciones debido a la endogeneidad: la correlación entre la variable explicativa y el término de error estocástico.
Instrumentos válidos
Para que las variables sean consideradas instrumentos válidos, es necesario que se cumplan las siguientes condiciones:
Z no está correlacionada con el término de error: Cov(Z, ui) = 0
Z está correlacionada con la variable endógena: Cov(Z, X1) ≠ 0
La primera condición se denomina de “exógeneidad”, e implica que el instrumento seleccionado no esté correlacionado con el término de error de la ecuación en donde la variable endógena aparece como explicativa.
La segunda condición se denomina “relevancia del instrumento”; se requiere que la correlación entre X1 y Z sea diferente de cero. Dado que π1=Cov(z,x)Var(Z), la condición se cumple si y solo si π1 ≠ 0.
Un ejemplo práctico de la importancia de estas condiciones en la construcción de instrumentos puede verse en Frankel y Romer (1999), donde se analiza el impacto del comercio internacional en los estándares de vida.
En MC2E se establece la ecuación poniendo la variable endógena en función de las variables exógenas que sirven como instrumentos. En este caso es necesario verificar que dicho conjunto cumpla con la condición de correlación entre instrumentos y variable endógena diferente de cero.
Shea (1997) menciona que el uso instrumentos débiles aumenta la inconsistencia del estimador resultante aun si los instrumentos no son perfectamente exógenos [Cov(Z, u) = 0] . Cuando los instrumentos son perfectamente exógenos, la baja correlación con la variable endógena aumenta los errores estándar asintóticos y por lo tanto reduce la potencia de las pruebas de hipótesis. Poca correlación puede causar que la distribución del estimador difiera considerablemente de la distribución normal asintótica.
Se han propuesto algunas pruebas para detectar instrumentos débiles como la R2 parcial (Shea, 1997), el estadístico F de la primera etapa (Staiger & Stock, 1997; Stock, Wright & Yogo, 2002), y el estadístico F de la primera etapa basado en el sesgo relativo de MC2E, dependiendo del número de instrumentos y variables endógenas (Stock & Yogo, 2001). Miguel, Satyanath & Sergenti (2004) es un ejemplo de la utilización de este criterio en la verificación de la debilidad de los instrumentos en un estudio que analiza el impacto de las condiciones económicas en la posibilidad de conflictos civiles.
Métodos de selección de instrumentos
Staiger y Stock (1997) señalan que cuando se tienen instrumentos “débiles” los resultados asintóticos convencionales fallan incluso si el tamaño de muestra es grande, los estimadores de MC2E (ˆβMC2Ei) son inconsistentes pueden ser gravemente sesgados y pueden producir intervalos de confianza con cobertura distorsionada. Además, se tiene un incremento en la varianza del estimador y su estadístico t no está bien aproximado por una distribución normal.
Stock y Watson (2011) recomiendan que si se tienen muchos instrumentos, algunos estarán más correlacionados con la variable endógena; por lo tanto, una alternativa es seleccionar variables con el fin de encontrar el conjunto de instrumentos que más se correlacione con la variable endógena y eliminar los débiles.
Se han propuesto metodologías de selección, como el uso de regresión LASSO (Belloni, Chernozhukov & Hansen, 2011; Belloni, Chen, Chernozhukov & Hansen, 2012), uso de estimadores encogidos (Okui, 2010), componentes principales, selección mediante el método boosting (Bai & Ng, 2009), y minimización del MSE asintótico (Donald & Newey, 2001).
Okui (2010) subraya que la existencia de muchos instrumentos puede ocasionar que el estimador de variables instrumentales tenga propiedades pobres, por lo que plantea la selección de instrumentos con el uso estimadores encogidos en MC2E y LIML para la reducción de un subconjunto de variables instrumentales, sin dejar de lado que el uso de un pequeño número de instrumentos, provoca pérdida de eficiencia, lo que resulta en errores estándar relativamente grandes.
El procedimiento en los métodos de encogimiento consiste en dos etapas; la contracción de algunos de los coeficientes de MCO en la regresión de las variables endógenas con los instrumentos, y a continuación, la utilización de los valores predichos de las variables endógenas (basados en las estimaciones de los coeficientes encogidos) como instrumentos.
Concluye que los métodos de encogimiento para selección pueden mejorar los estimadores de variables instrumentales y son recomendables cuando la fortaleza de los instrumentos es clara.
Bai y Ng (2009) consideran dos formas de reducir el número de instrumentos seleccionados; en primer lugar, proponen el uso de componentes principales de los instrumentos observados y en segundo lugar hacer una selección mediante el método de boosting. Concluyen que los principales componentes son a menudo mejores instrumentos que los datos observados, exceptuando cuando el número de instrumentos es pequeño.
Bai y Ng (2009) mencionan la idea de utilizar LASSO como método de selección de instrumentos; sin embargo, centraron su análisis en el método de boosting. Mostraron a través de ejemplos de simulación que la selección de instrumentos a través de boosting funciona bien en los ejemplos que consideran.
Donald y Newey (2001) consideran un procedimiento de selección de variables que minimiza el MSE asintótico; sin embargo, se basa en un orden de la fortaleza de los instrumentos por lo que se requiere un conocimiento a priori sobre la fortaleza de estos.
Tal criterio es usado en los métodos de mínimos cuadrados (MC2E), máxima verosimilitud con información limitada (LIML) y el estimador Jacknife IV (JIVE).
LASSO como método de selección de instrumentos
En Belloni, Chernozhukov y Hansen (2011) se analizan modelos econométricos en los que se tienen muchos regresores disponibles, no obstante la función de regresión está bien aproximada por un conjunto reducido de regresores aún con identidad desconocida. Se discuten algunos métodos para identificar este conjunto de variables explicativas y la estimación de sus coeficientes utilizando regresión restringida con norma de penalización5 ℓ1.
Belloni, Chen, Chernozhukov y Hansen (2012) proponen el uso de regresión LASSO para seleccionar instrumentos y estimar los coeficientes de regresión en la primera etapa. De la misma forma se propone el uso del método post-LASSO que consiste en utilizar el conjunto de datos de los instrumentos seleccionados por LASSO y reajustar el modelo de regresión en la primera etapa, estimando los coeficientes mediante MCO, con el fin de mitigar el sesgo de la contracción de LASSO. De esta manera si se seleccionan exactamente los instrumentos “relevantes”, el estimador post-LASSO resultante es simplemente el estimador MCO estándar utilizando únicamente las variables pertinentes.
Belloni, Chernozhukov y Hansen, (2011) y Belloni, Chen, Chernozhukov y Hansen (2012) demuestran mediante simulación y en ejemplos con datos reales que los métodos basados en LASSO producen predicciones de la primera etapa que proporcionan buenas aproximaciones a los instrumentos óptimos incluso cuando el número de instrumentos disponibles es mucho más grande que el tamaño de la muestra. Concluyen que en la práctica estos métodos permiten obtener mayor eficiencia en el uso de losinstrumentos óptimos mientras amortiguan los problemas asociados con muchos instrumentos.
Regresión LASSO
El método de estimación en modelos lineales LASSO fue propuesto por Tibshirani (1996). Consiste en la estimación por mínimos cuadrados ordinarios, restringiendo la suma absoluta de los coeficientes de regresión.
Sean x1, x2, ... xm vectores de tamaño nxm que representan el conjunto de covariables, y sea el vector de la variable respuesta de dimensión nx1.
Sin pérdida de generalidad las variables han sido estandarizadas para tener media cero y varianza 1 y la variable respuesta tiene media cero.
Sea el vector de coeficientes de regresión,
dado el vector de predicción
y la suma de los residuos al cuadrado
además, sea la norma absoluta de ˆβ,
LASSO selecciona ˆβ que minimiza S(ˆβ) sujeto a T(ˆβ)≤t.
Donde t ≥ 0 es un parámetro de ajuste que controla el nivel de restricción o encogimiento aplicado a la estimación.
El problema se resuelve mediante programación cuadrática usando multiplicadores de lagrange, y queda planteado de la siguiente manera:
donde λ ≥ 0 tiene una correspondencia uno a uno con el parámetro t.
Lockhar, Taylor, Tibshirani y Tibshirani (2014) destacan las siguientes propiedades de LASSO:
“La solución LASSO, ˆβ(λ) es una función del parámetro λ ∈ (0,∞]”.
“La trayectoria ˆβ(λ) es una función lineal continua por tramos en λ (denominados nudos o pasos), con cambios en la pendiente en valores de λ1 ≥ λ2 ≥ ⋯ ≥ λr ≥ 0 que dependen de Y y X”.
“En λ=∞[ˆβ(∞)] todas las variables tienen coeficientes cero y a medida que disminuye λ, cada nudo λk marca la entrada o la eliminación de alguna variable del conjunto activo actual y su coeficiente es distinto de cero o cero, respectivamente. Por lo tanto, el conjunto activo, y los signos de los coeficientes permanecen constantes entre pasos”.
“Sí en algún paso λk, el conjunto activo es A=supp( ˆβ(λk)) y los signos de los coeficientes activos son SA=sign( ˆβA(λk)), entonces el conjunto activo y signos no puede ser otra vez A y SA en algún otro paso λℓ ≠ λk, lo que significa que una vez que una variable entra en el conjunto activo, no puede salir de inmediato del conjunto activo en el siguiente paso”.
Una de las ventajas de la regresión LASSO es que simultáneamente obtiene la estimación de los parámetros y la selección de variables. En la trayectoria de la estimación LASSO los coeficientes de regresión son encogidos hasta que algunos son eliminados y solo un conjunto de ellos son diferentes de cero, de modo que los coeficientes que quedan en el modelo están restringidos, y se supone que son los predictores que más influyen en la variable respuesta. De esta forma se permite eliminar e incluir en el modelo solo las variables más importantes, además de eliminar variables redundantes en presencia de multicolinealidad.
La solución LASSO puede obtenerse utilizando el algoritmo LARS, Efron, Johnstone y Tibshirani (2004) que ha sido descrito como una versión del método tradicional de selección de variables forward. Este algoritmo calcula todas las posibles estimaciones LASSO para un problema dado, actualizando las estimaciones de los coeficientes hasta obtener el ajuste por mínimos cuadrados.
Elección del parámetro de penalización. El parámetro de penalización o de regularización es considerado una medida de complejidad del modelo, y es frecuentemente seleccionado mediante validación cruzada (Hastie, Tibshirani & Friedman, 2008).
El conjunto de datos se divide en k partes, con k - 1 partes se estiman los parámetros del modelo, se predice la parte que no fue usada en la estimación y se estima el error de predicción, el proceso se repite en cada una de las k partes.
En nuestro caso se utilizó k = n también conocida como validación “dejando uno fuera” por lo que la parte removida es la observación i donde i = 1, ..., n y se tienen kj partes con j = 1, ..., n.
Se obtiene CV definido como el error de predicción de la validación cruzada y se calcula por:
Donde ˆYi(j)=xiˆβi es el valor predicho de la observación i cuando la parte j a la que pertenece i no fue usada en la estimación.
La función CV proporciona una curva del promedio del error de predicción estimado al cuadrado y el parámetro t que lo minimiza.
Este procedimiento se realizó mediante el algoritmo LARS (Efron, Johnstone y Tibshirani, 2004) del paquete LARS (Hastie, Tibshirani & Friedman, 2013) implementado en el software R (versión 3.1.0).
Metodología
Sistema de ecuaciones simultáneas para el mercado de carne de bovino en México
La carne de bovino es uno de los productos alimenticios más importantes, principalmente por su aporte de proteína, además de la generación de empleos y materia prima (Callejas, Aranda, Rebollar & De la Fuente, 2014). Para el año 2011, Cruz y García (2014) menciona que la carne de bovino es la mayor cantidad producida en México, después de la de ave. Para 2015, la producción de carne de ganado bovino en México fue de 1.9 millones de toneladas, ocupando con esta producción la sexta posición mundial (Puebla, Rebollar, Gómez, Hernández & Guzmán, 2018). Respecto del consumo FIRA (2017) menciona que el consumo per cápita de carne de bovino en México en 2007 se estimó en 18 kilogramos por persona por año y se ha reducido en los últimos años con un promedio de 14.8 kilogramos para el año 2016.
Ante la importancia de este producto, se analizó el sistema de ecuaciones simultáneas para el mercado de carne de bovino en México propuesto en Cruz (2013) para el periodo 1972-2011.
Dicho sistema está compuesto por nueve ecuaciones: una ecuación de oferta, una ecuación de demanda, seis ecuaciones de transmisiones de precios y una identidad o cierre del sistema.
donde las variables se clasifican en:
Variables endógenas:
OCB: Oferta de carne de bovino en canal en el periodo (t).
PPCBCR1: Precio real al productor de carne de bovino en canal rezagado un periodo ($/t).
PMCBCR1: Precio real al mayoreo de la carne de bovino en canal rezagado un periodo ($/t).
PALBR1: Precio real del alimento balanceado para bovino rezagado un periodo ($/t).
PMMR1: Precio real al mayoreo del maíz rezagado un periodo ($/t).
PMSR1: Precio real mayoreo del sorgo rezagado un periodo ($/t).
PCBR1: Precio real al consumidor de cortes de bovino rezagado un periodo ($/t).
DCBC: Demanda de carne de bovino en cortes equivalentes al consumidor (t).
SCEB: Saldo de comercio exterior de bovino (t).
1.30431: Es el Coeficiente de transformación de carne en canal a cortes equivalentes.
2. Variables exógenas:
PBEIR2: Precio real interno del becerro para engorda rezagado dos periodos ($/t).
PBXR: Precio real de exportación del becerro para engorda en el año t ($/t).
PPCCR2: Precio real al productor de la carne de porcino rezagado dos periodos ($/t).
PPCPR: Precio real al productor de la carne de pollo en el año t ($/t).
PPHR1: Precio real al productor de huevo rezagado un periodo ($/t).
INVBCAR2: Inventario de bovinos para carne rezagado dos periodos (cabezas).
D: Variable de clasificación, donde D = 0 periodo 1972-1990 (economía cerrada).
D = 1 periodo 1991-2010 (economía abierta).
CTG1: Costo de transporte interno de ganado rezagado un periodo ($/t).
T2: Variable de tendencia.
PICBR1: Precio real de importación de la carne de bovino en canal rezagado un periodo ($/t).
PIMR1: Precio real de importación del maíz rezagado un periodo ($/t).
PISR1: Precio real de importación del sorgo rezagado un periodo ($/t).
YPERR: Ingreso nacional disponible real per cápita ($).
PCCR: Precio real al consumidor de la carne cerdo en el año t ($/t).
PCPR: Precio real al consumidor de pollo en el año t ($/t).
PTORR: Precio real al consumidor de la tortilla en el año t ($/t).
PCJITR: Precio real al consumidor del jitomate en el año t ($/t).
Estimación de mínimos cuadrados en dos etapas
Estimación de la primera etapa
Se realizó la estimación de cada variable endógena mediante mínimos cuadrados ordinarios (MCO) en la primera etapa utilizando como instrumentos todas las variables exógenas incluidas en el sistema.
Se reportan el coeficiente R2 y el estadístico F como indicadores la variación explicada de cada variable endógena por los instrumentos utilizados y como indicador de la fortaleza de los instrumentos.
Tabla 1 Estadísticas de la estimación en la primera etapa usando el conjunto total de variables exógenas
Variables endógenas |
R-cuadrado | R-cuadrado corregido |
Est. F | Número de variables utilizadas en la estimación |
Número de instrumentos con valor p < 0.05 |
PPCBCR1 | 0.772899 | 0.597412 | 4.4 | 17 | 2 |
PMCBCR1 | 0.920805 | 0.859609 | 15.04 | 17 | 2 |
PALBR1 | 0.964762 | 0.937533 | 35.43 | 17 | 2 |
PMMR1 | 0.94804 | 0.907888 | 23.6 | 17 | 3 |
PMSR1 | 0.953881 | 0.918243 | 26.76 | 17 | 2 |
PCBR1 | 0.952047 | 0.914992 | 25.69 | 17 | 0 |
Fuente: Elaboración propia.
En la estimación de la primera etapa, usando todas las variables exógenas pertenecientes al sistema, se obtuvieron coeficientes R2 relativamente altos, no obstante se tienen pocas o ninguna variable estadísticamente significativa con un valor de p menor a 0.05; esto de acuerdo con la literatura (Gujarati & Porter, 2010) es un síntoma de multicolinealidad.
Diagnóstico en la primera etapa de la estimación de mínimos cuadrados en dos etapas
Prueba de instrumento débil a variables exógenas. De acuerdo con el criterio del estadístico F de la primera etapa propuesto en Stock y Yogo (2001), el valor crítico de F para decir que el conjunto de instrumentos es fuerte es 10.99 y 10.47 para dos y tres variables endógenas en la ecuación respectivamente.
Con base en el criterio de Stock y Yogo (2001) únicamente la variable PPCBCR1 (Precio real al productor de carne de bovino en canal rezagado un periodo) tiene un estadístico F de la primera etapa (4.4) menor al valor crítico establecido, por lo que se concluye que el conjunto de variables exógenas es un conjunto débil para esta variable endógena.
De acuerdo con Shea (1997) una medida de la fortaleza o relevancia de un instrumento es la correlación parcial con la variable endógena. Bajo este criterio se busca tener variables con correlaciones parciales cercanas a uno. Las Tablas 2a y 2b muestran que las variables exógenas y endógenas están poco correlacionadas; es decir, se tienen instrumentos débiles.
Tabla 2a Correlaciones parciales del conjunto de variables exógenas
Variables endógenas | Variables exógenas | |||||||
PICBR1 | PIMR1 | PISR1 | YPERR | PCCR | PCPR | PTORR | PCJITR | |
PPCBCR1 | 0.03 | 0.41 | -0.14 | 0.07 | -0.15 | -0.14 | -0.31 | -0.17 |
PMCBCR1 | -0.04 | 0.36 | -0.31 | -0.05 | -0.02 | 0.25 | 0.0022 | 0.17 |
PALBR1 | -0.22 | -0.02 | 0.38 | -0.17 | 0.16 | 0.44 | 0.25 | 0.15 |
PMMR1 | 0.01 | 0.06 | 0.17 | -0.39 | 0.21 | 0.51 | 0.03 | 0.52 |
PMSR1 | 0.45 | -0.18 | 0.08 | -0.2 | 0.04 | 0.46 | -0.29 | 0.22 |
PCBR1 | 0.29 | 0.13 | -0.21 | 0.24 | 0.34 | -0.2 | 0.18 | 0.01 |
Fuente: Elaboración propia.
Tabla 2b Correlaciones parciales del conjunto de variables exógenas
Variables endógenas | Variables exogenas | ||||||||
PBEIR2 | PBXR | PPCPR | PPCCR2 | PPHR1 | INVBCAR2 | D | CTG1 | T2 | |
PPCBCR1 | 0.18 | 0.63 | 0.11 | 0.19 | -0.09 | 0.09 | -0.12 | -0.37 | 0.31 |
PMCBCR1 | 0.01 | 0.03 | 0.43 | 0.54 | -0.14 | -0.14 | 0.11 | -0.32 | 0.02 |
PALBR1 | -0.13 | -0.23 | 0.35 | 0.23 | 0.52 | -0.38 | 0.06 | -0.11 | -0.16 |
PMMR1 | -0.16 | -0.26 | 0.14 | 0.57 | -0.26 | 0.45 | 0.04 | 0.05 | 0.16 |
PMSR1 | -0.11 | -0.38 | 0.05 | 0.06 | -0.15 | 0.01 | 0.16 | 0.33 | -0.31 |
PCBR1 | 0.34 | -0.27 | 0.33 | 0.26 | 0.1 | -0.15 | -0.33 | -0.16 | -0.22 |
Fuente: Elaboración propia.
Estimación de la segunda etapa
En la Tabla 3 se muestran los coeficientes estimados mediante MC2E. Dichas estimaciones presentan los signos esperados de acuerdo con la teoría económica planteada en la construcción del sistema de ecuaciones, por lo que son consideradas estimaciones válidas para el modelo, no obstante se obtuvieron coeficientes R2 relativamente bajos en algunas ecuaciones y variables estadísticamente no significativas con un valor p mayor a 0.05.
Tabla 3 Estimadores de MC2E
Var. Dep. | Intercepto | R^2 | Valor F | |||||||||
PPCBCR1 | PBEIR2 | PBXR | PPCCR2 | PPCPR | PPHR1 | PALBR1 | INVBCAR2 | D | ||||
OCB | 2661105 | 23.46698 | -12.3946 | -16.5077 | -8.26165 | -9.00177 | -20.2435 | -122.471 | -0.02216 | 275366.4 | 0.96506 | 92.07 |
Error estándar | 435684 | 11.50309 | 3.116353 | 4.426509 | 3.941188 | 4.909066 | 23.77348 | 114.3672 | 0.007105 | 110295.5 | ||
Valor p | <.0001 | 0.0502 | 0.0004 | 0.0008 | 0.0446 | 0.0766 | 0.4012 | 0.2928 | 0.004 | 0.0183 | <.0001 | 0.0502 |
PMCBCR1 | CTG1 | T2 | 0.45013 | 9.82 | ||||||||
PPCBCR1 | 13512.38 | 0.143214 | -28.175 | 254.5369 | ||||||||
Error estándar | 5980.544 | 0.075053 | 12.72927 | 110.2329 | ||||||||
Valor p | 0.03 | 0.0644 | 0.0333 | 0.0268 | ||||||||
PICBR1 | D | 0.65394 | 34.96 | |||||||||
PMCBCR1 | 41875 | 0.640746 | -26679.4 | |||||||||
Error estándar | 5554.238 | 0.235855 | 3205.52 | |||||||||
Valor p | <.0001 | 0.203 | <.0001 | |||||||||
PMMR1 | PMSR1 | 0.84723 | 102.59 | |||||||||
PALBR1 | 199.8492 | 0.088574 | 1.189427 | |||||||||
Error estándar | 233.9804 | 0.068349 | 0.215672 | |||||||||
Valor p | 0.3985 | 0.203 | <.0001 | |||||||||
PIMR1 | 0.75452 | 116.8 | ||||||||||
PMMR1 | 1178.697 | 1.02085 | ||||||||||
Error estándar | 87.86464 | 0.028614 | ||||||||||
Valor p | 0.0003 | <.0001 | ||||||||||
PISR1 | 0.72401 | 99.69 | ||||||||||
PMSR1 | 1248.024 | 0.285698 | ||||||||||
Razón de t | 14.2 | 9.98 | ||||||||||
Error estándar | 295.3189 | 0.09446 | ||||||||||
Valor p | <.0001 | <.0001 | ||||||||||
PMCBCR1 | 0.74584 | 111.51 | ||||||||||
PCBR1 | 20421.05 | 1.394184 | ||||||||||
Error estándar | 5997.151 | 0.132028 | ||||||||||
Valor p | 0.0016 | <.0001 | ||||||||||
PCBR1 | YPERR | PCCR | PCPR | PTORR | PCJITR | D | 0.9407 | 72.51 | ||||
DCBC | 1640299 | -12.4622 | 12.52016 | 2.09422 | -13.6365 | -0.31498 | -4.32698 | -62574.4 | ||||
Error estándar | 280249.3 | 2.180963 | 2.684233 | 3.643364 | 6.345978 | 24.30088 | 6.079231 | 94773.48 | ||||
Valor p | <.0001 | <.0001 | <.0001 | 0.5694 | 0.0393 | 0.9897 | 0.4818 | 0.5138 |
Fuente: Elaboración propia.
Estimación de mínimos cuadrados en dos etapas utilizando LASSO en la selección de instrumentos
Selección de instrumentos con LASSO
Se aplicó regresión LASSO como método de selección de variables, para elegir un conjunto de instrumentos para las variables endógenas del sistema de ecuaciones, para lo cual se usó el paquete LARS (Hastie, Tibshirani & Friedman, 2013) implementado en el software R (versión 3.1.0).
Mediante el algoritmo LARS se obtiene la trayectoria de la solución LASSO para cada variable. La trayectoria de solución LASSO es calculada para un número finito de valores de λ, los cuales coinciden con los pasos marcados a lo largo de solución y señalan la entrada o la eliminación de alguna variable al modelo actual (conjunto activo).
En el paso cero todos los coeficientes estimados son cero y λ toma el valor máximo. A medida que nos movemos de izquierda a derecha en la figura, λ disminuye y los coeficientes tienden a los estimados por mínimos cuadrados.
El parámetro de restricción se eligió mediante validación cruzada con k = 40 (n = 40)para cada variable endógena. Se graficó el error cuadrado medio (MSE) vs t (la norma L1) a escala entre cero y uno. Dado que t y λ tienen una correspondencia uno a uno, se seleccionó el parámetro t que minimiza el MSE.
Se usó el parámetro de restricción elegido para seleccionar las variables que fueron utilizadas como instrumentos. Para cada variable se muestra la trayectoria de regularización (Figuras 7 a 12) (8, 9, 10, 11), en la cual se puede observar la inclusión de variables en cada paso. El eje Y representa la magnitud de los coeficientes de regresión y el eje X representa el valor t (la norma L1) del vector de coeficientes estimados a escala entre cero y uno.
El conjunto de instrumentos seleccionado mediante este método en adelante se denominó “instrumentos LASSO”.
Tabla 4 Variables seleccionadas mediante Regresión LASSO
Variable endógena |
Parámetro de restricción t |
Variables seleccionadas |
PPCBCR1 | 0.1616 | PISR1, PBXR, CTG1, PPCPR, INVBCAR2, PTORR, y T2 |
PMCBCR1 | 0.2323 | PPCCR2, PPCPR |
PALBR1 | 0.6767 | PPCPR, PISR1, PPHR1, T2 ,PPCCR2, PC/CR, INVBCAR2, PCPR, PTORR, YPERR, PBEIR2, PICBR1, PBXR y PCJITR |
PMMR1 | 0.4646 | PPCPR, PPCCR2, PIMR1, D, INVBCAR2, YPERR, PBEIR2, PCJITR, PBXR y PCPR |
hPMSR1 | 0.4747 | CTG1, PPCPR, T2, PPCCR2, PICBR1, PTORR, PCPR, INVBCAR2 y PBXR. |
PCBR1 | 0.3838 | PPCPR, T2, D, PPCCR2, PCCR, PBXR y PBEIR2 |
Fuente: Elaboración propia.
Estimación de la primera etapa con instrumentos LASSO
En la estimación de la primera etapa utilizando como instrumentos los seleccionados mediante regresión LASSO, se obtuvo para cada variable endógena un coeficiente R2 relativamente alto y tomando como criterio un valor p menor a 0.05, el número de variables estadísticamente significativas aumentó en cada modelo.
Tabla 5 Estadísticas de la estimación en la primera etapa usando instrumentos LASSO
Variables endógenas |
R-cuadrado | R-cuadrado corregido |
Estadístico F | Número de variables utilizadas en la estimación |
Instrumentos con valor p < 0.05 |
PPCBCR1 | 0.665562 | 0.592404 | 9.09 | 7 | 3 |
PMCBCR1 | 0.870253 | 0.86324 | 124 | 2 | 2 |
PALBR1 | 0.960767 | 0.938797 | 43.73 | 14 | 3 |
PMMR1 | 0.940396 | 0.919843 | 45.75 | 10 | 5 |
PMSR1 | 0.945998 | 0.929798 | 58.39 | 9 | 4 |
PCBR1 | 0.937886 | 0.924298 | 69.02 | 7 | 4 |
Fuente: Elaboración propia.
Diagnóstico en la primera etapa de la estimación de mínimos cuadrados en dos etapas
Prueba de instrumento débil a instrumentos LASSO. En las Tablas 6a y 6b se muestran las correlaciones parciales como indicadores de la fortaleza de los instrumentos seleccionados mediante regresión LASSO. Es preciso señalar que LASSO seleccionó en la mayoría de los casos los instrumentos que en el conjunto de exógenas tuvieron mayores correlaciones parciales. Así mismo, se nota que algunos de los instrumentos seleccionados incrementaron sus correlaciones parciales con las variables endógenas en cuestión, por lo que se consideran instrumentos “más fuertes”.
Tabla 6a Correlaciones parciales de las variables seleccionadas mediante LASSO
Variable endógena | Variables exógenas | ||||||||
PBEIR2 | PBXR | PPCPR | PPCCR2 | PPHR1 | INVBCAR2 | D | CTG1 | T2 | |
PPCBCR1 | - | 0.62 | 0.08 | - | - | 0.42 | - | 0.12 | 0.23 |
PMCBCR1 | - | - | 0.45 | 0.67 | - | - | - | - | - |
PALBR1 | -0.14 | -0.23 | 0.36 | 0.19 | 0.48 | -0.44 | - | - | -0.13 |
PMMR1 | -0.34 | -0.38 | 0.2 | 0.63 | - | 0.52 | 0.15 | - | - |
PMSR1 | - | -0.25 | 0.04 | 0.03 | - | -0.19 | - | 0.47 | -0.52 |
PCBR1 | 0.38 | -0.18 | 0.35 | 0.39 | - | - | -0.41 | - | -0.03 |
Fuente: Elaboración propia.
Tabla 6b Correlaciones parciales de las variables seleccionadas mediante LASSO
Variable endógena | Variables exógenas | |||||||
PICBR1 | PIMR1 | PISR1 | YPERR | PCCR | PCPR | PTORR | PCJITR | |
PPCBCR1 | - | - | -0.03 | - | - | - | -0.46 | - |
PMCBCR1 | - | - | - | - | - | - | - | - |
PALBR1 | -0.18 | - | 0.3 | -0.18 | 0.2 | -0.38 | 0.29 | 0.16 |
PMMR1 | - | 0.31 | - | -0.36 | - | 0.46 | - | 0.34 |
PMSR1 | 0.46 | - | - | - | - | 0.44 | -0.28 | - |
PCBR1 | - | - | - | - | 0.29 | - | - | - |
Fuente: Elaboración propia.
Con base en el criterio del estadístico F de la primera etapa únicamente la variable endógena PPCBCR1 tiene un estadístico menor al valor crítico establecido (valor F = 9.09) en Stock y Yogo (2001), por lo que se considera que el conjunto de variables seleccionadas como instrumentos es “débil”; sin embargo, se tiene evidencia de mayor fortaleza que los obtenidos en estimación de mínimos cuadrados en dos etapas. Cabe destacar que el valor obtenido es muy cercano al valor crítico.
Estimación de la segunda etapa con instrumentos LASSO
En la estimación de la segunda etapa se sustituyeron las variables endógenas en las ecuaciones estructurales por sus valores predichos estimados con los instrumentos seleccionados mediante regresión LASSO.
En esta etapa se obtuvieron coeficientes estimados acordes con el signo esperado en la teoría económica propuesta en la construcción del modelo.
En la ecuación OCB se obtuvieron tres variables no significativas (PPCBCR1, PALBR1 y PPHR1). En la estimación de MC2E se obtuvieron las mismas variables no significativas y adicionalmente la variable PPCPR.
Tabla 7 Estimación de la segunda etapa usando instrumentos LASSO
V. endógena |
Intercepto | |||||||||||
PPCBChat_2 | PBEIR2 | PBXR | PPCCR2 | PPCPR | PPHR1 | PALBRhat_2 | INVBCAR2 | D | R^2 | Valor F | ||
OCB | 2.85E+06 | 23.7745 | -13.7145 | -16.654 | -5.50789 | -9.36792 | -18.1111 | -163.333 | -0.025818 | 248441 | 0.97248 | 117.7905 |
Error Estándar | 377424.03 | 15.1919624 | 2.78133887 | 5.1277899 | 3.120557 | 4.5245524 | 24.120296 | 113.73118 | 0.0064947 | 95310.186 | ||
Valor p | 4.47E-09 | 0.12588784 | 1.65E-05 | 0.0024338 | 0.0855941 | 0.0452532 | 0.4573584 | 0.1591466 | 0.000304 | 0.0129896 | ||
PMCBChat | CTG1 | T2 | 0.39041 | 7.685351 | ||||||||
PPCBCR1 | 17539.3 | 0.0968666 | -31.7685 | 183.994 | ||||||||
Error Estándar | 7614.2866 | 0.11051013 | 15.4885386 | 139.05422 | ||||||||
Valor p | 0.0268167 | 0.386244044 | 0.047198274 | 0.1936818 | ||||||||
PMMR1hat_2 | PMSR1hat_2 | 0.876915 | 131.8029 | |||||||||
PALBR1 | 198.4 | 0.105655 | 1.15584 | |||||||||
Error Estándar | 186.56946 | 0.05468149 | 0.17256175 | |||||||||
Valor p | 0.2943069 | 0.060816601 | 6.32E-08 | |||||||||
PMCBChat | 8.35E-01 | 192.2322 | ||||||||||
PCBR1 | 16914.3 | 1.47628 | ||||||||||
Error Estándar | 3812.0376 | 0.08419 | ||||||||||
Valor p | 7.57E-05 | 8.30E-20 | ||||||||||
PCBR1hat_1 | YPERR | PCCR | PCPR | PTORR | PCJITR | D | 0.95548 | 98.11086 | ||||
DCBC | 1.88E+06 | -14.1802 | 10.747 | 3.1968 | -10.012 | -20.3023 | -5.57101 | -98761.2 | ||||
Error Estándar | 246797.52 | 2.01027941 | 2.23307332 | 2.9242982 | 5.1970999 | 19.670916 | 4.757653 | 80423.989 | ||||
Valor p | 3.65E-09 | 2.08E-08 | 2.37954E-05 | 0.2811943 | 0.0615509 | 0.3085509 | 0.2489065 | 0.2269967 |
^PPCBCR1=PPCBChat_2 y ^PALBR1=PALBRhat_2, ^PMCBCR1=PMCBChat, ^PMCBCR=PMCBChat
Fuente: Elaboración propia.
Resultados
Los instrumentos seleccionados con LASSO son en general los más “fuertes” (en términos de correlación parcial más alta) para cada variable endógena. Del mismo modo, el estadístico F de la primera etapa como prueba de la fortaleza de los instrumentos muestra que únicamente el conjunto de instrumentos seleccionado mediante LASSO para la variable endógena PPCBCR1, es débil.
Similar a los resultados obtenidos mediante MC2E, solo en la primera ecuación de oferta (OCB la variable PPCBCR1 con el método de selección LASSO tiene un conjunto de instrumentos débil (con base en el criterio del estadístico F); sin embargo, está muy cerca del valor crítico.
Ambos métodos son congruentes en cuanto al signo de los coeficientes estimados acorde la teoría económica planteada en Cruz (2013).
De acuerdo con los parámetros estimados en la ecuación de oferta se muestra una relación positiva entre la cantidad ofertada de carne de bovino y el precio al productor de la carne de bovino en canal, y una relación inversa de la cantidad ofertada de carne de bovino con las variables: precio interno del becerro para engorda, precio de exportación del becerro para engorda, precio del alimento balanceado para bovino, precio al productor de la carne de porcino y pollo, y el precio al productor del huevo para consumo humano.
En las siguientes ecuaciones el modelo muestra una relación directa entre el precio real al productor y el precio real al mayoreo de la carne de bovino, y una relación inversa con el costo de transporte interno; así mismo, se encontró una relación directa entre el precio del alimento balanceado y las variables precio al mayoreo del maíz y sorgo ambos insumos del mismo.
Igualmente se estableció una relación directa entre las variables precio al consumidor de cortes de bovino y el precio real al mayoreo de carne de bovino.
En la ecuación de demanda, se establece una relación inversa entre la cantidad demandada de la carne de bovino el precio al consumidor de la misma; del mismo modo, en las variables carne de porcino y pollo, el modelo muestra una relación directa, cabe mencionar que ambos bienes son considerados como sustitutos de la carne de bovino. Finalmente se encontró una relación positiva entre la demanda de la carne de bovino y las variables tortilla y jitomate, ambos productos considerados como complementarios de la carne de bovino.
Los valores obtenidos en las estimaciones con el método de selección de instrumentos LASSO en general son más pequeños en valor absoluto en comparación con los obtenidos con el método de MC2E.
El uso de estimadores sobreestimados en análisis posteriores por ejemplo el cálculo de las elasticidades precio de la oferta y la demanda puede resultar en elasticidades clasificadas de forma errónea.
El análisis de las elasticidades permite cuantificar en qué medida los compradores y vendedores responden a las condiciones en el mercado, identificando si se trata de un bien de primera necesidad o un bien de lujo y se existen bienes sustitutos; constituye una herramienta útil en formulación de políticas económicas, por lo que el uso de metodologías más precisas en el cálculo de las mismas permite obtener mejores estimaciones del impacto de variables objeto de estudio.
Una sobreestimación de la elasticidad precio de la demanda puede minimizar el efecto que tendrá el incremento del precio en el consumo de un bien, debido a la clasificación equívoca como demanda con tendencia elástica (observada generalmente en bienes de lujo) cuando puede tratarse de un producto con elasticidad precio más inelástica (correspondiente a un bien de primera necesidad) de modo que las políticas económicas dirigidas a reducir el impacto negativo que tendría en el ingreso y bienestar de los consumidores no serán formuladas de forma adecuada para ese fin.
Del mismo modo el cálculo de la elasticidad precio de la oferta calculada con base en estimadores sobre estimadas, podría resultar en elasticidades equívocas repercutiendo en la formulación de políticas dirigidas a los productores.
Conclusiones
El uso de LASSO permitió la selección de los instrumentos con mayor contenido de información para cada variable explicativa endógena.
Los coeficientes estimados en la segunda etapa, obtenidos usando los instrumentos seleccionados mediante regresión LASSO corresponden en signo con los estimados mediante MC2E y con la teoría económica planteada en la construcción del modelo, aunque con menor magnitud. Los errores estándar en la mayoría de los coeficientes disminuyeron, mejorando la calidad de los estimadores.
El uso de los estimadores obtenidos usando la metodología LASSO en la primera etapa puede mejorar el cálculo de elasticidades en análisis cuyo fin sea la formulación de política económica.