Introducción
Los suelos tienen varias funciones como amortiguamiento, regulador del clima, conservación de la biodiversidad, espacio habitable y actividades sobre él como la producción de alimentos, lo que lo hace un recurso valioso y existe la necesidad de ser estudiado de la manera más adecuada (Dominati, Patterson y Mackay, 2010).
Existen diferentes métodos cuantitativos y cualitativos propuestos para estudiar la distribución, funcionamiento y génesis de los suelos, los cuales se engloban en un área de conocimiento conocida como pedometría (Heuvelink, 2003). En la pedometría se encuentra el modelado y cartografía digital del suelo-paisaje (Grunwald, 2006).
Para la cartografía digital de suelos (CDS) existe un modelo conceptualizado por McBratney, Santos y Minasny (2003), conocido como SCORPAN, donde emplea la ecuación de formación del suelo para una descripción empírica cuantitativa entre el suelo y sus factores formadores, que se relacionan con su predicción. El SCORPAN se basa en siete factores: 1 atributos medidos del suelo (S), 2 clima (C), 3 organismos (O), 4 topografía (R), 5 material parental (P), 6 edad (A); 7 espacio y posición geográfica (N). Mediante el SCORPAN se pueden inferir clases o propiedades de suelos relacionadas con su nutrición, fertilidad, entre otros (Grunwald, 2009). Para lo cual, se emplean modelos matemáticos que permiten realizar la correlación entre factores y la predicción del suelo. McBratney et al. (2003) y Thompson, Roecker, Grunwald y Owens (2012) realizaron revisiones exhaustivas sobre los modelos matemáticos y se agrupan en técnicas geoestadísticas, modelos lineales generalizados y de aprendizaje automatizado.
Las técnicas geoestadísticas son las más empleadas para realizar la predicción de atributos o propiedades de suelos, entre las que destacan kriging ordinario, co-kriging y regresión-kriging (Grunwald, 2009). Con la técnica de regresión-kriging se han obtenido mejores resultados, ha probado ser la mejor para la generación de mapas de propiedades de suelos (Hengl, Heuvelink y Rossiter, 2007b; Sun, Minasny y McBratney, 2012a; Hengl et al., 2015), de tipos de vegetación (Miller, Franklin y Aspinall, 2007) y distribución de especies (Allouche, Steinitz, Rotem, Rosenfeld y Kadmon, 2008; Hengl, Sierdsema, Radović y Dilo, 2009). Además, permite tomar en cuenta la autocorrelación espacial que presentan los residuales de la regresión (Ge, Thomasson, Sui y Wooten, 2011).
Las fuentes de información para representar los factores del SCPORPAN son diversas, y con el avance de la tecnología se ha hecho fácil disponer de ellas, entre las que destacan por representar información de tipo espacial y temporal, son los datos de sensores remotos. Además, se puede disponer desde escala de parcela a nivel global. Se han utilizado para predecir diferentes propiedades físicas y químicas como la textura, humedad, mineralogía, carbono orgánico, nitrógeno y salinidad (Mulder, De Bruin, Schaepman y Mayr, 2011; Rossiter, 2018).
El objetivo de la investigación fue contribuir al mejor entendimiento de la variabilidad espacial de algunas propiedades de los suelos existentes en la Ciénega de Chapala, Michoacán. Mediante la técnica geoestadística conocida como regresión-kriging y datos de sensores remotos.
Materiales y Métodos
Área de estudio
En el periodo de 1904 a 1908 se construyó el bordo de Maltaraña para la desecación de la parte sureste del lago de Chapala, dando como origen a lo que hoy se conoce como la Ciénega de Chapala, porción Michoacán (Loeza, Ramírez y Reyes, 2015). La Ciénega de Chapala se localiza al noroeste del estado de Michoacán, entre las coordenadas 102° 45’ O y 20° 12’ N y 102° 30’ O y 20° 05’ N; su superficie es de 546.55 km2 (Figura 1). Los tipos de suelos son Vertisoles y Fluvisoles principalmente. Los principales cultivos son maíz (Zea mays), sorgo (Sorghum spp.), cebolla (Allium cepa), alfalfa (Medicago sativa) y jitomate (Solanum lycopersicum) los cuales cuentan con riego. El clima es semicálido subhúmedo.
Muestreo y análisis de suelos
El esquema de muestreo fue sistemático y el tamaño de muestra de 297 puntos (Anexo 1), resultando una separación de 1357 m entre puntos. En cada sitio se colectó un kg de suelo a una profundidad de 0-30 cm. En laboratorio se determinó a cada muestra de suelo la conductividad eléctrica (extracto de saturación y conductivímetro), carbono orgánico (Walkey-Black), los cationes solubles (Ca, K, Mg, Na; extracto de saturación, espectrometría de absorción atómica y espectrometría de adsorción), nitrógeno total (micro-Kjeldahl) y el pH (H20 1:2.5) (Van Reeuwijk, 2002). Para cada una las propiedades de suelos se obtuvieron las estadísticas descriptivas.
Regresión-kriging
La regresión-kriging (RK) es la combinación de un modelo lineal múltiple (MLM) y kriging ordinario (Hengl, 2007a). La combinación de las dos técnicas se realizó adicionando los residuales de MLM (variable dependiente de la propiedad de suelo de interés y variables independientes, factores del SCORPAN) al kriging ordinario (Ecuación 1). Esta relación se establece por la siguiente formula:
Donde
En la RK se puede mejorar la predicción de la variable objetivo si se incorpora información de efectos aleatorios en el MLM, que consiste en agrupar los sitios o puntos de muestreo en grupos con características similares (Omuto y Vargas, 2015). Para este estudio así se generaron los grupos: 1) se realizó un análisis de componentes principales a las 10 variables de suelo; 2) se seleccionaron los primeros componentes principales que representaron más de 80% de la varianza acumulada para realizar un análisis clúster jerérquico (distancia euclidiana y método Ward). Los factores del SCORPAN para el MLM fueron datos de sensores remotos del satélite Landsat 8 del 5 de mayo de 2013 (bandas de la 2 a la 8). El nitrógeno total (N), conductividad eléctrica (CE), carbono orgánico (CO) y pH fueron las variables de interés a predecir. Los residuales del MLM se emplearon para construir el semivariograma experimental, se ajustaron siete modelos teóricos (bessel, esférico, exponencial, gaussiano, lineal, matern, pentaesférico) y se seleccionó el de menor error. Posteriormente se realizó la predicción espacial de las propiedades de suelo con kriging ordinario y el variograma ajustado. El poder predictivo de RK se evaluó con el error medio (ME, Ecuación 2) y error cuadrático medio (RMSE, Ecuación 3).
Donde
Resultados y Discusión
Estadística descriptiva
El Cuadro 1 muestra la estadística descriptiva de las propiedades de suelos. Las variables de conductividad eléctrica y cationes solubles muestran un coeficiente de variación mayor a 100%. Por lo contrario, el pH y nitrógeno total, presentaron coeficiente de variación menores a 50%. Las variables de suelo que presentaron coeficientes de variación mayores a 100%, se debe a la alta heterogeneidad de sus valores. Por ejemplo, existen suelos con conductividades eléctricas menores a 1 dS m-1, y otros mayores a 30 dS m-1. La alta conductividad de los suelos se debe a cuestiones naturales y antrópicas (Silva-García, Ochoa, Cristóbal y Estrada, 2006). La primera causa corresponde a suelos que se encuentran en una zona geotérmica conocida como Los Negritos, que está localizada en la parte media de la ciénega de Chapala. La segunda provocada porque algunos de los suelos son regados con aguas de pozos profundos, cuya salinidad varia de 1 dS m-1 a 4.5 dS m-1, lo cual ocasiona que estos suelos se degraden por los procesos de salinización (Silva, Rodríguez, Ochoa y López, 2002). El coeficiente de variación del pH fue menor a 5%, lo cual se debe a la génesis del suelo (Arnalds et al., 2011). Los suelos son originados por sedimentos lacustres, y estos provinieron esencialmente de materiales ricos en bases como las rocas ígneas extrusivas básicas (basaltos), que proporcionan la característica de alcalinidad (Krasilnikov et al., 2013).
Variable | Mínimo | Máximo | Media | DS | CV | Sesgo | Curtosis |
pH | 6.60 | 9.00 | 7.89 | 0.34 | 4.33 | -0.50 | 5.57 |
CE (dS m-1) | 0.22 | 30.30 | 1.24 | 4.42 | 355.40 | 5.99 | 38.38 |
CaCO3 (%) | 0.15 | 21.00 | 8.30 | 5.83 | 70.26 | 0.02 | -1.16 |
CO (%) | 0.15 | 2.55 | 0.90 | 0.63 | 70.31 | 1.53 | 1.39 |
N (%) | 0.01 | 0.19 | 0.08 | 0.03 | 41.45 | 0.17 | 1.96 |
P (cmol L-1) | 3.73 | 69.84 | 9.89 | 9.62 | 97.28 | 4.94 | 30.29 |
Na (cmol L-1) | 9.87 | 10831.55 | 328.89 | 1543.39 | 469.28 | 6.49 | 44.22 |
K (cmol L-1) | 3.01 | 87.05 | 9.49 | 12.29 | 129.51 | 5.18 | 31.88 |
Ca (cmol L-1) | 0.50 | 627.00 | 57.52 | 126.96 | 220.72 | 3.95 | 14.49 |
Mg (cmol L-1) | 5.50 | 1060.00 | 33.26 | 147.59 | 443.79 | 6.88 | 48.49 |
DS = desviación estándar; CV = coeficiente de variación; CE = conductividad eléctrica; CO = carbono orgánico.
SD = standard deviation; CV = coefficient of variation; EC = electrical conductivity; OC = organic carbon.
Definición de efectos aleatorios
Los primeros cinco componentes principales (PC) representan más de 81% de los datos originales. Las variables de conductividad eléctrica, nitrógeno total, carbono orgánico, fósforo y potasio se encuentran más correlacionadas para los primeros cinco PC respectivamente (Cuadro 2). Debido a las características que tienen los componentes principales, no correlacionados y se ponderan en orden de importancia. Se pueden emplear para análisis posteriores como datos de entrada, ya sea para modelos de nicho ecológico o análisis clúster. Sin perder en forma significativa información de todas las variables originales, pero generando modelos más parsimoniosos o disminuir la dimensión de los datos para análisis posteriores. Porque al menos con cuatro PC se puede representar más 78% de la varianza acumulada (Anaya-Flores, Cruz, Silva, Ochoa y Álvarez, 2018; Cadena, Vázquez, Cruz y Villaseñor, 2019).
PC1 | PC2 | PC3 | PC4 | PC5 | |
Importancia de los componentes | |||||
Desviación estándar | 1.837 | 1.425 | 1.007 | 0.947 | 0.885 |
Proporción de la varianza | 0.337 | 0.203 | 0.101 | 0.090 | 0.078 |
Proporción acumulativa | 0.337 | 0.541 | 0.642 | 0.732 | 0.810 |
Valores de carga | |||||
pH | 0.104 | 0.443 | 0.322 | 0.248 | -0.288 |
CE (dS m-1) | -0.488 | 0.18 | - | -0.165 | 0.169 |
CaCO3 (%) | 0.102 | 0.503 | - | -0.282 | -0.411 |
CO (%) | - | -0.132 | 0.94 | - | 0.141 |
N (%) | 0.101 | 0.546 | - | -0.113 | - |
P (cmol L-1) | -0.134 | -0.365 | - | -0.571 | -0.636 |
Na (cmol L-1) | -0.428 | 0.109 | - | 0.39 | -0.27 |
K (cmol L-1) | -0.37 | -0.137 | - | 0.481 | -0.347 |
Ca (cmol L-1) | -0.417 | 0.164 | - | -0.27 | 0.299 |
Mg (cmol L-1) | -0.467 | 0.11 | - | -0.191 | 0.108 |
PC= Componente principal; CE= conductividad eléctrica; CO= carbono orgánico.
PC = Principal component; EC = electrical conductivity; OC = organic carbon.
Los primeros cinco PC se emplearon en el análisis clúster. Las 297 muestras de suelos se agruparon en cinco clústers (Figura 2). Los clústers con el mayor y menor número de observaciones (muestras de suelos) es el 2 y 5, con 96 y 15 respectivamente.
Ajuste de semivariogramas
Los coeficientes de determinación de los MLM de N, CE, CO y pH son de 0.62, 0.63, 0.22 y 0.28 respectivamente. Los residuales de estos modelos se emplearon para ajustar el semivariograma experimental con los modelos teóricos. Los modelos teóricos con un mejor ajuste fueron esférico, lineal, exponencial y lineal para N, CE, CO y pH respectivamente (Figura 3). Un buen ajuste del semivariograma experimental con los modelos teóricos depende de varios factores como el tamaño de muestra, diseño de muestreo, la distancia entre pares de puntos (lag), entre otros. En el presente estudio, el tamaño de muestra fue de 297 puntos y el diseño sistemático, lo cual garantiza un semivariograma confiable, además, el lag no influyó por el tipo de muestreo (Oliver y Webster, 2014). Lo anterior asegura que se puedan formar un número similar de pares de puntos en toda el área y obtener menor error en el modelo ajustado (Mahdi, Abuzaid y Atta, 2020). En diversos estudios los semivariogramas de nitrógeno, conductividad eléctrica, carbono orgánico y pH del suelo, se han ajustado con el modelo exponencial (Hengl, Heuvelink y Stein, 2004; Sun, Whelan, Minasny y McBratney, 2012b; Bilgili, 2013; Hengl et al., 2015); pero en el presente estudio solo fue el carbono orgánico. Esto se debe a que el modelo exponencial es más consistente para el ajuste, cuando la distancia máxima de separación entre pares de puntos es de ½ aproximadamente 18 000 m (Figura 3c) y con un diseño de muestreo sistemático (Jin y Kelly, 2017).
Predicción espacial
En términos generales se obtuvo buena predicción de las cuatro propiedades del suelo con RK (Cuadro 3; Anexo 2), porque se utilizó la versión modificada (con efectos aleatorios) y se obtuvo mejor desempeño (Keskin y Grundwald, 2018). Los valores de RMSE son menores a 1 para las variables de nitrógeno total, carbono orgánico y pH, coincidiendo lo reportado en otros estudios (Sun et al., 2012a; Hengl et al., 2015). Sin embargo, la conductividad eléctrica mostró RMSE mayor a 4, esto se relaciona con el coeficiente de variación, a medida que aumenta 355, (Cuadro 1) la precisión de RK disminuye (Keskin y Grunwald, 2018). Lo cual podría deberse a que no existe buena correlación entre los valores observados de la variable y los factores del SCORPAN, y que las variaciones de la conductividad eléctrica no son capturadas por los residuales del modelo (Eldeiry y Garcia, 2010; Sun et al., 2012b). Además, la relación entre la conductividad eléctrica y los factores del SCORPAN podría ser no lineal como se establece con el MLM empleado, para mejorar el desempeño de RK se pueden utilizar otros modelos (Sun, Yang, Wang y Wu, 2019). Por ejemplo, con árboles de regresión, bosques aleatorios, máquinas de soporte vectorial y redes neuronales artificiales, la precisión de la predicción aumentó hasta en 20% (Dash, Panigrahi y Mishra, 2022).
La mayor superficie de los suelos muestra contenido de nitrógeno total de 0.05% a 0.10%, principalmente hacia el norte del área de estudio. La conductividad eléctrica en general es menor a 1 dS m-1; sin embargo, una superficie importante presenta conductividades de 2.1 a 4 dS m-1. Por otra parte, más de 50% de la superficie tiene contenido de carbono orgánico de 0.5% a 1.5%. Aproximadamente 100% de los suelos del área de estudio tienen pH de 7.4 a 8.5 (Figura 4).
En función de la NOM-021-SEMARNAT-2000 (SEMARNAT, 2002) el contenido de nitrógeno total de los suelos se considera como de bajo a muy bajo (< 0.15%). Al menos 30% de los suelos presentan problemas de salinidad debido a que su conductividad eléctrica es mayor de 1.1 dS m-1. Los contenidos de carbono orgánico se consideran de medios a altos (> 0.6%). Los suelos tienen pH medianamente alcalino.
Conclusiones
El uso de regresión-kriging y datos de sensores remotos para la cartografía digital de suelos generó mapas de precisión aceptable de manera general. Los factores que pueden afectar en el desempeño de regresión-kriging es el ajuste del semivariograma experimental con modelos teóricos, y la relación de los factores del SCORPAN con las propiedades de suelo estudiadas para la predicción espacial. El ajuste del semivariograma experimental fue el adecuado porque cuenta con el número suficiente de puntos de muestreo (297) y el diseño fue sistemático, lo que garantiza semivariogramas consistentes. Se pueden emplear otros modelos predictivos como los de aprendizaje automatizado cuando la propiedad de suelo de interés y los factores del SCORPAN no tengan relación lineal.