SciELO - Scientific Electronic Library Online

 
vol.5 issue1Behavior of olive (Olea europaea L) cultivars for oil under deserted conditions in SonoraUltrastructural findings in foliar lesions associated with 'red vein' in leather leaf fern author indexsubject indexsearch form
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • Have no similar articlesSimilars in SciELO

Share


Revista mexicana de ciencias agrícolas

Print version ISSN 2007-0934

Rev. Mex. Cienc. Agríc vol.5 n.1 Texcoco Jan./Feb. 2014

 

Artículos

 

Discriminación de tipos de calidad de agua de riego según atributos químicos utilizando una técnica multivariada*

 

Discrimination of types of irrigation water quality by chemical attributes using a multivariate technique

 

Javier Lorbes Medina1§, Yelitza García Orellana1, Carlos Ohep1 y Manuel Milla Pino2

 

1 Universidad Centroccidental Lisandro Alvarado. Decanato de Agronomía. Cabudare, estado Lara. Tel. +582512592323. (yelitzagarcia@ucla.edu.ve; carlosohep@ucla.edu.ve). §Autor de correspondencia: javierlorbes@ucla.edu.ve.

2 Instituto Universitario de Tecnología de Yaracuy. San Felipe, estado Yaracuy. Tel. +584147935295. (memilla22@yahoo.com.mx).

 

* Recibido: junio de 2013
Aceptado: noviembre de 2013

 

Resumen

Con el objetivo de discriminar tipos de calidad de agua para riego según sus atributos químicos se consideró un experimento donde se evaluó el efecto de tres tipos de calidad de agua en la estructura de los suelos de la depresión de Quíbor, estado Lara. Los tres tipos de aguas consideradas en la investigación fueron: agua del embalse Yacambú (YAC), agua del embalse Dos Cerritos (DCE) y agua de pozo (POZO). Se tomaron 12 muestras de cada una y se midieron sobre ellas las variables: conductividad eléctrica (Ce) y los contenidos de calcio (Ca), magnesio (Mg), sodio (Na), potasio (K), bicarbonatos (HCO3), cloruros (Cl), sulfatos (SO4) y pH. Se utilizó el método del análisis discriminante canónico con dos técnicas gráficas multivariadas como la gráfica hipótesis-error (HE) y la gráfica de estructura discriminante canónica para evaluar los datos. Los resultados muestran diferencias significativas entre los tres tipos de agua y las variables evaluadas más influyentes en su discriminación fueron, Mg, Cl, Ce, SO4, Na y Ca. Las técnicas gráficas muestran que se puede interpretar las diferencias entre las aguas y relaciones entre variables y observaciones de manera fácil y sencilla ofreciendo una buena alternativa para analizar e interpretar datos.

Palabras clave: análisis discriminante canónico, gráfica HE, gráfica discriminante canónica.

 

Abstract

In order to discriminate types of irrigation water quality according to their chemical attributes was considered an experiment where we evaluated the effect of three types of water quality on soil structure of depression Quibor, Lara state. The three types of waters covered by the research were: reservoir water Yacambú (YAC), water reservoir Dos Cerritos (DCE) and well water (WELL). 12 samples were taken from each of them were measured variables: electrical conductivity (EC) and the calcium (Ca), magnesium (Mg), sodium (Na), potassium (K), bicarbonate (HCO3), chlorides (Cl), sulfate (SO4) and pH. We used canonical discriminant analysis method with two multivariate techniques such as graphical charts and error hypothesis (HE) and canonical discriminant structure plot to evaluate the data. The results show significant differences between the three types of water and the most influential variables evaluated in discrimination were Mg, Cl, Ce, SO4, Na and Ca graphs show techniques that can interpret the differences between the waters and relationships between variables and observations easily and simply offering a good alternative to analyze and interpret data.

Key words: canonical discriminant analysis, graphical HE, canonical discriminant plot.

 

Tanto la calidad del agua de riego como el manejo adecuado es esencial para la producción, ya que la calidad afecta los rendimientos y las condiciones físicas del suelo, debido a que el tipo de agua que se utilice puede tener efectos importantes.

Los diferentes parámetros que se consideran en la determinación de la calidad del agua de riego, contemplan características físicas, químicas y biológicas que definen su adecuación y por ello se requiere de métodos de análisis que tomen en cuenta las interrelaciones entre las distintas variables de manera simultánea, lo cual se puede lograr cuando se analiza desde un punto de vista multivariante.

Muchas metodologías subyacen en el ámbito de la estadística multivariante donde el problema de reducción de la dimensionalidad de los datos es fundamental para cada aplicación experimental. La limitación fundamental de las técnicas multivariantes es la complejidad en la presentación de los resultados y la interpretación de los mismos, sobre todo cuando se tienen muchas variables, debido a las interrelaciones entre ellas y a la variabilidad de características asociadas a los modelos, lo cual ha conducido a muchos investigadores a realizar análisis univariantes para cada una de las variables por separado, con los consecuentes errores u omisiones en la interpretación de sus resultados (Amaro et al, 2004).

Una técnica estadística multivariada bien desarrollada que puede ser usada como ayuda o complemento en la interpretación de los resultados es el análisis discriminante canónico (ADC), la cual permite la identificación de diferencias entre grupos (clases o tratamientos) a partir de medidas de características de los individuos pertenecientes a esos grupos y facilitar la comprensión de las relaciones entre las variables evaluadas dentro de los mismos (Afifi y Clark 1996; Vaylay y Santen, 2002; Onofre y Ciriciofolo, 2004).

Recientemente han surgido una variedad de nuevos métodos gráficos en el contexto del modelo lineal multivariado, entre los que se encuentran las gráficas HE y de estructura canónica (Friendly, 2006; 2007; Egesel et al, 2011), que proveen una comparación visual directa de las matrices de covarianza de la hipótesis y error, y su uso en aproximaciones o proyecciones de bajo rango de datos multivariados para desplegar una vista en baja dimensión de los resultados basado sobre un análisis discriminante canónico.

El objetivo principal de este trabajo es discriminar tres tipos de calidad de agua de riego desde el punto de vista de nueve atributos químicos basado en el análisis discriminante canónico con dos técnicas gráficas multivariantes, la gráfica HE canónica y de estructura discriminante canónica.

Para la discriminación de los tipos de agua se evaluó el efecto de tres tipos de calidad de agua en la estructura de los suelos de la depresión de Quíbor, estado Lara, Venezuela. Los tres tipos de aguas consideradas en la investigación fueron: agua del embalse Yacambú (YAC), agua del embalse Dos Cerritos (DCE) y agua de pozo (POZO), en las cuales se tomaron 12 muestras de cada una y se midieron sobre ellas las siguientes variables: conductividad eléctrica (Ce), en ds m-1; y los contenidos de calcio (Ca), magnesio (Mg), sodio (Na), potasio (K), bicarbonatos (HCO3), cloruros (Cl) y sulfatos (SO4), todas medidas en miliequivalentes por litro (meq l-1), y pH. El análisis estadístico fue hecho basado en el modelo estadístico multivariante siguiente:

yijh = μhih+ εijh

Donde: i = 1, 2, 3; j = 1, 2, . . . ,12; h = 1, 2, . . . , 9; yijh es el vector multivariado de observaciones sobre la variable h para el tratamiento i, en la observación ; μhes el vector multivariado de medias general sobre la variable h; τih es el vector multivariado de efectos en el tratamiento i sobre la variable h, y εijh es el vector multivariado para errores aleatorios asociado con el vector de observaciones yijh.

En la gráfica HE, la elipse de la hipótesis (H) es obtenida de las sumas de cuadrados y productos para la hipótesis (tratamientos), mientras que la elipse del error (E) es obtenida de las sumas de cuadrados y productos para el error. Por otro lado, la gráfica de estructura discriminante canónica provee un resumen visual compacto de las características resaltantes de los datos, ya que muestra todas las observaciones, las medias de los grupos sobre las dos variables canónicas más grandes, círculos de confianza para estas medias, y vectores variables mostrando las correlaciones de las variables respuestas con las funciones canónicas (Egesel et al, 2011).

Para generar las gráficas HE y de estructura canónica con el ADC se utilizaron los procedimientos PROC GLM y PROC CANDISC del programa estadístico SAS (SAS, 1999), conjuntamente con los programas macros CANPLOT, HEPLOT y HECAN para las representaciones gráficas (Friendly, 2006; 2007).

En ambas gráficas el orden y separación de las medias de los tratamientos sobre cada variable canónica, indicará cómo esa combinación lineal de las respuestas discrimina entre los tipos de agua y los vectores variables sobre la gráfica indicarán la correlación de cada una de las variables observadas con las dimensiones canónicas. Con ejes igualados, la longitud relativa de cada vector será proporcional a su contribución a la discriminación entre los tratamientos, como también, los ángulos entre los vectores indicarán aproximadamente las correlaciones entre las diferencias medias de los grupos, basado sobre la matriz H estandarizada proyectada en el espacio de las dimensiones canónicas.

Así, la longitud relativa de cada vector será un indicativo de la proporción de varianza explicada por esa variable y el ángulo entre cada vector con cada función canónica será proporcional a su correlación; por tanto los coeficientes de estructura canónica total medirán la correlación lineal simple bivariada entre una variable respuesta original y la variable canónica, por lo que el coeficiente canónico reflejará la varianza que la variable observada comparte con la variable canónica, y puede ser interpretada en la valoración de la contribución relativa de cada variable a cada función canónica.

Si existe una correlación positiva entre dos variables, los vectores tendrán similar dirección, y mostrarán diversas direcciones en el caso de una correlación negativa. La longitud del vector relacionado indica qué tan bien la variación de la variable puede ser explicada en el espacio bidimensional. En otras palabras, cuanto más largo es un vector, mejor interpretación es posible sobre la variable que representa. Además, las formas de las elipses de la hipótesis (H) y del error (E) en las gráficas HE brinda información acerca de la distribución de los datos y las dimensiones canónicas. Si el círculo de la hipótesis es anular significa que la variación total es explicada por ambas dimensiones canónicas igualmente, mientras que si es un elipsoide plano entonces significa que la primera dimensión explica una proporción mayor que la segunda dimensión. El diámetro del círculo del error indica la tasa de error de la hipótesis, y los niveles de los factores ubicados dentro de este círculo tienen una alta tasa de error.

Los valores obtenidos para cada una de las nueve respuestas estudiadas fueron sometidos a análisis exploratorios de datos. Los resultados demostraron que ninguna variable presentó desvíos significativos con relación a las suposiciones de normalidad y homogeneidad de varianzas, indicando ausencia de limitaciones para la realización del análisis de la varianza de los datos. Se comprobó que el vector de errores tiene distribución multinormal, verificado por las pruebas de Mardia y Henze-Zirkler usando el macro Multnorm del SAS versión 8 (SAS, 1999), el cual reporta además las pruebas de Shapiro-Wilk, para normalidad univariada y las pruebas multivariadas de Asimetría y Curtosis de Mardia y el estadístico T de Henze-Zirkler.

Con el ADC se generaron funciones canónicas que posibilitaron la separación de los tres tipos de aguas, lo cual puede ser verificado a través de la distancia D2 de Mahalanobis entre las medias (centroides) de los tipos de aguas. Las mismas se muestran en el Cuadro 1.

Los valores de D2 indican que la mayor distancia ocurrió entre las aguas de YAC y POZO y la menor entre YAC y DCE, y aunque la distancia entre las aguas de YAC y DCE fue la más pequeña (D2= 23.64), las medias entre las tres aguas difieren significativamente entre sí (p< 0.01), lo que indica que el grado de separación entre las mismas es relativamente grande.

El análisis multivariante reveló un efecto significativo para los tratamientos. El contraste global basado en el estadístico Lambda de Wilks tiene un valor de 0.005, el cual se distribuye como una F con 18 y 50 grados de libertad y un valor de p< 0.01; indicando que el contraste multivariante para diferenciar entre los tipos de agua es altamente significativo considerando las nueve respuestas simultáneamente. En el Cuadro 2, se resumen los resultados del análisis discriminante canónico.

Se puede ver que la proporción explicada por el primer eje canónico es de 0.988; indicando esto que la primera variable canónica (Can 1) representa 98.8% de la varianza total, lo cual coincide con la premisa básica del ADC que establece que la primera función canónica debe expresar la máxima variación entre los tratamientos. Se presentan también los valores de correlación canónica de cada variable canónica con los tipos de agua, resultando ambas significantes (p< 0.01) indicando que las dos variables canónicas pueden explicar la diferenciación de las tres aguas, siendo Can 1 (0.99) la función canónica que posee el mayor poder discriminante.

En el Cuadro 3, se reportan los coeficientes de la estructura canónica total de las 9 variables evaluadas sobre las dos funciones canónicas para los tipos de agua. La matriz de estructura canónica total contiene las correlaciones entre las variables y las funciones discriminantes canónicas, donde se examinan las correlaciones simples entre las variables originales y las funciones canónicas. Los pesos canónicos reflejan la varianza que la variable observada comparte con la función canónica, y puede ser interpretada en la evaluación de la contribución relativa de cada variable a cada función canónica.

Se observa que la primera variable canónica está dominada por un valor grande para Mg (0.99), seguido por Cl (-0.88), Ce (0.87), SO4 (0.86), Na (0.84) y Ca (0.49). La segunda variable canónica está dominada por Ca (0.38) y Na (-0.33), evidenciando que la calidad de las tres aguas difiere principalmente en Mg, Cl, Ce, SO4, Na y Ca, y son responsables de una porción importante de la discriminación entre los tres tipos de agua.

Los coeficientes R2 que indican la proporción de variabilidad explicada de cada vector variable, siendo Mg con un valor de 0.97 el vector variable con mayor proporción de explicación, seguido de Cl, Ce, Na y SO4. Esta explicación se ve reflejada en las gráficas HE canónica y de estructura discriminante canónica ilustrada en las Figuras 1 y 2, en las que la proyección discriminante canónica toma en cuenta la más grande variación entre las medias de los tres tipos de agua relativa al error.

Es aparente que la estructura de las medias es esencialmente unidimensional con 98.8% de la variación, explicada por grandes diferencias entre las tres aguas, principalmente sobre las variables Mg, Ce, SO4 y Na, y en menor medida, Ca, las cuales tienen correlación positiva con la primera variable canónica y Cl, que tiene correlación negativa. Es decir, 98.8% de la variación en las medias de las tres aguas es explicada por una sola dimensión canónica, que corresponde a valores grandes para POZO, y pequeñas para YAC y DCE sobre Mg, Cl, Ce, SO4 y Na y moderado para Ca.

El orden y separación de las medias de los tratamientos sobre las dos variables canónicas indica que Can 1 discrimina los tres tipos de agua, mientras que Can 2, sólo discrimina entre las aguas de YAC y DCE. Se observa que la mayor parte de la variación entre las aguas (98.8%) puede ser explicada por las diferencias entre las aguas de YAC y POZO y entre DCE y POZO, donde esta última es alta en los contenidos de Mg, Na, Ce y SO4.

En la Figura 2, se muestra la gráfica de la estructura discriminante canónica. En la misma están representados conjuntamente los individuos, los tratamientos y las variables, así como los círculos de confianza alrededor de la media de cada tratamiento que permite comparar gráficamente las tres aguas.

Ésta gráfica muestra que la primera dimensión canónica está reflejando las diferencias entre los tratamientos, con 98.8% de la variación. Se observa que los círculos de confianza no se interceptan, lo que significa que hay diferencias entre los tres tipos de agua; principalmente sobre el primer eje canónico. Las aguas de YAC y POZO son diferentes en Mg, Cl, SO4, Ce y Na, porque al proyectar sus círculos de confianza sobre el vector que representa a esas variables, las proyecciones son disjuntas. Lo mismo se puede decir de las aguas de DCE y POZO sobre las variables Mg, Cl, SO4, Ce y Ca. La variable que más influye en la separación de las aguas de YAC y POZO es Mg, porque el vector que representa esta variable es casi paralelo a la recta que pasa por los centroides de ambos. Para la separación de DCE y POZO, las variables que más influyen son SO4 y Mg, y para la separación de YAC y DCE Cl y Na. Las variables con mayor correlación con el primer eje canónico son Mg, Cl, Ce, SO4 y Na y con el segundo eje Ca y Na. Por tanto, las variables Mg, Cl, Ce, SO4, Na y Ca, son las que presentan la mayor proporción de varianza explicada (R2) con los dos ejes canónicos.

 

Conclusiones

Debido a la importancia que tiene conocer cómo es el agua que se utiliza para regar, especialmente si proviene de diferentes fuentes, en el presente artículo se discriminan claramente los tres tipos de agua, según sus atributos químicos. Los resultados muestran que el análisis discriminante canónico con las gráficas HE y de estructura canónica usadas conjuntamente, permitieron identificar relaciones importantes entre las variables respuestas y los tratamientos evaluados de una manera resumida y compacta, brindando una buena alternativa para analizar datos de este tipo de estudios. Latécnica permitió diferenciar claramente los tratamientos e identificar las variables más importantes en la discriminación de los tres tipos de agua. Las variables evaluadas que más influyen en la separación de las tres aguas, fueron Mg, Cl, Ce, SO4, Na y Ca, y estas diferencias están básicamente sobre el primer eje canónico. El agua de Pozo se diferencia grandemente de las aguas de Yacambú y de la de Dos Cerritos, y está relacionada principalmente con las variables Mg, Ce, Na y SO4.

 

Literatura citada

Afifi, A. A. and Clark, V. 1996. Computer-aided multivariate analysis. 3th. Chapman and Hall, London.         [ Links ]

Amaro, R.; Vicente Villardón, J. L. y Galindo Villardón, M. P. 2004. MANOVA-Biplot para arreglos de tratamientos con dos factores basado en modelos lineales generales multivariantes. Interciencia, 29(1):26-32.         [ Links ]

Egesel, C. O.; Kahnman, F. and Güi, M. K. 2011. Discrimination of maize inbreds for kenel quality traits and fatty acid composition by a multivariate technique. Acta Sci.Agron. Maringá, 33 (4): 613-620.         [ Links ]

Friendly, M. 2006. Data ellipses, HE plots and reduced-rank displays for multivariate linear models: SAS Software and Examples. J. Statis. Software. 17(6):1- 43.         [ Links ]

Friendly, M. 2007. HE plots for multivariate general linear models. J. Comp. Graph. Statistics.16:1-23.         [ Links ]

Onofri A. e E, Ciriciofolo. 2004. Characterisation of yield quality in durum wheat by canonical variate anaysis. Proceedings VIII ESA Congress Ëuropean Agriculture in a global context", Copenhagen, 11-15 July 2004. 541-542 pp.         [ Links ]

Statistical Analysis System (SAS) Institute. 1999. SAS user's guide. Statistics. Version 8. SAS Inst., Cary, NC. USA. Quality, and elemental removal. J. Environ. Qual. 19:749-756.         [ Links ]

Vaylay, R. and van Santen, E. 2002. application of canonical discriminant analysis for the assessment of genetic variation in tall fescue. Crop Sci. 42:534-539.         [ Links ]

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License