SciELO - Scientific Electronic Library Online

 
vol.1 issue4Modeling the hydrological response to climate change: experiences from two south-central Chilean watershedsIrrigation systems in the Huamuxtitlán Ravine: tradition and present time author indexsubject indexsearch form
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • Have no similar articlesSimilars in SciELO

Share


Tecnología y ciencias del agua

On-line version ISSN 2007-2422

Tecnol. cienc. agua vol.1 n.4 Jiutepec Oct./Dec. 2010

 

Artículos técnicos

 

Predicción no lineal de caudales utilizando variables macroclimáticas y análisis espectral singular

 

Nonlinear river flow prediction using macroclimatic variables and singular spectral analysis

 

Julián David Rojo-Hernández, Luis Fernando Carvajal-Serna

 

Universidad Nacional de Colombia.

 

Dirección institucional de los autores

Ing. Julián David Rojo-Hernández
Ing. Luis Fernando Carvajal-Serna

Universidad Nacional de Colombia
Escuela de Geociencias y Medio Ambiente
Carrera 80 núm. 65-223, bloque M2 Oficina 301
Medellín, Colombia
teléfonos: +57 (4) 5710 147 y 8634 073
fax: +57 (4) 4255 100
jdrojoh@gmail.com,
jdrojoh@unal.edu.co
lfcarvaj@unalmed.edu.co,
lfcarvaj@bt.unal.edu.co

 

Recibido: 24/04/09
Aprobado: 02/06/10

 

Resumen

La estrecha relación no lineal entre la hidrología colombiana y los procesos climáticos globales justifican el estudio de modelos no lineales de predicción. Este estudio presenta la dinámica no lineal de los caudales de los ríos de Colombia, utilizando un modelo periódico de predicción basado en el Análisis Espectral Singular (AES). El modelo periódico fue desarrollado y aplicado para ventanas de predicción de tres y seis meses. Se hacen comparaciones para los casos univariado y multivariado; este último incluye variables macroclimáticas. El modelo propuesto se estudia a través del análisis de componentes principales, la estructura de correlación con variables macroclimáticas y parámetros de reconstrucción de las series. Los esquemas desarrollados con base en el AES se aplican a las series de caudales mensuales de los ríos San Carlos, Río Grande II, Guatapé, Magdalena, Guavio y Batá. Los resultados indican que los modelos propuestos reproducen aceptablemente las principales características estadísticas de las series de caudales, obteniéndose predicciones cercanas a las observaciones históricas; además, la inclusión de variables macroclimáticas en el esquema multivariado mejora de forma significativa la capacidad de predicción.

Palabras clave: Análisis Espectral Singular (AES), modelación de series de tiempo, predicción no lineal de caudales, predicción con variables exógenas.

 

Abstract

The close nonlinear relationship between Colombian hydrology and global climatic processes justifies the study of nonlinear river flow models. This paper shows the nonlinear river flow dynamics in Colombia using a periodic prediction model based on the Singular Spectrum Analysis (SSA). The prediction window length is 3 and 6 months. The prediction includes both univariate and multivariate cases. The multivariate case takes into account macro-climatic variables. The proposed model is studied through the Principal Component Analysis, the correlation structure between macro-climatic variables and river flow time series and the reconstruction of series. This model is applied to the San Carlos, Riogrande II, Guatapé, Magdalena, Guavio, and Batá rivers. The results show an improvement in river flow prediction and indicate that river flow multivariate prediction using macro-climatic variables is better.

Keywords: Singular Spectral Analysis (SSA), time series modeling, nonlinear river flow prediction, prediction with exogenous variables.

 

Introducción

Para el sector productivo de un país, la predicción de caudales medios mensuales es un insumo de gran importancia para operar y optimizar el recurso hídrico, y valorar los beneficios económicos derivados de la aplicación de tales predicciones (Smith et al., 2004; Mesa et al., 1995).

La utilización del Análisis Espectral Singular (AES) en la predicción de caudales medios mensuales en Colombia se remonta al año 1994, cuando Carvajal, con base en el trabajo de Vautard et al. (1992), propuso utilizar la descomposición en componentes principales, ajustando a cada componente un modelo auto-regresivo tipo AR para su predicción y luego reconstruir la serie; desde entonces, la predicción con AES ha incorporado el uso de regresiones lineales múltiples sobre componentes principales o componentes reconstruidas, involucrando variables macroclimáticas rezagadas en el tiempo (Carvajal et al., 1998; Poveda et al., 2002).

El presente trabajo muestra la dinámica no lineal de los caudales de los ríos de Colombia, utilizando un modelo periódico de predicción basado en el Análisis Espectral Singular. Este documento posee una síntesis del AES y el uso de dicha técnica para estudiar los ciclos que influyen sobre la dinámica de las series de caudales mediante el análisis de las componentes principales (ACP). Se utiliza el AES para reconstruir las series de caudales y encontrar relaciones entre las series reconstruidas y las variables macroclimáticas mediante la estimación de los coeficientes de correlación; con base en las observaciones se desarrolla un esquema periódico de predicción y por último se comentan los resultados.

 

Datos

A continuación se hace una breve descripción de los datos de caudal y variables macroclimáticas empleadas en este trabajo.

Series de caudales

Se seleccionaron estaciones de caudales con más de cuarenta años de registro de seis ríos de la geografía colombiana: Nare, Río Grande, San Carlos, Magdalena, Guavio y Batá. La figura 1 presenta la localización de las estaciones y los respectivos ciclos anuales de caudales. Las series de caudales han sido estandarizas por su respectiva media y desviación estándar mensual.

Variables macroclimáticas

Algunos de los índices macroclimáticos obtenidos del National Climatic Data Center (http://www.cdc.noaa.gov/data.noaa.ersst.html) de los Estados Unidos son descritos en el cuadro 1. Las correlaciones entre el MEI y las diferentes variables macroclimáticas se presentan en la figura 1.

 

Análisis Espectral Singular

El Análisis Espectral Singular (AES) es usado en estudios climáticos para referirse a la aplicación univariada del Análisis de Componentes Principales (ACP) en el tiempo y es equivalente a aplicar las Funciones Ortogonales Empíricas a series de tiempo univariadas. El AES trata de capturar la evolución del sistema en el espacio de fases y la implementación del método procede de manera análoga a la reconstrucción artificial de la evolución de las trayectorias en un sistema no lineal sensible a condiciones iniciales (Ghil et al., 2002).

Vautard et al. (1992) describieron el Análisis Espectral Singular (AES) para una serie estandarizada de tiempo Xi, donde i varía de 1 hasta N (cantidad total de datos). Si se asume una ventana de visualización M puede formarse una matriz de covarianzas denominada matriz de Toeplitz (Tx), cuyas componentes son los coeficientes de covariancia de la serie con cada uno de los M rezagos a visualizar (Carvajal, 1994), calculada como:

A la matriz cuadrada Tx se le hallan sus valores propios λk, resolviendo el sistema (Tx - λkl) x = 0; posteriormente se encuentra una base ortogonal, cuyas direcciones corresponden a los vectores propios Ek asociados con los autovalores de la matriz Tx; estos vectores Ek son denominados Funciones Ortogonales Empíricas (FOEs); la proyección de la serie original sobre cada FOE permite encontrar las componentes principales mediante la expresión (2) (Carvajal, 1994):

Las CP son procesos de longitud N -M + 1, considerados como un promedio móvil ponderado del proceso Xi, pero para obtener componentes que posean la misma longitud de la serie original debe hacerse una reconstrucción de las CP utilizando la expresión (3):

las cuales se conocen como componentes reconstruidas (CR) de la serie. Expresiones para Xik con i < M e i > N - M + 1 pueden hallarse en Vautard et al. (1992). La ortogonalidad en tiempo (covarianza cruzada igual a cero para dos CP en el rezago cero) y el espacio (ortogonalidad de las FOE) implican que λk (autovalor k de la matriz de la matriz de Toeplitz) representa la varianza de la k-ésima CP. Si se reduce la información a las primeras p CP podemos obtener una serie que omite gran parte del ruido, dado que las primeras p componentes describen la mayor parte varianza total acumulada, conservando la esencia de la serie (Carvajal, 1994).

Para la implementación del análisis espectral multivariado que considere L sitios (o L variables) con información del campo por estudiar, la expansión de las CP en las FOE está dada por la expresión:

 

Metodología

Las series de caudales representan un sistema dinámico y por tanto pueden ser descritas como una combinación lineal de diferentes osciladores. Mediante una proyección de la serie de caudales sobre sus FOEs se encuentran las componentes principales (CP) (expresión (2)), las cuales, al ser analizadas en el dominio del tiempo y la frecuencia, permiten determinar modos dominantes de oscilación que puedan ser asociados con diversos eventos macroclimáticos. Se trata entonces de utilizar dicha información para reconstruir las series de caudales con base en componentes de baja frecuencia, con periodos alrededor de cuatro y seis años, además de aquellas cuyos periodos correspondan a ciclos anuales o semi-anuales (Plaut y Vautard, 1994).

Cuando se utiliza el análisis espectral singular con un tamaño de ventana M para reconstruir las series, existen M formas diferentes de reconstruir una señal, por lo que se debe establecer una metodología tendiente a determinar la cantidad de componentes y el tamaño de la ventana (M) necesarios para que la serie reconstruida represente de manera idónea la influencia del macroclima sobre los caudales.

Cabe anotar que para la predicción de la hidrología es vital involucrar la influencia de las diferentes variables macroclimáticas, cuantificando el grado de dependencia lineal entre tales variables a través de coeficientes de correlación a distintos rezagos de tiempo (Mesa et al., 1997). Entre mayores sean los coeficientes de correlación, mayor será la capacidad de la serie para representar los cambios debidos al macroclima; luego, se pretende estimar la cantidad de varianza y el valor de M necesarios para reconstruir las series y obtener mayores coeficiente de correlación entre las series de caudales reconstruidas y las variables macroclimáticas.

Una vez ajustados tamaño de ventana y porcentaje de varianza, según el macroclima, la serie reconstruida (filtrada) mediante la aplicación del AES se ordena formando vectores columna para cada mes, y sobre ésta se ajusta un modelo auto-regresivo periódico de orden tres, usando una regresión lineal múltiple que permite definir los parámetros para predecir cada mes. Para predecir el mes t se requieren los meses en t-1, t-2 y t-3. Por tanto:

La serie reconstruida puede utilizar el AES univariado o multivariado; el primero corresponde al análisis hecho solamente a la serie de caudales y el segundo asume que el problema posee L variables que son la serie de caudales y los índices macroclimáticos rezagados un tiempo t. Para este último caso se espera que la serie reconstruida a partir de las componentes multivariadas represente mejor la influencia del macroclima sobre la hidrología.

Una vez concluida la calibración, se cuantifica la capacidad de predicción que tiene el modelo mediante la comparación de los caudales observados o históricos con los caudales pronosticados en un periodo de validación. Dicha evaluación se hace mediante la siguiente expresión:

Donde k es el número de años de validación y Qmed es el valor promedio del mes predicho en los años de validación. Esta expresión define el error porcentual de un valor simulado del mes j con respecto al valor real de dicho mes, iniciando las predicciones desde un mes i, en t años de validación. Se construye entonces el cuadro de errores en la validación, con ventanas de tres y seis meses. El promedio de los errores de validación puede ser usado como un índice para cuantificar la capacidad de predicción del modelo.

 

Análisis de resultados

Análisis de componentes principales

En el cuadro 2 se presentan los resultados del análisis de frecuencia de los diferentes componentes principales de los ríos analizados mediante el espectro de Fourier y la trasformada en onditas (Torrence, 1998).

En términos generales puede notarse que las primeras componentes principales representan la mayor cantidad de la varianza, y sus modos de vibración corresponden a periodos grandes entre los 128 y 64 meses (diez y cinco años, aproximadamente) para la primera componente principal; el periodo de la segunda componente varía entre los 64 y 32 meses (entre tres y cinco años), y la tercera varía entre los 32 y 12 meses. Las siguientes tres componentes poseen periodos que oscilan entre los ocho y los cuatro meses; por último, las demás componentes poseen periodos que van entre los cuatro y los dos meses.

A manera de diagnóstico, se pueden relacionar los periodos de las primeras componentes con los ciclos que poseen las variables macroclimáticas cuya influencia es de carácter interanual, como por ejemplo la PDO (diez años), el ENSO (entre tres y cinco años), el ciclo anual y semi-anual; los periodos 12 y 4 meses de las otras tres componentes siguientes pueden estar relacionados con variaciones intranuales, como el paso de la zona de convergencia intertropical (ZCIT) y los diferentes periodos de verano e invierno en el país. Las componentes de alta frecuencia pueden relacionarse con variables como las oscilaciones de Madden-Julian (de uno a tres meses) (Arias, 2005) y las ondas del este (Poveda, 2004).

 

Cantidad de varianza para reconstruir las series

Para los diferentes tamaños de ventana (M) se elaboraron gráficas que muestran la variación de los máximos coeficientes de correlación con la cantidad de varianza utilizada para reconstruir la serie (ver figura 2 para el caso del Río Grande).

Las observaciones permiten afirmar que independiente del tamaño de la ventana, las máximas correlaciones se obtienen a partir de series reconstruidas con base en las primeras componentes principales. Para la mayoría de los índices macroclimáticos, los máximos coeficientes de correlación se obtienen a partir de series reconstruidas con un 50 y 70% de la varianza de la serie de original en los ríos de ciclo bimodal (Río Grande, Nare y San Carlos). Para aquellos ríos unimodales (Magdalena en Betania, Guavio y Batá), los máximos coeficientes de correlación se obtienen a partir de series reconstruidas con un 25 y 45%. En el cuadro 3 se presentan los porcentajes de varianza requeridos para reconstruir las series y obtener las máximas correlaciones con los índices macroclimáticos para los ríos que se analizan en este trabajo.

 

Sensibilidad al tamaño de la ventana

El valor de la ventana M determina la longitud de la periodicidad que es capaz de capturar el análisis espectral singular (Kondrashov y Gil, 2006). Sabemos que los ríos de Colombia poseen un ciclo anual marcado de carácter netamente astronómico, que incluso puede dividirse en periodos trimestrales o semestrales, puesto que existen dos temporadas lluviosas y dos secas o de poca precipitación, definidos como ciclos bimodales; en otras regiones, como el oriente colombiano, la humedad procedente de la Amazonia influye de forma tal que los ríos poseen un ciclo unimodal durante todo el año. Sin embargo, eventos de fenómenos de gran escala y carácter interanual como el ENSO modulan la hidrología colombiana con una frecuencia de tres, cinco y diez años. Como los datos de la series de caudales son mensuales y teniendo en cuenta las frecuencias encontradas que influyen sobre la climatología colombiana, se han definido los tamaños de ventana M de 3, 6, 12, 24, 36 meses, que permitan capturar la variabilidad intra-anual e inter-anual de los fenómenos que modulan las series de caudales.

Los resultados muestran que los máximos coeficientes de correlación aumentan con el tamaño de la ventana de manera asintótica; es decir, inicialmente son bajos, pero en la medida en que aumenta el tamaño de la ventana, el máximo coeficiente de correlación tiende a ser constante, pues no presenta una variación significativa. La figura 3 muestra resultados de la variación de los coeficientes de correlación para algunos de los ríos que se analizan en este documento.

 

Metodología para reconstruir las series

Teniendo en cuenta los análisis que se incluyen en las secciones "Análisis de componentes principales" y "Cantidad de varianza para reconstruir las series", se propone que para reconstruir las series de forma tal que se obtengan los máximos coeficientes de correlación entre las variables macroclimáticas y las series estandarizadas de caudales se debe utilizar una ventana (M) de 12 meses para capturar variaciones relacionadas con eventos de carácter interanual. Para los ríos unimodales, se debe reconstruir, privilegiando entre el 25 y el 45% de la varianza, y para los ríos bimodales entre el 50 y el 70%.

Cuando se filtra una serie mediante Análisis Espectral Singular (AES), los coeficientes de correlación entre los caudales y los índices de variables macroclimáticas mejoran en porcentajes que pueden ir desde un 20 hasta un 120%, según el grado de influencia de las variables macroclimáticas en relación con las diferentes regiones del país.

 

Calibración y validación

Cuando se aplica el análisis espectral singular a la serie estandarizada y se reconstruye dicha serie utilizando las primeras dos o tres componentes para un tamaño de ventana de 12 meses (figura 4), la nueva serie filtrada posee propiedades lineales muy fuertes tanto de auto-correlación como con las variables macroclimáticas. Los parámetros de los modelos periódicos obtenidos se presentan en el cuadro 4. El periodo de validación comprende desde enero de 1996 hasta diciembre de 2006. Los esquemas de las series históricas, conjuntamente con las series predichas para ventanas de tres y seis meses, se muestran en la figura 5. Los errores promedio de la validación por mes para todos los ríos se presentan en la figura 6 y en el cuadro 5 se muestra el error promedio total durante el periodo de validación tanto en el caso de AES univariado como multivariado.

 

Conclusiones

En las series de caudales, cada CP posee una frecuencia asociable con los ciclos de diferentes variables macroclimáticas, siendo las tres primeras componentes aquellas cuyos ciclos pueden relacionarse con la variabilidad interanual de la serie, dado que representan periodos de diez, cinco y un año, respectivamente; por el porcentaje de varianza aportada al proceso, se puede decir que son las que más contribuyen a la dinámica de la serie de caudales; en la mayoría de los casos, el ruido de la serie de caudales lo aportan aquellas componentes cuyos periodos son inferiores a un año asociadas con la variabilidad interanual de la serie.

Cuando las series de caudales se reconstruyen mediante un AES univariado (sólo caudales), tomando las primeras componentes, la serie reconstruida aumenta considerablemente su relación lineal con los índices macroclimáticos de carácter interanual como la PDO, el MEI y las anomalías de temperatura en la región Niño 3-4; por tanto, la serie de caudales refleja de manera más evidente las variaciones debidas a los fenómenos macroclimáticos de gran escala.

En cuanto a la relación existente entre las series de caudales y las variables macroclimáticas, el tamaño de la ventana se vuelve irrelevante cuando se utilizan tamaños mayores a 12 meses. Los resultados son básicamente los mismos que los obtenidos para 24 y 36 meses, según el análisis de sensibilidad para el tamaño de la ventana y por tanto se aconseja para cualquier análisis de series de caudales utilizar una ventana de 12 meses.

El modelo univariado es una buena aproximación para la predicción, sin embargo en ocasiones no logra representar adecuadamente la variabilidad de la serie y por tanto presenta mayores errores que si se consideraran las variables macroclimáticas. La utilización de variables macroclimáticas mejora la capacidad de predicción entre un 3 y 10%, aproximadamente. Permiten disminuir el error global y los errores mensuales hasta en un 5%, con respecto al error medio mensual. Por tanto, aunque los procedimientos gastan un poco más de tiempo y memoria del computador, los resultados se ajustan mejor en la validación a los datos históricos y los errores de validación disminuyen de forma significativa.

 

Referencias

ARIAS, P.A. Diagnóstico y predicción de la variabilidad intra-anual de la hidrología colombiana. Tesis de Maestría en Ingeniería-Recursos Hidráulicos. Medellín: Universidad Nacional de Colombia, 2005, pp. 10-207.         [ Links ]

CARVAJAL, L.F. Acerca de la predicción no lineal en hidrología. Tesis de Maestría. Medellín: Facultad de Minas, Universidad Nacional de Colombia, 1994, 136 pp.         [ Links ]

CARVAJAL, L.F., MESA, O. y POVEDA, G. Predicción hidrológica en Colombia mediante análisis espectral singular y máxima entropía. Ingeniería hidráulica en México. Vol. XII, núm. 1, enero-abril de 1998, pp. 7-16.         [ Links ]

GHIL, M., ALLEN, M., DETTINGER, M., IDE, M., KONDRASHOV, D., MANN, M., ROBERTSON, A., SAUNDERS, A., TIAN, Y., VARADI, F. and YIOU, P. Advanced Spectral Methods for Climatic Time Series. Review of Geophysics. American Geophysical Union. Vol. 40, no. 1. 2002, pp. 1-41.         [ Links ]

MESA, O., SMITH, R., SALAZAR, J.E. y CARVAJAL, L.F. Modelos de predicción de caudales para el sector eléctrico colombiano. Parte I. Avances en Recursos Hidráulicos, 3. Agosto de 1995. Medellín: Universidad Nacional de Colombia, Sede Medellín, Facultad de Minas, 1995.         [ Links ]

MESA, O.J., POVEDA, G. y CARVAJAL, L.F. Introducción al Clima de Colombia. Bogotá: Imprenta Universidad Nacional de Colombia, 1997, 390 pp.         [ Links ]

PLAUT, G. and VAUTARD, R. Spells of low-frequency oscillations and weather regimes in the Northern hemisphere. Journal of the Atmospheric Sciences. Vol. 51, no. 2, 1994, pp. 210-236.         [ Links ]

POVEDA, G. La hidroclimatología de Colombia: una síntesis desde la escala inter-decadal hasta la escala diurna. Rev. Acad. Colomb. Cien. Vol. 28, núm. 107, 2004, pp. 201-219.         [ Links ]

POVEDA, G., MESA, O.J., CARVAJAL, L.F., HOYOS, C.D., MEJÍA, J.F., CUARTAS, L.A. y PULGARÍN, A. Predicción de caudales medios mensuales en ríos colombianos usando métodos no lineales. Meteorología Colombiana. Vol. 6, 2002, pp. 101-110.         [ Links ]

SMITH, R.A., VÉLEZ, J.I., VELÁSQUEZ, J.D., CEBALLOS, A., CORREA, P.L., GÓEZ, C., HERNÁNDEZ, O.O., SALAZAR, L.F., y ZAPATA., E.C. Modelos de predicción de caudales mensuales para el sector eléctrico colombiano. Avances en Recursos Hidráulicos 11. Facultad de Minas, septiembre de 2004, pp. 91-102.         [ Links ]

VAUTARD, R., YIOU and GHIL. Singular-spectrum analysis: A toolkit for shot, noisy chaotic signals. Physica. D 58, 1992, pp. 95-126.         [ Links ]

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License