SciELO - Scientific Electronic Library Online

 
vol.2 número3Gobernabilidad del agua y género en el sector de la irrigación: Un estudio de caso en Chiapas, México índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay artículos similaresSimilares en SciELO

Compartir


Tecnología y ciencias del agua

versión On-line ISSN 2007-2422

Tecnol. cienc. agua vol.2 no.3 Jiutepec jul./sep. 2011

 

Notas técnicas

 

Transferencia de información de crecientes mediante regresión lineal múltiple

 

Transfer of flood information through multiple linear regression

 

Daniel Francisco Campos-Aranda
Profesor jubilado de la Universidad Autónoma de San Luis Potosí

 

Dirección institucional del autor

Dr. Daniel Francisco Campos-Aranda

Profesor jubilado de la Universidad Autónoma
de San Luis Potosí
Genaro Codina núm. 240
Col. Jardines del Estadio
78280 San Luis Potosí, S.L.P., México
campos_aranda@hotmail.com

 

Recibido: 08/07/09
Aprobado: 21/10/10

 

Resumen

Los registros de gastos máximos anuales (crecientes) permiten el dimensionamiento hidrológico de las obras hidráulicas de protección y de cruce. Lógicamente, entre mayores sean las series disponibles, más confiables serán sus estimaciones probabilísticas o predicciones. Por tal razón, en este trabajo se describe con detalle la técnica de transferencia de información de crecientes, mediante regresión lineal múltiple, para ampliar registros cortos con base en las series largas cercanas, revisando la conveniencia estadística de dicha transferencia. Se expone la formulación matemática de manera simple, al utilizar la solución matricial y se desarrolla un ejemplo numérico para ampliar la serie de la estación hidrométrica Platón Sánchez del río Tempoal en el estado de Veracruz, México, utilizando diversos registros cercanos. Por último, se formulan las conclusiones, las cuales destacan la sencillez del procedimiento y sugieren su aplicación sistemática.

Palabras clave: media, variancia, coeficiente de correlación múltiple, aleatoriedad, test de Shapiro-Wilk, río Tempoal.

 

Abstract

Maximum annual flow records (floods) are used for hydrologic dimensionality of hydraulic structures designed for protection and crossing. Logically, the longer the available series, the more reliable their probabilistic estimates or predictions. Thus, this work describes in detail the procedure for flood information transfer through multiple linear regression. Short records are enlarged based on longer nearby series, examining the statistical advantage of said transfer. The mathematical formulation is presented in a simple way using a matrix solution and a numerical example is developed to enlarge the series at the Platón Sánchez hydrometric station on the Tempoal River in the state of Veracruz, using several nearby records. Lastly, the conclusions are formulated, which point out the simplicity of the procedure and suggest its systematic application.

Keywords: mean, variance, multiple correlation coefficient, randomness, Shapiro-Wilk test, Tempoal river.

 

Introducción

La planeación, diseño y manejo de los proyectos de recursos hidráulicos se basa en los registros históricos climáticos e hidrológicos, tales como precipitaciones, evaporaciones, escurrimientos líquidos y sólidos, y crecientes. Desafortunadamente, los registros históricos son comúnmente de corta extensión y por ello pueden fallar en proporcionar una estimación confiable de la variabilidad del fenómeno hidrológico estudiado (Salas et al., 2008).

Por lo anterior, resulta importante buscar fuentes de datos adicionales y técnicas de extensión de los registros que permitan obtener series más largas. Las fuentes comunes de información para ampliar registros cortos son otros registros largos cercanos, o bien series amplias de precipitación disponibles dentro de la zona estudiada. Respecto a los procedimientos desarrollados para extender registros cortos, la mayoría son estadísticos basados en la correlación que puede existir entre las series utilizadas; presentando dos objetivos al realizar la extensión, uno busca mejorar la estimación de los parámetros poblacionales (media y variancia) del registro corto y el otro intenta mantener o preservar sus estimaciones (Salas et al., 2008).

Tomando en cuenta que comúnmente los registros cortos conducen a estimaciones inexactas de los parámetros poblacionales, el propósito de toda extensión de un registro consiste en mejorar la confiabilidad de sus estimaciones, a través de reducir su variabilidad (Gilroy, 1970); ya que una estimación θ1 de un parámetro estadístico 8 se dice que es más confiable que otra θ2 de θ, si E(θi) = θ, con i = 1, 2 y Var(θ'1) < Var(θ'2).

El objetivo de este trabajo consiste en exponer con detalle la técnica de transferencia de información de crecientes (gastos máximos anuales), mediante regresión lineal múltiple, para ampliar registros cortos con base en las series largas cercanas, revisando la conveniencia estadística de dicha transferencia. Se presenta la formulación matemática de manera simple al utilizar la solución matricial y se desarrolla un ejemplo numérico en la cuenca del río Tempoal, de la Región Hidrológica 26 (Pánuco), de México, para ampliar el registro de la estación hidrométrica Platón Sánchez, empleando diversos registros cercanos de tal cuenca.

 

Desarrollo

Modelo matemático

La regresión lineal múltiple es aplicada para transferir información de gastos máximos anuales (crecientes) a una localidad con registro corto, cuando existen dos o más sitios cercanos que tienen registros largos. Considerando que la serie corta tiene una extensión de n1 años, es representada por la variable dependiente y y se tienen p registros de tamaño n1 + n2 representados por el vector x; es decir, que se tiene el siguiente arreglo:

en el cual, las observaciones en los diferentes instantes o puntos en el tiempo son independientes. Además, como es lo usual en estadística, se acepta que todos los gastos proceden de una población Normal multivariada, o bien que ellos pueden ser transformados para seguir tal distribución, con parámetros: y R, en donde y son los valores poblacionales de la media y la variancia de xi, respectivamente, para i = 1, 2, p; μy y son las magnitudes poblacionales de la media y variancia de y, y R es el coeficiente de correlación múltiple poblacional (Gilroy, 1970; Salas, 1993).

Entonces, para transferir información de crecientes desde las p estaciones hidrométricas con registros de tamaño n1 + n2 al sitio con la serie corta y, y además mejorar las estimaciones de sus parámetros μy y , se usa el siguiente modelo de regresión múltiple que relaciona a yt con los p registros de xt (Gilroy, 1970; Salas, 1993):

para el cual, la constante y los coeficientes se obtienen mediante el arreglo matricial siguiente (Campos-Aranda, 2003):

es decir:

Las otras variables de la ecuación (1) asociadas con el término de ruido son (Salas, 1980):

ya definido como el coeficiente de correlación múltiple, siendo s1(y) la dispersión de la variable dependiente y Se2 es la suma de los cuadrados de los residuos, es decir (Campos-Aranda, 2003):

con:

El factor α es el requerido para obtener una estimación insesgada de σy; su expresión es (Salas, 1980):

El factor θ es igual a la unidad si el término de ruido es considerado, de otra manera es cero; caso común cuando se transfiere información de crecientes. Finalmente, εt es una variable Normal con media cero y variancia unitaria (Salas, 1980, 1993).

 

Criterios para mejorar los parámetros

Al aplicar la ecuación (1) para extender el registro corto y, se obtiene la secuencia:

a partir de la cual se obtienen la nueva media y la variancia Estos nuevos parámetros tendrán menor variancia y por lo tanto serán mejores estimaciones muestrales de los valores poblacionales si el coeficiente de correlación múltiple (R) excede ciertos límites. Para la media, su valor crítico está dado por (Gilroy, 1970; Salas, 1980, 1993):

en las columnas (1) del cuadro 1 se muestran los valores críticos de R para diversas magnitudes de n1 y de p. Para la variancia, el valor crítico de R tiene una expresión que es función de n1, n2, θ y p (Gilroy, 1970; Moran, 1974; Salas, 1993). Sin embargo, cuando θ = 0, prácticamente no varía con n2, por ello en las columnas (2) del cuadro 1 se presentan sus valores críticos para n2 = 60.

 

Descripción del sistema de río Tempoal

Al río Tempoal lo forman los ríos Hules y Calabozo, cuyas cuencas de drenaje inician en la frontera del bajo Pánuco (Región Hidrológica 26 Parcial), en los estados de Hidalgo y Veracruz; están aforados por las estaciones hidrométricas Los Hules y Terrerillos, respectivamente. El río Tempoal tiene un recorrido de sur a norte y es uno de los colectores más importantes del río Moctezuma, al que se le une por la margen derecha en el poblado de El Higo, Veracruz. Antes de la estación hidrométrica Tempoal, última del sistema, le llega por margen izquierda el río San Pedro, aforado en la estación El Cardón. Finalmente, cerca del poblado de Platón Sánchez, en Veracruz, está la estación hidrométrica del mismo nombre sobre el río Tempoal. En la figura 1 se muestra la ubicación del sistema del río Tempoal.

 

Información hidrométrica disponible y su procesamiento

Las áreas de cuenca de las cinco estaciones de aforos citadas: El Cardón, Los Hules, Terrerillos, Platón Sánchez y Tempoal son, respectivamente: 609, 1 269, 1 493, 4 700 y 5 275 km2. El registro de gastos máximos anuales de la estación Tempoal comienza en 1954 y los del resto en 1960, teniendo disponibles tales series hasta 2002 en el sistema BANDAS (IMTA, 2003). En el cuadro 2 se presenta la información que será procesada para completar el registro de la estación hidrométrica Platón Sánchez en el periodo de 1960 a 1977 (n2 = 18 años).

Respecto a los datos faltantes de las estaciones Los Hules (1990 y 1991) y Terrerillos (1981), se intentó deducirlos con base en una regresión entre ambos registros, pero el diagrama de dispersión indica que no existe tal relación. Los datos faltantes de la estación El Cardón (1998 y 2000) tampoco se pudieron ser estimados con cierta garantía. Por lo anterior, el periodo común (n1) queda definido en veinte años, en el periodo 1978 a 2002, con los cinco años citados excluidos.

Todos los registros disponibles (cuadro 2), tanto de su periodo completo como de 1978 a 2002, se probaron para verificar su aleatoriedad, ausencia de componentes determinísticas y procedencia de una población Normal. Se aplicaron las pruebas de persistencia, de Kendall, de von Neumann, de Cramer (Campos-Aranda, 1992) y de Shapiro-Wilk (Shapiro y Wilk, 1965; Ruiz-Maya, 1977). Todas las pruebas se realizaron con un nivel de significancia del 5% (95% de confiabilidad).

Se encontró que todos los registros presentan aleatoriedad, es decir, son valores independientes, no presentan componentes determinísticas y no proceden de poblaciones Normales. Debido a esto último, las regresiones que se analizan se realizaron con base en los valores logarítmicos de los datos, que es la situación común en los estudios de transferencia de información de crecientes. Se utilizaron logaritmos naturales.

 

Regresiones lineales efectuadas

Primeramente se realizaron cuatro regresiones lineales univariadas en el periodo 1978-2002 entre Platón Sánchez y cada una de las otras cuatro estaciones hidrométricas, los coeficientes de correlación (rxy) obtenidos fueron: con resultados son consistentes, ya que las crecientes que mide la estación El Cardón (EC) no tienen relación con las de Platón Sánchez (PS); por el contrario, la estación Tempoal (TP) está aguas abajo, de cuya área de cuenca la estación con registro corto afora el 89.1%. En el cuadro 3 se presentan las estimaciones de gasto máximo anual en PS con esta última estación, cuya ecuación de regresión resultó:

Las siguientes regresiones probadas y sus coeficientes de correlación múltiple fueron: (I) Terrerillos (TR) y Tempoal con PS, obteniéndose 0.9583, y (2) Los Hules (LH) y Tempoal con PS, conduciendo a 0.9626, con la expresión siguiente:

En el cuadro 3 se tienen las estimaciones de gasto máximo anual en PS con la ecuación (II).

Finalmente se realizaron otras dos regresiones múltiples, la primera con tres estaciones auxiliares y la segunda con las cuatro. Los resultados fueron:

cuyos coeficientes R son 0.9640 y 0.9693, respectivamente. Nuevamente en el cuadro 3 se exponen las ampliaciones de registro en PS con estos dos modelos de regresión.

 

Análisis de los resultados

La estación hidrométrica Tempoal, por su ubicación aguas abajo de la estación Platón Sánchez, es una opción muy conveniente para realizar la transferencia de información, como lo demuestra su coeficiente de correlación (rxy), con un valor de 0.9556, el cual es muy superior a los mínimos requeridos para mejorar la estimación de la media y la variancia, que son 0.236 y 0.469, respectivamente, según el cuadro 1.

Conforme se utiliza más información de las estaciones de aforos cercanas la transferencia mejora, como lo demuestra el valor cada vez mayor de R, hasta el máximo alcanzado de 0.9693, obtenido al utilizar las cuatro estaciones auxiliares (ecuación (13)). Para este caso, los valores críticos de R son 0.471 y 0.695, mismos que son superados ampliamente, por lo cual es conveniente la transferencia de información.

Por otra parte, con base en los resultados del cuadro 4 mostrados en sus columnas 3 y 5, se concluye que los parámetros estadísticos de la estación de aforos Platón Sánchez se conservan con la transferencia, disminuyendo ligeramente la media y el coeficiente de variación, y aumentando sensiblemente los coeficientes de asimetría y curtosis. Además, se conserva la escasa persistencia negativa, es decir, que la serie extendida también muestra una secuencia de valores grandes seguidos por magnitudes reducidas.

 

Conclusiones

La transferencia de información de gastos máximos anuales mediante regresión lineal múltiple para ampliar un registro corto con base en las series largas cercanas es una técnica sencilla y su conveniencia estadística puede ser verificada fácilmente. El uso de esta técnica permite obtener registros con un periodo común, lo cual es necesario para aplicar ciertos procedimientos de los análisis regionales de estimación de crecientes.

Además, el registro ampliado garantiza una mejor estimación de los parámetros estadísticos (media y variancia) poblacionales, lo cual conducirá a una mayor exactitud de los análisis probabilísticos orientados a J obtener las predicciones o avenidas de diseño. Por lo anterior, se recomienda su aplicación sistemática antes de iniciar un análisis de frecuencia de crecientes, ya sea con métodos locales o regionales.

 

Referencias

CAMPOS-ARANDA, D.F. Estudios de homogeneidad en 34 estaciones pluviométricas del altiplano Potosino. XII Congreso Nacional de Hidráulica (AMH). Tema 5: Investigación y Tecnología, Ponencia 5.29, Puerto Vallarta, Jalisco, México, del 7 al 10 de octubre de 1992.         [ Links ]

CAMPOS-ARANDA, D.F. Introducción a los Métodos Numéricos: Software en Basic y Aplicaciones en Hidrología Superficial. Capítulo 5: Ajuste de Curvas. San Luis Potosí, México: Librería Universitaria Potosina, 2003, pp. 93-127.         [ Links ]

GILROY, E.J. Reliability of a variance estimate obtained from a sample augmented by multivariate regression. Water Resources Research. Vol. 6, No. 6, 1970, pp. 1595-1600.         [ Links ]

IMTA. Banco Nacional de Datos de Aguas Superficiales (BANDAS). Hidrometría y Sedimentos hasta 2002. 8 CD's. Jiutepec, México: CNA-SEMARNAP-IMTA, 2003.         [ Links ]

MORAN, M.A. On estimators obtained from a sample augmented by multiple regression. Water Resources Research. Vol. 10, No. 1, 1974, pp. 81-85.         [ Links ]

RUIZ-MAYA, L. Métodos Estadísticos de Investigación. Capítulo 9: Condiciones paramétricas del análisis de varianza. Madrid: Instituto Nacional de Estadística, 1977, pp. 233-249.         [ Links ]

SALAS, J.D. Transfer of information to improve estimates of flood frequencies. Chapter 17. Hydrology for Transportation Engineers. Thomas G. Sanders (editor). Washington, D.C.: Federal Highway Administration, 1980, pp. 592-653.         [ Links ]

SALAS, J.D. Analysis and modeling of hydrologic time series. Chapter 19. Handbook of Hydrology. David R. Maidment (editor in chief). New York: McGraw-Hill, Inc., 1993, pp. 19.1-19.72.         [ Links ]

SALAS, J.D., RAYNAL, J.A., TARAWNEH, Z.S., LEE, T.S., FREVERT, D. and FULP, T. Extending short record of hydrologic data. Chapter 20. Hydrology and Hydraulics. Vijay P. Singh (editor). Highlands Ranch, USA: Water Resources Publications, 2008, pp. 717-760.         [ Links ]

SHAPIRO, S.S. and WILK, M.B. An analysis of variance test for normality (complete samples). Biomètrica. Vol. 52, No. 3-4, 1965, pp. 591-611.         [ Links ]

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons