SciELO - Scientific Electronic Library Online

 
vol.52 número2Obtención de compuestos aromáticos por oxidación de lignina con lacasa inmovilizada en alginato índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

  • No hay artículos similaresSimilares en SciELO

Compartir


Agrociencia

versión On-line ISSN 2521-9766versión impresa ISSN 1405-3195

Agrociencia vol.52 no.2 Texcoco feb./mar. 2018

 

Agua-Suelo-Clima

Ajuste con momentos L de las distribuciones GVE, LOG y PAG no estacionarias en su parámetro de ubicación, aplicado a datos hidrológicos extremos

Daniel Francisco Campos-Aranda1 

1Facultad de Ingeniería de la Universidad Autónoma de San Luis Potosí. Genaro Codina Núm 240. 78280 San Luis Potosí, San Luis Potosí. (campos_aranda@hotmail.com)


Resumen

El análisis de frecuencias de datos hidrológicos extremos, como crecientes, sequías, vientos y precipitación máxima diaria, se basa en aceptar que los datos máximos anuales de la muestra disponible son independientes y provienen de un proceso aleatorio estacionario. Esto significa que sus propiedades estadísticas no varían en el tiempo. Debido a cambios en el uso del suelo e impactos del calentamiento global, las series de datos hidrológicos presentan tendencias, lo que indica que no son estacionarias. El objetivo de este estudio fue exponer la generalización del método de los momentos L, para estimar los parámetros de ajuste de las funciones de distribución de probabilidades: General de Valores Extremos (GVE), Logística Generalizada (LOG) y Pareto Generalizada (PAG) de tipo no estacionario, al variar con el tiempo (t) su parámetro de ubicación (u) de forma lineal y cuadrática. Los modelos probabilísticos GVE1, LOG1 y PAG1 tienen cuatro parámetros de ajuste (δ1, δ2, a, k), ya que u = δ1 + δ2·t y sus parámetros de escala (a) y forma (k) son constantes. Los modelos GVE2, LOG2 y PAG2 tienen cinco parámetros de ajuste (δ1, δ2, δ3, a, k), debido a que u = δ1 + δ2·t + δ3·t2. En series con tendencia se emplea como covariable t en años, pero también se pueden emplear indicadores de la variabilidad climática regional o global, como el índice de la oscilación del sur. Por medio de las cuatro aplicaciones numéricas que se describen, se demostró la sencillez del procedimiento operativo y la utilidad del uso de los modelos GVE, LOG y PAG no estacionarios se destacó a través de sus predicciones en series con tendencia, o usando una covariable climática.

Palabras clave: momentos L; distribuciones de probabilidad no estacionarias; regresión lineal; regresión cuadrática; error estándar de ajuste; índice de la oscilación del sur

Abstract

The analysis of frequencies of extreme hydrological data such as floods, droughts, winds and maximum daily precipitation, is based on accepting that the maximum annual data of the available sample are independent and come from a random process that is stationary. This means that their statistical properties do not vary with time. Due to changes in land use and impacts of global warming, the hydrological data series show trends, indicating that they are non-stationary. The objective of this study was to expose the generalization of the L moments method, to estimate the fit parameters of the probability distribution functions: General Extreme Values (GVE), Generalized Logistics (LOG) and Generalized Pareto (PAG) of non-stationary type, by varying with time (t) its location parameter (u) in a linear and quadratic way. The probabilistic models GVE1, LOG1 and PAG1 have four fitting parameters (δ1, δ2, a, k ), since u = δ1 + δ2·t and their scale (a) and form (k) parameters are constant. The models GVE2, LOG2 and PAG2 have five fitting parameters (δ1, δ2, δ3, a, k), due to the fact that u = δ1 + δ2·t + δ3·t2. In series with trend it is used as a covariate t in years, but indicators of regional or global climate variability can also be used, such as the southern oscillation index. By means of the four numerical applications that are described, the simplicity of the operating procedure was demonstrated and the utility of the use of non-stationary GVE, LOG and PAG models is highlighted through their predictions in series with trend, or using a climatic covariate.

Key words: L-moments; non-stationary probability distribution; linear regression; quadratic regression; standard error of fit; southern oscillation index

Introducción

Todas las obras hidráulicas de aprovechamiento o control, como embalses, diques de protección, encauzamientos y rectificaciones, puentes y drenaje pluvial urbano, requieren las etapas de planeación, diseño y operación de la estimación, lo más exacta posible, de las crecientes de diseño. Con base en estas estimaciones hidrológicas, se dimensionan las obras hidráulicas y se intenta garantizar su seguridad; por ello, las crecientes de diseño son predicciones asociadas a probabilidades bajas de excedencia, que se obtienen a través del Análisis de Frecuencias de Crecientes (AFC). Otra etapa, en la que se requiere revisar la seguridad hidrológica de las obras hidráulicas, es cuando ocurre alguna de las dos eventualidades siguientes: 1) se llegó al final de su vida útil y por ello existe más información para realizar el AFC o 2) han ocurrido cambios en su cuenca, como uso del suelo, construcción de otras obras hidráulicas o los originados por el cambio climático (Jakob, 2013).

El AFC es una técnica estadística de inferencia, que utiliza un modelo probabilístico o función de distribución de probabilidades (FDP), para representar a la muestra disponible de gastos máximos anuales instantáneos. Este procedimiento engloba las siguientes etapas (Rao y Hamed, 2000; Meylan et al., 2012): 1) recopilación de los datos y verificación de su calidad estadística, 2) selección de una FDP; 3) elección de un método de estimación de sus parámetros de ajuste, 4) cuantificación objetiva del ajuste logrado con cada FDP y técnica de estimación y 5) selección de resultados.

El AFC se basa en la suposición de estacionariedad; es decir, un clima que no cambia con el tiempo en el sentido estadístico y, por ello, se acepta que los registros disponibles de gasto máximo anual sean independientes y estén idénticamente distribuidos, condición designada “iid”. Sin embargo, en años recientes se ha aceptado el cambio climático global originado por el aumento del efecto de los gases de efecto invernadero. Estas dos consideraciones físicas han intensificado el ciclo hidrológico, con incrementos en la frecuencia e intensidad de los eventos extremos de precipitación y la posibilidad de crecientes más severas (Katz, 2013; Kim et al., 2015; Álvarez-Olguín y Escalante-Sandoval, 2016).

La extensión de la teoría estadística de valores extremos a registros hidrológicos no estacionarios ha seguido los enfoques descritos por Khaliq et al. (2006). Uno de esto, quizás el más simple, aplica la FDP clásica de esta teoría, la distribución General de Valores Extremos (GVE) con tres parámetros (u, a, k) y permite el ajuste o traslado gradual, al introducir el tiempo t como una covariable en su parámetro de ubicación u, conservando constantes el de escala a y el de forma k (Park et al., 2011; Katz, 2013).

La nomenclatura para estas FDP no estacionarias se ha establecido. El Adlouni et al. (2007) y Aissaoui-Fqayeh et al. (2011) definieron la función GVE estacionaria como GVE0, esta tiene su parámetro de ubicación variable linealmente con el tiempo (u = δ1 + δ2·t) como GVE1 y GVE2 cuando la variación es cuadrática (u = δ1 + δ2·t + δ3·t2). En el modelo GVE11 los parámetros de ubicación y de escala varían linealmente con el tiempo. En estos modelos algún indicador de la variabilidad climática global o regional se ha utilizado como covariable (López de la Cruz y Francés, 2014; Franks et al., 2015; Álvarez-Olguín y Escalante-Sandoval, 2016), es el caso del índice de la oscilación del sur (SOI). El SOI se cuantifica como la diferencia de la presión del aire en superficie entre Darwin, Australia y Tahití en la Polinesia Francesa (Teegavarapu, 2012).

El objetivo de este estudio fue exponer la generalización del método de los momentos L para estimar los parámetros de ajuste de las FDP no estacionarias GVE1 y GVE2. El Adlouni y Ouarda (2008b) propusieron el modelo, lo aplicaron y contrastaron con el tiempo t y SOI como covariables. El procedimiento se amplió a las FDP Logística Generalizada (LOG) y Pareto Generalizada (PAG), que son modelos que se usan en el análisis de frecuencias de datos hidrológicos extremos (Kim et al., 2015). Cuatro aplicaciones numéricas se describen con datos de la literatura especializada y se enfatiza la utilidad del método de los momentos L para ajustar seis FDP no estacionarias.

Materiales y Métodos

Momentos L poblacionales y de la muestra

Los momentos L son un sistema alternativo para describir las formas de las FDP. Históricamente aparecen como modificaciones de los momentos de probabilidad ponderada (MPP) desarrollados por Greenwood et al. (1979). Los MPP de una variable aleatoria x con FDP acumulada F(x) los definieron las cantidades siguientes:

Mp, r, s=ExFpF(x)r1-F(x)s (1)

Un caso especial es el siguiente: βr = M1,r,0 . La ecuación 1, para una distribución con función de cuantiles x(F), conduce a:

βr=01x(F)FrdF (2)

Esta ecuación puede contrastarse con la definición ordinaria de momentos, que es:

EXr=01x(F)rdF (3)

La definición convencional de momentos involucra potencias sucesivas de la función de cuantiles x(F), mientras que los MPP implican potencias sucesivas de F y por ello pueden considerarse integrales de x(F) ponderadas por polinomios Fr ; de ahí su nombre. Los MPP mejoran sustancialmente las propiedades del muestreo, porque los valores dispersos no los influencian (Asquith, 2011). Los momentos L son combinaciones lineales de los MPP, de la manera siguiente (Hosking y Wallis, 1997 son:

λ1=β0 (4)

λ2=2β1-β0 (5)

λ3=6β2-6β1+β0 (6)

λ4=20β3-30β2+12β1-β0 (7)

Además, los cocientes (τ) de momentos L se definen, iniciando con L-Cv, que es análogo a este coeficiente, y después los de similitud con los coeficientes de asimetría y de curtosis, estos son:

τ=λ2/λ1 (8)

τ3=λ3/λ2 (9)

τ4=λ4/λ2 (10)

En una muestra de tamaño n, con sus elementos en orden ascendente (x1 ≤ x2 ≤… xn), los estimadores insesgados de βr son (Stedinger et al., 1993; Hosking y Wallis, 1997):

b0=1nj=1nxj (11)

b1=1nj=2n(j-1)(n-1)xj (12)

b2=1nj=3n(j-1)(j-2)(n-1)(n-2)xj (13)

con la siguiente expresión general:

b2=1nj=r+1nj-1j-2(j-r)n-1n-2(n-r)xj (14)

Los estimadores muestrales de λr serán lr , están definidos por las ecuaciones 4 a 7 y los de los cocientes de momentos L serán t, t3 y t4, según las ecuaciones 8 a 10.

Ajuste con momentos L de las distribuciones GVE, LOG y PAG

Hosking y Wallis (1997) destacaron en su “Tabla 5.1”, que estas tres FDP, cuando su parámetro de forma es negativo (k < 0), tienen colas derechas más gruesas o densas que todas las otras FDP, comúnmente utilizadas en los AFC. Debido a esto, las FDP han ganado aceptación en los análisis de frecuencias de datos hidrológicos extremos (El Adlouni et al. 2008a). Estas tres FDP también coinciden en tener un límite superior cuando k > 0 y definir funciones de dos parámetros de ajuste, conocidas como Gumbel, Logística y Exponencial, cuando k = 0.

La solución inversa x(F) de las distribuciones GVE, LOG y PAG se citan a continuación, con ella se estiman las predicciones que se asocian a una cierta probabilidad de no excedencia (F) y las ecuaciones que permiten estimar sus tres parámetros de ajuste (u, a, k) correspondientes a la ubicación, escala y forma, con el método de momentos L.

Distribución GVE (Hosking y Wallis, 1997): intervalo de x: u + a/k ≤ x < ∞ si k < 0; -∞ < x < ∞ si k = 0; -∞ < xu + a/k si k > 0.

xF=u+ak1-(-In F)k;k0; (15)

k7.8590c+2.9554c2 (16)

siendo:

c=23+t3-0.63093 (17)

a=l2kΓ(1+k)(1-2-k) (18)

u=l1-ak1-Γ(1+k) (19)

Para evaluar la función gamma se utiliza la fórmula de Stirling (Davis, 1972):

Γ(ε)e-εεε-1/22π1+112ε+1288ε2-13951840ε3-5712488320ε4+... (20)

Para la distribución LOG (Hosking y Wallis, 1997) el intervalo de x es idéntico al de la GVE.

xF=u+ak1-1-FFk;k0; (21)

k=-t3 (22)

a=l2sen(πk)πk (23)

u=l1-alk-πsen(πk) (24)

Para la distribución PAG (Hosking y Wallis, 1997) el intervalo de x es u ≤ x < ∞ si k ≤ 0; uxu + a/k si k > 0.

xF=u+ak1-(1-F)k;k0 (25)

k=1-3t31+t3 (26)

a=l2(1+k)(2+k) (27)

u=l1-l2(2+k) (28)

Ajuste con momentos L de las distribuciones GVE1 y GVE2

La generalización del método de momentos L propuesta por El Adlouni y Ouarda (2008b) para el ajuste de la FDP no estacionaria tipo GVE1 comienza por analizar el valor esperado según la expresión:

EX=ut+ak1-Γ(1+k)=δ1+δ2t+ak1-Γ(1+k) (29)

De esta ecuación se deduce que un estimador δ^2 de δ2 puede obtenerse mediante una regresión lineal simple entre la variable X y la covariable t. Después se define una nueva variable S1 con la expresión:

S1=X-δ2t (30)

De la ecuación 29 se deduce que la nueva variable se distribuye según una FDP tipo GVE0 con parámetros δ1, a y k que se estiman con las ecuaciones 16 a 19 del método de momentos L. Destaca que u (ecuación 19) es igual a δ1, con lo cual quedan estimados los cuatro parámetros de ajuste del modelo GVE1. La ecuación 30 corresponde a uno de los primeros enfoques simples, sugeridos para procesar registros hidrológicos con tendencia. Este consistente en retirar primero tal componente determinística (McCuen y Thomas, 1990; Campos-Aranda, 2012). Mudersbach y Jensen (2010) indicaron que este enfoque es práctico pero los resultados de su AFC son válidos sólo en el presente y las obras hidráulicas deben ser seguras al término de su vida útil. Por lo que se requiere que la creciente de diseño sea estimada en una fecha futura predeterminada.

El mismo enfoque se utiliza para introducir una dependencia cuadrática en el parámetro de ubicación u, por lo cual, las estimaciones δ^2 y δ^3 de δ2 y δ3 se obtienen mediante regresión lineal múltiple de la variable X contra t y t2, o regresión polinomial de segundo grado de X contra t. La nueva variable S2 será:

S2=X-δ2t-δ3t2 (31)

Con las ecuaciones 16 a 19 aplicadas a la muestra de datos corregidos S2 se definen los parámetros restantes k, a y δ1 del modelo GVE2. El Adlouni y Ouarda (2008b) compararon por simulación numérica tres procedimientos para obtener los cuatro y cinco parámetros de ajuste de los modelos GVE1 y GVE2: el método de máxima verosimilitud (Coles, 2001; Nadarajah, 2005; Katz, 2013), el de máxima verosimilitud generalizada (Martins y Stedinger, 2000; El Adlouni et al., 2007) y su generalización de momentos L. Los autores concluyeron que el último es mejor que el primero, por su sesgo y error medio cuadrático menores, pero no supera al segundo, sobre todo en registros con asimetría importante.

Ecuaciones de la regresión lineal

La variable dependiente (y) se considera que son los datos anuales hidrológicos Xi y los tiempos o años ti son las abscisas (x), en este caso iguales al i-ésimo valor i. Para probar si la pendiente (δ2) de la recta de regresión, ajustada por mínimos cuadrados de los residuos, es estadísticamente diferente de cero se usa una prueba basada en la distribución de Student (DS), definida por las ecuaciones siguientes (Ostle y Mensing, 1975):

Xi=b+δ2ti (32)

b=X--δ2t- (33)

δ2=Cov(X,t)Var(t)=1ni=1nXii-X-t-1ni=1ni2-t-2 (34)

rxy=Cov(X,t)Var(X)Var(t) (35)

VarX=1ni=1nXi2-X-2 (36)

DS=δ2Sδ2 (37)

Sδ2=SE2i=1nti-t-2 (38)

SE2=i=1nXi-X^i2(n-2) (39)

X- y t- son las medias aritméticas, rxy es el coeficiente de correlación lineal que varía de cero a ±1, la pendiente δ2 tiene unidades de X/año y la ordenada al origen b de X. X^i en la ecuación 39 es el valor estimado con la ecuación 32. SE2 y Sδ2 son las varianzas de los errores y de la pendiente, respectivamente. Si el valor absoluto calculado DS (ecuación 37) es mayor que el crítico (DSc ), el que se obtiene para la distribución de Student con ν = n - 2 grados de libertad y α = 5 % en una prueba de dos colas, la pendiente δ2 es significativa; es decir, existe tendencia lineal. Para estimar el valor de DSc se utiliza el algoritmo propuesto por Zelen y Severo (1972), con Z = 1.95996 para una confiabilidad (1 - α) del 95 %:

DSc=Z+G1/v+G2/v2+G3/v3+G4/v4 (40)

donde:

G1 = (Z3 + Z)/4

G2 = (5Z5 +16Z3 + 3Z)/96

G3 = (3Z7 + 19Z5 + 17Z3 - 15Z)/384

G4 = (79Z9 + 776Z7 + 1482Z5 - 1920Z3 - 945Z)/92160

Pendiente δ2 según criterio de Pranab Kumar Sen

Para verificar numéricamente el valor de δ2, con la ecuación 34, se usó el criterio de Sen (1968). Este utiliza la fórmula de la tendencia establecida en el test de Kendall, para estimar su pendiente, que se define como el valor mediano (MED) de las pendientes parciales, es decir:

δ2=MEDXj-Xij-i para toda j>i (41)

Xj y Xi son los datos en los tiempos j e i, que representan años: n es el número de datos, entonces se tienen n(n - 1)/2 pendientes parciales. δ2 tiene unidades de X/año y su signo positivo define tendencias ascendentes y el negativo descendentes. Machiwal y Jha (2012) indicaron que este criterio es resistente o robusto a la presencia de valores dispersos (outliers).

Ecuaciones de la regresión cuadrática

El polinomio cuadrático o parabólico para la tendencia no lineal entre los datos Xi y los años del registro ti es (Campos-Aranda, 2003):

X=δ1+δ2t+δ3t2 (42)

cuyo arreglo matricial de sus ecuaciones normales es:

ni=1ntii=1nti2i=1ntii=1nti2i=1nti3i=1nti2i=1nti3i=1nti4δ1δ2δ3=i=1nXii=1nXitii=1nXiti2 (43)

con solución:

Tδ=Xδ_=T-1X (44)

donde: T es una matriz cuadrada con inversa T-1, δ es un vector columna de incógnitas y X es otro vector columna de términos independientes. El coeficiente de determinación R2 cuantifica el grado de correlación del ajuste polinomial, su numerador mide la mejora o reducción del error debido a la regresión y su denominador es la dispersión de la variable dependiente, es decir:

R2=Sx2-Se2Sx2 (45)

siendo:

Sx2=1ni=1n(Xi-X-)2 (46)

Se2=1ni=1n(Xi-X^i)2=1ni=1nXi-δ1-δ2ti-δ3ti22 (47)

Como Se2 siempre es menor que Sx2, entonces R2 varía de cero a la unidad (cuando Se2 = 0) y su raíz cuadrada corresponde al coeficiente de correlación polinomial (Campos-Aranda, 2003).

Ajuste con momentos L de las distribuciones LOG1, LOG2, PAG1 y PAG2

Rao y Hamed (2000) presentaron las ecuaciones del valor esperado de las distribuciones Logística Generalizada (LOG) y Pareto Generalizada (PAG), similares a la expresión 29 de la función GVE. Esto implica que la generalización de El Adlouni y Ouarda (2008b) del método de momentos L para ajustar FDP no estacionarias con parámetro de ubicación variable en el tiempo, también es aplicable en los modelos LOG y PAG.

Error estándar de ajuste

A mediados de la década de 1960 se estableció al error estándar de ajuste (EEA) como un indicador estadístico cuantitativo, ya que evalúa la desviación estándar de las diferencias entre los valores observados y los estimados con la FDP que se prueba; en este estudio son los modelos: GVE1, GVE2, LOG1, LOG2, PAG1 y PAG2. Su expresión es la siguiente (Kite, 1977; Pandey y Nguyen, 1999):

EEA=i=1nXi-X^i2n-np (48)

en la cual: n y np son el número de datos de la muestra y de parámetros de ajuste, en este caso cuatro y cinco, Xi son los datos ordenados de menor a mayor y X^i son los valores estimados con la solución inversa x(F) o función de cuantiles, que utiliza el parámetro de ubicación variable, para una probabilidad de no excedencia estimada con la fórmula de Weibull (Benson, 1962):

PX<x=mn+1 (49)

donde: m es el número de orden del dato, con 1 para el menor y n para el mayor.

Registros de valores máximos anuales por procesar

Cuatro registros de la literatura especializada se seleccionaron para ilustrar la aplicación de las FDP no estacionarias GVE, LOG y PAG con el método de generalización de los momentos L (El Adlouni y Ouarda, 2008b); sus valores se exponen en el Cuadro 1. Estos registros tienen datos aproximados, leídos en las gráficas donde fueron expuestos. El primer registro lo mostró Leclerc y Ouarda (2007) como ejemplo de una serie de gastos (m3·s-1) con tendencia descendente en una estación hidrométrica del Río Dartmouth en Canadá, con 630 km2 de área de cuenca. El segundo registro es de precipitación máxima diaria (PMD) anual en milímetros, corresponde a la estación pluviométrica Andong de Corea del Sur (Park et al., 2011) y fue seleccionado por su tendencia ascendente robusta.

Cuadro 1 Datos máximos anuales por procesar de gasto (Q), precipitación máxima diaria (PMD) e índice de la oscilación del sur (SOI) en las estaciones indicadas. 

No. Dartmouth Andong Ficticia Tehachapi
Año Q Año PMD Año PMD Año PMD SOI
1 1974 154 1973 60 1961 16.0 1952 15 -0.2
2 1975 227 1974 67 1962 18.6 1953 17 0.8
3 1976 217 1975 120 1963 10.0 1954 13 0.9
4 1977 398 1976 76 1964 10.4 1955 38 -0.7
5 1978 238 1977 87 1965 10.5 1956 29 -0.6
6 1979 244 1978 27 1966 8.3 1957 45 -0.3
7 1980 150 1979 - 1967 8.1 1958 21 0.5
8 1981 346 1980 - 1968 10.5 1959 37 1.2
9 1982 223 1981 - 1969 13.3 1960 24 0.2
10 1983 180 1982 - 1970 10.2 1961 36 -0.9
11 1984 145 1983 129 1971 9.6 1962 16 -0.6
12 1985 122 1984 121 1972 9.2 1963 25 0.4
13 1986 99 1985 88 1973 15.5 1964 12 -0.3
14 1987 198 1986 82 1974 12.5 1965 36 0.7
15 1988 191 1987 87 1975 9.2 1966 17 0.4
16 1989 129 1988 78 1976 22.3 1967 16 -0.5
17 1990 214 1989 62 1977 13.4 1968 56 -0.2
18 1991 195 1990 69 1978 9.5 1969 35 -1.1
19 1992 173 1991 100 1979 13.2 1970 36 0.6
20 1993 101 1992 75 1980 13.0 1971 13 -0.2
21 1994 159 1993 114 1981 8.6 1972 34 -0.5
22 1995 148 1994 69 1982 7.8 1973 42 -0.4
23 1996 158 1995 109 1983 10.3 1974 17 1.5
24 1997 225 1996 90 1984 9.0 1975 18 1.4
25 1998 175 1997 119 1985 8.6 1976 31 -0.8
26 1999 275 1998 114 1986 16.1 1977 21 2.1
27 2000 144 1999 97 1987 10.1 1978 17 0.1
28 2001 192 2000 170 1988 9.2 1979 19 1.4
29 2002 65 2001 94 1989 15.3 1980 41 -0.1
30 2003 142 2002 115 1990 13.5 1981 82 -1.4
31 - - 2003 103 1991 12.2 1982 18 -0.2
32 - - 2004 129 1992 12.7 1983 45 -0.5
33 - - 2005 77 1993 10.3 1984 35 -0.6
34 - - 2006 102 1994 19.9 1985 19 0.3
35 - - 2007 89 1995 19.6 1986 87 -3.2
36 - - - - 1996 13.9 1987 29 -0.2
37 - - - - 1997 15.8 1988 28 0.1
38 - - - - 1998 13.7 1989 29 -0.2
39 - - - - 1999 16.7 1990 19 -1.5
40 - - - - 2000 15.7 1991 22 -0.4
41 - - - - 2001 18.7 1992 16 1.2
42 - - - - 2002 21.9 1993 17 -0.8
43 - - - - 2003 18.8 1994 41 -0.4
44 - - - - 2004 30.0 1995 48 -1.9
45 - - - - 2005 22.1 1996 49 -0.9
46 - - - - 2006 17.2 1997 26 -0.3
47 - - - - 2007 22.6 1998 71 -0.6
48 - - - - 2008 18.7 1999 33 0.2
49 - - - - 2009 22.2 2000 27 0.3
50 - - - - 2010 22.6 - - -

El tercer registro procede de El Adlouni y Ouarda (2008b) y son datos generados aleatoriamente con una distribución GVE2, los valores en sus parámetros de ajuste fueron: δ1 = 10, δ2 = -0.10, δ3 = 0.005, a = 1.0 y k = -0.10 y corresponde a una serie de PMD con tendencia no lineal. El cuarto registro también procede de la referencia anterior, El Adlouni et al. (2007), Aissaoui-Fqayeh et al. (2009) y Ouarda y El Adlouni (2011) la ha utilizado y corresponde a la PMD registrada en el periodo de 1952 a 2000 en la estación pluviométrica Tehachapi del sur de California, EUA. Estos valores guardan relación con SOI (Southern Oscillation Index) y por ello se emplearon como covariable.

Planteamiento general para los análisis probabilísticos

La relación de los valores de los datos (Xi ) en función del tiempo (ti ) permite definir si existe tendencia lineal o cuadrática. Cuando la tendencia es lineal, se estiman los parámetros de ajuste (δ2, δ1, a, k) de las FDP no estacionarias GVE1, LOG1 y PAG1, se cuantifica su EEA con la ecuación 48, para seleccionar la FDP que conduce al valor menor de tal indicador. Cuando la tendencia es curva se prueban las FDP no estacionarias GVE2, LOG2 y PAG2; para ello, se estiman sus parámetros de ajuste (δ2, δ3, δ1, a, k), se cuantifica su EEA, adoptando la que aportó el valor menor. En este proceso, puede adoptarse una FDP no estacionaria, con base en juicios de conveniencia; por ejemplo, las predicciones más desfavorables o críticas. Lo anterior se ilustra en la primera aplicación numérica.

En los análisis que usan el tiempo (t) como covariable, con base en las soluciones inversas (ecuaciones 15, 21 y 25) de las distribuciones GVE, LOG y PAG, se calcularon predicciones con periodos de retorno (Tr) de 2, 25, 50 y 100 años, a través del periodo de registro, se aplicó variable el parámetro de ubicación u. La primera predicción corresponde a la mediana, ya que su probabilidad de no excedencia (F) es de 50 % y las tres siguientes se calcularon para probabilidades complementarias, y definir su valor superior e inferior (Park et al., 2011); es decir, para los valores siguientes: F = 0.96 y F = 0.04 para el Tr de 25 años; F = 0.98 y F = 0.02 para el Tr de 50 años y F = 0.99 y F = 0.01 para el Tr de 100 años. Además, en estos análisis se hicieron predicciones para los años 2020, 2050 y 2100. Las predicciones correspondientes a Tr de 2, 25, 50 y 100 años, cuando la covariable es SOI, fluctúan según su magnitud y entonces sus valores máximos se indican en la magnitud extrema de SOI. En este caso, las predicciones para el futuro son posibles si se utilizan valores pronosticados de SOI.

Resultados y Discusión

Predicciones en una estación de aforos del río Dartmouth

Los datos mostraron tendencia lineal descendente y significativa, ya que DS = -2.2931 y DSc = 2.0484 (Figura 1). En el registro, EEA de las FDP no estacionarias GVE1, LOG1 y PAG1 fueron 42.0, 43.1 y 41.6 m3·s-1. Debido a la semejanza numérica de los EEA, los resultados de la función LOG1 se adoptaron por conducir a las predicciones más grandes o críticas. Sus parámetros de ajuste fueron: δ2 = -3.125, δ1 = 227.919, a = 33.318 y k = -0.144; con coeficiente de correlación lineal de -0.3976 y pendiente de -2.8182, según criterio de Sen. El registro de 30 datos concluyó en 2003 (Cuadro 2) y el valor del tiempo t en 2020, 2050 y 2100 fue 47, 77 y 127.

Figura 1 Datos y rectas de predicciones estimadas con la distribución LOG1 en una estación hidrométrica del río Dartmouth, Canadá. 

Cuadro 2 Predicciones (m3·s-1) en el periodo histórico y futuro en una estación hidrométrica del río Dartmouth, con base en FDP no estacionaria LOG1

No. (t) Año Gasto (Q) Tr= 2 años Tr = 25 años Tr = 50 años Tr = 100 años
(Mediana) VS VI§ VS VI VS VI
1 1974 154 224.8 359.1 139.8 398.7 125.5 441.8 112.8
10 1983 180 196.7 330.9 111.7 370.5 97.4 413.7 84.7
20 1993 101 165.4 229.7 80.5 339.3 66.2 382.5 53.4
30 2003 142 134.2 268.4 49.2 308.0 34.9 351.2 22.2
No. (t) Año uÞ Tr = 2 años Tr = 25 años Tr = 50 años Tr = 100 años
(Mediana) VS VI VS VI VS VI
47 2020 81.0 81.0 215.3 0.0 254.9 0.0 298.1 0.0
77 2050 -12.7 -12.7 121.6 0.0 161.2 0.0 204.3 0.0
127 2100 -169.0 -169.0 0.0 0.0 4.9 0.0 48.1 0.0

Periodo de retorno. Valor superior. §Valor inferior. ÞParámetro de ubicación.

Predicciones en la estación pluviométrica Andong

Este registro de PMD tuvo tendencia lineal ascendente y significativa, debido a que DS = 2.1568 y DSc = 2.0452 (Figura 2). El ajuste de FDP no estacionarias GVE1, LOG1 y PAG1 condujo a EEA, en milímetros, de 9.8, 8.8 y 11.9. Para este registro se adoptó la función LOG1, por lograr el menor EEA, sus parámetros de ajuste fueron: δ2 = 1.1101, δ1 = 73.805, a = 13.740 y k = -0.113, el coeficiente de correlación lineal fue 0.3718 y la pendiente 1.100, de acuerdo son el criterio de Sen. El registro de las predicciones abarcó 31 datos (Cuadro 3) y concluyó en el año 2007, la magnitud del tiempo t en 2020, 2050 y 2100 fue 44, 74 y 124.

Figura 2 Datos y predicciones estimadas con la distribución LOG1 en la estación pluviométrica Andong, Corea del Sur. 

Cuadro 3 Predicciones (mm) en el periodo histórico y a futuro en la estación pluviométrica Andong, con base en la FDP no estacionaria LOG1

No. (t) Año PMD Tr= 2 años Tr = 25 años Tr = 50 años Tr = 100 años
(Mediana) VS VI§ VS VI VS VI
1 1973 60 74.9 127.5 38.2 142.1 31.7 157.7 25.7
10 1986 82 84.9 137.5 48.2 152.1 41.7 167.7 35.7
20 1996 90 96.0 148.6 59.3 163.2 52.8 178.8 46.8
31 2007 89 108.2 160.8 71.5 175.4 65.0 191.0 59.0
No. (t) Año uÞ Tr = 2 años Tr = 25 años Tr = 50 años Tr = 100 años
(Mediana) VS VI VS VI VS VI
44 2020 122.6 122.6 175.2 86.0 189.8 79.4 205.4 73.4
74 2050 156.0 156.0 208.5 119.3 223.1 112.7 238.8 106.7
124 2100 211.5 211.5 264.0 174.8 278.6 168.2 294.3 162.2

Periodo de retorno. Valor superior. §Valor inferior. ÞParámetro de ubicación.

Predicciones en una estación pluviométrica ficticia

El registro PMD tuvo tendencia curva ascendente (Figura 3). El ajuste de las FDP no estacionarias GVE2, LOG2 y PAG2 condujo a EEA, en milímetros, de 2.4, 2.3 y 2.5. La función LOG2 se adoptó, por lograr el EEA menor; sus parámetros de ajuste fueron: δ2 = -0.3367, δ3 = 0.0109, δ1 = 12.828, a = 1.618 y k = -0.264, con coeficiente de correlación polinomial de 0.7415. En él se muestra una parte de las predicciones dentro del registro y a futuro en tres fechas prefijadas. El registro de 50 datos concluyó en 2010 (Cuadro 4), entonces la magnitud del tiempo t en 2020, 2050 y 2100 fue 60, 90 y 140.

Figura 3 Datos y curvas de predicción estimadas con la distribución LOG2 en una estación pluviométrica ficticia. 

Cuadro 4 Predicciones (mm) en el periodo histórico y a futuro en la estación pluviométrica ficticia, con base en la FDP no estacionaria LOG2

No. (t) Año PMD Tr= 2 años Tr = 25 años Tr = 50 años Tr = 100 años
(Mediana) VS VI§ VS VI VS VI
1 1961 16.0 12.5 20.6 9.0 23.5 8..6 27.0 8.2
10 1970 10.2 10.5 18.6 7.1 21.6 6.6 25.1 6.2
20 1980 13.0 10.4 18.5 7.0 21.4 6.5 24.9 6.1
30 1990 13.5 12.5 20.6 9.0 23.5 8.6 27.0 8.2
40 2000 15.7 16.8 24.8 13.3 27.8 12.8 31.3 12.5
50 2010 22.6 23.2 31.2 19.7 34.2 19.2 37.7 18.9
No. (t) Año uÞ Tr = 2 años Tr = 25 años Tr = 50 años Tr = 100 años
(Mediana) VS VI VS VI VS VI
60 2020 31.8 31.8 39.8 28.3 42.8 27.8 46.3 27.5
90 2050 70.6 70.6 78.7 67.1 81.6 66.7 85.1 66.3
140 2100 178.8 178.8 186.9 175.3 189.8 174.9 193.3 174.5

Periodo de retorno. Valor superior. §Valor inferior. ÞParámetro de ubicación.

Predicciones en la estación pluviométrica Tehachapi

El registro PMD anual en función de SOI (Figura 4) indica que no es posible seleccionar entre una tendencia descendente lineal o una curva, por lo que se aplicaron los dos ajustes. Las FDP no estacionarias GVE1, LOG1 y PAG1 condujeron a valores del EEA, en milímetros, de 11.6, 11.4 y 12.2. Para este ajuste lineal se adoptó la función LOG1, por obtener el EEA menor; sus parámetros de ajuste fueron: δ2 = -10.2657, δ1 = 28.376, a = 7.570 y k = -0.104, con coeficiente de correlación lineal de -0.5680. Parte de las predicciones dentro del registro se incluyen en el Cuadro 5.

Figura 4 Predicciones estimadas con la distribución LOG2 en la estación pluviométrica Tehachapi del sur de California, EUA. 

Cuadro 5 Predicciones (mm) en el periodo histórico en la estación pluviométrica Tehachapi, con base en la FDP no estacionaria LOG1

Datos Tr= 2 años Tr = 25 años Tr = 50 años Tr = 100 años
No. SOI PMD (Mediana) VS VI§ VS VI VS VI
26 2.1 21 6.8 35.3 0.0 43.1 0.0 51.4 0.0
23 1.5 17 13.0 41.5 0.0 49.3 0.0 57.5 0.0
3 0.9 13 19.1 47.6 0.0 55.4 0.0 63.7 0.0
7 0.5 21 23.2 51.7 2.7 59.5 0.0 67.8 0.0
29 -0.1 41 29.4 57.9 8.9 65.7 5.2 73.9 1.7
30 -1.4 82 42.7 71.2 22.2 79.0 18.5 87.3 15.1
44 -1.9 48 47.9 76.4 27.4 84.2 23.6 92.4 20.2
35 -3.2 87 61.2 89.7 40.7 97.5 37.0 105.8 33.5

Periodo de retorno. Valor superior. §Valor inferior.

Las FDP no estacionarias GVE2, LOG2 y PAG2 condujeron a EEA en milímetros de 12.8, 12.7 y 13.3. Para este ajuste no lineal se adoptó la función LOG2, por alcanzar el valor menor de EEA, sus parámetros de ajuste fueron: δ2 = -8.7385, δ3 = 2.8432, δ1 = 25.936, a = 6.942 y k = -0.127 y coeficiente de correlación polinomial de 0.6279. Parte de las predicciones dentro de registro se incluyeron en el Cuadro 6.

Cuadro 6 Predicciones (mm) en el periodo histórico en la estación pluviométrica Tehachapi, con base en la FDP no estacionaria LOG2

Datos Tr= 2 años Tr = 25 años Tr = 50 años Tr = 100 años
No. SOI PMD (Mediana) VS VI§ VS VI VS VI
26 2.1 21 20.1 47.3 2.0 55.0 0.0 63.4 0.0
23 1.5 17 19.2 46.4 1.1 54.1 0.0 62.5 0.0
3 0.9 13 20.4 47.5 2.2 55.3 0.0 63.7 0.0
7 0.5 21 22.3 49.4 4.1 57.2 1.0 65.6 0.0
29 -0.1 41 26.8 54.0 8.7 61.8 5.5 70.1 2.7
30 -1.4 82 43.7 70.9 25.6 78.7 22.4 87.0 19.6
44 -1.9 48 52.8 80.0 34.6 87.7 31.5 96.1 28.6
35 -3.2 87 83.0 110.2 64.9 117.9 61.7 126.3 58.8

Periodo de retorno. Valor superior. §Valor inferior.

La selección entre las dos FDP no estacionarias LOG1 o LOG2 no debe basarse en el EEA, sino en el mejor ajuste logrado con las parejas de datos de Xi y SOIi , lo cual se alcanzó con un parámetro de ubicación con variación cuadrática con respecto a SOI, con 0.6274 como coeficiente de correlación polinomial. Además, el ajuste condujo a predicciones superiores en el valor extremo histórico de SOI de -3.2, relativo al año 1986.

Conclusiones

La generalización del método de los momentos L que propusieron El Adlouni y Ouarda (2008b) para ajustar la distribución GVE no estacionaria, se amplió a las funciones LOG y PAG, que son modelos de uso general en los análisis de frecuencias de datos hidrológicos extremos.

En este estudio se usaron seis distribuciones no estacionarias, GVE1, LOG1, PAG1, GVE2, LOG2 y PAG2, las que se aplicaron a tres registros con tendencia y un cuarto de precipitación máxima diaria anual, relacionada con el índice de la oscilación de sur. La selección del mejor ajuste se basó en el error estándar de ajuste y en el coeficiente de correlación entre los datos y la covariable.

A través de las cuatro aplicaciones numéricas se demuestra la sencillez del procedimiento operativo y el contraste de resultados con los obtenidos en las referencias de procedencia de esos datos, permitió verificar empíricamente su exactitud. Con base en las predicciones, se destaca su importancia y utilidad de los análisis probabilísticos de registros hidrológicos extremos no estacionarios.

Agradecimientos

Se agradece al editor designado su opinión de aceptación e inclusión del artículo. Al árbitro 2 se agradecen sus múltiples correcciones a la redacción.

Literatura Citada

Aissaoui-Fqayeh, I., S. El Adlouni, T. B. M. J. Ouarda, and A. St-Hilaire. 2009. Développement du modèle log-normal non-stationnaire et comparaison avec le modèle GEV non-stationnaire. Hydrol. Sci. J. 54: 1141-1156. [ Links ]

Álvarez-Olguín, G., y C. A. Escalante-Sandoval. 2016. Análisis de frecuencias no estacionario de series de lluvia anual. Tecnol. Cien. Agua VII: 71-88. [ Links ]

Asquith, W. H. 2011. Probability-Weighted Moments. In: Distributional Analysis with L-moment Statistics using the R Environment for Statistical Computing. Author edition (ISBN-13: 978-1463508418). Texas, U.S.A. pp: 77-86. [ Links ]

Benson, M. A. 1962. Plotting positions and economics of engineering planning. J. Hydraulics Div. 88: 57-71. [ Links ]

Campos-Aranda, D. F. 2003. Ajuste de Curvas. In: Introducción a los Métodos Numéricos: Software en Basic y aplicaciones en Hidrología Superficial. Editorial Universitaria Potosina. San Luis Potosí, S.L.P., México. pp. 93-127. [ Links ]

Campos-Aranda, D. F. 2012. Técnicas asociadas al Análisis de Frecuencia de Crecientes en cuencas con desarrollo urbano. Ing. Invest. Tecnol. XIII: 385-392. [ Links ]

Coles, S. 2001. An Introduction to Statistical Modeling of Extreme Values. Springer-Verlag London Limited. London, England. 208 p. [ Links ]

Davis, P. J. 1972. Gamma Function and related functions. In: Abramowitz M. and I. Stegun (eds). Handbook of Mathematical Functions. Dover Publications. New York, U.S.A. Ninth printing. pp: 253-296. [ Links ]

El Adlouni, S., T. B. M. J. Ouarda, X. Zhang, R. Roy, and B. Bobée. 2007. Generalized maximum likelihood estimators for the nonstationary generalized extreme value model. Water Resour. Res. 43: 1-13. [ Links ]

El Adlouni, S., B. Bobée, and T. B. M. J. Ouarda. 2008a. On the tails of extreme event distributions in hydrology. J. Hydrol. 355: 16-33. [ Links ]

El Adlouni, S., and T. B. M. J. Ouarda. 2008b. Comparaison des méthodes d’estimation des paramètres du modèle GEV non stationnaire. Revue Sciences L’Eau 21: 35-50. [ Links ]

Franks, S. W., C. J. White, and M. Gensen. 2015. Estimating extreme flood events-assumptions, uncertainty and error. Proc. IAHS, No. 369, pp: 31-36. [ Links ]

Greenwood, J. A., J. M. Landwehr, N. C. Matalas, and J. R. Wallis. 1979. Probability weighted moments: Definition and relation to parameters of several distributions expressible in inverse form. Water Resour. Res. 15: 1049-1054. [ Links ]

Hosking, J. R. M., and J. R. Wallis. 1997. Regional Frequency Analysis. An Approach Based on L-moments. Cambridge University Press. Cambridge, England. 224 p. [ Links ]

Jakob, D. 2013. Nonstationarity in extremes and engineering design. In: AghaKouchak, A., D. Easterling, K. Hsu, S. Schubert, and S. Sorooshian (eds). Extremes in a Changing Climate. Springer. Dordrecht, The Netherlands. pp: 393-417. [ Links ]

Katz, R. W. 2013. Statistical methods for nonstationary extremes. In: AghaKouchak, A., D. Easterling, K. Hsu, S. Schubert, and S. Sorooshian (eds). Extremes in a Changing Climate. Springer. Dordrecht, The Netherlands. pp: 15-37. [ Links ]

Khaliq, M. N., T. B. M. J. Ouarda, J. C. Ondo, P. Gachon, and B. Bobée. 2006. Frequency analysis of a sequence of dependent and/or non-stationary hydro-meteorological observations: A review. J. Hydrol. 329: 534-552. [ Links ]

Kim, S., W. Nam, H. Ahn, T. Kim, and J. H. Heo. 2015. Comparison of nonstationary generalized logistic models based on Monte Carlo simulation. Proc. IAHS, No. 371, pp: 65-68. [ Links ]

Kite, G. W. 1977. Comparison of frequency distributions. In: Frequency and Risk Analyses in Hydrology. Water Resources Publications. Fort Collins, Colorado, U.S.A. pp: 156-168. [ Links ]

Leclerc, M., and T. B. M. J. Ouarda. 2007. Non-stationary regional flood frequency analysis at ungauged sites. J. Hydrol. 343: 254-265. [ Links ]

López de la Cruz, J., y F. Francés. 2014. La variabilidad climática de baja frecuencia en la modelación no estacionaria de los regímenes de las crecidas en las regiones hidrológicas Sinaloa y Presidio-San Pedro. Tecnol. Cienc. Agua 5: 79-101. [ Links ]

Machiwal, D., and M. K. Jha. 2012. Methods for time series analysis. In: Hydrologic Time Series Analysis: Theory and Practice. Springer. Dordrecht, The Netherlands. pp: 51-84. [ Links ]

Martins, E. S., and J. R. Stedinger. 2000. Generalized maximum-likelihood GEV quantile estimators for hydrologic data. Water Resour. Res. 36: 737-744. [ Links ]

McCuen, R. H., and W. O. Thomas. 1990. Flood frequency analysis techniques for urbanizing watersheds. In: Symposium Proceedings on Urban Hydrology. American Water Resources Association. Bethesda, Maryland, U.S.A. pp: 35-46. [ Links ]

Meylan, P., A. C. Fabre, and A. Musy. 2012. Predictive Hydrology. A Frequency Analysis Approach. CRC Press. Boca Raton, Florida, U.S.A. 212 p. [ Links ]

Mudersbach, C., and J. Jensen. 2010. An advanced statistical extreme value model for evaluating storm surge heights considering systematic records and sea level scenarios. In: Proceedings of the 32nd Conference on Coastal Engineering. Shanghai, China. pp: 23. [ Links ]

Nadarajah, S. 2005. Extremes of daily rainfall in west central Florida. Clim. Change 69: 325-342. [ Links ]

Ostle, B., and R. W. Mensing. 1975. Regression analysis. In: Statistics in Research. Iowa State University Press. Ames, Iowa, U.S.A. Third edition. pp: 165-236. [ Links ]

Ouarda, T. B. M. J., and S. El Adlouni. 2011. Bayesian nonstationary frequency analysis of hydrological variables. J. Amer. Water Resour. Assoc. 47: 496-505. [ Links ]

Pandey, G. R., and V. T. V. Nguyen. 1999. A comparative study of regression based methods in regional flood frequency analysis. J. Hydrol. 225: 92-101. [ Links ]

Park, J. S., H. S. Kang, Y. S. Lee, and M. K. Kim. 2011. Changes in the extreme daily rainfall in South Korea. Int. J. Climatol. 31: 2290-2299. [ Links ]

Rao, A. R., and K. H. Hamed. 2000. Flood Frequency Analysis. CRC Press. Boca Raton, Florida, U.S.A. 350 p. [ Links ]

Sen, P. K. 1968. Estimates of the regression coefficient based on Kendall’s tau. J. Amer. Stat. Assoc. 63: 1379-1389. [ Links ]

Stedinger, J. R., R. M. Vogel, and E. Foufoula-Georgiou. 1993. Frequency analysis of extreme events. In: Maidment, D. R. (ed). Handbook of Hydrology. McGraw-Hill, Inc. New York, U.S.A. pp: 18.1-18.66. [ Links ]

Teegavarapu, R. S. V. 2012. Precipitation variability and teleconnections. In: Floods in a Changing Climate. Extreme Precipitation. International Hydrology Series (UNESCO) and Cambridge University Press. Cambridge, United Kingdom. pp: 169-192. [ Links ]

Zelen, M., and N. C. Severo. 1972. Probability functions. In: Abramowitz; M. and I. Stegun (eds). Handbook of Mathematical Functions. Dover Publications. New York, U.S.A. Ninth printing. pp: 925-995. [ Links ]

Recibido: 01 de Diciembre de 2016; Aprobado: 01 de Julio de 2017

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons