Contraste de la distribución Logística Generalizada en 31 registros históricos de eventos máximos anuales

Campos-Aranda, D.F.

Services on Demand

Journal

Article

Indicators

Cited by SciELO
Access statistics

Ingeniería, investigación y tecnología

On-line version ISSN 2594-0732Print version ISSN 1405-7743

Ing. invest. y tecnol. vol.14 n.1 Ciudad de México Jan./Mar. 2013

Contraste de la distribución Logística Generalizada en 31 registros históricos de eventos máximos anuales

Contrast of Generalized Logistic Distribution in 31 Historical Records of Annual Extreme Events

Campos-Aranda D.F.

Facultad de Ingeniería Universidad Autónoma de San Luis Potosí. Correo: campos_aranda@hotmail.com

Información del artículo: recibido: noviembre de 2011.
Aceptado: junio de 2012

Resumen

La distribución Logística Generalizada es la más reciente cuya aplicación ha sido establecida bajo precepto, por ello es importante su contraste con las otras dos que le precedieron, la Log-Pearson tipo III en USA y la General de Valores Extremos en Inglaterra. Se comenzó por destacar la importancia en la estimación de las crecientes de diseño, de los análisis probabilísticos y de las distribuciones citadas. Para la más reciente se describe con detalle la estimación de sus tres parámetros de ajuste por el método de momentos L. Además se propone su ajuste por minimización del error cuadrático medio a través optimización numérica. Los resultados de la aplicación de esta distribución en 31 registros de eventos máximos anuales, con base en los dos métodos citados, se contrastan con los óptimos obtenidos previamente con los modelos General de Valores Extremos y Log-Pearson tipo III. Se concluye que la distribución Logística Generalizada (LOG) es una opción conveniente para registros que muestran grandes cocientes L de curtosis y que en general sus resultados conducen a las predicciones más severas en los periodos de retorno extremos, en registros con valores dispersos.

Descriptores: distribución LOG, momentos L, cocientes de momentos L, diagrama de cocientes de momentos L, optimización numérica.

Abstract

The Generalized Logistic distribution is the most recent whose application has been established as precept. Thus, comparing it with the other two that preceded it: the Log-Pearson type III in USA and the General Extreme Values in England, is of high importance. In this work, the relevance of probabilistic analysis and the above mentioned distributions in design flood estimation is pointed out. For the most recent, a fitting method of L-moments is described in detail for the estimation of its three parameters, also a fitting by minimizing the quadratic mean error through numerical optimization is proposed. The results of the application of this distribution to 31 records, using both cited methods, are compared with the optimal ones obtained using the General Extreme Values and Log-Pearson type III models. It is concluded that the Generalized Logistic distribution is a good choice for records with high L-kurto-sis quotients and its predictions in general are more extreme in high return periods when applied to records with outliers.

Keywords: GLO distribution, L-moments, L-moment ratios, L-moment ratios diagram, numerical optimization.

Introducción

Las estimaciones fundamentales de los hidrólogos están relacionadas con el escurrimiento en dos escalas de tiempo, la mensual y la instantánea. En el primer caso, se buscan los volúmenes escurridos disponibles para el diseño hidrológico de embalses de aprovechamiento. En el segundo caso, se intenta obtener las crecientes que generan la cuenca estudiada, asociadas éstas a diversas probabilidades de excedencia, cuyo recíproco es el periodo de retorno o intervalo promedio de recurrencia en años. Las crecientes son básicas en el diseño y la revisión hidrológica de todo tipo de obras hidráulicas de protección como son: presas, diques, rectificaciones y encauzamientos; además permiten el dimensionamiento de las obras de cruce (alcantarillas y puentes).

La estimación de crecientes de diseño más confiable es la que está basada en los registros de gastos máximos anuales, existiendo actualmente dos enfoques de procesamiento, el local y el regional. El tratamiento local de los datos disponibles se aplica donde el registro es amplio (> 50 años), si es menor, pero cuenta con más de 25 años, los resultados de procesamiento local se deben ratificar mediante comparación con cuencas vecinas (WRC, 1977). Cuando el registro tiene menos de 25 años las estimaciones de crecientes deben estar basadas en el enfoque regional.

La estimación probabilística de crecientes ha evolucionado desde sus inicios en 1930 y 1941 con los estudios de Hazen y Gumbel (Maidment, 1993), hasta el uso de modelos probabilísticos físicamente basados. Una etapa importante aconteció a mediados de los años sesenta, cuando el Subcomité de Hidrología del US Water Resources Council, contrastó seis distribuciones comúnmente empleadas en esa época y concluyó que el modelo Log-Pearson tipo III (LP3) era el más conveniente y lo recomendó para uso general en las agencias de gobierno (Ponce, 1989). En un estudio similar en Inglaterra se determinó que las distribuciones de tres parámetros de ajuste (General de Valores Extremos, Pearson tipo III y LP3) conducían a mejores ajustes que los modelos de dos parámetros (NERC, 1975).

La propuesta de uso generalizado de la distribución general de valores extremos (GVE) incluye como caso especial a la distribución Gumbel, la cual ya era conocida y utilizada; además define a los modelos Log-Gumbel y Weibull, que son curvas en el papel de probabilidad Gumbel-Powell, el primero con concavidad hacia arriba y el segundo hacia abajo. La nueva versión del Flood Studies Report (NERC, 1975) se llama Flood Estimation Handbook y recomienda para los análisis de frecuencia de crecientes a la distribución Logística Generalizada, ajustada mediante el método de los momentos L, que es más confiable y consistente en registros sesgados (Mansell, 2003; Shaw et al., 2011).

Ya se han realizado contrastes de las distribuciones GVE y LP3 (Campos, 2001 y 2002a, b) en 31 registros históricos de eventos máximos anuales con amplitudes variando de 16 a 113 años. Por tanto, el objetivo de este estudio fue aplicar la distribución Logística Generalizada (LOG) a tales registros históricos mediante dos métodos de ajuste, el de momentos L y el de optimización numérica y confrontar sus resultados con los óptimos obtenidos para los modelos citados, finalmente formular conclusiones relativas a esta última distribución.

Desarrollo

Momentos y cocientes L muestrales

Son un sistema alternativo para describir las formas de las funciones de distribución de probabilidades (FDP). Históricamente aparecen como modificaciones de los momentos de probabilidad pesada (MPP) desarrollados por Greenwood et al. (1979). Los momentos L son combinaciones lineales de los MPP, de manera que (Hosking y Wallis, 1997):

Además se definen los cocientes (τ) de momentos L, comenzando con L-Cv que es análogo al coeficiente de variación y después los de similitud con los coeficientes de asimetría (Cs) y de curtosis (Ck):

En una muestra de tamaño n, con sus elementos arreglados en orden ascendente (x₁ ≤ x₂ ≤ ... ≤ x_n) los estimadores insesgados de β_r son:

Los estimadores muestrales de λ_r serán l_r estando definidos por las ecuaciones 1 a 4 y los de los cocientes serán t₂, t₃ y t₄, según las ecuaciones 5 a 7.

Diagrama de momentos L

Hosking y Wallis (1997) establecieron la relación que guardan los cocientes de momentos L de asimetría y curtosis en cinco distribuciones de probabilidad (figura 1): logística generalizada (LOG), general de valores extremos (GVE), Log-Normal de 3 parámetros (LN3), Pearson tipo III (PT3) y pareto generalizada (PAG).

Registros procesados

Las referencias de procedencia de los 31 registros históricos que se usarán se pueden consultar en Campos (2001, 2002a, b), así como sus parámetros estadísticos insesgados. En cambio, en el cuadro 1 se presentan los valores de sus momentos y cocientes L, según las ecuaciones 1 a 7. Los valores de los cocientes τ₃ y τ₄ de cada registro se llevaron al diagrama de momentos L para dibujar puntos que por su cercanía a una cierta curva, definen la distribución de probabilidades más conveniente (figura 1).

Estos resultados están en la columna 2 del cuadro 2 y lógicamente sólo pueden ser los modelos: LOG, GVE, LN3, PT3 y PAG. Además se observa que únicamente los registros números 3, 4, 6, 7, 10, 23, 26 y 28 se aproximan a la curva de la distribución LOG y que los registros números 2, 8, 9 y 31 son los más alejados de ella.

La distribución LOG se aplicará a los 31 registros procesados, pero en el análisis de resultados se revisará con mayor acuciosidad estos dos grupos de registros.

Ajuste de la distribución Logística Generalizada mediante momentos L

Este modelo probabilístico tiene tres parámetros: ξ, (ubicación), α (escala) y k (forma). La variable x fluctúa así: - ∞ < x ≤ ξ, + α/k si k > 0, de - ∞ < x < ∞ si k = 0 y de ξ, + α/k ≤ x < ∞ si k < 0. Incluye como caso especial a la distribución Logística cuando k = 0, sus funciones de densidad y de distribución de probabilidades son (Hosking y Wallis, 1997):

Las soluciones inversas son:

donde F es probabilidad de no excedencia. Las expresiones de los parámetros de ajuste son:

Ajuste de la distribución Logística Generalizada mediante optimización numérica

Las distribuciones general de valores extremos (GVE) y Log-Pearson tipo III (LP3) se ajustaron mediante optimización numérica para minimizar el error cuadrático medio y el error absoluto medio. Los resultados muestran (Campos, 2001; 2002b) similitud en las predicciones alcanzadas con cada enfoque, además de que se observa una correspondencia numérica entre los valores mínimos de tales errores que son alcanzados en cada registro. Debido a lo anterior, se consideró suficiente contrastar la distribución logística generalizada (LOG) minimizando únicamente el error cuadrático medio, usualmente conocido como error estándar de ajuste (EEA). Nuevamente, este proceso se realizó con base en el algoritmo de múltiples variables no restringidas de Rosenbrock (Kuester y Mize, 1973; Campos 2003), considera como variables a optimizar sus tres parámetros de ajuste, al igual que en el modelo GVE, cuyos valores iniciales fueron los del método de momentos L. En cambio, en la distribución LP3 tales variables de ajuste corresponden a los estadísticos logarítmicos, media, desviación estándar y coeficiente de asimetría corregido, es decir: Ym, Sy y g_c (Campos, 2002b).

Resultados y discusión

Resumen de resultados

En el cuadro 2 para cada registro procesado hay seis renglones de resultados, los dos primeros proceden de Campos (2001) y corresponden a los parámetros de ajuste (u, α, k), EEA y predicciones con periodos de retorno 10, 25, 50, 100, 500, 1 000 y 10 000 años obtenidas con la distribución GVE, con uno de los cuatro métodos de ajuste, el que condujo al EEA mínimo y con el ajuste mediante optimización numérica (OPN), indicando, en la columna 8 del cuadro 2, los números de etapas y evaluaciones de la función objetivo (EEA) realizadas; en la columna 3 se indica el método de ajuste (MA): momentos L (MOL), optimización numérica (OPN), máxima verosimilitud (MMV), sextiles (SEX), momentos en el dominio logarítmico (MML), mezcla de momentos (MMM), máxima entropía (MME) y promedios diversos (MPD). Los siete periodos de retorno citados, cubren los diversos dimensionamientos y/o revisiones hidrológicas de las obras hidráulicas.

De manera similar, en los renglones 3 y 4 de cada registro se presentan idénticos resultados para la distribución LP3, pero utilizando alguno de sus seis métodos de ajuste y el de OPN. Finalmente en los renglones 5 y 6 de cada registro están los resultados de la distribución LOG, en este caso, ajustada mediante el método de momentos L (ecuaciones 16 a 20) y de OPN.

El algoritmo de OPN únicamente falló en los registros 19, 25 y 31 al ajustar la distribución LOG, lo cual se corrigió limitando el número de etapas permitido a la última en que se tenían resultados consistentes.

Análisis global de resultados

En el cuadro 2 se presenta un contraste global de los resultados obtenidos para los tres modelos probabilísticos probados (GVE, LP3 y LOG), concluyéndose:

1) En todos los casos, con el método de optimización numérica (OPN), el EEA es reducido más allá del mínimo obtenido con los procedimientos estadísticos;

2) Las tres distribuciones conducen a valores del EEA del mismo orden de magnitud, ya sea a través de los métodos estadísticos o con el de OPN;

3) Lo mismo se puede decir para sus parámetros de ajuste, los cuales no cambian radicalmente con el método de ajuste;

4) Respecto a las predicciones, en general, sus magnitudes son bastante coincidentes en periodos de retorno bajos (< 50 años), incluso en ciertos registros hasta los periodos de retorno elevados (>1,000 años), tal es el caso de los registros 2, 6, 9, 16, 18, 20, 22, 26, 27, 28 y 31;

5) En registros que presentan valores extremos dispersos (outliers), sus predicciones en los periodos de retorno altos (> 1,000 años) varían notablemente, como en los registros 10, 11, 12, 17 y 25.

Las observaciones globales del cuadro 2 destacan que la distribución LP3 es mucho menos flexible en la búsqueda del EEA mínimo a través del método de OPN, como se muestra por la similitud entre sus predicciones en los periodos de retorno de 1,000 y 10,000 años, las cuales casi siempre resultaron similares con el método estadístico y el de OPN. Lo contrario ocurre con las distribuciones GVE y LOG, las cuales casi siempre conducen a predicciones bastante dispersas en los periodos de retorno citados, con el método estadístico de ajuste y con la OPN.

Análisis específico de resultados

Para los ocho registros donde es recomendable la distribución LOG se observa (cuadro 2) que sus EEA mínimos son plenamente coincidentes con los de los modelos GVE y LP3. También son similares las predicciones de los tres modelos en los periodos de retorno reducidos, pero en general resultan superiores las de la distribución LOG en relación con las otras dos, en los periodos de retorno de 1 000 y 10 000 años. Cuando el modelo LOG no es el más conveniente, por ejemplo en los registros 2, 8, 9 y 31, sus EEA mínimos son mayores que los obtenidos con las distribuciones GVE y LP3 y también sus predicciones resultan superiores en los periodos de retorno elevados.

Conclusiones

La aplicación de las tres distribuciones de probabilidad contrastadas (general de valores extremos, Log-Pearson tipo III y logística generalizada) es recomendable en los análisis probabilísticos de crecientes y de otros datos hidrológicos extremos, debido a la consistencia o similitud numérica que presentan todas sus predicciones en los periodos de retorno reducidos (< 50 años), sin importar el método de ajuste. La distribución logística generalizada ofrece una opción probabilística adecuada o conveniente a los registros con valores grandes del cociente L de curtosis (τ₄), tanto en los análisis probabilísticos locales como regionales. En registros que presenten valores extremos dispersos (outliers), la distribución logística generalizada, permitirá un ajuste muy bueno a los datos, por medio del método de optimización numérica, pero debido a ello sus predicciones en los periodos de retorno elevados serán muy grandes.

Referencias

Campos-Aranda D.F. Contraste de cinco métodos de ajuste de la distribución GVE en 31 registros históricos de eventos máximos anuales. Ingeniería Hidráulica en México, volumen XVI (número 2), abril-junio de 2001: 77-92. [ Links ]

Campos-Aranda D.F. Contraste de seis métodos de ajuste de la distribución Log-Pearson tipo III en 31 registros históricos de eventos máximos anuales. Ingeniería Hidráulica en México, volumen XVII (número 2), abril-junio de 2002a: 77-97. [ Links ]

Campos-Aranda D.F. Ajuste de la distribución Log-Pearson tipo III por medio de optimización numérica no restringida. Ingeniería Hidráulica en México, volumen XVII (número 4), octubre-noviembre de 2002b: 115-128. [ Links ]

Campos-Aranda D.F. Introducción a los Métodos Numéricos: Software en Basic y aplicaciones en Hidrología Superficial, capítulo 9: Optimización numérica, pp. 172-211, San Luis Potosí, SLP, Librería Universitaria Potosina, 2003, 222 p. [ Links ]

Greenwood J.A., Landwehr J.M., Matalas N.C., Wallis J.R. Probability Weighted Moments: Definition and Relation to Parameters of Several Distributions Expressible in Inverse Form. Water Resources Research, volumen 15, 1979: 1049-1054. [ Links ]

Hosking J.R.M., Wallis J.R. Regional Frequency Analysis. An Approach Based on L-Moments, Appendix: L-Moments for Some Specific Distributions, pp. 191-209, Cambridge, Inglaterra, Cambridge University Press, 1997, 224 p. [ Links ]

Kuester J.L., Mize J.H.. Optimization Techniques with Fortran, RO-SENB Algorithm, pp. 320-330, Nueva York, USA, McGraw-Hill Book Co., 1973. [ Links ]

Maidment D.R. Hydrology, en: Handbook of Hydrology, pp. 1.11.15, editor Maidment D.R. , Nueva York, USA, McGraw-Hill, Inc., 1993. [ Links ]

Mansell M.G. Rural and Urban Hydrology, capítulo 8: The Analysis and Predictions of Flows, pp. 319-354, Londres, Inglaterra, Thomas Telford Publishing Ltd., 2003, 411 p. [ Links ]

Natural Environment Research Council (NERC). Flood Studies Report, volumen I: Hydrological Studies, Londres, Inglaterra, 1975, 550 p. [ Links ]

Ponce V.M. Engineering Hydrology. Principles and Practices., capítulo 6: Frequency Analysis, pp. 205-232, Englewood Cliffs, NJ, USA, Prentice Hall, 1989, 640 p. [ Links ]

Shaw E.M., Beven K.J., Chappel N.A., Lamb R. Hydrology in Practice, capítulo 13: Estimating Floods and Low Flows in the UK, pp. 322-350, 4a ed., Londres, Inglaterra, Spon Press, 2011, 543 p. [ Links ]

Water Resources Council (WRC). Guidelines for Determining Flood Flow Frequency. Bulletin # 17A of the Hydrology Committee, Washington DC, USA, 1977. [ Links ]

Semblanza del autor

Daniel Francisco Campos-Aranda. Obtuvo el título de ingeniero civil en diciembre de 1972, en la entonces Escuela de Ingeniería de la UASLP. Durante el primer semestre de 1977, realizó en Madrid, España un diplomado en hidrología general y aplicada. Posteriormente, durante 1980-1981 llevó a cabo estudios de maestría en ingeniería en la especialidad de hidráulica, en la División de Estudios de Posgrado de la Facultad de Ingeniería de la UNAM. En esa misma institución, inició (1984) y concluyó (1987) el doctorado en ingeniería con especialidad en aprovechamientos hidráulicos. Ha publicado artículos, principalmente en revistas mexicanas de excelencia: 40 en Tecnología y Ciencias del Agua (antes Ingeniería Hidráulica en México), 14 en Agrociencia y 11 en Ingeniería. Investigación y Tecnología. Fue investigador nacional (nivel I) desde el 1° de julio de 1991 hasta el 31 de diciembre del 2007. Actualmente es profesor jubilado de la UASLP, desde el 1°. de febrero del 2003. En noviembre de 1989 obtuvo la medalla Gabino Barreda de la UNAM y en 2008 le fue otorgado el Premio Nacional "Francisco Torres H." de la AMH, a la práctica profesional de la hidráulica.