<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>1405-3195</journal-id>
<journal-title><![CDATA[Agrociencia]]></journal-title>
<abbrev-journal-title><![CDATA[Agrociencia]]></abbrev-journal-title>
<issn>1405-3195</issn>
<publisher>
<publisher-name><![CDATA[Colegio de Postgraduados]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S1405-31952011000800002</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Transferencia de información hidrológica mendiante regresión lineal múltiple, con selección óptima de regresores]]></article-title>
<article-title xml:lang="en"><![CDATA[Transference of hydrologic information through multiple linear regression, with best predictor variables selection]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Campos-Aranda]]></surname>
<given-names><![CDATA[Daniel F.]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Autónoma de San Luis Potosí Facultad de Ingeniería ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>12</month>
<year>2011</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>12</month>
<year>2011</year>
</pub-date>
<volume>45</volume>
<numero>8</numero>
<fpage>863</fpage>
<lpage>880</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_arttext&amp;pid=S1405-31952011000800002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&amp;pid=S1405-31952011000800002&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_pdf&amp;pid=S1405-31952011000800002&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Es necesario contar con registros largos de información hidrológica anual para obtener una imagen más apegada a la realidad de su variabilidad, así como estimaciones confiables de sus propiedades estadísticas. Para obtener tales registros es común buscar fuentes adicionales de datos y técnicas de transferencia. Una técnica es la regresión lineal múltiple, cuya aplicación numérica lleva implícita la selección óptima de los registros largos cercanos (regresores) para buscar que la ampliación del registro corto sea una estimación confiable. Este proceso de selección implica tres análisis: 1) cómo definir las mejores estimaciones, 2) cuáles ecuaciones de regresión investigar, y 3) cuál modelo tiene mejor capacidad predictiva. Para el primer análisis se presentan cuatro criterios basados en las sumas de los cuadrados de los residuos; para el segundo se investigan todas las regresiones posibles porque en los problemas de transferencia de información hidrológica se dispondrá máximo de cinco regresores; para el tercero, seleccionar el mejor modelo predictivo se utiliza el análisis de residuales y la validación cruzada. La aplicación numérica descrita es una ampliación del registro de volúmenes escurridos anuales en la estación hidrométrica Platón Sánchez del sistema del río Tempoal, en la Región Hidrológica No. 26 (Pánuco, México). En este caso se utilizan cuatro regresores que son los registros del resto de las estaciones de aforos de tal sistema. Se concluye que incluso en problemas con multicolinealidad, los criterios de selección y los análisis expuestos conducen a resultados consistentes y permiten obtener las mejores ecuaciones de regresión. La similitud de los resultados alcanzados con los modelos de regresión seleccionados genera confianza en las estimaciones adoptadas.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[It is necessary to have long records of annual hydrological data to get a truer picture of their variability, as well as reliable estimates of their statistical properties. To obtain these records it is common to use additional sources of data and transfer techniques. One technique is the multiple linear regression whose numerical application implies the optimum selection of close lengthy records (regressors) to have the extension of short registration be a reliable estimate. This selection process involves three analyses: 1) how to define the best estimates, 2) what regression equations should be investigated, and 3) which model has better predictive ability. For the first analysis four criteria based on the sums of the squares of the residuals are presented; for the second all possible regressions are investigated since in the problems of hydrological information transfer, we will have five regressors at the most; for the third, about selecting the best predictive model, we used the residual analysis and cross-validation. The numerical application described is an extension of the annual runoff volume record in the Platón Sánchez hydrometric station of the Tempoal river system in the 26 Hydrological Region (Pánuco, México). Here we used four regressors that are the records of other gauging stations in such system. We came to the conclusion that even in problems with multicollinearity, the selection criteria and analysis led to consistent results and allowed for the best regression equations. The similarity of the results obtained with the selected regression models generated confidence in the estimates adopted.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[cuadrado medio de los residuos]]></kwd>
<kwd lng="es"><![CDATA[multicolinealidad]]></kwd>
<kwd lng="es"><![CDATA[análisis de residuales]]></kwd>
<kwd lng="es"><![CDATA[prueba de Durbin-Watson]]></kwd>
<kwd lng="es"><![CDATA[validación cruzada]]></kwd>
<kwd lng="es"><![CDATA[Río Tempoal]]></kwd>
<kwd lng="en"><![CDATA[residual mean square]]></kwd>
<kwd lng="en"><![CDATA[multicollinearity]]></kwd>
<kwd lng="en"><![CDATA[residual analysis]]></kwd>
<kwd lng="en"><![CDATA[Durbin-Watson test]]></kwd>
<kwd lng="en"><![CDATA[cross-validation]]></kwd>
<kwd lng="en"><![CDATA[Rio Tempoal]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="justify"><font face="verdana" size="4">Agua&#150;suelo&#150;clima</font></p>     <p align="justify"><font face="verdana" size="4">&nbsp;</font></p>     <p align="center"><font face="verdana" size="4"><b>Transferencia de informaci&oacute;n hidrol&oacute;gica mendiante regresi&oacute;n lineal m&uacute;ltiple, con selecci&oacute;n &oacute;ptima de regresores</b></font></p>     <p align="center"><font face="verdana" size="2">&nbsp;</font></p>     <p align="center"><font face="verdana" size="3"><b>Transference of hydrologic information through multiple linear regression, with best predictor variables selection</b></font></p>     <p align="center"><font face="verdana" size="2">&nbsp;</font></p>     <p align="center"><font face="verdana" size="2"><b>Daniel F. Campos&#150;Aranda<sup>1</sup></b></font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><i><sup>1</sup> Facultad de Ingenier&iacute;a de la Universidad Aut&oacute;noma de San Luis Potos&iacute;. Genaro Codina N&uacute;m. 240. 78280 San Luis Potos&iacute;, San Luis Potos&iacute;. </i>(<a href="mailto:campos_aranda@hotmail.com">campos_aranda@hotmail.com</a>). <i>* Autor responsable.</i></font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"> Recibido: junio, 2011.     <br> Aprobado: octubre, 2011. </font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Resumen</b></font></p>     <p align="justify"><font face="verdana" size="2">Es necesario contar con registros largos de informaci&oacute;n hidrol&oacute;gica anual para obtener una imagen m&aacute;s apegada a la realidad de su variabilidad, as&iacute; como estimaciones confiables de sus propiedades estad&iacute;sticas. Para obtener tales registros es com&uacute;n buscar fuentes adicionales de datos y t&eacute;cnicas de transferencia. Una t&eacute;cnica es la regresi&oacute;n lineal m&uacute;ltiple, cuya aplicaci&oacute;n num&eacute;rica lleva impl&iacute;cita la selecci&oacute;n &oacute;ptima de los registros largos cercanos (regresores) para buscar que la ampliaci&oacute;n del registro corto sea una estimaci&oacute;n confiable. Este proceso de selecci&oacute;n implica tres an&aacute;lisis: 1) c&oacute;mo definir las mejores estimaciones, 2) cu&aacute;les ecuaciones de regresi&oacute;n investigar, y 3) cu&aacute;l modelo tiene mejor capacidad predictiva. Para el primer an&aacute;lisis se presentan cuatro criterios basados en las sumas de los cuadrados de los residuos; para el segundo se investigan todas las regresiones posibles porque en los problemas de transferencia de informaci&oacute;n hidrol&oacute;gica se dispondr&aacute; m&aacute;ximo de cinco regresores; para el tercero, seleccionar el mejor modelo predictivo se utiliza el an&aacute;lisis de residuales y la validaci&oacute;n cruzada. La aplicaci&oacute;n num&eacute;rica descrita es una ampliaci&oacute;n del registro de vol&uacute;menes escurridos anuales en la estaci&oacute;n hidrom&eacute;trica Plat&oacute;n S&aacute;nchez del sistema del r&iacute;o Tempoal, en la Regi&oacute;n Hidrol&oacute;gica No. 26 (P&aacute;nuco, M&eacute;xico). En este caso se utilizan cuatro regresores que son los registros del resto de las estaciones de aforos de tal sistema. Se concluye que incluso en problemas con multicolinealidad, los criterios de selecci&oacute;n y los an&aacute;lisis expuestos conducen a resultados consistentes y permiten obtener las mejores ecuaciones de regresi&oacute;n. La similitud de los resultados alcanzados con los modelos de regresi&oacute;n seleccionados genera confianza en las estimaciones adoptadas.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Palabras clave: </b>cuadrado medio de los residuos, multicolinealidad, an&aacute;lisis de residuales, prueba de Durbin&#150;Watson, validaci&oacute;n cruzada, R&iacute;o Tempoal.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Abstract</b></font></p>     <p align="justify"><font face="verdana" size="2">It is necessary to have long records of annual hydrological data to get a truer picture of their variability, as well as reliable estimates of their statistical properties. To obtain these records it is common to use additional sources of data and transfer techniques. One technique is the multiple linear regression whose numerical application implies the optimum selection of close lengthy records (regressors) to have the extension of short registration be a reliable estimate. This selection process involves three analyses: 1) how to define the best estimates, 2) what regression equations should be investigated, and 3) which model has better predictive ability. For the first analysis four criteria based on the sums of the squares of the residuals are presented; for the second all possible regressions are investigated since in the problems of hydrological information transfer, we will have five regressors at the most; for the third, about selecting the best predictive model, we used the residual analysis and cross&#150;validation. The numerical application described is an extension of the annual runoff volume record in the Plat&oacute;n S&aacute;nchez hydrometric station of the Tempoal river system in the 26 Hydrological Region (P&aacute;nuco, M&eacute;xico). Here we used four regressors that are the records of other gauging stations in such system. We came to the conclusion that even in problems with multicollinearity, the selection criteria and analysis led to consistent results and allowed for the best regression equations. The similarity of the results obtained with the selected regression models generated confidence in the estimates adopted.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Keywords: </b>residual mean square, multicollinearity, residual analysis, Durbin&#150;Watson test, cross&#150;validation, Rio Tempoal.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Introducci&oacute;n</b></font></p>     <p align="justify"><font face="verdana" size="2">En general, las estimaciones de las caracter&iacute;sticas estad&iacute;sticas de un registro hidrol&oacute;gico de valores anuales son m&aacute;s confiables y consistentes si &eacute;ste es m&aacute;s amplio, porque al ser m&aacute;s largo es m&aacute;s probable que incluya periodos de a&ntilde;os secos y h&uacute;medos y no s&oacute;lo de uno de ellos. Las principales variables en la pr&aacute;ctica hidrol&oacute;gica son precipitaci&oacute;n, escurrimiento y crecientes, donde el volumen escurrido anual tiene relevancia en todas las estimaciones asociadas con la disponibilidad y el dise&ntilde;o hidrol&oacute;gico de embalses para abastecimiento. La t&eacute;cnica b&aacute;sica para ampliar registros hidrol&oacute;gicos anuales es la regresi&oacute;n lineal, la cual permite la transferencia de informaci&oacute;n de un sitio a otro. Cuando esta t&eacute;cnica se aplica regionalmente, es decir, se transporta informaci&oacute;n de varios sitios o registros al de inter&eacute;s, se usa la regresi&oacute;n lineal m&uacute;ltiple y es necesario seleccionar las mejores variables predictivas o registros auxiliares, tambi&eacute;n llamados regresores.</font></p>     <p align="justify"><font face="verdana" size="2">El objetivo de este estudio fue exponer la t&eacute;cnica de transferencia de informaci&oacute;n hidrol&oacute;gica de variables anuales, mediante regresi&oacute;n lineal m&uacute;ltiple, para ampliar registros cortos de vol&uacute;menes escurridos con base en las series largas cercanas, seleccionando la mejor ecuaci&oacute;n de regresi&oacute;n de entre todas las posibles. La formulaci&oacute;n matem&aacute;tica se presenta de manera simple al utilizar la soluci&oacute;n matricial, se exponen con detalle los criterios de selecci&oacute;n y validaci&oacute;n, y se desarrolla un ejemplo num&eacute;rico en el sistema del r&iacute;o Tempoal, de la Regi&oacute;n Hidrol&oacute;gica No. 26 (P&aacute;nuco, M&eacute;xico), para ampliar el registro corto de la estaci&oacute;n hidrom&eacute;trica Plat&oacute;n S&aacute;nchez utilizando los cuatro registros largos disponibles en tal sistema.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Materiales y M&eacute;todos</b></font></p>     <p align="justify"><font face="verdana" size="2"><b>Regresi&oacute;n lineal m&uacute;ltiple</b></font></p>     <p align="justify"><font face="verdana" size="2">Esta regresi&oacute;n es &uacute;til cuando la variable dependiente (<i>y</i>) no est&aacute; relacionada s&oacute;lo con otra (<i>x</i>), sino que depende de varias, las cuales no est&aacute;n correlacionadas entre si y tanto <i>y </i>como todas las otras variables <i>x </i>proceden de una poblaci&oacute;n Normal multivariada (Gilroy, 1970; Salas <i>et al., </i>2008). La expresi&oacute;n de este modelo de regresi&oacute;n es:</font></p>     <p align="center"><font face="verdana" size="2"><img src="/img/revistas/agro/v45n8/a2s1.jpg"></font></p>     <p align="justify"><font face="verdana" size="2">Las ecuaciones normales se obtienen igual que para la recta de regresi&oacute;n lineal, pero ahora la ecuaci&oacute;n del error depende de <i>x</i>m variables y por tanto se establece igual n&uacute;mero de ecuaciones; en forma matricial el sistema es el siguiente (Campos, 2003):</font></p>     ]]></body>
<body><![CDATA[<p align="center"><font face="verdana" size="2"><img src="/img/revistas/agro/v45n8/a2s2.jpg"></font></p>     <p align="justify"><font face="verdana" size="2">en notaci&oacute;n matricial:</font></p>     <p align="center"><font face="verdana" size="2"><img src="/img/revistas/agro/v45n8/a2s3.jpg"></font></p>     <p align="justify"><font face="verdana" size="2">Cuando se utiliza este modelo de regresi&oacute;n para transportar informaci&oacute;n hidrol&oacute;gica desde varios sitios, el problema es seleccionar del grupo de regresores candidatos (registros disponibles), el subconjunto que conviene usar en el modelo. Tal selecci&oacute;n implica dos objetivos contrapuestos (Montgomery <i>et al., </i>2002): 1) que el modelo incluya tantos regresores como sea posible, para que el contenido de informaci&oacute;n en ellos pueda influir favorablemente en la estimaci&oacute;n de <i>y; </i>y 2) que el modelo incorpore el menor n&uacute;mero posible de regresores porque la varianza de la estimaci&oacute;n de <i>y </i>aumenta con el n&uacute;mero de &eacute;stos. El proceso de encontrar un modelo que cumpla ambos objetivos se llama selecci&oacute;n &oacute;ptima de regresores y, en general, los diferentes algoritmos para realizarlo conducen a resultados diferentes debido a la presencia de valores at&iacute;picos y correlaci&oacute;n entre los registros candidatos (McCuen, 1998; Montgomery <i>et al., </i>2002).</font></p>     <p align="justify"><font face="verdana" size="2">Dos aspectos fundamentales del problema de selecci&oacute;n &oacute;ptima de regresores son la generaci&oacute;n de los modelos con subconjuntos y la decisi&oacute;n de si un subconjunto es mejor que otro. Aqu&iacute; se exponen los cuatro criterios usados para evaluar y comparar ecuaciones de regresi&oacute;n con subconjuntos, y luego cuales modelos revisar.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Coeficiente de determinaci&oacute;n m&uacute;ltiple</b></font></p>     <p align="justify"><font face="verdana" size="2">Es quiz&aacute;s la medida m&aacute;s utilizada para medir lo adecuado de un modelo de regresi&oacute;n. Se designa por <i>R<sub>p</sub><sup>2</sup> </i>cuando el modelo tiene un subconjunto de <i>p </i>t&eacute;rminos, es decir, p&#150;1 regresores y un t&eacute;rmino <i>a</i><sub>0</sub> de ordenada al origen, y la ecuaci&oacute;n es:</font></p>     <p align="center"><font face="verdana" size="2"><img src="/img/revistas/agro/v45n8/a2s4.jpg"></font></p>     <p align="justify"><font face="verdana" size="2">donde <img src="/img/revistas/agro/v45n8/a2s12.jpg"><i>p</i> es la estimaci&oacute;n de la variable <i>y<sub>i</sub></i> a trav&eacute;s de la ecuaci&oacute;n de regresi&oacute;n, por ello <i>SC<sub>Res</sub></i>(<i>p</i>) es la suma de cuadrados de los residuos y <i>SC<sub>y</sub> </i>es la varianza total de la variable dependiente cuya media aritm&eacute;tica es <img src="/img/revistas/agro/v45n8/a2s13.jpg">. Siendo Kel n&uacute;mero de regresores candidatos, el problema asociado al uso de <i>R<sub>p</sub><sup>2</sup></i>, es que aumenta conforme lo hace <i>p </i>y es m&aacute;ximo cuando <i>p=K</i>+1. Entonces, para aplicar este criterio de selecci&oacute;n de modelos se agregan regresores hasta un n&uacute;mero en que el siguiente ya no produce un aumento significativo en <i><i>R<sub>p</sub><sup>2</sup></i></i>.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Coeficiente de determinaci&oacute;n m&uacute;ltiple ajustado</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Designado por <img src="/img/revistas/agro/v45n8/a2s14.jpg">, no necesariamente aumenta al introducir regresores, sino que al introducir <i>s </i>regresores, <img src="/img/revistas/agro/v45n8/a2s15.jpg">&gt; <img src="/img/revistas/agro/v45n8/a2s14.jpg"> si y s&oacute;lo si, la estad&iacute;stica <i>F </i>parcial es mayor que 1. Por tanto, este criterio permite seleccionar el subconjunto &oacute;ptimo a trav&eacute;s de su valor m&aacute;ximo (Montgomery <i>et al., </i>2002) y su f&oacute;rmula es:</font></p>     <p align="center"><font face="verdana" size="2"><img src="/img/revistas/agro/v45n8/a2s5.jpg"></font></p>     <p align="justify"><font face="verdana" size="2"><b>Cuadrado medio de los residuos</b></font></p>     <p align="justify"><font face="verdana" size="2">Este criterio tiene un comportamiento de decaimiento que se estabiliza y luego crece, pues en alg&uacute;n punto (<i>p</i>) la disminuci&oacute;n del numerador no es suficiente para compensar la p&eacute;rdida de un grado de libertad del denominador. Entonces el subconjunto &oacute;ptimo ser&aacute; el que define el valor m&iacute;nimo, cuya expresi&oacute;n es (Montgomery <i>et al., </i>2002):</font></p>     <p align="center"><font face="verdana" size="2"><img src="/img/revistas/agro/v45n8/a2s6.jpg"></font></p>     <p align="justify"><font face="verdana" size="2"><b>Estad&iacute;stica <i>C </i>de Mallows</b></font></p>     <p align="justify"><font face="verdana" size="2">El valor de <i>C<sub>p</sub> </i>se puede dibujar en una gr&aacute;fica de <i>p </i>en las abscisas que incluya la recta a 45&deg; (<i>C<sub>p</sub></i>= p). Las ecuaciones de regresi&oacute;n con poco sesgo tendr&aacute;n valores de <i>C<sub>p</sub> </i>pr&oacute;ximos a la recta y aqu&eacute;llas con sesgo apreciable se apartar&aacute;n de &eacute;sta. Se prefieren los valores menores de <i>C<sub>p</sub>, </i>pues indican menor error total, y la ecuaci&oacute;n de <i>C </i>es (Montgomery <i>et al., </i>2002):</font></p>     <p align="center"><font face="verdana" size="2"><img src="/img/revistas/agro/v45n8/a2s7.jpg"></font></p>     <p align="justify"><font face="verdana" size="2">Al usar el cuadrado medio del modelo regresional completo como denominador se supone que tiene un sesgo despreciable. Si el modelo completo tiene varios regresores que no contribuyen significativamente, es decir que tienen coeficientes <i>a<sub>i</sub> </i>cercanos a cero, el denominador de la ecuaci&oacute;n 7 estar&aacute; sobreestimado y los <i>C<sub>p</sub></i> ser&aacute;n peque&ntilde;os. En tales casos se puede usar el m&iacute;nimo cuadrado medio obtenido, sin importar que regresores lo originaron; ello conducir&aacute; a un <i>C<sub>p</sub>=p </i>para tal modelo regresional.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Ecuaciones de regresi&oacute;n con subconjuntos</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Hay dos procedimientos de an&aacute;lisis de los diferentes modelos de regresi&oacute;n que se pueden formar con los subconjuntos de variables regresoras candidatos; el primero consiste en procesar todas las regresiones posibles y el segundo en realizar una regresi&oacute;n por segmentos. Cuando se analizan todas las regresiones posibles se busca el mejor modelo seg&uacute;n uno o varios criterios de selecci&oacute;n, entre ecuaciones que tienen un regresor candidato, dos regresores, o m&aacute;s. Ya que el t&eacute;rmino de ordenada al origen (<i>a</i><sub>0</sub>) se incluye en todas las regresiones y como hay <i>K </i>regresores candidatos, entonces habr&aacute; 2<i><sup>K</sup></i> ecuaciones por estimar y examinar; por ejemplo si <i>K</i>=4, hay 2<sup>4</sup>=16 ecuaciones posibles, en cambio si K=8, hay 2<sup>8</sup>=256 regresiones por analizar. Este procedimiento se vuelve impr&aacute;ctico para <i>K</i>&gt; 5. En la regresi&oacute;n por segmentos se eval&uacute;a s&oacute;lo una peque&ntilde;a cantidad de ecuaciones, agregando o eliminando regresores uno por uno. Hay diversos algoritmos de este procedimiento, por ejemplo, selecci&oacute;n hacia adelante, eliminaci&oacute;n hacia atr&aacute;s y sus combinaciones (McCuen, 1998).</font></p>     <p align="justify"><font face="verdana" size="2">Debido a que en la transferencia de informaci&oacute;n hidrol&oacute;gica dif&iacute;cilmente se dispone de cinco registros aleda&ntilde;os o regresores candidatos, el procedimiento sugerido para el an&aacute;lisis de las regresiones por subconjuntos, es el de procesar todas las ecuaciones posibles, las cuales se indican en el <a href="/img/revistas/agro/v45n8/a2c1.jpg" target="_blank">Cuadro 1</a>.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Validaci&oacute;n de los modelos seleccionados</b></font></p>     <p align="justify"><font face="verdana" size="2">Cuando los regresores usados son series cronol&oacute;gicas se debe verificar que sus residuos no est&eacute;n autocorrelacionados, pues ello implica violar una de las hip&oacute;tesis b&aacute;sicas de la regresi&oacute;n lineal: sus errores tienen media cero, varianza constante y no est&aacute;n correlacionados. Tal verificaci&oacute;n se realiza mediante gr&aacute;ficas de residuales, cuyo comportamiento indica si se debe detectar autocorrelaci&oacute;n positiva o negativa; en el primer caso los residuos se agrupan seg&uacute;n su signo y en el segundo cambian demasiado de signo. Esto se verifica mediante la prueba de Durbin&#150;Watson (Makrindakis <i>et al., </i>1983; Montgomery <i>et al., </i>2002), cuya hip&oacute;tesis establece que los errores (<i>e<sub>t</sub></i>) los genera un proceso autorregresivo de primer orden. Cuando se busca autocorrelaci&oacute;n positiva se usa el siguiente estad&iacute;stico:</font></p>     <p align="center"><font face="verdana" size="2"><img src="/img/revistas/agro/v45n8/a2s8.jpg"></font></p>     <p align="justify"><font face="verdana" size="2">siendo</font></p>     <p align="center"><font face="verdana" size="2"><img src="/img/revistas/agro/v45n8/a2s9.jpg"></font></p>     <p align="justify"><font face="verdana" size="2">donde, <i>n </i>es el n&uacute;mero de datos, <i>y<sub>t</sub> </i>es la variable dependiente y <img src="/img/revistas/agro/v45n8/a2s12.jpg"><i>t</i> su estimaci&oacute;n mediante el modelo de regresi&oacute;n lineal m&uacute;ltiple que se est&aacute; probando. La hip&oacute;tesis nula (H<sub>0</sub>) establece que no existe autocorrelaci&oacute;n y la alternativa (H<sub>1</sub>) que s&iacute;. La tabulaci&oacute;n de Durbin&#150;Watson establece dos l&iacute;mites (<i>d<sub>L</sub> </i>y <i>d<sub>U</sub></i>) seg&uacute;n n, n&uacute;mero de regresores (<i>K</i>) y nivel de significancia <i>a </i>de la prueba (<i>&#945;</i>=5%, com&uacute;nmente). La regla de decisi&oacute;n es:</font></p>     <p align="center"><font face="verdana" size="2"><img src="/img/revistas/agro/v45n8/a2s11.jpg"></font></p>     <p align="justify"><font face="verdana" size="2">Cuando la prueba se emplea para detectar autocorrelaci&oacute;n negativa se emplea el estad&iacute;stico 4&#150;<i>d</i>, usando como l&iacute;mites 4&#150;<i>d<sub>L </sub></i>y 4&#150;<i>d<sub>U</sub> </i>y la misma regla de decisi&oacute;n.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Ya verificado que la autocorrelaci&oacute;n de los residuos no existe o es aceptable, se busca el mejor modelo de acuerdo a la capacidad predictiva usando la t&eacute;cnica de validaci&oacute;n cruzada, que se describe en la aplicaci&oacute;n num&eacute;rica expuesta.</font></p>     <p align="justify"><font face="verdana" size="2">Otro aspecto importante relacionado con el empleo de regresores que son series cronol&oacute;gicas, es su correlaci&oacute;n entre sus elementos, lo cual conduce a la multicolinealidad y sus consecuencias. Ello se detecta a trav&eacute;s de la matriz de coeficientes de correlaci&oacute;n lineal entre regresores y se cuantifica con base en los factores de inflaci&oacute;n de la varianza. Estos t&oacute;picos ser&aacute;n expuestos en la aplicaci&oacute;n num&eacute;rica.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Descripci&oacute;n del sistema de r&iacute;o Tempoal</b></font></p>     <p align="justify"><font face="verdana" size="2">Al r&iacute;o Tempoal lo forman los r&iacute;os Hules y Calabozo, aforados por las estaciones Los Hules y Terrerillos, cuyas cuencas de drenaje inician en la frontera del bajo r&iacute;o P&aacute;nuco (Regi&oacute;n Hidrol&oacute;gica No. 26 parcial), en los estados de Hidalgo y Veracruz (20&deg; 30' N). El r&iacute;o Tempoal tiene un recorrido de sur a norte y es uno de los colectores m&aacute;s importantes del R&iacute;o Moctezuma, al cual se une por margen derecha en el poblado El Higo, Veracruz. Antes de la estaci&oacute;n hidrom&eacute;trica Tempoal, &uacute;ltima del sistema, llega por margen izquierda el r&iacute;o San Pedro aforado en la estaci&oacute;n El Card&oacute;n. Finalmente, cerca del poblado de Plat&oacute;n S&aacute;nchez, Veracruz, est&aacute; la estaci&oacute;n hidrom&eacute;trica del mismo nombre sobre el r&iacute;o Tempoal. En la <a href="/img/revistas/agro/v45n8/a2f1.jpg" target="_blank">Figura 1</a> se muestra la ubicaci&oacute;n y morfolog&iacute;a del sistema del R&iacute;o Tempoal, con base en la cual se adopt&oacute; el siguiente orden de regresores: <i>x</i>1=Tempoal, <i>x</i>2=Terrerillos, <i>x</i>3=Los Hules, y <i>x</i>4=El Card&oacute;n, para tomar en cuenta su posible relaci&oacute;n f&iacute;sica o de causa&#150;efecto, con la estaci&oacute;n Plat&oacute;n S&aacute;nchez.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Informaci&oacute;n hidrom&eacute;trica procesada</b></font></p>     <p align="justify"><font face="verdana" size="2">En el <a href="/img/revistas/agro/v45n8/a2c2.jpg" target="_blank">Cuadro 2</a> se muestran los cinco registros disponibles de vol&uacute;menes escurridos anuales en millones de m<sup>3</sup> (Mm<sup>3</sup>), en las estaciones hidrom&eacute;tricas del sistema del r&iacute;o Tempoal. Tales registros proceden del sistema BANDAS (IMTA, 2002) y est&aacute;n expuestos por orden creciente de tama&ntilde;os de cuenca drenada, cuyo valores son: 609, 1269, 1493, 4700 y 5275 km<sup>2</sup>, para las estaciones El Card&oacute;n, Los Hules, Terrerillos, Plat&oacute;n S&aacute;nchez y Tempoal. Las claves respectivas en tal sistema son: 26286, 26277, 26289, 26433 y 26248.</font></p>     <p align="justify"><font face="verdana" size="2">En el <a href="/img/revistas/agro/v45n8/a2c2.jpg" target="_blank">Cuadro 2</a> se observa que el periodo com&uacute;n lo define la estaci&oacute;n Plat&oacute;n S&aacute;nchez, en el lapso de 1979 a 2002, con 24 a&ntilde;os y la ampliaci&oacute;n factible para tal registro ser&aacute; de 18 a&ntilde;os en el periodo 1961 a 1978. Debido a datos faltantes en las estaciones El Card&oacute;n, Los Hules y Terrerillos, el periodo com&uacute;n se reduce a 18 a&ntilde;os, pues no se consider&oacute; conveniente estimar los valores de los a&ntilde;os faltantes, para evitar inducir errores por emplear datos no reales.</font></p>     <p align="justify"><font face="verdana" size="2">En la parte inferior de la <a href="/img/revistas/agro/v45n8/a2f2.jpg" target="_blank">Figura 2</a> se comparan los registros de vol&uacute;menes escurridos anuales de las estaciones hidrom&eacute;tricas El Card&oacute;n y Los Hules, y en la porci&oacute;n superior se muestra el relativo a la estaci&oacute;n Terrerillos. En la <a href="#f3">Figura 3</a> se comparan los registros correspondientes de las estaciones Plat&oacute;n S&aacute;nchez y Tempoal. En las cuatro series cronol&oacute;gicas dibujadas no se observa tendencia ni saltos en la media y la variabilidad tampoco cambia, por lo cual tales series probablemente sean estacionarias.</font></p>     <p align="center"><font face="verdana" size="2"><a name="f3"></a></font></p>     <p align="center"><font face="verdana" size="2"><img src="/img/revistas/agro/v45n8/a2f3.jpg"></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b>Verificaci&oacute;n de requerimientos estad&iacute;sticos</b></font></p>     <p align="justify"><font face="verdana" size="2">Primeramente se verific&oacute; si es factible aceptar que los registros por procesar (<a href="/img/revistas/agro/v45n8/a2c2.jpg" target="_blank">Cuadro 2</a>) proceden de poblaciones Normales, lo cual se realiz&oacute; con la prueba W de Shapiro y Wilk (1965) y se encontr&oacute; que s&oacute;lo los registros de Los Hules y El Card&oacute;n no proceden de una poblaci&oacute;n Normal. En la parte inferior del <a href="/img/revistas/agro/v45n8/a2c2.jpg" target="_blank">Cuadro 2</a> se muestran los siguientes par&aacute;metros estad&iacute;sticos insesgados de los registros disponibles: media aritm&eacute;tica ( <i>X </i>), desviaci&oacute;n est&aacute;ndar (S) y coeficientes de variaci&oacute;n (<i>Cv</i>), asimetr&iacute;a (<i>Cs</i>) y curtosis (<i>Ck</i>). Se observa que los registros procedentes de poblaciones Normales presentan coeficientes de asimetr&iacute;a y curtosis cercanos a cero y tres, correspondientes a la distribuci&oacute;n Normal y que precisamente los registros de El Card&oacute;n y Los Hules tienen los valores del <i>Ck </i>m&aacute;s distantes de tres. Sin embargo, dada la similitud entre los valores de <i>Cv </i>y <i>Cs </i>de todos los registros, no se consider&oacute; necesario aplicar alguna transformaci&oacute;n para trabajar con datos normalizados.</font></p>     <p align="justify"><font face="verdana" size="2">Adem&aacute;s se aplicaron pruebas espec&iacute;ficas para buscar componentes determin&iacute;sticas como persistencia, tendencia y cambios en la media o la varianza; las pruebas fueron: coeficiente de correlaci&oacute;n serial de orden uno, Kendall, Cramer y Bartlett (WMO, 1971; Ruiz, 1977). &Uacute;nicamente se encontr&oacute; que el registro de la estaci&oacute;n Terrerillos muestra persistencia (<i>r</i><sub>1</sub> = 0.290).</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Resultados </b><b>y </b><b>Discusi&oacute;n</b></font></p>     <p align="justify"><font face="verdana" size="2"><b>Detecci&oacute;n de regresores colineales</b></font></p>     <p align="justify"><font face="verdana" size="2">Una consecuencia l&oacute;gica del uso de registros hidrol&oacute;gicos ubicados dentro de una regi&oacute;n homog&eacute;nea, es que probablemente ellos ser&aacute;n semejantes, es decir, que sus periodos de a&ntilde;os secos y h&uacute;medos son coincidentes y por tanto mostrar&aacute;n correlaci&oacute;n entre ellos (<a href="/img/revistas/agro/v45n8/a2f2.jpg" target="_blank">Figura 2</a> y <a href="#f3">3</a>). Entonces la detecci&oacute;n de registros colineales se realiza buscando correlaciones altas (<i>r<sub>xy</sub></i> &gt; 0.80) en la matriz de coeficientes de correlaci&oacute;n lineal (<a href="/img/revistas/agro/v45n8/a2c3.jpg" target="_blank">Cuadro 3</a>) y observando sus consecuencias en los coeficientes de los regresores, ya que cuando un regresor est&aacute; correlacionado con otro, su coeficiente cambiar&aacute; dr&aacute;sticamente al estar los dos en la ecuaci&oacute;n de regresi&oacute;n.</font></p>     <p align="justify"><font face="verdana" size="2">En el <a href="/img/revistas/agro/v45n8/a2c3.jpg" target="_blank">Cuadro 3</a> se observa que todos los regresores usados son colineales, y la mayor correlaci&oacute;n fue entre Tempoal (<i>x</i>1) y El Card&oacute;n (<i>x</i>4). Como consecuencia, en el <a href="/img/revistas/agro/v45n8/a2c4.jpg" target="_blank">Cuadro 4</a> se observa como los coeficientes de cada regresor (ec. 3) cambian debido a la presencia de otro(s) en la ecuaci&oacute;n de regresi&oacute;n. Tales cambios ocurren en magnitud y tambi&eacute;n en signo; adem&aacute;s, los coeficientes de los regresores <i>x</i>1 y <i>x</i>4 son los m&aacute;s estables o insensibles a la presencia de otro(s) en la ecuaci&oacute;n.</font></p>     <p align="justify"><font face="verdana" size="2">Los factores de inflaci&oacute;n de la varianza (VIF, de <i>variance inflation factors) </i>constituyen un diagn&oacute;stico cuantitativo importante, pues de acuerdo con los ejemplos num&eacute;ricos de Montgomery <i>et al. </i>(2002), cuando exceden a 1000 implican grav&iacute;simos problemas de multicolinealidad, menores de 100 problemas aceptables y sin problemas cuando no exceden de 10. La expresi&oacute;n para su estimaci&oacute;n pr&aacute;ctica es: donde <i>R<sub>j<sup>2</sup></sub> </i> es el coeficiente de determinaci&oacute;n m&uacute;ltiple obtenido haciendo la regresi&oacute;n de <i>x<i><sub>j</sub></i></i> con las dem&aacute;s variables regresoras. Los valores de los VIF para las variables regresoras <i>x</i>1 (Tempoal), <i>x</i>2 (Terrerillos), <i>x</i>3 (Los Hules) y <i>x</i>4 (El Card&oacute;n) fueron 49.53, 18.04, 11.33 y 28.15. Las magnitudes anteriores ratifican los resultados obtenidos con los valores del <a href="/img/revistas/agro/v45n8/a2c3.jpg" target="_blank">Cuadro 3</a> y establecen que es factible proseguir con la selecci&oacute;n y validaci&oacute;n de modelos.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Selecci&oacute;n de ecuaciones de regresi&oacute;n</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Con base en los resultados del <a href="/img/revistas/agro/v45n8/a2c5.jpg" target="_blank">Cuadro 5</a>, se seleccionaron tres ecuaciones de regresi&oacute;n. La primera incluye s&oacute;lo a <i>x</i>1 (Tempoal) como regresor y corresponde a los menores valores del cuadrado medio de los residuos (Ecuaci&oacute;n 6) y de la estad&iacute;stica de Mallows (Ecuaci&oacute;n 7). La segunda con regresores <i>x</i>1 y <i>x</i>4 (El Card&oacute;n) presenta el coeficiente de determinaci&oacute;n m&uacute;ltiple ajustado m&aacute;s alto (Ecuaci&oacute;n 5) y el segundo cuadrado medio de los residuos (Ecuaci&oacute;n 6) m&aacute;s bajo, en los modelos de dos regresores. La tercera tiene por regresores <i>x</i>1, <i>x</i>2 (Terrerillos) y <i>x</i>4, con el coeficiente de determinaci&oacute;n m&uacute;ltiple mayor (Ecuaci&oacute;n 4) y el menor cuadrado medio de los residuos en los modelos de tres regresores.</font></p>     <p align="justify"><font face="verdana" size="2"><b>An&aacute;lisis de residuales</b></font></p>     <p align="justify"><font face="verdana" size="2">En el <a href="/img/revistas/agro/v45n8/a2c6.jpg" target="_blank">Cuadro 6</a> se muestran las estimaciones de la variable dependiente (<img src="/img/revistas/agro/v45n8/a2s12.jpg"><i><sub>t</sub></i>) de cada uno de los tres modelos seleccionados y sus residuos en el periodo 1979&#150;2002, as&iacute; como sus respectivos valores del estad&iacute;stico <i>d </i>(Ecuaci&oacute;n 8). Para <i>n</i>=18, <i>&#945;</i>=5.0 % y <i>K</i>=1, 2 y 3 se obtienen de la tabla de valores l&iacute;mite de Durbin&#150;Watson (Makrindakis <i>et al., </i>1983): <i>d<sub>L</sub></i>=1.16 y <i>d<sub>U</sub></i>=1.39, <i>d<sub>L</sub></i>=1.05 y <i>d<sub>U</sub></i>=1.53, <i>d<sub>L</sub></i>=0.93 y <i>d<sub>U</sub></i>=1.69, por lo cual la primera serie de residuos tiene autocorrelaci&oacute;n positiva y para las otras dos la prueba no es concluyente. Lo anterior descarta al modelo del subconjunto <i>x</i>1.</font></p>     <p align="justify"><font face="verdana" size="2">Las tres gr&aacute;ficas de residuales (<a href="/img/revistas/agro/v45n8/a2f4.jpg" target="_blank">Figura 4</a>) son similares, tienen magnitudes bastante reducidas, excepto el primer residuo, generado por un escurrimiento en Plat&oacute;n S&aacute;nchez que es incluso mayor que de Tempoal (<a href="/img/revistas/agro/v45n8/a2c2.jpg" target="_blank">Cuadro 2</a>), lo cual es incorrecto. Por tanto, los tres modelos seleccionados tienen buena capacidad predictiva.</font></p>     <p align="justify"><font face="verdana" size="2"><b>An&aacute;lisis de validaci&oacute;n cruzada</b></font></p>     <p align="justify"><font face="verdana" size="2">Cuando los datos de los regresores son series cronol&oacute;gicas, el tiempo es usado para la formaci&oacute;n de los datos para estimaci&oacute;n y para predicci&oacute;n. El lapso conocido de datos se dividi&oacute; en dos sub&#150;periodos con nueve valores cada uno. En el <a href="/img/revistas/agro/v45n8/a2c7.jpg" target="_blank">Cuadro 7</a> se muestran los coeficientes de regresi&oacute;n estimados con cada sub&#150;periodo considerado como de estimaci&oacute;n y en el <a href="/img/revistas/agro/v45n8/a2c8.jpg" target="_blank">Cuadro 8</a> est&aacute;n las estimaciones y sus correspondientes residuos, para cada subperiodo complementario o de predicci&oacute;n.</font></p>     <p align="justify"><font face="verdana" size="2">En el <a href="/img/revistas/agro/v45n8/a2c7.jpg" target="_blank">Cuadro 7</a> se observan cambios dr&aacute;sticos de un sub&#150;periodo al otro en los coeficientes de los regresores de <i>x</i>2 y <i>x</i>4, adem&aacute;s el coeficiente <i>a</i><sub>0</sub> o constante tambi&eacute;n cambia bastante. Lo anterior se debe a la presencia de un ciclo h&uacute;medo y otro seco en el registro disponible en Plat&oacute;n S&aacute;nchez (<a href="/img/revistas/agro/v45n8/a2f3.jpg" target="_blank">Figuras 3</a> y <a href="/img/revistas/agro/v45n8/a2f4.jpg" target="_blank">4</a>).</font></p>     <p align="justify"><font face="verdana" size="2">El an&aacute;lisis de residuales por sub&#150;periodos (<a href="/img/revistas/agro/v45n8/a2c8.jpg" target="_blank">Cuadro 8</a>) muestra similitud con los mostrados en el <a href="/img/revistas/agro/v45n8/a2c6.jpg" target="_blank">Cuadro 6</a> y la <a href="/img/revistas/agro/v45n8/a2f4.jpg" target="_blank">Figura 4</a>, ya que primero hay residuos positivos y despu&eacute;s negativos. Los resultados de <a href="/img/revistas/agro/v45n8/a2c8.jpg" target="_blank">Cuadro 8</a> definen los modelos tercero y segundo como m&aacute;s convenientes por su mejor capacidad predictiva, medida por la menor suma de residuos en cada sub&#150;periodo de predicci&oacute;n; es decir el modelo con subconjunto <i>x</i>1, <i>x</i>2 y <i>x</i>4 y el del subconjunto <i>x</i>1 y <i>x</i>4.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Validaci&oacute;n con datos nuevos</b></font></p>     <p align="justify"><font face="verdana" size="2">A trav&eacute;s de la Direcci&oacute;n Local San Luis Potos&iacute; de la CONAGUA se intent&oacute; conseguir las magnitudes del volumen escurrido anual despu&eacute;s del a&ntilde;o 2002, en las estaciones del sistema del r&iacute;o Tempoal pero no se obtuvo tal informaci&oacute;n en la estaci&oacute;n Plat&oacute;n S&aacute;nchez, &uacute;nicamente en el resto y s&oacute;lo hasta 2006. Por tanto, no fue posible realizar una validaci&oacute;n con datos nuevos.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b>Estimaciones finales y su selecci&oacute;n</b></font></p>     <p align="justify"><font face="verdana" size="2">En el <a href="#c9">Cuadro 9</a> se muestran los vol&uacute;menes escurridos anuales estimados en la estaci&oacute;n Plat&oacute;n S&aacute;nchez, con cada uno de los dos modelos o ecuaciones de regresi&oacute;n seleccionados, y con sus respectivos par&aacute;metros estad&iacute;sticos. Se observa que las dos estimaciones conducen a registros bastante similares, ya que sus par&aacute;metros estad&iacute;sticos (<i>Cv</i>, <i>Cs</i>, <i>Ck</i>) y valores medios son casi id&eacute;nticos. Lo anterior genera confianza en la predicci&oacute;n de los valores buscados y se puede adoptar cualquiera de las dos series. Si hay que seleccionar s&oacute;lo una de ellas, se recomienda la primera por la magnitud menor en su media, lo cual implica cierta garant&iacute;a en estimaciones asociadas con la disponibilidad.</font></p>     <p align="center"><font face="verdana" size="2"><a name="c9"></a></font></p>     <p align="center"><font face="verdana" size="2"><img src="/img/revistas/agro/v45n8/a2c9.jpg"></font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Conclusiones</b></font></p>     <p align="justify"><font face="verdana" size="2">El ejemplo descrito para el sistema del r&iacute;o Tempoal, permiti&oacute; exponer con detalle los an&aacute;lisis previos y de regresi&oacute;n lineal m&uacute;ltiple realizados con la informaci&oacute;n hidrol&oacute;gica disponible y sus consecuencias.</font></p>     <p align="justify"><font face="verdana" size="2">Aunque la aplicaci&oacute;n num&eacute;rica expuesta tiene un problema grave de multicolinealidad, lo cual es muy probable que ocurra en todas las aplicaciones pr&aacute;cticas de ampliaci&oacute;n de registros de escurrimiento y de lluvia anuales, los criterios expuestos para selecci&oacute;n de regresores conducen a resultados consistentes y son una ayuda efectiva en la b&uacute;squeda de la mejor ecuaci&oacute;n de regresi&oacute;n lineal m&uacute;ltiple.</font></p>     <p align="justify"><font face="verdana" size="2">Cuando los criterios de selecci&oacute;n sugieren ecuaciones de regresi&oacute;n diferentes, sus resultados se deben analizar a trav&eacute;s del an&aacute;lisis de residuales y las validaciones cruzada y con datos nuevos, para adoptar el modelo candidato m&aacute;s conveniente. Pero la similitud en los resultados de tales modelos, como ocurri&oacute; con los datos del sistema del r&iacute;o Tempoal, origina confianza en las estimaciones y en aqu&eacute;llas adoptadas.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b>Agradecimientos</b></font></p>     <p align="justify"><font face="verdana" size="2">Se agradecen los comentarios y sugerencias de los dos &aacute;rbitros an&oacute;nimos y del editor asignado, los cuales permitieron completar el trabajo en t&oacute;picos no tratados pero relevantes al tema, como: an&aacute;lisis de residuales, factores de inflaci&oacute;n de la varianza y validaci&oacute;n cruzada.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Literatura Citada</b></font></p>     <!-- ref --><p align="justify"><font face="verdana" size="2">Campos A., D. F. 2003. Ajuste de curvas. <i>In: </i>Introducci&oacute;n a los M&eacute;todos Num&eacute;ricos: Software en Basic y Aplicaciones en Hidrolog&iacute;a Superficial. Librer&iacute;a Universitaria Potosina. San Luis Potos&iacute;, S.L.P. pp: 93&#150;127.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=560607&pid=S1405-3195201100080000200001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>     <!-- ref --><p align="justify"><font face="verdana" size="2">IMTA (Instituto Mexicano de Tecnolog&iacute;a del Agua). 2002. Banco Nacional de Datos de Aguas Superficiales (BANDAS). Secretar&iacute;a de Medio Ambiente y Recursos Naturales&#150;Comisi&oacute;n Nacional del Agua&#150;IMTA. Jiutepec, Morelos. 8 CD.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=560609&pid=S1405-3195201100080000200002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>     <!-- ref --><p align="justify"><font face="verdana" size="2">Makrindakis, S., S. C. Wheelwright, and V. E. McGee. 1983. Multiple regression. <i>In: </i>Forecasting: Methods and Applications. John Wiley &amp; Sons. New York, U.S.A. Second edition. pp: 246&#150;317.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=560611&pid=S1405-3195201100080000200003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>     ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">McCuen, R. H. 1998. Stepwise regression. <i>In: </i>Hydrologic Analysis and Design. Prentice Hall. New Jersey, U.S.A. pp: 84&#150;87.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=560613&pid=S1405-3195201100080000200004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>     <!-- ref --><p align="justify"><font face="verdana" size="2">Montgomery, D. C., E. A. Peck, y G. G. Vining. 2002. Selecci&oacute;n de variable y construcci&oacute;n del modelo. <i>In: </i>Introducci&oacute;n al An&aacute;lisis de Regresi&oacute;n Lineal. Compa&ntilde;&iacute;a Editorial Continental. M&eacute;xico, D. F. pp. 261&#150;290.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=560615&pid=S1405-3195201100080000200005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>     <!-- ref --><p align="justify"><font face="verdana" size="2">Gilroy, E. J. 1970. Reliability of a variance estimate obtained from a sample augmented by multivariate regression. Water Resources Res. 6: 1595&#150;1600.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=560617&pid=S1405-3195201100080000200006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>     <!-- ref --><p align="justify"><font face="verdana" size="2">Ruiz M., L. 1977. Condiciones param&eacute;tricas del an&aacute;lisis de varianza. <i>In: </i>M&eacute;todos Estad&iacute;sticos de Investigaci&oacute;n. Instituto Nacional de Estad&iacute;stica. Madrid, Espa&ntilde;a. pp. 233&#150;249.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=560619&pid=S1405-3195201100080000200007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>     <!-- ref --><p align="justify"><font face="verdana" size="2">Salas, J. D., J. A. Raynal, Z. S. Tarawneh, T. S. Lee, D. Frevert, and T. Fulp. 2008. Extending short record of hydrologic data. <i>In: </i>Singh, V. P. (ed). Hydrology and Hydraulics. Water Resources Publications. Highlands Ranch, Colorado, U.S.A. pp: 717&#150;760.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=560621&pid=S1405-3195201100080000200008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>     ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Shapiro, S. S., and M. B. Wilk. 1965. An analysis of variance test for normality (complete samples). Biometrika 52: 591&#150;611.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=560623&pid=S1405-3195201100080000200009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>     <!-- ref --><p align="justify"><font face="verdana" size="2">WMO (World Meteorological Organization). 1971. Standard test of significance to be recommended in routine analysis of climatic fluctuations. In: Climatic Chance. Technical Note No. 79. Secretariat of the WHO. Genova, Switzerland. pp:58-71.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=560625&pid=S1405-3195201100080000200010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> </font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Campos A.]]></surname>
<given-names><![CDATA[D. F]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Ajuste de curvas]]></article-title>
<source><![CDATA[Introducción a los Métodos Numéricos: Software en Basic y Aplicaciones en Hidrología Superficial]]></source>
<year>2003</year>
<page-range>93-127</page-range><publisher-loc><![CDATA[San Luis Potosí^eS.L.P. S.L.P.]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<collab>Instituto Mexicano de Tecnología del Agua</collab>
<source><![CDATA[Banco Nacional de Datos de Aguas Superficiales]]></source>
<year>2002</year>
<publisher-loc><![CDATA[Jiutepec^eMorelos Morelos]]></publisher-loc>
<publisher-name><![CDATA[Secretaría de Medio Ambiente y Recursos NaturalesComisión Nacional del AguaIMTA]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Makrindakis]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Wheelwright]]></surname>
<given-names><![CDATA[S. C.]]></given-names>
</name>
<name>
<surname><![CDATA[McGee]]></surname>
<given-names><![CDATA[V. E.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Multiple regression]]></article-title>
<source><![CDATA[Forecasting: Methods and Applications]]></source>
<year>1983</year>
<page-range>246-317</page-range><publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[John Wiley & Sons]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McCuen]]></surname>
<given-names><![CDATA[R. H]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Stepwise regression]]></article-title>
<source><![CDATA[Hydrologic Analysis and Design]]></source>
<year>1998</year>
<page-range>84-87</page-range><publisher-loc><![CDATA[New Jersey ]]></publisher-loc>
<publisher-name><![CDATA[Prentice Hall]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Montgomery]]></surname>
<given-names><![CDATA[D. C.]]></given-names>
</name>
<name>
<surname><![CDATA[Peck]]></surname>
<given-names><![CDATA[E. A.]]></given-names>
</name>
<name>
<surname><![CDATA[Vining]]></surname>
<given-names><![CDATA[G. G.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Selección de variable y construcción del modelo]]></article-title>
<source><![CDATA[Introducción al Análisis de Regresión Lineal]]></source>
<year>2002</year>
<page-range>261-290</page-range><publisher-loc><![CDATA[México^eD. F. D. F.]]></publisher-loc>
<publisher-name><![CDATA[Compañía Editorial Continental]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gilroy]]></surname>
<given-names><![CDATA[E. J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Reliability of a variance estimate obtained from a sample augmented by multivariate regression]]></article-title>
<source><![CDATA[Water Resources Res.]]></source>
<year>1970</year>
<volume>6</volume>
<page-range>1595-1600</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ruiz M.]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Condiciones paramétricas del análisis de varianza]]></article-title>
<source><![CDATA[Métodos Estadísticos de Investigación]]></source>
<year>1977</year>
<page-range>233-249</page-range><publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Instituto Nacional de Estadística]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Salas]]></surname>
<given-names><![CDATA[J. D.]]></given-names>
</name>
<name>
<surname><![CDATA[Raynal]]></surname>
<given-names><![CDATA[J. A.]]></given-names>
</name>
<name>
<surname><![CDATA[Tarawneh]]></surname>
<given-names><![CDATA[Z. S.]]></given-names>
</name>
<name>
<surname><![CDATA[Lee]]></surname>
<given-names><![CDATA[T. S.]]></given-names>
</name>
<name>
<surname><![CDATA[Frevert]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Fulp]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Extending short record of hydrologic data]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Singh]]></surname>
<given-names><![CDATA[V. P.]]></given-names>
</name>
</person-group>
<source><![CDATA[Hydrology and Hydraulics]]></source>
<year>2008</year>
<page-range>717-760</page-range><publisher-loc><![CDATA[^eColorado Colorado]]></publisher-loc>
<publisher-name><![CDATA[Water Resources Publications]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Shapiro]]></surname>
<given-names><![CDATA[S. S.]]></given-names>
</name>
<name>
<surname><![CDATA[Wilk]]></surname>
<given-names><![CDATA[M. B.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An analysis of variance test for normality (complete samples)]]></article-title>
<source><![CDATA[Biometrika]]></source>
<year>1965</year>
<volume>52</volume>
<page-range>591-611</page-range></nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="book">
<collab>World Meteorological Organization</collab>
<article-title xml:lang="en"><![CDATA[Standard test of significance to be recommended in routine analysis of climatic fluctuations]]></article-title>
<source><![CDATA[Climatic Chance]]></source>
<year>1971</year>
<page-range>58-71</page-range><publisher-loc><![CDATA[Genova ]]></publisher-loc>
<publisher-name><![CDATA[Secretariat of the WHO]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
