<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2007-2422</journal-id>
<journal-title><![CDATA[Tecnología y ciencias del agua]]></journal-title>
<abbrev-journal-title><![CDATA[Tecnol. cienc. agua]]></abbrev-journal-title>
<issn>2007-2422</issn>
<publisher>
<publisher-name><![CDATA[Instituto Mexicano de Tecnología del Agua, Coordinación de Comunicación, Participación e Información]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2007-24222014000400012</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Ampliación de registros de volumen escurrido anual con base en información regional y regresión de tipo Ridge]]></article-title>
<article-title xml:lang="en"><![CDATA[Extension of Annual Runoff Volume Records Based on Regional Information and Ridge Regression]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Campos-Aranda]]></surname>
<given-names><![CDATA[Daniel Francisco]]></given-names>
</name>
</contrib>
</contrib-group>
<aff id="A">
<institution><![CDATA[,  ]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>08</month>
<year>2014</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>08</month>
<year>2014</year>
</pub-date>
<volume>5</volume>
<numero>4</numero>
<fpage>173</fpage>
<lpage>185</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_arttext&amp;pid=S2007-24222014000400012&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&amp;pid=S2007-24222014000400012&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_pdf&amp;pid=S2007-24222014000400012&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[En general, la planeación, diseño y manejo de las obras de infraestructura hidráulica se realiza con base en los registros históricos disponibles de crecientes, escurrimientos y lluvias anuales. Conforme tales registros abarcan más años, sus estimaciones hidrológicas tienen una mayor exactitud. Por lo anterior, siempre es necesario ampliar los registros cortos (Y), por ejemplo a través de la regresión lineal múltiple (RLM), la cual utiliza la información regional disponible. El establecimiento de una RLM tiene varias dificultades, quizá la más importante en el transporte de información hidrológica sea la presencia de correlación entre los registros auxiliares o variables predictivas (Xi), lo cual da origen a un problema de multicolinealidad. En este trabajo se expone con detalle el diagnóstico cuantitativo de tal problema por medio de los factores de inflación de la varianza y de los eigenvalores de la matriz X' · X. También se describe ampliamente la RLM de tipo Ridge o sesgada como estrategia para minimizar los efectos de la multicolinealidad, buscando su parámetro de sesgo con base en la traza Ridge. Se detalla una aplicación numérica para ampliar el registro de volúmenes escurridos anuales en la estación hidrométrica Santa Isabel de la cuenca del Alto Río Grijalva, utilizando cuatro registros amplios cercanos. Por último se formulan las conclusiones, las cuales destacan las ventajas del uso de la RLM de tipo Ridge.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[The planning, design and management of water infrastructure are typically based on available historical records of annual floods, runoff and rainfall. The more years covered by these records the more accurate the hydrological estimates. Therefore, it is always necessary to expand short records (Y), for example, through multiple linear regression (MLR), which uses available regional information. Establishing a MLR has several difficulties, perhaps the most important regarding the transport of hydrological information is the presence of correlation between the auxiliary or predictor variables (Xi), which gives rise to a problem of multicollinearity. In this work, the quantitative evaluation of multicollinearity is presented in detail through variance inflation factors and eigenvalues for the X' · X matrix. In addition, the biased or Ridge MLR is described extensively as a strategy to minimize the effects of multicollinearity, seeking its biasing parameter based on the Ridge trace. A numerical application is presented in detail, which expands the annual runoff volume records in the Santa Isabel gauging station in the upper Grijalva River using four broad records nearby. Lastly, several conclusions are formulated which highlight the advantages of using the Ridge MLR.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[multicolinealidad]]></kwd>
<kwd lng="es"><![CDATA[factores de inflación de la varianza]]></kwd>
<kwd lng="es"><![CDATA[eigenvalores]]></kwd>
<kwd lng="es"><![CDATA[eigenvectores]]></kwd>
<kwd lng="es"><![CDATA[alto río Grijalva]]></kwd>
<kwd lng="en"><![CDATA[Multicollinearity]]></kwd>
<kwd lng="en"><![CDATA[variance inflation factors]]></kwd>
<kwd lng="en"><![CDATA[eigenvalues]]></kwd>
<kwd lng="en"><![CDATA[eigenvectors]]></kwd>
<kwd lng="en"><![CDATA[upper Grijalva River]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  	    <p align="justify"><font face="verdana" size="4">Nota t&eacute;cnica</font></p>      <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="4"><b>Ampliaci&oacute;n de registros de volumen escurrido anual con base en informaci&oacute;n regional y regresi&oacute;n de tipo Ridge</b></font></p>      <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="3"><b>Extension of Annual Runoff Volume Records Based on Regional Information and Ridge Regression</b></font></p>      <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="2"><b>Daniel Francisco Campos&#45;Aranda*    <br> 	</b></font><font face="verdana" size="2"><i>Profesor jubilado de la Universidad Aut&oacute;noma de San Luis Potos&iacute;, M&eacute;xico.     <br> 	*Autor de correspondencia.</i></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify">&nbsp;</p> 	    <p align="justify"><font face="verdana" size="2"><b>Direcci&oacute;n del autor</b></font></p>         <p align="justify"><font face="verdana" size="2"><i>Dr. Daniel Francisco Campos Aranda</i><b>    <br>       </b> Profesor jubilado de la Universidad Aut&oacute;noma de San Luis Potos&iacute;    <br>       Genaro Codina 240, Colonia Jardines del Estadio    <br>       78280 San Luis Potos&iacute;, San Luis Potos&iacute;, M&Eacute;XICO    <br>       Tel&eacute;fono: &#43;52 (444) 8151 431    <br> <a href="mailto:campos_aranda@hotmail.com">campos&#95;aranda@hotmail.com</a></font></p>         <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2">Recibido: 26/12/12    ]]></body>
<body><![CDATA[<br> 	Aceptado: 09/01/14</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Resumen</b></font></p>  	    <p align="justify"><font face="verdana" size="2">En general, la planeaci&oacute;n, dise&ntilde;o y manejo de las obras de infraestructura hidr&aacute;ulica se realiza con base en los registros hist&oacute;ricos disponibles de crecientes, escurrimientos y lluvias anuales. Conforme tales registros abarcan m&aacute;s a&ntilde;os, sus estimaciones hidrol&oacute;gicas tienen una mayor exactitud. Por lo anterior, siempre es necesario ampliar los registros cortos (Y), por ejemplo a trav&eacute;s de la <i>regresi&oacute;n lineal m&uacute;ltiple</i> (RLM), la cual utiliza la informaci&oacute;n <i>regional</i> disponible. El establecimiento de una RLM tiene varias dificultades, quiz&aacute; la m&aacute;s importante en el transporte de informaci&oacute;n hidrol&oacute;gica sea la presencia de correlaci&oacute;n entre los registros auxiliares o variables predictivas <i>(X<sub>i</sub>),</i> lo cual da origen a un problema de <i>multicolinealidad.</i> En este trabajo se expone con detalle el diagn&oacute;stico cuantitativo de tal problema por medio de los factores de inflaci&oacute;n de la varianza y de los eigenvalores de la matriz <b>X'</b> <b>&#183;</b> <b>X.</b> Tambi&eacute;n se describe ampliamente la RLM de tipo Ridge o sesgada como estrategia para minimizar los efectos de la multicolinealidad, buscando su par&aacute;metro de sesgo con base en la traza Ridge. Se detalla una aplicaci&oacute;n num&eacute;rica para ampliar el registro de vol&uacute;menes escurridos anuales en la estaci&oacute;n hidrom&eacute;trica Santa Isabel de la cuenca del Alto R&iacute;o Grijalva, utilizando cuatro registros amplios cercanos. Por &uacute;ltimo se formulan las conclusiones, las cuales destacan las ventajas del uso de la RLM de tipo Ridge.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Palabras clave:</b> multicolinealidad, factores de inflaci&oacute;n de la varianza, eigenvalores, eigenvectores, alto r&iacute;o Grijalva.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Abstract</b></font></p>  	    <p align="justify"><font face="verdana" size="2">The planning, design and management of water infrastructure are typically based on available historical records of annual floods, runoff and rainfall. The more years covered by these records the more accurate the hydrological estimates. Therefore, it is always necessary to expand short records (Y), for example, through multiple linear regression (MLR), which uses available regional information. Establishing a MLR has several difficulties, perhaps the most important regarding the transport of hydrological information is the presence of correlation between the auxiliary or predictor variables (X<i><sub>i</sub></i>), which gives rise to a problem of multicollinearity. In this work, the quantitative evaluation of multicollinearity is presented in detail through variance inflation factors and eigenvalues for the <b>X'</b> <b>&#183;</b> <b>X</b> matrix. In addition, the biased or Ridge MLR is described extensively as a strategy to minimize the effects of multicollinearity, seeking its biasing parameter based on the Ridge trace. A numerical application is presented in detail, which expands the annual runoff volume records in the Santa Isabel gauging station in the upper Grijalva River using four broad records nearby. Lastly, several conclusions are formulated which highlight the advantages of using the Ridge MLR.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Keywords:</b> Multicollinearity, variance inflation factors, eigenvalues, eigenvectors, upper Grijalva River.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b>Introducci&oacute;n</b></font></p>  	    <p align="justify"><font face="verdana" size="2">En general, la planeaci&oacute;n, dise&ntilde;o, operaci&oacute;n y revisi&oacute;n de las obras hidr&aacute;ulicas se realiza con base en los registros hist&oacute;ricos disponibles de datos hidrol&oacute;gicos, principalmente crecientes, escurrimientos y lluvias <i>anuales.</i> Al contar s&oacute;lo con registros cortos, la confianza en sus estimaciones estad&iacute;sticas es baja y por ello se debe buscar informaci&oacute;n adicional y t&eacute;cnicas de ampliaci&oacute;n de las series disponibles (Salas <i>et al.,</i> 2008). Para el caso espec&iacute;fico de los escurrimientos anuales, la fuente m&aacute;s com&uacute;n de datos adicionales son los registros largos de las estaciones hidrom&eacute;tricas cercanas y la t&eacute;cnica estad&iacute;stica m&aacute;s utilizada para el llamado <i>transporte regional de informaci&oacute;n hidrol&oacute;gica</i> es la regresi&oacute;n lineal m&uacute;ltiple (RLM).</font></p>  	    <p align="justify"><font face="verdana" size="2">Bajo este enfoque, el registro corto (Y) debe tener un periodo com&uacute;n de informaci&oacute;n con las series largas <i>(X<sub>i</sub>, regresores)</i> y guardar una cierta dependencia o correlaci&oacute;n con ellas. Obtenida y validada su ecuaci&oacute;n, se pueden obtener las estimaciones que ampl&iacute;an el registro corto, con base en los valores observados en los regresores. Esta t&eacute;cnica estad&iacute;stica implica una complejidad real tan s&oacute;lo en los tres aspectos siguientes (Ryan, 1998): (1) selecci&oacute;n de cu&aacute;ntos y cu&aacute;les registros amplios e independientes utilizar; (2) interpretaci&oacute;n de los resultados, en especial de los coeficientes de la regresi&oacute;n (&#946;<sub>i</sub>), y (3) determinaci&oacute;n de cu&aacute;ndo un m&eacute;todo de ajuste, alternativo al de m&iacute;nimos cuadrados de los residuos, debe ser utilizado.</font></p>  	    <p align="justify"><font face="verdana" size="2">Como el registro corto debe estar correlacionado con los auxiliares o circunvecinos, resulta l&oacute;gico esperar que tambi&eacute;n &eacute;stos muestren cierta dependencia entre s&iacute;, pues adem&aacute;s de ser cercanos guardan correlaci&oacute;n con la variable dependiente. La correlaci&oacute;n entre los regresores implica que alguna parte de la informaci&oacute;n estad&iacute;stica contenida en cada uno tambi&eacute;n est&aacute; presente en alguna de las otras i &#45; 1 variables independientes (Haan, 1977). Esta situaci&oacute;n genera un problema de <i>multicolinealidad</i> debido a la semejanza o correlaci&oacute;n existente entre los registros involucrados. Tal problema se debe diagnosticar y resolver, por ejemplo, a trav&eacute;s de la regresi&oacute;n tipo Ridge (Montgomery <i>et al.,</i> 1998; 2002).</font></p>  	    <p align="justify"><font face="verdana" size="2">Los tres <i>objetivos</i> b&aacute;sicos de este trabajo son: (1) describir la teor&iacute;a estad&iacute;stica relativa a la RLM y su ajuste por m&iacute;nimos cuadrados de los residuos; (2) explicar los conceptos y el diagn&oacute;stico cuantitativo de la multicolinealidad, y (3) exponer y aplicar la RLM de tipo Ridge o sesgada, como m&eacute;todo eficiente para contrarrestar la dependencia lineal entre los regresores. Se realiza una aplicaci&oacute;n num&eacute;rica con cinco estaciones hidrom&eacute;tricas de la cuenca del Alto R&iacute;o Grijalva para ampliar el registro corto de vol&uacute;menes escurridos anuales en la estaci&oacute;n Santa Isabel.</font></p>  	    <p align="justify"><font face="verdana" size="2">Se comparan los resultados con los obtenidos previamente, mediante el enfoque de selecci&oacute;n exhaustiva de variables predictivas.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Resumen de la teor&iacute;a operativa</b></font></p>  	    <p align="justify"><font face="verdana" size="2"><b><i>Regresi&oacute;n Lineal M&uacute;ltiple (RLM) y su ajuste</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">Con frecuencia se puede establecer una relaci&oacute;n de tipo lineal entre la variable dependiente (Y) y varias (p) independientes <i>X<sub>1</sub>, X<sub>2</sub>,..., X<sub>p</sub></i>, que es la generalizaci&oacute;n o extensi&oacute;n natural de la regresi&oacute;n lineal simple; su expresi&oacute;n es (Ryan, 1998):</font></p>  	    ]]></body>
<body><![CDATA[<p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e1.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Debido a esto &uacute;ltimo, los principios que rigen a la regresi&oacute;n lineal se aplican a la RLM; por ejemplo, que tanto <i>Y</i> como las <i>X<sub>i</sub></i> est&eacute;n normalmente distribuidas, y que los errores &#949; sean independientes tambi&eacute;n con distribuci&oacute;n normal de media cero y misma varianza (&#963;<sup>2</sup>) para cada X<sub>i</sub>. Por lo general, la estimaci&oacute;n de los coeficientes de la regresi&oacute;n (&#946;<sub>i)</sub> se realiza mediante el llamado ajuste de m&iacute;nimos cuadrados de los residuos. Tal soluci&oacute;n matricial para la RLM, en el caso general de <i>p</i> variables independientes o <i>regresores</i> y <i>n</i> observaciones o datos de Y, X<sub>1</sub>, X<sub>2</sub>,..., X<sub>p</sub>, es la siguiente (Ryan, 1998):</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e2.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Siendo:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12i1.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">El planteamiento de esta soluci&oacute;n implica que la sumatoria de uno a <i>n</i> de los residuos al cuadrado debe ser minimizada, es decir que:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e3.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Entonces, diferenciando el lado derecho de la ecuaci&oacute;n anterior con respecto a &#946;<sub>0</sub>, &#946;<sub>1</sub>, &#946;<sub>2</sub>,..., &#946;<sub>p</sub>, por separado, se originan las ecuaciones llamadas <i>normales,</i> funci&oacute;n de los par&aacute;metros desconocidos. En notaci&oacute;n matricial, estas ecuaciones son:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e4.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">cuya soluci&oacute;n es:</font></p>  	    ]]></body>
<body><![CDATA[<p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e5.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">en la cual <b>X'</b> es la matriz transpuesta de <b>X</b> y <b>(X'</b> <b>&#183;</b> <b>X)<sup>&#45;1</sup></b> indica la matriz inversa de <b>X'</b> <b>&#183;</b> <b>X.</b></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b><i>Coeficiente de determinaci&oacute;n m&uacute;ltiple</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">Designado por <i>R<sup>2</sup></i> es probablemente el estad&iacute;stico m&aacute;s utilizado para medir lo adecuado de un modelo de regresi&oacute;n; indica cu&aacute;nta de la varianza de <i>Y</i> la explica el modelo; por ello su expresi&oacute;n es (Hirsch <i>et al.,</i> 1993):</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e6.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">en la cual &#374;<i><sub>i</sub></i> es la estimaci&oacute;n de la variable Y<sub>i</sub> a trav&eacute;s de la ecuaci&oacute;n de regresi&oacute;n; por ello <i>SC<sub>Res</sub></i> es la suma de cuadrados de los residuos y <i>SC<sub>Y</sub></i> es la varianza total de la variable dependiente, cuya media aritm&eacute;tica es <img src="/img/revistas/tca/v5n4/a12i2.jpg">.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b><i>Escalamiento de longitud unitaria de los datos</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">Sustraer a cada variable independiente o regresor su media aritm&eacute;tica se conoce como <i>centrado</i> de los datos y tiene como ventaja fundamental que las matrices <b>X</b> involucradas de <i>n</i> renglones ahora tienen <i>p</i> columnas, ya que la ecuaci&oacute;n de RLM es:</font></p>  	    ]]></body>
<body><![CDATA[<p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e7.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">cuyo reacomodo para obtener la ecuaci&oacute;n (1) implica que:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e8.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">El escalamiento de longitud unitaria implica, adem&aacute;s del centrado, la divisi&oacute;n entre la ra&iacute;z cuadrada de la varianza (Montgomery <i>et al.</i> , 2002), por lo cual:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e9.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Donde:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e11.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">El escalamiento de longitud unitaria produce, en relaci&oacute;n con la ecuaci&oacute;n (4), que la matriz <b>E'</b> <b>&#183;</b> <b>E</b> sea una matriz de correlaci&oacute;n simple entre los regresores X<sub>J</sub>; adem&aacute;s, la matriz <b>E'</b> <b>&#183;</b> <b>Y</b> es ahora una matriz de correlaci&oacute;n simple entre cada regresor <i>X</i><sub><i>J</i></sub> y la variable dependiente Y. Este escalamiento y el normal conducen a <i>coeficientes estandarizados de regresi&oacute;n,</i> cuya comparaci&oacute;n entre ellos define la importancia de cada regresor.</font></p>  	    <p align="justify"><font face="verdana" size="2">Otro escalamiento que se requiere con frecuencia est&aacute; asociado con la estabilidad num&eacute;rica de la matriz inversa de <b>E'</b> <b>&#183;</b> <b>E,</b> pues es com&uacute;n obtenerla planteando esta igualdad <b>A</b> <b>&#183;</b> <b>A<sup>&#45;1</sup></b> &#61; <b>I</b>; al transformar la matriz <b>A</b> en la matriz identidad <b>I</b> y realizar las mismas operaciones en <b>I,</b> &eacute;sta se convierte en la matriz <b>A<sup>&#45;1</sup></b> buscada. Cuando la matriz <b>A</b> tiene elementos muy grandes, su inversa presentar&aacute; elementos muy peque&ntilde;os y entonces los errores por redondeo se vuelven importantes. En tales casos conviene dividir <i>(escalar)</i> todos los datos entre una cantidad fija o cociente reductor (COR) antes de aplicar la ecuaci&oacute;n (5) y despu&eacute;s los resultados de la ecuaci&oacute;n (1) se multiplican por el COR.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b><i>Multicolinealidad: definici&oacute;n y soluciones</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">Como ya se indic&oacute;, en el caso de una ampliaci&oacute;n de un registro hidrol&oacute;gico con base en la informaci&oacute;n <i>regional</i> disponible, el conjunto de datos siempre mostrar&aacute; un cierto grado de multicolinealidad, a menos que las columnas de la matriz <b>X</b> sean ortogonales, es decir que <b>X'</b> <b>&#183;</b> <b>X</b> sea una matriz diagonal, lo cual s&oacute;lo suceder&aacute; en un experimento dise&ntilde;ado (Montgomery <i>et al.,</i> 1998; 2002). Siendo <b>X</b><sub><i>J</i></sub> la j&#45;&eacute;sima columna de la matriz <b>X,</b> la <i>multicolinealidad</i> se define de manera formal como la dependencia lineal entre tales columnas, es decir, que existe un conjunto de constantes <i>t<sub>1</sub>, t<sub>2</sub>,</i>... , <i>t<sub>p</sub>,</i> no todas cero, tales que:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e13.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Si la ecuaci&oacute;n anterior es exactamente v&aacute;lida para un subconjunto de las columnas de <b>X,</b> el rango de la matriz <b>X'</b> <b>&#183;</b> <b>X</b> es menor que <i>p</i> y entonces no existe <b>(X'</b> <b>&#183;</b> <b>X)<sup>&#45;1</sup>.</b> Cuando la ecuaci&oacute;n (13) es v&aacute;lida, s&oacute;lo aproximadamente existe multicolinealidad; es decir, que la matriz <b>X'</b> <b>&#183;</b> <b>X</b> presenta un cierto grado de deterioramiento. En general, cuando se aplica el m&eacute;todo de m&iacute;nimos cuadrados de los residuos a datos que presentan multicolinealidad, la estimaci&oacute;n de los coeficientes de regresi&oacute;n no es confiable, ya que su valor absoluto est&aacute; exagerado y adem&aacute;s es inestable.</font></p>  	    <p align="justify"><font face="verdana" size="2">Las t&eacute;cnicas b&aacute;sicas para combatir la multicolinealidad son las tres siguientes (Ryan, 1998; Montgomery <i>et al.,</i> 1998):</font></p>  	    <blockquote> 		    <p align="justify"><font face="verdana" size="2">1. Obtener m&aacute;s datos, lo cual puede no ser posible y adem&aacute;s es probable que los datos nuevos reflejen el comportamiento de los anteriores.</font></p>  		    <p align="justify"><font face="verdana" size="2">2. Re&#45;especificar el modelo, redefiniendo los regresores. Por ejemplo, si X<sub>1</sub>, X<sub>2</sub> y X<sub>3</sub> son linealmente dependientes, se puede adoptar una funci&oacute;n de ellos del tipo <i>X</i> &#61; (X<sub>1</sub> &#43; X<sub>2</sub>)/X<sub>3</sub>, o bien <i>X</i> &#61; X<sub>1</sub> &#183; X<sub>2</sub> &#183; X<sub>3</sub>, que preserva el contenido de la informaci&oacute;n de los regresores originales, pero que reduce el deterioramiento de los datos debido a la multicolinealidad. Otro m&eacute;todo de reespecificaci&oacute;n muy efectivo consiste en la eliminaci&oacute;n de una o m&aacute;s variables o regresores, esto de manera definitiva reduce la multicolinealidad, pero puede da&ntilde;ar notablemente la capacidad predictiva del modelo.</font></p>  		    <p align="justify"><font face="verdana" size="2">3. Obtener estimaciones sesgadas, como la RLM de tipo Ridge.</font></p> 	</blockquote>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p><strong></strong>              ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b><i>Diagn&oacute;stico cuantitativo de la multicolinealidad con base en (E'</i></b> <b>&#183;</b> <b><i>E)<sup>&#45;1</sup></i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">La manera m&aacute;s simple de descubrir la multicolinealidad es a trav&eacute;s de la inspecci&oacute;n de la matriz <b>E'</b> <b>&#183;</b> <b>E,</b> cuyos elementos fuera de la diagonal principal corresponden a los coeficientes de correlaci&oacute;n simple entre pares de regresores; entonces, si existen valores absolutos mayores de 0.80, se tiene dependencia entre tal pareja. Este m&eacute;todo s&oacute;lo detecta la multicolinealidad, pero no la cuantifica; en cambio, cuando los factores de inflaci&oacute;n de la varianza VIF de <i>Variance Inflation Factor</i> son mayores que 10 implican que los coeficientes de regresi&oacute;n obtenidos con la ecuaci&oacute;n (5) no son confiables debido a la multicolinealidad. La expresi&oacute;n de los VIF es (Montgomery <i>et al.,</i> 1998; 2002):</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e14.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">donde <i>R<sub>J</sub><sup>2</sup></i> es el coeficiente de determinaci&oacute;n que resulta de la RLM entre el regresor <i>X<sub>j</sub></i> como variable dependiente y el resto <i>p</i> &#45; 1 como regresores. Los VIF<i><sub>j</sub></i> corresponden a la diagonal principal de la matriz inversa de <b>E'</b> <b>&#183;</b> <b>E.</b></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b><i>Diagn&oacute;stico cuantitativo de la multicolinealidad con base en los eigenvalores de E'</i></b> <b>&#183;</b> <b><i>E</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">Los eigenvalores de la matriz <b>E'</b> <b>&#183;</b> <b>E</b> se designan por &#955;<sub>1</sub>, &#955;<sub>2</sub>, &#955;<sub>3</sub>,..., &#955;<i><sub>p</sub>;</i> tambi&eacute;n se conocen como valores propios y corresponden a las ra&iacute;ces de la ecuaci&oacute;n caracter&iacute;stica <b>&#124;A&#45;&#955;&#183;I&#124;</b> &#61; 0 de la matriz <b>A.</b> Se obtienen con procedimientos de m&eacute;todos num&eacute;ricos, por ejemplo, el m&eacute;todo de potencias (Carnahan <i>et al.,</i> 1969). Si existe una o m&aacute;s dependencias casi lineales en los datos, uno o m&aacute;s de los eigenvalores ser&aacute;n peque&ntilde;os. El <i>n&uacute;mero de condici&oacute;n</i> &#954; de la matriz <b>E'</b> <b>&#183;</b> <b>E</b> se define como (Montgomery <i>et al.,</i> 1998; 2002):</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e15.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">y representa el espectro de variaci&oacute;n de los eigenvalores de la matriz <b>E'</b> <b>&#183;</b> <b>E.</b> En general, cuando &#954; es menor que 100, pr&aacute;cticamente no existen problemas de multicolinealidad; cuando var&iacute;a de 100 a 1 000 se tiene multicolinealidad de moderada a fuerte, y cuando excede de 1 000 seguramente se tendr&aacute;n graves problemas asociados con &eacute;sta. Los <i>&iacute;ndices de condici&oacute;n</i> &#954;<sub><i>j</i></sub> de la matriz <b>E'</b> <b>&#183;</b> <b>E</b> son:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e16.jpg"></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Los valores de &#954;<sub><i>j</i></sub> definen el n&uacute;mero y magnitud de las dependencias lineales que existen en los datos. Adem&aacute;s, los eigenvectores asociados con cada eigenvalor permiten establecer num&eacute;ricamente la dependencia lineal que existe entre los regresores, como se mostrar&aacute; en la aplicaci&oacute;n num&eacute;rica.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b><i>La regresi&oacute;n Ridge</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">El m&eacute;todo de m&iacute;nimos cuadrados de los residuos asegura que la estimaci&oacute;n <img src="/img/revistas/tca/v5n4/a12i3.jpg"> (ecuaci&oacute;n (5)) tenga varianza m&iacute;nima, pero la multicolinealidad genera varianza muy grande, por lo cual sus estimaciones son inestables. Suponiendo que se puede obtener un estimador sesgado <img src="/img/revistas/tca/v5n4/a12i4.jpg"> que tenga mucho menor varianza, entonces se puede aceptar una cantidad peque&ntilde;a de sesgo en <img src="/img/revistas/tca/v5n4/a12i4.jpg">, de manera que el error medio cuadr&aacute;tico de <img src="/img/revistas/tca/v5n4/a12i4.jpg"> sea menor que la varianza del estimador insesgado <img src="/img/revistas/tca/v5n4/a12i3.jpg">. La menor varianza del estimador sesgado implica que <sup><img src="/img/revistas/tca/v5n4/a12i4.jpg"></sup> es un estimador m&aacute;s estable de &#946; que el insesgado <img src="/img/revistas/tca/v5n4/a12i3.jpg">.</font></p>  	    <p align="justify"><font face="verdana" size="2">Se han desarrollado varios procedimientos para obtener estimadores sesgados de los coeficientes de regresi&oacute;n &#946;. Uno de ellos es la <i>regresi&oacute;n Ridge</i> o de cresta, que fue propuesta a comienzos de la d&eacute;cada de los a&ntilde;os setenta por Hoerl y Kennard (1970), y que debe su nombre a la semejanza de sus operaciones matem&aacute;ticas con el an&aacute;lisis Ridge empleado para describir el comportamiento de superficies de respuesta de segundo orden. El estimador Ridge <img src="/img/revistas/tca/v5n4/a12i3.jpg"><sub>R</sub> se obtiene resolviendo una versi&oacute;n ligeramente modificada de las ecuaciones normales, expuestas como ecuaciones (4) y (5); &eacute;sta es (Montgomery <i>et al.,</i> 1998; 2002):</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e17.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">por lo cual:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e18.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">en las expresiones anteriores, la constante <i>k</i> &#8805; 0, denominada <i>par&aacute;metro de sesgo,</i> se selecciona durante el proceso de aplicaci&oacute;n de la regresi&oacute;n Ridge. En realidad, el estimador Ridge es una transformaci&oacute;n lineal del estimador de m&iacute;nimos cuadrados de los residuos, cuyo sesgo crece al aumentar k, pero al mismo tiempo disminuye su varianza. Con la regresi&oacute;n Ridge se obtiene una estimaci&oacute;n estable de sus coeficientes, a cambio de no ser el mejor ajuste a los datos. Debido a esto &uacute;ltimo se cree, pues no hay demostraci&oacute;n matem&aacute;tica concluyente, que conduce a ecuaciones de regresi&oacute;n que funcionan mejor para predecir observaciones futuras, en comparaci&oacute;n con la de m&iacute;nimos cuadrados de los residuos.</font></p>  	    <p align="justify"><font face="verdana" size="2">Hoerl y Kennard (1970) sugirieron que un valor adecuado de <i>k</i> puede estimarse por inspecci&oacute;n de la <i>traza Ridge,</i> que es una gr&aacute;fica de las magnitudes de <img src="/img/revistas/tca/v5n4/a12i3.jpg"><sub>R</sub> dibujados en las ordenadas, contra sus respectivos valores de <i>k</i> en las abscisas. Los valores de <i>k</i> suelen estar en intervalo de 0 a 1. Si la multicolinealidad es grave, los coeficientes <img src="/img/revistas/tca/v5n4/a12i3.jpg"><sub>R</sub> variar&aacute;n mucho, pero en un cierto valor de <i>k</i> se estabilizan. La idea fundamental es seleccionar el valor de <i>k</i> m&aacute;s peque&ntilde;o, donde los <img src="/img/revistas/tca/v5n4/a12i3.jpg"><sub>R</sub> ya sean estables. Con ello es posible que se obtenga una ecuaci&oacute;n de regresi&oacute;n con menor error medio cuadr&aacute;tico que el correspondiente a m&iacute;nimos cuadrados.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Aplicaci&oacute;n num&eacute;rica</b></font></p>  	    <p align="justify"><font face="verdana" size="2"><b><i>Datos en el Alto R&iacute;o Grijalva</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">En la <a href="/img/revistas/tca/v5n4/a12f1.jpg" target="_blank">figura 1</a> se muestra la ubicaci&oacute;n, dentro de la Regi&oacute;n Hidrol&oacute;gica 30 (R&iacute;os Grijalva y Usumacinta), de cinco cuencas pertenecientes a las estaciones hidrom&eacute;tricas Santa Isabel, La Escalera, El Boquer&oacute;n II, Las Flores II y Santa Mar&iacute;a, cuyos datos generales se tienen en el <a href="/img/revistas/tca/v5n4/a12c1.jpg" target="_blank">cuadro 1</a>. El planteamiento general de esta aplicaci&oacute;n num&eacute;rica consiste en ampliar el registro corto de Santa Isabel a trav&eacute;s de RLM de tipo Ridge, empleando los otros cuatro registros largos. Esta estimaci&oacute;n ya fue realizada (Campos, 2012), con base en el m&eacute;todo de selecci&oacute;n de variables predictivas.</font></p>  	    <p align="justify"><font face="verdana" size="2">Campos (2012) recopil&oacute; en el sistema <i>BANDAS</i> (IMTA, 2002) los datos disponibles en las estaciones citadas, correspondientes al volumen escurrido anual en millones de metros c&uacute;bicos (Mm<sup>3</sup>); tambi&eacute;n estim&oacute; valores mensuales perdidos para los a&ntilde;os incompletos y dedujo las magnitudes anuales faltantes en el periodo com&uacute;n, definido de 1956 a 1973. Adem&aacute;s, estableci&oacute; el periodo de ampliaci&oacute;n de 1974 a 1994. Tales datos se presentan en el <a href="/img/revistas/tca/v5n4/html/a12c2.html" target="_blank">cuadro 2</a>. Finalmente, prob&oacute; que los datos no tuvieran componentes determin&iacute;sticas y verific&oacute; su procedencia de una distribuci&oacute;n normal, con base en el test de Shapiro y Wilk (Shapiro, 1998).</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b><i>Diagn&oacute;stico de la multicolinealidad</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">Las matrices <b>E'</b> <b>&#183;</b> <b>E, E'</b> <b>&#183;</b> <b>Y</b> y <b>(E'</b> <b>&#183;</b> <b>E)<sup>&#45;1</sup></b> obtenidas para los datos del cuadro 1, procesados l&oacute;gicamente con escalamiento unitario y subrutinas de multiplicaci&oacute;n e inversi&oacute;n de matrices elaboradas <i>ex professo</i> son:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12i5.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">La inspecci&oacute;n de la matriz <b>E'</b> <b>&#183;</b> <b>E</b> muestra que &uacute;nicamente existen dos correlaciones importantes: la mayor (<i>r<sub>xy</sub></i> &#61; 0.9115), entre X<sub>3</sub> y X<sub>4</sub>, y la menor (<i>r<sub>xy</sub></i> &#61; 0.8673), entre X<sub>2</sub> y X<sub>3</sub>. Por lo anterior, se detecta un problema de multicolinealidad en los datos, pero quiz&aacute;s sea aceptable o moderada. En relaci&oacute;n con el vector <b>E'</b> <b>&#183;</b> <b>Y,</b> ninguna correlaci&oacute;n es importante y &eacute;stas disminuyen conforme las estaciones hidrom&eacute;tricas est&aacute;n m&aacute;s alejadas de la estaci&oacute;n Santa Isabel (ver <a href="/img/revistas/tca/v5n4/a12f1.jpg" target="_blank">figura 1</a>).</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">El diagn&oacute;stico cuantitativo de la multicolinealidad se tiene en el <a href="/img/revistas/tca/v5n4/a12c3.jpg" target="_blank">cuadro 3</a>, cuyo primer rengl&oacute;n de resultados corresponde a los valores de los factores de inflaci&oacute;n de la varianza (VIF<sub><i>j</i></sub>) y son los elementos de la diagonal principal de la matriz inversa de <b>E'</b> <b>&#183;</b> <b>E.</b> Como la magnitud mayor de los VIF<sub><i>j</i></sub> escasamente excede de 10, se encuentra multicolinealidad aceptable. Por otra parte, como ninguno de los &iacute;ndices de condici&oacute;n (&#954;<sub><i>j</i></sub>) excede de 100, entonces los problemas asociados con la multicolinealidad no ser&aacute;n serios, lo cual ratifica la conclusi&oacute;n anterior.</font></p>  	    <p align="justify"><font face="verdana" size="2">Con base en los elementos del cuarto eigenvector, que corresponde al menor de los eigenvalores, se establece la siguiente ecuaci&oacute;n (13), relativa a la multicolinealidad presente:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e19.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">considerando que el coeficiente de X<sub>1</sub> es cercano a cero se obtiene:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e20.jpg"></font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/tca/v5n4/a12e21.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">la ecuaci&oacute;n anterior establece la relaci&oacute;n aproximada entre X<sub>3</sub> con X<sub>2</sub> y X<sub>4</sub>.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b><i>C&aacute;lculo y an&aacute;lisis de la traza Ridge</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">La aplicaci&oacute;n de la ecuaci&oacute;n (18), con base en un programa de c&oacute;mputo elaborado <i>ex professo,</i> el cual utiliza los valores de <i>k</i> indicados en el <a href="/img/revistas/tca/v5n4/a12c4.jpg" target="_blank">cuadro 4</a>, condujo a los coeficientes de regresi&oacute;n tipo Ridge ah&iacute; concentrados, cuyos coeficientes de determinaci&oacute;n <i>(R<sup>2</sup>)</i> correspondientes tambi&eacute;n se muestran en este cuadro. El c&aacute;lculo de <i>R<sup>2</sup></i> se realiz&oacute; haciendo el centrado de los datos y utilizando un COR &#61; 500. A partir de los resultados del <a href="/img/revistas/tca/v5n4/a12c4.jpg" target="_blank">cuadro 4</a> se ha construido la traza Ridge, mostrada en la <a href="/img/revistas/tca/v5n4/a12f2.jpg" target="_blank">figura 2</a>.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">El estudio de la traza Ridge muestra que s&oacute;lo el coeficiente de regresi&oacute;n de la variable <i>X<sub>1</sub>,</i> es decir, de la estaci&oacute;n hidrom&eacute;trica La Escalera es estable; en cambio, los relativos a las estaciones Las Flores II <i>(X<sub>3</sub>)</i> y Santa Mar&iacute;a <i>(X<sub>4</sub>)</i> var&iacute;an bastante y de manera similar; por &uacute;ltimo, el de El Boquer&oacute;n II (X<sub>2</sub>) fluct&uacute;a menos, pero incluso cambia de signo. Con el objeto de establecer el menor valor para el par&aacute;metro de sesgo <i>(k),</i> se acepta que en la traza Ridge sus coeficientes ya est&aacute;n estables en 0.25 y m&aacute;s apropiadamente en 0.35.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b><i>Estimaciones Ridge y su contraste</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">En el <a href="/img/revistas/tca/v5n4/a12c5.jpg" target="_blank">cuadro 5</a> se exponen las 18 estimaciones de la variable dependiente (&#374; <sub>i</sub>), esto es, el registro hist&oacute;rico en la estaci&oacute;n hidrom&eacute;trica Santa Isabel en el periodo 1956&#45;1973, as&iacute; como sus residuos correspondientes, realizadas con las regresiones Ridge, que emplean <i>k</i> &#61; 0.250 y 0.350. Los coeficientes de regresi&oacute;n respectivos se muestran en el <a href="/img/revistas/tca/v5n4/a12c6.jpg" target="_blank">cuadro 6</a> y fueron obtenidos con datos centrados y usando un COR de 500.</font></p>  	    <p align="justify"><font face="verdana" size="2">En el <a href="/img/revistas/tca/v5n4/a12c6.jpg" target="_blank">cuadro 6</a> se han concentrado los resultados del contraste entre los residuos de los dos mejores modelos de regresi&oacute;n obtenidos a trav&eacute;s de selecci&oacute;n de variables predictivas (Campos, 2012) y las regresiones Ridge adoptadas. Se observa que la regresi&oacute;n Ridge origina valores ligeramente mayores de los residuos negativos y escasamente menores de los residuos positivos; la suma de residuos al cuadrado es mayor, pues no es el mejor ajuste a los datos, pero la suma algebraica de sus errores es menor.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b><i>Estimaciones Ridge adoptadas</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">Finalmente, en el <a href="/img/revistas/tca/v5n4/a12c7.jpg" target="_blank">cuadro 7</a> se presentan los 21 vol&uacute;menes escurridos anuales estimados en la estaci&oacute;n hidrom&eacute;trica Santa Isabel para el periodo de 1974 a 1994, mediante las regresiones Ridge adoptadas, as&iacute; como sus respectivos par&aacute;metros estad&iacute;sticos.</font></p>  	    <p align="justify"><font face="verdana" size="2">En la <a href="/img/revistas/tca/v5n4/a12f3.jpg" target="_blank">figura 3</a> se muestra la comparaci&oacute;n entre la segunda serie de vol&uacute;menes escurridos anuales estimados con regresi&oacute;n Ridge y los valores adoptados bajo el planteamiento de selecci&oacute;n de variables predictivas (Campos, 2012). Se observa que ambas series estimadas de vol&uacute;menes escurridos anuales presentan el mismo comportamiento, pero la procedente de la regresi&oacute;n Ridge es mayor y con los valores m&aacute;ximos m&aacute;s peque&ntilde;os, lo cual origina un valor medio (<img src="/img/revistas/tca/v5n4/a12i6.jpg"> &#61; 862.3 Mm<sup>3</sup>) y un coeficiente de variaci&oacute;n (Cv &#61; 0.223) m&aacute;s parecidos a los de los datos hist&oacute;ricos de Santa Isabel (<img src="/img/revistas/tca/v5n4/a12i6.jpg"> &#61; 1 009.4 Mm<sup>3</sup> y <i>Cv</i> &#61; 0.227), en comparaci&oacute;n con los obtenidos mediante selecci&oacute;n de regresores (<img src="/img/revistas/tca/v5n4/a12i6.jpg">&#61; 831.1 Mm<sup>3</sup> y <i>Cv</i> &#61; 0.293).</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b>Conclusiones</b></font></p>  	    <p align="justify"><font face="verdana" size="2">La regresi&oacute;n Ridge es un procedimiento directo, de f&aacute;cil implementaci&oacute;n dentro de la soluci&oacute;n de m&iacute;nimos cuadrados de los residuos (ecuaciones (5) y (18)) y la interpretaci&oacute;n y uso de la traza Ridge no presenta ninguna dificultad.</font></p>  	    <p align="justify"><font face="verdana" size="2">En relaci&oacute;n con los problemas de ajuste que origina la multicolinealidad, existe consenso para recomendar que es mejor usar algo de la informaci&oacute;n estad&iacute;stica de todos los regresores, como lo hace la regresi&oacute;n Ridge, que emplear toda la informaci&oacute;n de algunos regresores y nada de otros, como act&uacute;a el m&eacute;todo de selecci&oacute;n de variables predictivas.</font></p>  	    <p align="justify"><font face="verdana" size="2">Respecto a la aplicaci&oacute;n num&eacute;rica descrita, problema previamente abordado con eliminaci&oacute;n de variables, los resultados de la regresi&oacute;n Ridge son bastante semejantes (ver <a href="/img/revistas/tca/v5n4/a12f3.jpg" target="_blank">figura 3</a>), pero m&aacute;s apegados a los par&aacute;metros estad&iacute;sticos hist&oacute;ricos de la estaci&oacute;n Santa Isabel (<a href="/img/revistas/tca/v5n4/html/a12c2.html" target="_blank">cuadro 2</a>).</font></p>  	    <p align="justify"><font face="verdana" size="2">Finalmente, en problemas con seis o siete registros amplios disponibles, caso com&uacute;n al transportar registros de lluvia anual, la regresi&oacute;n Ridge ser&aacute; una mejor opci&oacute;n que la inspecci&oacute;n de 64 o 128 posibles modelos obtenidos por m&iacute;nimos cuadrados de los residuos, como lo establece el esquema de eliminaci&oacute;n de variables predictivas.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Referencias</b></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Campos&#45;Aranda, D. F. (2012). <i>Ampliaci&oacute;n de registros de volumen escurrido anual a trav&eacute;s de Regresi&oacute;n Lineal M&uacute;ltiple, con selecci&oacute;n de variables predictivas.</i> XXII Congreso Nacional de Hidr&aacute;ulica. Tema: Aprovechamiento Integral de Cuencas, Ponencia 29, del 7 al 9 de noviembre, Acapulco, Guerrero.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9755965&pid=S2007-2422201400040001200001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Carnahan, B., Luther, H. A., &#38; Wilkes, J. O. (1969). Matrices and Related Topics. Chapter 4. In <i>Applied Numerical Methods</i> (pp. 210&#45;268). New York: John Wiley &#38; Sons.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9755967&pid=S2007-2422201400040001200002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Haan, C. T. (1977). Multivariate Analysis. Chapter 12. In <i>Statistical Methods in Hydrology</i> (pp. 236&#45;262). Ames, USA: The Iowa State University Press.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9755969&pid=S2007-2422201400040001200003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Hirsch, R. M., Helsel, D. R., Cohn, T. A., &#38; Gilroy, E. J. (1993). Statistical Analysis of Hydrologic Data. Chapter 17. In D. R. Maidment (Ed.), <i>Handbook of Hydrology</i> (pp. 17.1&#45;17.55). New York: McGraw&#45;Hill, Inc.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9755971&pid=S2007-2422201400040001200004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Hoerl, A. E., &#38; Kennard, R. W. (1970). Ridge Regression: Biased Estimation for Nonorthogonal Problems. <i>Technometrics, 12,</i> 55&#45;67.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9755973&pid=S2007-2422201400040001200005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">IMTA (2002). <i>Banco Nacional de Datos de Aguas Superficiales (BANDAS).</i> 8 CD's. Jiutepec, M&eacute;xico: Secretar&iacute;a de Medio Ambiente y Recursos Naturales, Comisi&oacute;n Nacional del Agua, Instituto Mexicano de Tecnolog&iacute;a del Agua.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9755975&pid=S2007-2422201400040001200006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Montgomery, D. C., Peck, E. A., &#38; Simpson, J. R. (1998). Multicollinearity and Biased Estimation in Regression. Chapter 16. In H. M. Wadsworth (Ed.), <i>Handbook of</i> <i>Statistical Methods for Engineers and Scientists</i> (pp. 291&#45;342). Second edition. New York: McGraw&#45;Hill, Inc.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9755977&pid=S2007-2422201400040001200007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Montgomery, D. C., Peck, E. A., &#38; Vining, G. G. (2002). Multicolinealidad. Cap&iacute;tulo 10. En <i>Introducci&oacute;n al an&aacute;lisis de regresi&oacute;n lineal</i> (pp. 291&#45;342). M&eacute;xico, DF: Compa&ntilde;&iacute;a Editorial Continental.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9755979&pid=S2007-2422201400040001200008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Ryan, T. P. (1998). Linear Regression. Chapter 14. In H. M. Wadsworth (Ed.), <i>Handbook of Statistical Methods for Engineers and Scientists</i> (pp. 14.1&#45;14.43). New York: McGraw&#45;Hill, Inc.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9755981&pid=S2007-2422201400040001200009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Salas, J. D., Raynal, J. A., Tarawneh, Z. S., Lee, T. S., Frevert, D., &#38; Fulp, T. (2008). Extending Short Record of Hydrologic Data. Chapter 20. In V. P. Singh (Ed.), <i>Hydrology and Hydraulics</i> (pp. 717&#45;760). Highlands Ranch, USA: Water Resources Publications.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9755983&pid=S2007-2422201400040001200010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Shapiro, S. S. (1998). Selection, Fitting and Testing Statistical Models. Chapter 6. In H. M. Wadsworth (Ed.), <i>Handbook of Statistical Methods for Engineers and Scientists</i> (pp. 6.1&#45;6.35). Second edition. New York: McGraw&#45;Hill, Inc.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9755985&pid=S2007-2422201400040001200011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Campos-Aranda]]></surname>
<given-names><![CDATA[D. F.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Ampliación de registros de volumen escurrido anual a través de Regresión Lineal Múltiple, con selección de variables predictivas]]></article-title>
<source><![CDATA[XXII Congreso Nacional de Hidráulica. Tema: Aprovechamiento Integral de Cuencas]]></source>
<year>2012</year>
<publisher-loc><![CDATA[^eAcapulco Acapulco]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Carnahan]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
<name>
<surname><![CDATA[Luther]]></surname>
<given-names><![CDATA[H. A.]]></given-names>
</name>
<name>
<surname><![CDATA[Wilkes]]></surname>
<given-names><![CDATA[J. O.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Matrices and Related Topics. Chapter 4]]></article-title>
<source><![CDATA[Applied Numerical Methods]]></source>
<year>1969</year>
<page-range>210-268</page-range><publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[John Wiley & Sons]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Haan]]></surname>
<given-names><![CDATA[C. T.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Multivariate Analysis. Chapter 12]]></article-title>
<source><![CDATA[Statistical Methods in Hydrology]]></source>
<year>1977</year>
<page-range>236-262</page-range><publisher-loc><![CDATA[Ames ]]></publisher-loc>
<publisher-name><![CDATA[The Iowa State University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hirsch]]></surname>
<given-names><![CDATA[R. M.]]></given-names>
</name>
<name>
<surname><![CDATA[Helsel]]></surname>
<given-names><![CDATA[D. R.]]></given-names>
</name>
<name>
<surname><![CDATA[Cohn]]></surname>
<given-names><![CDATA[T. A.]]></given-names>
</name>
<name>
<surname><![CDATA[Gilroy]]></surname>
<given-names><![CDATA[E. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Statistical Analysis of Hydrologic Data. Chapter 17]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Maidment]]></surname>
<given-names><![CDATA[D. R.]]></given-names>
</name>
</person-group>
<source><![CDATA[Handbook of Hydrology]]></source>
<year>1993</year>
<page-range>17.1-17.55</page-range><publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[McGraw-Hill, Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hoerl]]></surname>
<given-names><![CDATA[A. E.]]></given-names>
</name>
<name>
<surname><![CDATA[Kennard]]></surname>
<given-names><![CDATA[R. W.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Ridge Regression: Biased Estimation for Nonorthogonal Problems]]></article-title>
<source><![CDATA[Technometrics]]></source>
<year>1970</year>
<volume>12</volume>
<page-range>55-67</page-range></nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="book">
<collab>IMTA</collab>
<source><![CDATA[Banco Nacional de Datos de Aguas Superficiales (BANDAS)]]></source>
<year>2002</year>
<publisher-name><![CDATA[Secretaría de Medio Ambiente y Recursos NaturalesComisión Nacional del AguaInstituto Mexicano de Tecnología del Agua]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Montgomery]]></surname>
<given-names><![CDATA[D. C.]]></given-names>
</name>
<name>
<surname><![CDATA[Peck]]></surname>
<given-names><![CDATA[E. A.]]></given-names>
</name>
<name>
<surname><![CDATA[Simpson]]></surname>
<given-names><![CDATA[J. R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Multicollinearity and Biased Estimation in Regression. Chapter 16]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Wadsworth]]></surname>
<given-names><![CDATA[H. M.]]></given-names>
</name>
</person-group>
<source><![CDATA[Handbook of Statistical Methods for Engineers and Scientists]]></source>
<year>1998</year>
<edition>Second</edition>
<page-range>291-342</page-range><publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[McGraw-Hill, Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Montgomery]]></surname>
<given-names><![CDATA[D. C.]]></given-names>
</name>
<name>
<surname><![CDATA[Peck]]></surname>
<given-names><![CDATA[E. A.]]></given-names>
</name>
<name>
<surname><![CDATA[Vining]]></surname>
<given-names><![CDATA[G. G.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Multicolinealidad. Capítulo 10]]></article-title>
<source><![CDATA[Introducción al análisis de regresión lineal]]></source>
<year>2002</year>
<page-range>291-342</page-range><publisher-loc><![CDATA[México^eDF DF]]></publisher-loc>
<publisher-name><![CDATA[Compañía Editorial Continental]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ryan]]></surname>
<given-names><![CDATA[T. P.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Linear Regression. Chapter 14]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Wadsworth]]></surname>
<given-names><![CDATA[H. M.]]></given-names>
</name>
</person-group>
<source><![CDATA[Handbook of Statistical Methods for Engineers and Scientists]]></source>
<year>1998</year>
<page-range>14.1-14.43</page-range><publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[McGraw-Hill, Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Salas]]></surname>
<given-names><![CDATA[J. D.]]></given-names>
</name>
<name>
<surname><![CDATA[Raynal]]></surname>
<given-names><![CDATA[J. A.]]></given-names>
</name>
<name>
<surname><![CDATA[Tarawneh]]></surname>
<given-names><![CDATA[Z. S.]]></given-names>
</name>
<name>
<surname><![CDATA[Lee]]></surname>
<given-names><![CDATA[T. S.]]></given-names>
</name>
<name>
<surname><![CDATA[Frevert]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Fulp]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Extending Short Record of Hydrologic Data. Chapter 20]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Singh]]></surname>
<given-names><![CDATA[V. P.]]></given-names>
</name>
</person-group>
<source><![CDATA[Hydrology and Hydraulics]]></source>
<year>2008</year>
<page-range>717-760</page-range><publisher-name><![CDATA[Water Resources Publications]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Shapiro]]></surname>
<given-names><![CDATA[S. S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Selection, Fitting and Testing Statistical Models. Chapter 6]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Wadsworth]]></surname>
<given-names><![CDATA[H. M.]]></given-names>
</name>
</person-group>
<source><![CDATA[Handbook of Statistical Methods for Engineers and Scientists]]></source>
<year>1998</year>
<edition>Second</edition>
<page-range>6.1-6.35</page-range><publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[McGraw-Hill, Inc]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
