<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0036-3634</journal-id>
<journal-title><![CDATA[Salud Pública de México]]></journal-title>
<abbrev-journal-title><![CDATA[Salud pública Méx]]></abbrev-journal-title>
<issn>0036-3634</issn>
<publisher>
<publisher-name><![CDATA[Instituto Nacional de Salud Pública]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0036-36342006000500006</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Modelos de regresión para variables expresadas como una proporción continua]]></article-title>
<article-title xml:lang="en"><![CDATA[Regression models for variables expressed as a continuous proportion]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Salinas-Rodríguez]]></surname>
<given-names><![CDATA[Aarón]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Pérez-Núñez]]></surname>
<given-names><![CDATA[Ricardo]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Ávila-Burgos]]></surname>
<given-names><![CDATA[Leticia]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Instituto Nacional de Salud Pública Centro de Investigación en Salud Poblacional ]]></institution>
<addr-line><![CDATA[Cuernavaca Morelos]]></addr-line>
<country>México</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>10</month>
<year>2006</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>10</month>
<year>2006</year>
</pub-date>
<volume>48</volume>
<numero>5</numero>
<fpage>395</fpage>
<lpage>404</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_arttext&amp;pid=S0036-36342006000500006&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&amp;pid=S0036-36342006000500006&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_pdf&amp;pid=S0036-36342006000500006&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[OBJETIVO: Describir algunas de las alternativas estadísticas disponibles para el estudio de proporciones continuas y comparar los distintos modelos que existen para evidenciar sus ventajas y desventajas, mediante su aplicación a un ejemplo práctico del ámbito de la salud pública. MATERIAL Y MÉTODOS: Con base en la Encuesta Nacional de Salud Reproductiva realizada en el año 2003, se modeló la proporción de cobertura individual en el programa de planificación familiar -propuesta en un estudio previo realizado en el Instituto Nacional de Salud Pública en Cuernavaca, Morelos, México (2005)- mediante el uso de los modelos de regresión normal, gama, beta y de quasi-verosimilitud. La variante del criterio de información de Akaike (AIC) que propusieron McQuarrie y Tsai se utilizó para definir el mejor modelo. A continuación, y mediante simulación (enfoque Monte Carlo/cadenas de Markov), se generó una variable con distribución beta para evaluar el comportamiento de los cuatro modelos al variar el tamaño de la muestra desde 100 hasta 18 000 observaciones. RESULTADOS: Los resultados muestran que la mejor opción estadística para el análisis de proporciones continuas es el modelo de regresión beta, de acuerdo con sus supuestos y el valor de AIC. La simulación mostró que a medida que aumenta el tamaño de la muestra, el modelo gama y, en especial, el modelo de quasi-verosimilitud se aproximan en grado significativo al modelo beta. CONCLUSIONES: Para la modelación de proporciones continuas se recomienda emplear el enfoque paramétrico de la regresión beta y evitar el uso del modelo normal. Si se tiene un tamaño de muestra grande, el uso del enfoque de quasi-verosimilitud representa una buena alternativa.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[OBJECTIVE: To describe some of the statistical alternatives available for studying continuous proportions and to compare them in order to show their advantages and disadvantages by means of their application in a practical example of the Public Health field. MATERIAL AND METHODS: From the National Reproductive Health Survey performed in 2003, the proportion of individual coverage in the family planning program -proposed in one study carried out in the National Institute of Public Health in Cuernavaca, Morelos, Mexico (2005)- was modeled using the Normal, Gamma, Beta and quasi-likelihood regression models. The Akaike Information Criterion (AIC) proposed by McQuarrie and Tsai was used to define the best model. Then, using a simulation (Monte Carlo/Markov Chains approach) a variable with a Beta distribution was generated to evaluate the behavior of the 4 models while varying the sample size from 100 to 18 000 observations. RESULTS: Results showed that the best statistical option for the analysis of continuous proportions was the Beta regression model, since its assumptions are easily accomplished and because it had the lowest AIC value. Simulation evidenced that while the sample size increases the Gamma, and even more so the quasi-likelihood, models come significantly close to the Beta regression model. CONCLUSIONS: The use of parametric Beta regression is highly recommended to model continuous proportions and the normal model should be avoided. If the sample size is large enough, the use of quasi-likelihood model represents a good alternative.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[proporciones continuas]]></kwd>
<kwd lng="es"><![CDATA[modelos de regresión]]></kwd>
<kwd lng="es"><![CDATA[estadística]]></kwd>
<kwd lng="es"><![CDATA[México]]></kwd>
<kwd lng="en"><![CDATA[regression models]]></kwd>
<kwd lng="en"><![CDATA[continuous proportions]]></kwd>
<kwd lng="en"><![CDATA[statistics]]></kwd>
<kwd lng="en"><![CDATA[Mexico]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="right"><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>ART&Iacute;CULO    ORGINAL</b></font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="4"><b>Modelos de regresi&oacute;n    para variables expresadas como una proporci&oacute;n continua</b></font></p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>Regression models    for variables expressed as a continuous proportion</b></font></p>     <p>&nbsp;</p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Aar&oacute;n    Salinas-Rodr&iacute;guez, Psic, M en C; Ricardo P&eacute;rez-N&uacute;&ntilde;ez,    MC, M en C; Leticia &Aacute;vila-Burgos, MC, M en C, Dra en C.</b></font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Centro de Investigaci&oacute;n    en Salud Poblacional, Instituto Nacional de Salud P&uacute;blica. Cuernavaca,    Morelos, M&eacute;xico</font></p>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p> <hr size="1" noshade>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>RESUMEN</b></font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>OBJETIVO:</b>    Describir algunas de las alternativas estad&iacute;sticas disponibles    para el estudio de proporciones continuas y comparar los distintos modelos que    existen para evidenciar sus ventajas y desventajas, mediante su aplicaci&oacute;n    a un ejemplo pr&aacute;ctico del &aacute;mbito de la salud p&uacute;blica.    <br>   <b>MATERIAL Y M&Eacute;TODOS:</b> Con base en la Encuesta Nacional de Salud    Reproductiva realizada en el a&ntilde;o 2003, se model&oacute; la proporci&oacute;n    de cobertura individual en el programa de planificaci&oacute;n familiar &#150;propuesta    en un estudio previo realizado en el Instituto Nacional de Salud P&uacute;blica    en Cuernavaca, Morelos, M&eacute;xico (2005)&#150; mediante el uso de los modelos    de regresi&oacute;n normal, gama, beta y de quasi-verosimilitud. La variante    del criterio de informaci&oacute;n de Akaike (AIC) que propusieron McQuarrie    y Tsai se utiliz&oacute; para definir el mejor modelo. A continuaci&oacute;n,    y mediante simulaci&oacute;n (enfoque Monte Carlo/cadenas de Markov), se gener&oacute;    una variable con distribuci&oacute;n beta para evaluar el comportamiento de    los cuatro modelos al variar el tama&ntilde;o de la muestra desde 100 hasta    18 000 observaciones. <b>    <br>   RESULTADOS: </b> Los resultados muestran que la mejor opci&oacute;n estad&iacute;stica    para el an&aacute;lisis de proporciones continuas es el modelo de regresi&oacute;n    beta, de acuerdo con sus supuestos y el valor de AIC. La simulaci&oacute;n mostr&oacute;    que a medida que aumenta el tama&ntilde;o de la muestra, el modelo gama y, en    especial, el modelo de quasi-verosimilitud se aproximan en grado significativo    al modelo beta. <b>    <br>   CONCLUSIONES:</b> Para la modelaci&oacute;n de proporciones continuas se recomienda    emplear el enfoque param&eacute;trico de la regresi&oacute;n beta y evitar el    uso del modelo normal. Si se tiene un tama&ntilde;o de muestra grande, el uso    del enfoque de quasi-verosimilitud representa una buena alternativa.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Palabras clave:</b>    proporciones continuas; modelos de regresi&oacute;n; estad&iacute;stica; M&eacute;xico</font></p> <hr size="1" noshade>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>ABSTRACT</b></font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>OBJECTIVE:</b>    To describe some of the statistical alternatives available for studying continuous    proportions and to compare them in order to show their advantages and disadvantages    by means of their application in a practical example of the Public Health field.    <br>   <b>MATERIAL AND METHODS:</b> From the National Reproductive Health Survey performed    in 2003, the proportion of individual coverage in the family planning program    &#150;proposed in one study carried out in the National Institute of Public    Health in Cuernavaca, Morelos, Mexico (2005)&#150; was modeled using the Normal,    Gamma, Beta and quasi-likelihood regression models. The Akaike Information Criterion    (AIC) proposed by McQuarrie and Tsai was used to define the best model. Then,    using a simulation (Monte Carlo/Markov Chains approach) a variable with a Beta    distribution was generated to evaluate the behavior of the 4 models while varying    the sample size from 100 to 18 000 observations. <b>    ]]></body>
<body><![CDATA[<br>   RESULTS:</b> Results showed that the best statistical option for the analysis    of continuous proportions was the Beta regression model, since its assumptions    are easily accomplished and because it had the lowest AIC value. Simulation    evidenced that while the sample size increases the Gamma, and even more so the    quasi-likelihood, models come significantly close to the Beta regression model.    <br>   <b>CONCLUSIONS:</b> The use of parametric Beta regression is highly recommended    to model continuous proportions and the normal model should be avoided. If the    sample size is large enough, the use of quasi-likelihood model represents a    good alternative.</font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Keywords:</b>    regression models; continuous proportions; statistics; Mexico</font></p> <hr size="1" noshade>     <p>&nbsp;</p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Estudios de las    m&aacute;s diversas disciplinas se encuentran con cierta frecuencia ante la    necesidad de explicar una variable expresada como una proporci&oacute;n, porcentaje,    tasa o fracci&oacute;n en el rango continuo (0,1). En econom&iacute;a, por ejemplo,    se han estudiado los factores que influyen en la proporci&oacute;n de hogares    que se suscriben a la televisi&oacute;n por cable. De manera paralela, la proporci&oacute;n    de impurezas en los compuestos qu&iacute;micos es de inter&eacute;s cotidiano    para la f&iacute;sica y la qu&iacute;mica. Mientras que en estudios sobre preferencias    electorales se analizan las tasas de participaci&oacute;n ciudadana y las variables    que puedan explicarlas, en el &aacute;mbito educativo y de desempe&ntilde;o    acad&eacute;mico se intenta explicar la proporci&oacute;n de aciertos en pruebas    o <i>tests</i> estandarizados. Tambi&eacute;n el &aacute;rea de la salud p&uacute;blica    se ha enfrentado a la necesidad de modelar la proporci&oacute;n de cobertura    en programas de salud con el fin de identificar las caracter&iacute;sticas sociodemogr&aacute;ficas    y econ&oacute;micas relacionadas con el hecho de que una mujer est&eacute; cubierta.<a href="#back1"><sup>1</sup></a>    Una descripci&oacute;n detallada de estos y otros usos para una variable expresada    como proporci&oacute;n puede encontrarse en Johnson y colaboradores,<sup>1</sup>    Hviid y Villadsen<sup>2</sup> y Bury.<sup>3</sup></font></p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Johnson y colaboradores<sup>1</sup> expusieron las propiedades de la distribuci&oacute;n de probabilidad de este tipo de variables; estos investigadores muestran que la distribuci&oacute;n beta puede usarse para modelar proporciones, ya que su densidad puede tomar diferentes formas seg&uacute;n sean los valores de los dos par&aacute;metros de forma que indexan a la distribuci&oacute;n. Sin embargo, ni en este ni en otros textos de probabilidad se describen situaciones en las que es necesario imponer una estructura de regresi&oacute;n a este tipo de variables. Dada la complejidad que representa el an&aacute;lisis estad&iacute;stico de estas mismas, los investigadores de la salud deben conocer las alternativas estad&iacute;sticas disponibles para modelarlas, as&iacute; como los supuestos bajo los cuales es v&aacute;lida la aplicaci&oacute;n de estas alternativas. En este sentido, el objetivo de este trabajo es describir algunas de las alternativas estad&iacute;sticas disponibles para el estudio de las proporciones continuas y comparar los distintos modelos que existen para evidenciar sus ventajas y desventajas, mediante su aplicaci&oacute;n a un ejemplo pr&aacute;ctico de salud p&uacute;blica relacionado con el an&aacute;lisis de la cobertura del programa de planificaci&oacute;n familiar.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Varias propuestas metodol&oacute;gicas se han elaborado para analizar variables en el rango continuo (0,1). A continuaci&oacute;n se exponen los fundamentos te&oacute;ricos de los enfoques propuestos al respecto. En virtud de que este trabajo est&aacute; destinado a investigadores de la salud, el nivel de complejidad y notaci&oacute;n t&eacute;cnica se mantiene al m&iacute;nimo para permitir al lector seguir la secuencia de la exposici&oacute;n; empero, donde sea necesario se har&aacute; uso de algunas expresiones o f&oacute;rmulas, o ambas cosas.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Modelos de regresi&oacute;n    alternativos</b></font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><i>Distribuci&oacute;n normal</i></font></p>      ]]></body>
<body><![CDATA[<p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Por mucho, la pr&aacute;ctica m&aacute;s com&uacute;n para modelar proporciones continuas ha sido la aplicaci&oacute;n del m&eacute;todo de estimaci&oacute;n de regresi&oacute;n por m&iacute;nimos cuadrados ordinarios (OLS, por sus siglas en ingl&eacute;s). Sea o no que se utilice asumiendo los supuestos distribucionales, se aduce con regularidad un argumento asint&oacute;tico para su aplicaci&oacute;n, en el sentido de que tama&ntilde;os de muestra <i>grandes</i> permiten generar cuantificaciones v&aacute;lidas y confiables. Sin embargo, como apunta Godfrey,<sup>4</sup> cuando se analizan la prueba <i>t</i> o la prueba <i>F</i> correspondientes se asume una distribuci&oacute;n normal sin importar cu&aacute;l sea el tama&ntilde;o de muestra, lo mismo que al emplear algunas pruebas de heteroscedasticidad (como la de Breusch-Pagan o Cook-Weisberg). Adem&aacute;s del supuesto distribucional, el modelo de regresi&oacute;n lineal requiere el supuesto de homoscedasticidad y linealidad. En t&eacute;rminos conceptuales, este enfoque es err&oacute;neo por varios motivos. Primero, es obvio que una proporci&oacute;n no est&aacute; definida sobre el dominio de los n&uacute;meros reales, que es el dominio sobre el cual se define la distribuci&oacute;n normal. Segundo, como se usa una variable acotada en el intervalo (0,1) la funci&oacute;n de la esperanza condicional no es lineal; dicho en otras palabras, implica que no existe una relaci&oacute;n lineal entre la media de la variable de inter&eacute;s y las variables predictoras.<sup>5</sup> Tercero, por la misma raz&oacute;n, la varianza es heterosced&aacute;stica ya que se acerca a cero cuando la media se aproxima a los l&iacute;mites de su dominio, es decir, la varianza depende de la media,<sup>6</sup> lo que subestima los estimadores puntuales de los coeficientes.<sup>4</sup> Cuarto, como apuntan Ferrari y Cribari-Nieto,<sup>7</sup> si la variable de respuesta est&aacute; restringida al intervalo (0,1), el m&eacute;todo de OLS podr&iacute;a generar valores ajustados que excedan las cotas inferior y superior, adem&aacute;s de que la distribuci&oacute;n de probabilidad de las proporciones es casi siempre asim&eacute;tricas y, por lo tanto, las inferencias efectuadas sobre el supuesto de normalidad podr&iacute;an ser err&oacute;neas. Como puede observarse, las condiciones bajo las cuales los resultados del modelo de regresi&oacute;n lineal son v&aacute;lidos no se aplican cuando se tiene una proporci&oacute;n continua.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><i>Transformaci&oacute;n de la variable de respuesta</i></font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En un cap&iacute;tulo    de su libro, Atkinson<sup>8</sup> describe varias transformaciones para porcentajes    y proporciones, y aplica sobre ellas el m&eacute;todo de OLS. Atkinson recomienda    dos transformaciones . La primera es la transformaci&oacute;n <i>logit</i>,    en la que:</font></p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098x1.gif"></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">donde ln(y/(1-y)) representa la transformaci&oacute;n logit de la variable dependiente.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La segunda es una    transformaci&oacute;n logar&iacute;tmica para generar una variable que s&oacute;lo    tenga valores no negativos, es decir, que su dominio se halle en el intervalo    (0,&times;):</font></p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098x2.gif"></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En ambos casos el an&aacute;lisis implica la utilizaci&oacute;n de la metodolog&iacute;a OLS. Atkinson se&ntilde;ala que estas transformaciones generalmente logran <i>linealizar</i> la relaci&oacute;n entre la variable de respuesta y los predictores; sin embargo, y como lo resalta Aitchison,<sup>9</sup> cuando se usan con proporciones continuas casi nunca se consigue <i>estabilizar</i> la varianza y el efecto es el uso inapropiado de este enfoque. Adem&aacute;s, existe el inconveniente de que los valores l&iacute;mite, cero y uno, deben modificarse por una peque&ntilde;a constante para que no se generen valores perdidos o <i>missings</i>.<sup>5</sup> Con todo, se preserva el supuesto seg&uacute;n el cual el error (e) se distribuye normalmente y por ello todos los supuestos destacados en la secci&oacute;n anterior deben cumplirse para tener la seguridad de que las inferencias son v&aacute;lidas. Una alternativa para la segunda transformaci&oacute;n expresada en (2) consiste en utilizar un modelo de regresi&oacute;n gama, tras asumir que la variable transformada, expresada en el rango (0,&times;), sigue una distribuci&oacute;n gama. Esta distribuci&oacute;n es en particular &uacute;til para modelar variables que son estrictamente no negativas, ya que es muy flexible para modelar distintas <i>formas</i> de la variable de respuesta por los dos par&aacute;metros que indexan la distribuci&oacute;n<sup>10</sup> y no impone el supuesto de homoscedasticidad, aunque s&iacute; el de un coeficiente de variaci&oacute;n constante.<sup>11</sup> Cualquiera de los dos enfoques puede ser de utilidad si se satisfacen los supuestos que cada uno impone y el modelo gama debe preferirse si se tienen s&oacute;lo valores no negativos y la distribuci&oacute;n de la variable de respuesta no es sim&eacute;trica. El principal inconveniente de ambos enfoques es que los par&aacute;metros del modelo no pueden interpretarse con facilidad en t&eacute;rminos de la escala original de la variable; la segunda desventaja es que se requieren muestras <i>grandes</i> para lograr que la aproximaci&oacute;n sea adecuada.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><i>M&eacute;todos de quasi-verosimilitud</i></font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los dos enfoques anteriores han asumido, expl&iacute;cita o impl&iacute;citamente, alguna familia espec&iacute;fica de distribuciones para analizar la distribuci&oacute;n condicional de la proporci&oacute;n bajo estudio. Cox,<sup>6</sup> Papke y Wooldridge<sup>12</sup> optan por una v&iacute;a diferente y utilizan un enfoque de quasi-verosimilitud<sup>11</sup> que, de modo sin&oacute;ptico, se explica a continuaci&oacute;n.</font></p>      ]]></body>
<body><![CDATA[<p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En la mayor&iacute;a de las investigaciones emp&iacute;ricas se sabe que los datos siguen alguna distribuci&oacute;n de probabilidad. Si es continua y sim&eacute;trica, por ejemplo, se puede asumir la distribuci&oacute;n normal; si es discreta y dicot&oacute;mica, la distribuci&oacute;n binomial. No obstante, existen ocasiones en las que es menor la certidumbre respecto de la distribuci&oacute;n exacta de una variable. Un ejemplo de esta situaci&oacute;n es el an&aacute;lisis de los costos de hospitalizaci&oacute;n, que se sabe son positivos e invariablemente sesgados a la derecha. Quiz&aacute;s, y con un poco m&aacute;s de experiencia en el an&aacute;lisis de esta variable, se podr&iacute;a determinar que la varianza se incrementa con la media e incluso establecer la velocidad de este incremento. Sin embargo, podr&iacute;a resultar dif&iacute;cil, si no imposible, especificar la distribuci&oacute;n exacta para esta variable sin hacer uso de alg&uacute;n argumento asint&oacute;tico. El problema es que, de no hacerlo, no se podr&iacute;a construir la verosimilitud ni emplear t&eacute;cnicas como la m&aacute;xima verosimilitud o la prueba del cociente de verosimilitud. McCullagh y Nelder<sup>11</sup> evidenciaron que era posible construir un m&eacute;todo de cuantificaci&oacute;n, la quasi-verosimilitud, sin la necesidad de especificar ning&uacute;n supuesto distributivo, y que aun as&iacute; fuese capaz de generar procedimientos de inferencia confiables. La quasi-verosimilitud permite hacer inferencias con cierto grado de <i>robustez</i> a partir de dos condiciones importantes.<sup>13</sup> Primero, no se necesita imponer un supuesto distribucional y, segundo, s&oacute;lo es preciso especificar la relaci&oacute;n entre la media y la varianza, que se determina mediante una constante de proporcionalidad que puede calcularse a partir de los datos observados.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Cox<sup>7</sup>    ha desarrollado un modelo que analiza la especificaci&oacute;n para los primeros    dos momentos de la distribuci&oacute;n condicional de variables observadas en    el rango continuo (0,1). De forma espec&iacute;fica, examina el uso de las funciones    liga <i>logit</i> y <i>log-log complementaria</i> junto con dos especificaciones    para la funci&oacute;n varianza a las que &eacute;l llama <i>can&oacute;nica</i>    y <i>ortogonal</i>. Seg&uacute;n este investigador, la liga logit y la funci&oacute;n    varianza ortogonal son las m&aacute;s adecuadas en t&eacute;rminos asint&oacute;ticos,    es decir, Cox propone utilizar las siguientes relaciones para la media y la    varianza de la distribuci&oacute;n de la proporci&oacute;n continua:</font></p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098x3.gif"></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Papke y Wooldridge<sup>12</sup>    recurren a un enfoque similar, s&oacute;lo que en una problem&aacute;tica distinta.    Est&aacute;n interesados en la especificaci&oacute;n de un modelo de regresi&oacute;n    de quasi-verosimilitud para proporciones continuas y usan la siguiente especificaci&oacute;n    de la log-verosimilitud, la cual, apuntan, est&aacute; bien definida para 0    &lt;G(&#149;)&lt;1.</font></p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098x5.gif"></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Aunque discuten diversas especificaciones para G(&#149;), prefieren la funci&oacute;n log&iacute;stica en su an&aacute;lisis (equivalente a la liga logit de Cox). De manera adicional, utilizan un enfoque m&aacute;s robusto para la estimaci&oacute;n de los errores est&aacute;ndar de los coeficientes, a partir de la idea de que las proporciones estimadas pueden exhibir alg&uacute;n grado de correlaci&oacute;n dentro de alguna especificaci&oacute;n o combinaci&oacute;n de las covariables observadas; por dicha raz&oacute;n este ser&aacute; el enfoque empleado en este art&iacute;culo.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><i>Distribuci&oacute;n beta</i></font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La distribuci&oacute;n    beta puede usarse de manera efectiva en situaciones donde la variable est&aacute;    restringida al intervalo continuo (0,1). Ferrari y Cribari-Nieto<sup>7</sup>    han propuesto un modelo de regresi&oacute;n para variables que tienen una distribuci&oacute;n    beta. Antes de describir su propuesta, se define la distribuci&oacute;n beta    y sus dos primeros momentos. La funci&oacute;n de una variable beta se expresa    como:</font></p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098x6.gif"></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">donde p y q son    par&aacute;metros de forma (p, q &gt;0) y <font face="Symbol">G</font>(&#149;)    es la funci&oacute;n gama. La media y la varianza de la distribuci&oacute;n    son:</font></p>     ]]></body>
<body><![CDATA[<p align="center"><img src="/img/revistas/spm/v48n5/32098x7.gif"></p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098x8.gif"></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Puesto que el prop&oacute;sito    de Ferrari y Cribari-Nieto<sup>7</sup> es especificar un modelo de regresi&oacute;n,    utilizan una diferente <i>parametrizaci&oacute;n</i> del modelo, lo cual les    permite especificar la media as&iacute; como un par&aacute;metro de dispersi&oacute;n    para el modelo. Si se definen la media &micro;= p/(p+q) y el par&aacute;metro    de dispersi&oacute;n <font face="Symbol">f</font>= p+q, es decir, p= &micro;    <font face="Symbol">f</font> y q= (1-&micro;) <font face="Symbol">f</font>,    entonces la media y la varianza de la variable seg&uacute;n (7) y (8) son:</font></p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098x9.gif"></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">en donde V(&micro;)=    &micro;(1-&micro;), de modo que &micro; es la media de la variable de respuesta    y <font face="Symbol">f</font> puede interpretarse como un par&aacute;metro    de dispersi&oacute;n, en el sentido de que, para valores fijos de &micro;, mientras    m&aacute;s grande sea el valor <font face="Symbol">f</font>, menor es la varianza    de <i>y</i>. A partir de esta <i>parametrizaci&oacute;n</i> se puede especificar    la funci&oacute;n de probabilidad de la variable de respuesta como sigue:</font></p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098x11.gif"></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">con 0 &lt;y &lt;1,    0 &lt;&micro; &lt;1 y <font face="Symbol">f</font>&gt;0. Entonces, el modelo    especifica que la media de <i>y</i> puede escribirse como:</font></p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098x12.gif"></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">donde <font face="Symbol">b</font>    es un vector de par&aacute;metros de regresi&oacute;n desconocidos y las <i>x</i>    son observaciones para las <i>k</i> covariables y se asumen fijas y conocidas.    La correspondiente funci&oacute;n de log-verosimilitud se expresa como sigue:</font></p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098x13.gif"></p>      ]]></body>
<body><![CDATA[<p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">donde:</font></p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098x14.gif"></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"> Ferrari    y Cribari-Nieto<sup>7</sup> proponen expresiones para maximizar esta funci&oacute;n    y encontrar los estimadores de m&aacute;xima verosimilitud, as&iacute; como    para construir procedimientos de inferencia. Como ellos indican, este enfoque    tiene algunas caracter&iacute;sticas deseables. Por un lado, no se necesita    transformar la variable de respuesta, lo que supone que la interpretaci&oacute;n    de los coeficientes de regresi&oacute;n sea directa sobre el valor esperado    de la variable, esto es, sobre la media de la proporci&oacute;n. Por otro lado,    la varianza de la variable de respuesta es una funci&oacute;n de la media, por    lo cual no se impone el supuesto de homoscedasticidad; y, por &uacute;ltimo,    los par&aacute;metros de la distribuci&oacute;n beta permiten modelar diversas    formas de la distribuci&oacute;n, sobre todo aquellas que muestran asimetr&iacute;a    o relaciones no lineales.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Adem&aacute;s de estos enfoques se han utilizado algunos otros procedimientos como el modelo <i>tobit</i> para muestras censuradas,<sup>14</sup> que no se discute en este estudio en virtud de que en una proporci&oacute;n continua no existe censura: los valores fuera del intervalo (0,1) no est&aacute;n definidos y por consiguiente su uso ser&iacute;a inapropiado. Otro enfoque empleado, aunque desde una perspectiva distinta, es la aplicaci&oacute;n de la estad&iacute;stica bayesiana,<sup>15</sup> en la que se hace uso de la distribuci&oacute;n beta de manera regular; empero, tampoco se considera debido a la poca difusi&oacute;n que este enfoque ha recibido dentro del &aacute;rea de la salud p&uacute;blica y a que su introducci&oacute;n requiere un mayor espacio para presentar sus fundamentos.</font></p>      <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>Material y m&eacute;todos</b></font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Con el objetivo de comparar los resultados de las diferentes aproximaciones, se tom&oacute; como referencia informaci&oacute;n sobre la cobertura en el programa de planificaci&oacute;n familiar obtenida a partir de la Encuesta Nacional de Salud Reproductiva (ENSAR). Esta encuesta se realiz&oacute; a principios de 2003 bajo la coordinaci&oacute;n del Centro Nacional de Equidad de G&eacute;nero y Salud Reproductiva. El dise&ntilde;o metodol&oacute;gico, trabajo de campo, captura y procesamiento de la informaci&oacute;n estuvieron a cargo del Centro Regional de Investigaciones Multidisciplinarias de la Universidad Nacional Aut&oacute;noma de M&eacute;xico, con la supervisi&oacute;n y el control de la calidad del levantamiento de la informaci&oacute;n, captura y procesamiento de los datos por parte del Instituto Nacional de Salud P&uacute;blica.<sup>16</sup> Los comit&eacute;s de &eacute;tica de dichas instancias aprobaron su ejecuci&oacute;n.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para el levantamiento de la informaci&oacute;n se utilizaron tres tipos de cuestionarios: uno de hogar, otro para mujeres de 15 a 49 a&ntilde;os y uno m&aacute;s de localidad (aplicado a localidades menores de 2 500 habitantes). Para la selecci&oacute;n de la muestra se emple&oacute; un muestreo probabil&iacute;stico, poliet&aacute;pico y estratificado. Se trata de una encuesta con representatividad nacional, para &aacute;mbitos rurales y urbanos y para ocho estados del pa&iacute;s, que cuenta con un total de 19 498 cuestionarios individuales completos (tasa de no respuesta a nivel individual de 6.6%). El cuestionario individual se aplic&oacute; s&oacute;lo a mujeres en edad fecunda y recaba informaci&oacute;n detallada sobre ocho &aacute;reas de inter&eacute;s: caracter&iacute;sticas sociodemogr&aacute;ficas, fecundidad y antecedentes ginecoobst&eacute;tricos, anticoncepci&oacute;n, atenci&oacute;n materno-infantil, exposici&oacute;n al riesgo de concebir, infecundidad y menopausia, sexualidad y violencia dom&eacute;stica, as&iacute; como infecciones de transmisi&oacute;n sexual.<sup>16</sup></font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">A partir de la    ENSAR, P&eacute;rez-N&uacute;&ntilde;ez y colaboradores<a href="#back1"><sup>1</sup></a>    intentaron identificar las variables sociodemogr&aacute;ficas y econ&oacute;micas    vinculadas con la cobertura de la planificaci&oacute;n familiar. Para ello se    construy&oacute; un indicador compuesto de cobertura en el nivel individual    a partir de 13 indicadores de naturaleza dicot&oacute;mica (0= no cubierto,    1= cubierto).<a name="top2"></a><a href="#back2"><sup>2</sup></a> Sin embargo,    y en virtud de que no todos los indicadores se aplican a todas las mujeres,    se construy&oacute; un indicador que resumiera el nivel de cobertura individual    de cada mujer, que deb&iacute;a considerar s&oacute;lo los indicadores en los    que &eacute;sta formaba parte del denominador. La expresi&oacute;n siguiente    resume la construcci&oacute;n del indicador compuesto:</font></p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098x15.gif"></p>      ]]></body>
<body><![CDATA[<p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">donde:</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">CI= Cobertura individual</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">i= Intervenciones que recibi&oacute; o en las que est&aacute; cubierta</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">j= Intervenciones que necesita o en las que debi&oacute; estar cubierta</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Como se puede advertir, el indicador compuesto est&aacute; acotado al intervalo continuo (0,1) y entra al modelo como la variable de respuesta. Las variables empleadas para modelar la proporci&oacute;n de cobertura en planificaci&oacute;n familiar son edad, religi&oacute;n, &iacute;ndice de riqueza, escolaridad, estatus ind&iacute;gena, estado civil, aseguramiento m&eacute;dico, lugar de residencia antes de los 12 a&ntilde;os, disponibilidad de la cartilla de salud de la mujer, edad de inicio de vida sexual activa, edad de inicio laboral, n&uacute;mero de hijos, paridad satisfecha, riesgo reproductivo, lugar de residencia actual (rural o urbano), edad en el primer embarazo y ocupaci&oacute;n. En dicho estudio se utiliz&oacute; a la totalidad de las mujeres con entrevista completa para integrar un modelo de regresi&oacute;n gama. Sin embargo, en el an&aacute;lisis que se presenta en este art&iacute;culo se gener&oacute; una muestra aleatoria simple de 2 000 observaciones para la construcci&oacute;n y comparaci&oacute;n de los cuatro modelos ya descritos.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Para evaluar modelos    estad&iacute;sticos, el criterio usado y aceptado de modo m&aacute;s amplio    para la selecci&oacute;n de modelos es el Criterio de Informaci&oacute;n de    Akaike (AIC).<sup>5,17</sup> No obstante, existen diversas variaciones de este    criterio que dependen del modelo de regresi&oacute;n evaluado y el tama&ntilde;o    de muestra. En este trabajo se emple&oacute; la variante de McQuarrie y Tsai<sup>18</sup>    que toma en cuenta la funci&oacute;n de verosimilitud y el tama&ntilde;o de    muestra, as&iacute; como el n&uacute;mero de par&aacute;metros en el modelo;    esta formulaci&oacute;n, seg&uacute;n se&ntilde;alan estos especialistas, es    &uacute;til para incorporar modelos de regresi&oacute;n de quasi-verosimilitud    o no normales. El criterio se define de la forma siguiente:</font></p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098x16.gif"></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">donde ln<img src="/img/revistas/spm/v48n5/32098s1.gif" align="absmiddle">    es el logaritmo natural del error cuadr&aacute;tico medio del modelo de regresi&oacute;n,    <i>n</i> es el n&uacute;mero de observaciones y <i>k</i> el n&uacute;mero de    par&aacute;metros. Al igual que otras formulaciones de esta expresi&oacute;n,    el criterio de selecci&oacute;n es del estilo "peque&ntilde;o, mejor", ya que    para un menor valor de AIC, un mejor ajuste del modelo, esto es, ante un n&uacute;mero    fijo de observaciones y par&aacute;metros, se elige el modelo con el menor error    cuadr&aacute;tico medio.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Por &uacute;ltimo, es necesario aclarar que se utilizaron como variables independientes o de control, o ambas, aquellas que se hab&iacute;an incorporado anteriormente en el modelo original propuesto (P&eacute;rez-N&uacute;&ntilde;ez), aunque en este caso varias de ellas no tienen un valor <i>p</i> significativo, con el objetivo de efectuar un an&aacute;lisis comparativo con los resultados que se obtuvieron en dicho trabajo. Adem&aacute;s, para otorgarle sentido a la comparaci&oacute;n entre los estimadores de los coeficientes para cada uno de los cuatro modelos se decidi&oacute; reportar el valor de la derivada parcial de la funci&oacute;n de la esperanza condicional, en relaci&oacute;n con cada una de las covariables, evaluado en su media muestral (Kieschnick y McCullough<sup>5</sup>). </font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En una segunda    etapa de an&aacute;lisis se realiz&oacute; un ejercicio de simulaci&oacute;n    para modelar una variable de respuesta con distribuci&oacute;n beta a partir    de una variable independiente que sigue una distribuci&oacute;n normal,    con un tama&ntilde;o de muestra variable entre 100 y 18 000 observaciones. Para    simular los datos se utiliz&oacute; un enfoque de Monte Carlo/Cadenas de Markov,<sup>19</sup>    tal y como opera en WINBUGS. Se gener&oacute;, como variable dependiente, una    variable con distribuci&oacute;n beta (par&aacute;metros: <i>p</i>= 0.5, <i>q</i>=    0.5), y como variable independiente una variable con distribuci&oacute;n normal    (par&aacute;metros: &micro;= 2, <font face="Symbol">s</font><sup>2</sup>= 6).    Los an&aacute;lisis estad&iacute;sticos y de simulaci&oacute;n se llevaron a    cabo con la ayuda de los programas R,<a name="top3"></a><a href="#back3"><sup>3</sup></a>    SAS<a name="top4"></a><a href="#back4"><sup>4</sup></a> y WINBUGS.<a name="top5"></a><a href="#back5"><sup>5</sup></a></font></p>      ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>Resultados</b></font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Comparaci&oacute;n    de modelos</b></font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los resultados    para cada uno de los cuatro enfoques descritos con anterioridad se muestran    en el <a href="/img/revistas/spm/v48n5/32098c1.gif">cuadro I</a>. Como puede observarse, con    excepci&oacute;n de la variable <i>riesgo reproductivo</i>, en el cual ninguno    de los modelos (gama, quasi-verosimilitud, normal) coincide con el modelo beta,    cuyo valor <i>p</i> reportado no encuentra una diferencia significativa, para    todas las dem&aacute;s variables al menos coinciden dos de los modelos con los    resultados de la regresi&oacute;n beta en cuanto a los valores <i>p</i> reportados.    Sin embargo, si se realiza un an&aacute;lisis de los estimadores puntuales,    se encuentran marcadas diferencias entre los cuatro modelos. Al tomar como referencia    el modelo beta, el modelo normal subestima los valores de los coeficientes para    todas las variables, el modelo de quasi-verosimilitud los sobrestima, mientras    que el modelo gama tiende a subestimar algunos y sobrestimar a otros.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Si se examina el    supuesto de normalidad para los residuos, el modelo normal, &uacute;nico de    los modelos que lo impone, tampoco lo cumple (prueba de Anderson-Darling, <i>p</i>    &lt;0.005). Asimismo, el <a href="/img/revistas/spm/v48n5/32098c1.gif">cuadro I</a> muestra que    los valores predichos por el modelo normal est&aacute;n fuera del rango observado    para la variable de respuesta (0,1), que es otro inconveniente de utilizar este    modelo para ajustar proporciones, como ya se hab&iacute;a adelantado, ya sea    que &eacute;stas sean continuas o que se generen porque la variable de respuesta    es dicot&oacute;mica.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La <a href="/img/revistas/spm/v48n5/32098f1.gif">figura    1</a> muestra los gr&aacute;ficos de normalidad para los residuos generados    por los cuatro modelos. Como se puede observar, los modelos beta, gama y de    quasi-verosimilitud muestran un buen grado de ajuste y, tal y como se mencion&oacute;,    tienden a ser asim&eacute;tricos. En cambio, a partir del modelo normal, aunque    es muy parecido a los otros modelos, no puede concluirse que sus residuos sigan    una distribuci&oacute;n normal, lo cual confirma lo que hab&iacute;a detectado    la prueba de Anderson-Darling. Tambi&eacute;n se puede reconocer en el <a href="/img/revistas/spm/v48n5/32098c1.gif">cuadro    I</a> que los valores predichos por estos tres modelos (beta, gama y de quasi-verosimilitud)    se encuentran dentro del rango observado para la variable de respuesta (0,1).</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Por &uacute;ltimo,    a partir del valor del AIC se puede identificar que el modelo beta es el que    mejor se ajusta a los datos, seguido por el modelo gama (<a href="/img/revistas/spm/v48n5/32098c1.gif">cuadro    I</a>). El modelo normal y el de quasi-verosimilitud muestran el valor de AIC    m&aacute;s grande y, en consecuencia, son los que <i>peor</i> ajuste poseen;    sin embargo, y como se ver&aacute; a continuaci&oacute;n, en cuanto al enfoque    de quasi-verosimilitud, cuando se incrementa el tama&ntilde;o de muestra es    el que m&aacute;s se aproxima al modelo beta.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2"><b>Comparaci&oacute;n    de modelos seg&uacute;n el efecto del tama&ntilde;o de la muestra</b></font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En la <a href="#fig2">figura    2</a> se muestra el comparativo de los cuatro modelos descritos y su comportamiento    al incrementar el tama&ntilde;o de muestra. Al igual que en la secci&oacute;n    anterior, los coeficientes est&aacute;n expresados como efectos marginales.    Una vez m&aacute;s, si se toma el modelo beta como referencia (la l&iacute;nea    que permanece fija en 1), se puede advertir que los modelos gama y normal subestiman    de manera consistente a los coeficientes sin importar si el tama&ntilde;o de    la muestra crece; en cambio, el modelo de quasi-verosimilitud sobrestima a los    coeficientes, pero cuando el tama&ntilde;o de muestra se incrementa (<i>n <font face="Symbol">&reg;</font>    <font face="Symbol">&yen;</font></i>) los coeficientes de este modelo se aproximan    de manera notoria a los del modelo beta.</font></p>     <p><a name="fig2"></a></p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p align="center"><img src="/img/revistas/spm/v48n5/32098f2.gif"></p>     <p>&nbsp;</p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>Discusi&oacute;n</b></font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La presencia de una variable dependiente que est&aacute; expresada como una proporci&oacute;n en el intervalo continuo (0,1) es cada vez m&aacute;s com&uacute;n en estudios y aplicaciones de distintas disciplinas, tal y como lo han documentado Johnson y colaboradores.<sup>1</sup> Varios autores han destacado tambi&eacute;n la necesidad de generar modelos con una estructura de regresi&oacute;n que ayuden a explicar la <i>variabilidad</i> de este tipo de variables.<sup>6,7,12</sup> Pese a ello, no existe una pr&aacute;ctica aceptada y difundida para esta clase de modelos. Kieschnick y McCullough<sup>5</sup> efectuaron una revisi&oacute;n, no exhaustiva, de las distintas propuestas que se han generado para modelar una proporci&oacute;n continua.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En este art&iacute;culo se han comparado las cuatro formas m&aacute;s difundidas para construir un modelo de regresi&oacute;n cuando la variable de inter&eacute;s es una proporci&oacute;n continua. Se han tomado en cuenta los siguientes aspectos. Primero, que la variable de inter&eacute;s est&eacute; acotada en el intervalo continuo (0,1); segundo, que la funci&oacute;n de su esperanza condicional sea no lineal; tercero, que sea de naturaleza heterosced&aacute;stica; y cuarto, que la aplicaci&oacute;n de cualquier modelo estad&iacute;stico suponga la existencia de ciertas condiciones (<i>supuestos</i>) bajo las cuales los resultados son v&aacute;lidos, entre ellos el supuesto distribucional.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">La semejanza entre los resultados obtenidos a partir de los diferentes modelos de regresi&oacute;n bajo estudio, reflejan, como lo ha notado Cox,<sup>6</sup> que los estimadores de la varianza, vinculados con los coeficientes de un modelo de regresi&oacute;n cuando la variable de respuesta es una proporci&oacute;n continua, son <i>consistentes</i>, sobre todo si se utiliza el m&eacute;todo de estimaci&oacute;n de m&aacute;xima verosimilitud. Con todo, no debe dejar de destacarse que las conclusiones e inferencias dependen del modelo que se elija para el an&aacute;lisis.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">En este sentido, las diferencias encontradas en los estimadores puntuales pueden tener su origen en dos causas principales. Primera, el tama&ntilde;o de la muestra, ya que si se incrementa el n&uacute;mero de observaciones los estimadores tienden a ser <i>consistentes</i>. Segunda, los supuestos que cada modelo impone. Con referencia al modelo normal, si bien es cierto que los valores <i>p</i> entre los modelos beta y normal son congruentes, en general, respecto de un nivel de significancia nominal, tambi&eacute;n lo es que el modelo normal tiende a mostrar valores m&aacute;s peque&ntilde;os, es decir, <i>m&aacute;s significativos</i>, ya que sus errores est&aacute;ndar son tambi&eacute;n m&aacute;s peque&ntilde;os. Esto concuerda con la cr&iacute;tica en cuanto al supuesto de homoscedasticidad del modelo normal, ya que al no cumplir con tal supuesto (prueba de Cook-Weisberg para heteroscedasticidad, <i>p</i>&lt; 0.001), el modelo tiende a subestimar los errores est&aacute;ndar.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Adem&aacute;s, la falta de cumplimiento del supuesto distribucional (normalidad de los residuos) lleva casi siempre a una subvaloraci&oacute;n de los estimadores puntuales.<sup>4</sup> Como ya se coment&oacute;, de los cuatro modelos expuestos, el &uacute;nico que impone el supuesto de homoscedasticidad es el modelo normal, en tanto que el supuesto de normalidad para los residuos puede extenderse a los cuatro modelos, si es que se trata de los residuos de devianza, pero sin perder nunca de vista que para modelos que no asumen una distribuci&oacute;n normal esto no es m&aacute;s que una aproximaci&oacute;n, ya que las m&aacute;s de las veces muestran cierto grado de asimetr&iacute;a.<sup>17</sup></font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Los resultados indican que el modelo beta es el que posee un mejor ajuste, de acuerdo con sus supuestos y el valor de AIC, y que de los otros tres modelos, el gama y el de quasi-verosimilitud podr&iacute;an ser una opci&oacute;n viable, siempre y cuando el tama&ntilde;o de muestra sea suficientemente <i>grande</i>. Del modelo normal los datos muestran que debe evitarse su aplicaci&oacute;n y que, en el peor de los escenarios, debe utilizarse sobre una variable transformada, sea logit o logar&iacute;tmica. Al final, se recomienda utilizar el enfoque param&eacute;trico de la regresi&oacute;n beta de Ferrari y Cribari-Nieto<sup>7</sup> y, si se tiene un tama&ntilde;o de muestra grande, el de quasi-verosimilitud de Papke y Wooldridge.<sup>12</sup> Los hallazgos encontrados en el enfoque de quasi-verosimilitud concuerdan con los datos de Kieschnick y McCullough<sup>6</sup> y confirman su naturaleza asint&oacute;tica.</font></p>      ]]></body>
<body><![CDATA[<p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Dos factores deben incorporarse a las conclusiones, ya que no se han descrito en los p&aacute;rrafos anteriores. En primer lugar, es necesario llevar a cabo una comparaci&oacute;n m&aacute;s amplia con modelos m&aacute;s <i>complejos,</i> por ejemplo el que desarroll&oacute; Jorgensen<sup>20</sup> para la distribuci&oacute;n <i>simplex</i> o el modelo de McDonald y Xu<sup>21</sup> sobre la distribuci&oacute;n beta generalizada. M&aacute;s a&uacute;n, es preciso comparar estos resultados con aquellos que se generen a partir de un enfoque bayesiano. En segundo lugar, tambi&eacute;n podr&iacute;a ser &uacute;til contrastar los resultados de un modelo de regresi&oacute;n beta para variables expresadas como una tasa y analizadas mediante un enfoque de regresi&oacute;n <i>poisson</i> o un enfoque de regresi&oacute;n binomial (que incluya un t&eacute;rmino <i>offset</i>). Es concebible esperar resultados similares, siempre y cuando se cumplan los supuestos de los modelos <i>poisson</i> o binomial.</font></p>      <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Por &uacute;ltimo, debe notarse que estos modelos han tenido poca difusi&oacute;n y aplicaci&oacute;n en el &aacute;mbito de la salud p&uacute;blica, debido a la falta de una cultura estad&iacute;stica en el &aacute;rea que centra casi toda su atenci&oacute;n en los modelos de regresi&oacute;n lineal y al uso limitado del <i>software</i> estad&iacute;stico disponible para ajustar esta clase de modelos. En este sentido, todos los modelos presentados aqu&iacute; pueden procesarse en cualquier <i>software</i> que cuente con un m&oacute;dulo para los modelos lineales generalizados, con excepci&oacute;n del modelo de regresi&oacute;n beta que requiere el uso de los programas R o SAS.</font></p>      <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="3"><b>Referencias</b></font></p>      <!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">1. Johnson NL, Kotz S, Balakrishnan N. Continuous univariate distributions, vol. 2. New York: Wiley, 1995.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221647&pid=S0036-3634200600050000600001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">2. Hviid M, Villadsen B. Beta distributed market shares in a spatial model with an application to the market for audit services. Review of Industrial Organization 1995;10:737-747.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221648&pid=S0036-3634200600050000600002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">3. Bury K. Statistical distributions in engineering. New York: Cambridge University Press, 1999.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221649&pid=S0036-3634200600050000600003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">4. Godfrey L. Misspecification tests in econometrics: the Lagrange multiplier principle and other approaches. New York: Cambridge University Press, 1988.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221650&pid=S0036-3634200600050000600004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">5. Kieschnick R, McCullough BD. Regression analysis of variates observed on (0, 1): percentages, proportions and fractions. Stat Model 2003;3(3):193-213.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221651&pid=S0036-3634200600050000600005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">6. Cox C. Nonlinear quasi-likelihood models: applications to continuous proportions. Comput StatDat Anal 1996;21:449-461.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221652&pid=S0036-3634200600050000600006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">7. Ferrari S, Cribari-Nieto F. Beta regression for modelling rates and proportions. J Appl Stat 2004;31(7):799-815.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221653&pid=S0036-3634200600050000600007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">8. Atkinson A. Plots, transformations and regression: an introduction to graphical methods of diagnostic regression analysis. New York: Oxford University Press, 1985.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221654&pid=S0036-3634200600050000600008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">9. Aitchison J. The statistical analysis of compositional data. New York: Chapman &amp; Hall, 1986.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221655&pid=S0036-3634200600050000600009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">10. Hardin J, Hilbe J. Generalized linear models and extensions. Texas: Stata Press, 2001</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221656&pid=S0036-3634200600050000600010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">11. McCullagh P, Nelder JA. Generalized linear models. New York: Chapman &amp; Hall, 1989.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221657&pid=S0036-3634200600050000600011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">12. Papke LE, Wooldridge JM. Econometric methods for fractional response variables with an application to 401(k) plan participation rates. J Appl Econom 1996;11(6):619-632.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221658&pid=S0036-3634200600050000600012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">13. McCulloch CH, Searle SR. Generalized, linear, and mixed models. New York: Wiley, 2001.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221659&pid=S0036-3634200600050000600013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">14. Barclay MJ, Smith CW. The determinants of corporate leverage and dividend policies. Journal of Applied Corporate Finance 1995;7:4-19.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221660&pid=S0036-3634200600050000600014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">15. Congdon P. Bayesian statistical modelling. Chichester, UK: John Wiley &amp; Sons, 2001.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221661&pid=S0036-3634200600050000600015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">16. Programa Nacional de Poblaci&oacute;n 2001-2006. Informe de ejecuci&oacute;n 2003-2004 del Programa Nacional de Poblaci&oacute;n 2001-2006:321-365.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221662&pid=S0036-3634200600050000600016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">17. Lindsey JK. Applying generalized linear models. New York: Springer-Verlag, 1997.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221663&pid=S0036-3634200600050000600017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">18. McQuarrie A, Tsai C. Regression and time series model selection. New Jersey: World Scientific Publishing Company, 1998.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221664&pid=S0036-3634200600050000600018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">19. Gilks WR, Richardson S, Spiegelhalter DJ eds. Markov chain Monte Carlo in practice. London, UK: Chapman and Hall, 1996.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221665&pid=S0036-3634200600050000600019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">20. Jorgensen B. The theory of dispersion models. New York: Chapman &amp; Hall, 1997.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221666&pid=S0036-3634200600050000600020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">21. McDonald JB, Xu YJ. A generalization of the beta distribution with applications. J Econom 1995;66:133-52.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=9221667&pid=S0036-3634200600050000600021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><p>&nbsp;</p>     <p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Fecha de rebido:    5 de enero de 2006    <br>   Fecha de aprobado: 7 de junio de 2006</font></p>     <p>&nbsp;</p>     ]]></body>
<body><![CDATA[<p>&nbsp;</p>     <p><font face="Verdana, Arial, Helvetica, sans-serif" size="2">Solicitud de sobretiros:    Ricardo P&eacute;rez-N&uacute;&ntilde;ez. Centro de Investigaci&oacute;n en    Sistemas de Salud, INSP. Av. Universidad 655, Col.    Sta. Mar&iacute;a Ahuacatitl&aacute;n. 62508 Cuernavaca, Morelos, M&eacute;xico.    Correo electr&oacute;nico:    <a href="mailto:rperez@correo.insp.mx">rperez@correo.insp.mx</a> o <a href="mailto:riquiperez@lycos.com">riquiperez@lycos.com</a>    <br>   <a name="back1"></a>1 P&eacute;rez-N&uacute;&ntilde;ez R, Salinas-Rodr&iacute;guez    A, Avila-Burgos L, Mojarro&Iacute;&ntilde;iguez MG, Medina-Sol&iacute;s CE,    Schiavon R et al. Cobertura y financiamiento de la Planificaci&oacute;n Familiar    en M&eacute;xico: hallazgos de la Encuesta Nacional de Salud Reproductiva 2003.    Documento no publicado.     <br>   <a name="back2"></a><a href="#top2">2</a> Para mayor detalle sobre los indicadores    utilizados para evaluar la cobertura en el nivel individual se sugiere consultar:    P&eacute;rez-N&uacute;&ntilde;ez R, Salinas-Rodr&iacute;guez A, Avila-Burgos    L et al. Cobertura y financiamiento de la planificaci&oacute;n familiar en M&eacute;xico:    hallazgos de la Encuesta Nacional de Salud Reproductiva 2003. Art&iacute;culo    enviado a la revista de la Organizaci&oacute;n Panamericana de la Salud en octubre    de 2005.    <br>   <a name="back3"></a><a href="#top3">3</a> R Development Core Team. R: a language    and environment for statistical computing. R Foundation for Statistical Computing,    Vienna, Austria: 2005. Disponible en: <a href="http://www.R-project.org" target="_blank">http://www.R-project.org</a>.    <br>   <a name="back4"></a><a href="#top4">4</a> SAS. STAT Software, Version 9.1.3.    Cary, NC: SAS Institute Inc, 2004.    <br>   <a name="back5"></a><a href="#top5">5</a> Spiegelhalter D, Thomas A, Best N,    et al. WinBUGS User Manual Version 1.4. Cambridge, UK: MRC Biostatistics Unit,    2003. </font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Johnson]]></surname>
<given-names><![CDATA[NL]]></given-names>
</name>
<name>
<surname><![CDATA[Kotz]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Balakrishnan]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
</person-group>
<source><![CDATA[Continuous univariate distributions]]></source>
<year>1995</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Wiley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hviid]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Villadsen]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Beta distributed market shares in a spatial model with an application to the market for audit services]]></article-title>
<source><![CDATA[Review of Industrial Organization]]></source>
<year>1995</year>
<volume>10</volume>
<page-range>737-747</page-range></nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bury]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
</person-group>
<source><![CDATA[Statistical distributions in engineering]]></source>
<year>1999</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Cambridge University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Godfrey]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<source><![CDATA[Misspecification tests in econometrics: the Lagrange multiplier principle and other approaches]]></source>
<year>1988</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Cambridge University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kieschnick]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[McCullough]]></surname>
<given-names><![CDATA[BD]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Regression analysis of variates observed on (0, 1): percentages, proportions and fractions]]></article-title>
<source><![CDATA[Stat Model]]></source>
<year>2003</year>
<volume>3</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>193-213</page-range></nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cox]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Nonlinear quasi-likelihood models: applications to continuous proportions]]></article-title>
<source><![CDATA[Comput StatDat Anal]]></source>
<year>1996</year>
<volume>21</volume>
<page-range>449-461</page-range></nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ferrari]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Cribari-Nieto]]></surname>
<given-names><![CDATA[F]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Beta regression for modelling rates and proportions]]></article-title>
<source><![CDATA[J Appl Stat]]></source>
<year>2004</year>
<volume>31</volume>
<numero>7</numero>
<issue>7</issue>
<page-range>799-815</page-range></nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Atkinson]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Plots, transformations and regression: an introduction to graphical methods of diagnostic regression analysis]]></source>
<year>1985</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Oxford University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Aitchison]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[The statistical analysis of compositional data]]></source>
<year>1986</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Chapman & Hall]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hardin]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Hilbe]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Generalized linear models and extensions]]></source>
<year>2001</year>
<publisher-loc><![CDATA[Texas ]]></publisher-loc>
<publisher-name><![CDATA[Stata Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McCullagh]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[Nelder]]></surname>
<given-names><![CDATA[JA]]></given-names>
</name>
</person-group>
<source><![CDATA[Generalized linear models]]></source>
<year>1989</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Chapman & Hall]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Papke]]></surname>
<given-names><![CDATA[LE]]></given-names>
</name>
<name>
<surname><![CDATA[Wooldridge]]></surname>
<given-names><![CDATA[JM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Econometric methods for fractional response variables with an application to 401(k) plan participation rates]]></article-title>
<source><![CDATA[J Appl Econom]]></source>
<year>1996</year>
<volume>11(6)</volume>
<page-range>619-632</page-range></nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McCulloch]]></surname>
<given-names><![CDATA[CH]]></given-names>
</name>
<name>
<surname><![CDATA[Searle]]></surname>
<given-names><![CDATA[SR]]></given-names>
</name>
</person-group>
<source><![CDATA[Generalized, linear, and mixed models]]></source>
<year>2001</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Wiley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Barclay]]></surname>
<given-names><![CDATA[MJ]]></given-names>
</name>
<name>
<surname><![CDATA[Smith]]></surname>
<given-names><![CDATA[CW]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The determinants of corporate leverage and dividend policies]]></article-title>
<source><![CDATA[Journal of Applied Corporate Finance]]></source>
<year>1995</year>
<volume>7</volume>
<page-range>4-19</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Congdon]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[Bayesian statistical modelling]]></source>
<year>2001</year>
<publisher-loc><![CDATA[Chichester ]]></publisher-loc>
<publisher-name><![CDATA[John Wiley & Sons]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="">
<collab>Programa Nacional de Población 2001-2006</collab>
<source><![CDATA[Informe de ejecución 2003-2004 del Programa Nacional de Población 2001-2006: 321-365]]></source>
<year></year>
</nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lindsey]]></surname>
<given-names><![CDATA[JK]]></given-names>
</name>
</person-group>
<source><![CDATA[Applying generalized linear models]]></source>
<year>1997</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Springer-Verlag]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McQuarrie]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Tsai]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<source><![CDATA[Regression and time series model selection]]></source>
<year>1998</year>
<publisher-loc><![CDATA[New Jersey ]]></publisher-loc>
<publisher-name><![CDATA[World Scientific Publishing Company]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gilks]]></surname>
<given-names><![CDATA[WR]]></given-names>
</name>
<name>
<surname><![CDATA[Richardson]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Spiegelhalter]]></surname>
<given-names><![CDATA[DJ]]></given-names>
</name>
</person-group>
<source><![CDATA[Markov chain Monte Carlo in practice]]></source>
<year>1996</year>
<publisher-loc><![CDATA[London ]]></publisher-loc>
<publisher-name><![CDATA[Chapman and Hall]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B20">
<label>20</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jorgensen]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<source><![CDATA[The theory of dispersion models]]></source>
<year>1997</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Chapman & Hall]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B21">
<label>21</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McDonald]]></surname>
<given-names><![CDATA[JB]]></given-names>
</name>
<name>
<surname><![CDATA[Xu]]></surname>
<given-names><![CDATA[YJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A generalization of the beta distribution with applications]]></article-title>
<source><![CDATA[J Econom]]></source>
<year>1995</year>
<volume>66</volume>
<page-range>133-52</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
