<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2007-5057</journal-id>
<journal-title><![CDATA[Investigación en educación médica]]></journal-title>
<abbrev-journal-title><![CDATA[Investigación educ. médica]]></abbrev-journal-title>
<issn>2007-5057</issn>
<publisher>
<publisher-name><![CDATA[Universidad Nacional Autónoma de México, Facultad de Medicina]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2007-50572012000400010</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[La prueba de la hipótesis nula y sus alternativas: revisión de algunas críticas y su relevancia para las ciencias médicas]]></article-title>
<article-title xml:lang="en"><![CDATA[Null hypothesis significance testing and its alternatives: A revision of some criticisms and their relevance for the medical sciences]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Leenen]]></surname>
<given-names><![CDATA[Iwin]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Nacional Autónoma de México Facultad de Medicina Departamento de Evaluación Educativa]]></institution>
<addr-line><![CDATA[México Distrito Federal]]></addr-line>
<country>México</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>12</month>
<year>2012</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>12</month>
<year>2012</year>
</pub-date>
<volume>1</volume>
<numero>4</numero>
<fpage>225</fpage>
<lpage>234</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_arttext&amp;pid=S2007-50572012000400010&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&amp;pid=S2007-50572012000400010&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_pdf&amp;pid=S2007-50572012000400010&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[La prueba de significancia de la hipótesis nula constituye la herramienta más generalizada para evaluar hipótesis científicas y tomar decisiones al respecto, no sólo en las ciencias médicas y de la salud, sino también en la biología, la psicología, las ciencias políticas y otras ciencias sociales. Sin embargo, desde su introducción por Sir Ronald Fisher en 1925, la técnica ha sido objeto de un debate acalorado entre, por un lado, críticos que identifican varios problemas conceptuales y de interpretación y, por otro lado, defensores que se aferran a la idea de que (el uso correcto de) la técnica tiene un lugar insustituible en el arsenal de la estadística aplicada. Este ensayo revisa algunas de las críticas de este debate, ilustra su relevancia en el ámbito de la investigación en medicina y discute algunas recomendaciones como remedio o alternativa para la prueba de significancia.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Arguably, null hypothesis significance testing constitutes the most widely-applied tool for the evaluation of scientific hypotheses and decision making, not only in medical and health sciences but also in biology, psychology, political sciences, and other social sciences. However, since its introduction by Sir Ronald Fisher in 1925, the method has been the center of a heated debate where various criticisms related to conceptual and interpretational problems have been counterattacked by advocates of the technique who argue that the method, if used correctly, does have its place in the statistician's toolbox. In this article, I revise some of the most pertinent criticisms of this debate, illustrate their relevance for research in the field of medical and health sciences and discuss some recommendations that have been proposed as a remedy or an alternative for significance testing.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Prueba de significancia]]></kwd>
<kwd lng="es"><![CDATA[hipótesis nula]]></kwd>
<kwd lng="es"><![CDATA[valor p]]></kwd>
<kwd lng="es"><![CDATA[inferencia estadística]]></kwd>
<kwd lng="es"><![CDATA[inferencia Bayesiana]]></kwd>
<kwd lng="en"><![CDATA[Significance test]]></kwd>
<kwd lng="en"><![CDATA[null hypothesis]]></kwd>
<kwd lng="en"><![CDATA[p-value]]></kwd>
<kwd lng="en"><![CDATA[inferential statistics]]></kwd>
<kwd lng="en"><![CDATA[Bayesian inference]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  	    <p align="justify"><font face="verdana" size="4">Metodolog&iacute;a de investigaci&oacute;n en educacion m&eacute;dica</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="4"><b>La prueba de la hip&oacute;tesis nula y sus alternativas: revisi&oacute;n de algunas cr&iacute;ticas y su relevancia para las ciencias m&eacute;dicas</b></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="3"><b>Null hypothesis significance testing and its alternatives: A revision of some criticisms and their relevance for the medical sciences</b></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="2"><b>Iwin Leenen</b></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><i>Departamento de Evaluaci&oacute;n Educativa, Facultad de Medicina, Universidad Nacional Aut&oacute;noma de M&eacute;xico. M&eacute;xico D.F., M&eacute;xico.</i></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Correspondencia:</b>    <br> 	Secretar&iacute;a de Educaci&oacute;n M&eacute;dica, Facultad de Medicina, Universidad Nacional Aut&oacute;noma de M&eacute;xico.    <br> 	Edif. B, 3er piso, Av. Universidad 3000, Circuito escolar CU,    <br> 	C.P. 04510. M&eacute;xico D.F., M&eacute;xico.    <br> 	Tel&eacute;fono: 5623 2300, ext. 43034.    <br> 	Correo electr&oacute;nico: <a href="mailto:iwin.leenen@gmail.com">iwin.leenen@gmail.com</a></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2">Recepci&oacute;n 7 de mayo 2012.    <br> 	Aceptaci&oacute;n 9 de junio 2012.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Resumen</b></font></p>  	    <p align="justify"><font face="verdana" size="2">La prueba de significancia de la hip&oacute;tesis nula constituye la herramienta m&aacute;s generalizada para evaluar hip&oacute;tesis cient&iacute;ficas y tomar decisiones al respecto, no s&oacute;lo en las ciencias m&eacute;dicas y de la salud, sino tambi&eacute;n en la biolog&iacute;a, la psicolog&iacute;a, las ciencias pol&iacute;ticas y otras ciencias sociales. Sin embargo, desde su introducci&oacute;n por Sir Ronald Fisher en 1925, la t&eacute;cnica ha sido objeto de un debate acalorado entre, por un lado, cr&iacute;ticos que identifican varios problemas conceptuales y de interpretaci&oacute;n y, por otro lado, defensores que se aferran a la idea de que (el uso correcto de) la t&eacute;cnica tiene un lugar insustituible en el arsenal de la estad&iacute;stica aplicada. Este ensayo revisa algunas de las cr&iacute;ticas de este debate, ilustra su relevancia en el &aacute;mbito de la investigaci&oacute;n en medicina y discute algunas recomendaciones como remedio o alternativa para la prueba de significancia.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Palabras clave</b><b>:</b> Prueba de significancia; hip&oacute;tesis nula; valor p; inferencia estad&iacute;stica; inferencia Bayesiana.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Abstract</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Arguably, null hypothesis significance testing constitutes the most widely&#45;applied tool for the evaluation of scientific hypotheses and decision making, not only in medical and health sciences but also in biology, psychology, political sciences, and other social sciences. However, since its introduction by Sir Ronald Fisher in 1925, the method has been the center of a heated debate where various criticisms related to conceptual and interpretational problems have been counterattacked by advocates of the technique who argue that the method, if used correctly, does have its place in the statistician's toolbox. In this article, I revise some of the most pertinent criticisms of this debate, illustrate their relevance for research in the field of medical and health sciences and discuss some recommendations that have been proposed as a remedy or an alternative for significance testing.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Keywords</b><b>:</b> Significance test; null hypothesis; p&#45;value; inferential statistics; Bayesian inference.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Echarle una ojeada a los estudios de investigaci&oacute;n publicados en <i>Investigaci&oacute;n en Educaci&oacute;n M&eacute;dica</i>, as&iacute; como en otras revistas en el &aacute;rea de medicina nacionales e internacionales, revela que una abrumadora mayor&iacute;a incluye pruebas de significancia estad&iacute;stica (rechazando o no una hip&oacute;tesis nula) en las secciones de resultados o discusi&oacute;n. Efectivamente, muchos investigadores &#45;no s&oacute;lo en las ciencias m&eacute;dicas, sino tambi&eacute;n en la biolog&iacute;a, la psicolog&iacute;a, las ciencias pol&iacute;ticas y dem&aacute;s ciencias sociales&#45; conceden un papel clave a la prueba de significancia de la hip&oacute;tesis nula (PSHN), para determinar la validez de sus resultados y decidir cu&aacute;les hallazgos merecen ser discutidos. Aunque las ideas b&aacute;sicas de la PSHN datan del siglo XIX,<sup>1</sup> el desarrollo de la teor&iacute;a se suele situar en los a&ntilde;os 20 y 30 del siglo pasado con las publicaciones de Sir Ronald Fisher,<sup>2,3</sup> y Jerzy Neyman e Egon Pearson.<sup>4&#45;6</sup> Existen diferencias filos&oacute;ficas y conceptuales entre los enfoques de Fisher y de Neyman y Pearson;<sup>7&#45;10</sup> los protagonistas, especialmente Fisher y Neyman, quedaron enredados en una discusi&oacute;n virulenta hasta el fallecimiento de Fisher en 1962. En efecto, la pr&aacute;ctica actual de la PSHN resulta un "h&iacute;brido an&oacute;nimo"<sup>9</sup> surgido de los dos corrientes, y es m&aacute;s una mezcla de los dos paradigmas que una teor&iacute;a coherente sobre la prueba de hip&oacute;tesis.</font></p>  	    <p align="justify"><font face="verdana" size="2">No s&oacute;lo el debate entre Fisher y Neyman ti&ntilde;&oacute; la historia de la PSHN, finalmente, estos dos fundadores defendieron diferentes &aacute;ngulos de interpretaci&oacute;n del mismo procedimiento (en l&iacute;neas generales coincidieron sobre los c&aacute;lculos de c&oacute;mo llegar al resultado). Existe otra controversia, probablemente de m&aacute;s relevancia, que inici&oacute; poco despu&eacute;s<sup>11</sup> de las publicaciones principales de Fisher y que contin&uacute;a hasta la fecha. Se trata de un debate vigoroso, con numerosos autores,<sup>11&#45;23</sup> que critican severamente la PSHN y otros<sup>24&#45;30</sup> que con igual tenacidad la defienden. Las cr&iacute;ticas se pueden dividir en dos grupos. La literatura de las disciplinas aplicadas (es decir, donde se usa la estad&iacute;stica como una herramienta, como en las ciencias m&eacute;dicas o la psicolog&iacute;a) ha encaminado la discusi&oacute;n sobre todo hacia las dificultades en la interpretaci&oacute;n, mientras que la literatura estad&iacute;stica se enfoca m&aacute;s en los problemas de la construcci&oacute;n formal de las pruebas de significancia.<sup>31</sup> Por lo general, los aliados de la PSHN no niegan que el procedimiento tiene limitaciones y pocos defender&iacute;an la idea de que proporcionar el valor <i>p</i> obtenido a trav&eacute;s de una PSHN, sea un resultado suficiente para un an&aacute;lisis estad&iacute;stico; en su defensa aluden a que muchas de las cr&iacute;ticas no se dirigen a la PSHN misma sino a las personas que la usan o interpretan de forma incorrecta y que, aunque el m&eacute;todo tiene defectos, la t&eacute;cnica generalmente lleva a conclusiones correctas. Es decir, los defensores abogan que el <i>uso correcto</i> de la t&eacute;cnica puede tener su valor en ciertos estudios y para contestar preguntas espec&iacute;ficas de investigaci&oacute;n. Para revisiones de la controversia con los argumentos de detractores y defensores de la PSHN, v&eacute;anse los art&iacute;culos de Nickerson<sup>32</sup> y de Balluerka y cols<i>.</i><sup>33</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">La estructura del resto del art&iacute;culo es la siguiente: la siguiente secci&oacute;n inicia con una revisi&oacute;n breve de las ideas fundamentales detr&aacute;s de la PSHN y la interpretaci&oacute;n exacta de un valor <i>p</i>, resaltando adem&aacute;s las diferencias entre el enfoque de Fisher y el de Neyman y Pearson. En la siguiente secci&oacute;n, se presenta una selecci&oacute;n de las cr&iacute;ticas sobre la PSHN y se ilustra su posible relevancia en el &aacute;mbito de la investigaci&oacute;n en medicina. A continuaci&oacute;n, se discuten algunas de las enmiendas y enfoques alternativos que se han propuesto para evitar los problemas asociados con la PSHN. Finalmente, la &uacute;ltima secci&oacute;n considera algunos elementos de discusi&oacute;n.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Breve revisi&oacute;n de la teor&iacute;a de la PSHN</b></font></p>  	    <p align="justify"><font face="verdana" size="2">El objetivo de una prueba de significancia es hacer inferencias sobre un par&aacute;metro &#45;es decir, una caracter&iacute;stica num&eacute;rica de una poblaci&oacute;n&#45; con base en los datos de una muestra extra&iacute;da de esta poblaci&oacute;n. Espec&iacute;ficamente, la PSHN es un instrumento para <i>excluir</i> un valor espec&iacute;fico (o un rango de valores espec&iacute;ficos) como valor(es) plausible(s) para el par&aacute;metro.</font></p>  	    <p align="justify"><font face="verdana" size="2">Para ilustrar los conceptos y argumentos en este art&iacute;culo, usar&eacute; el siguiente ejemplo. Un profesor investigador, que organiza cursos dirigidos a m&eacute;dicos para su desarrollo profesional continuo, desea evaluar la eficacia de dos estrategias para la ense&ntilde;anza: la educaci&oacute;n tradicional, donde el curso de actualizaci&oacute;n se imparte en una serie de clases presenciales, y la educaci&oacute;n a distancia, que ofrece los mismos contenidos a trav&eacute;s de una plataforma virtual y donde el contacto profesor&#45;alumno se realiza exclusivamente por v&iacute;a electr&oacute;nica. Para este fin, el investigador dise&ntilde;a un estudio en el marco de un curso de actualizaci&oacute;n sobre los descubrimientos recientes en el tratamiento de pacientes que viven con VIH o SIDA. Asigna aleatoriamente la mitad de los 50 m&eacute;dicos inscritos para el curso a la condici&oacute;n de educaci&oacute;n tradicional, mientras que la otra mitad recibir&aacute; el curso a distancia. Tanto al inicio (<i>pre</i>) como al final (<i>post</i>) del curso, aplica a cada m&eacute;dico cuatro pruebas para medir diferentes aspectos de su conocimiento sobre el tema del curso, y calcula una puntuaci&oacute;n global sumando los resultados en las cuatro pruebas. Finalmente, obtiene para cada participante la diferencia <i>pre&#45;post</i> entre dichas puntuaciones globales.</font></p>  	    <p align="justify"><font face="verdana" size="2">Una prueba de significancia incluye los siguientes pasos:</font></p>  	    <blockquote> 		    <p align="justify"><font face="verdana" size="2"><i>1. Construir un modelo estad&iacute;stico.</i> Se trata de un conjunto de supuestos sobre las variables de inter&eacute;s. En nuestro ejemplo se pueden considerar dos variables: (a) la diferencia (<i>X</i>) entre pre y post en m&eacute;dicos que reciben el curso tradicional, y (b) la diferencia (<i>Y</i>) correspondiente en m&eacute;dicos que participan en el curso impartido a distancia. El investigador supone que <i>X</i> y <i>Y</i> en sus respectivas poblaciones tienen una distribuci&oacute;n normal con media &#181;<i><sub>X</sub></i> y &#181;<i><sub>Y</sub></i>, respectivamente. Otros supuestos incluyen que la varianza (&#963;<sup>2</sup>) de dichas distribuciones es igual y que las observaciones de la muestra se han extra&iacute;do de forma independiente de sus respectivas poblaciones. Los par&aacute;metros del modelo son &#181;<i><sub>X</sub></i>, &#181;<i><sub>Y</sub></i> y &#963;<sup>2</sup>.</font></p>  		    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><i>2. Especificar la hip&oacute;tesis nula.</i> Aplicado a nuestro ejemplo, se trata de la hip&oacute;tesis de que no hay diferencia entre las medias de las dos poblaciones: H<sub>0</sub> : &#181;<i><sub>X</sub></i> &#151;&#181;<i><sub>Y</sub></i> = 0. Aunque usualmente se especifica la hip&oacute;tesis nula en estos t&eacute;rminos, en general se puede considerar la hip&oacute;tesis H<sub>0</sub> : &#181;<i><sub>X</sub></i> &#151;&#181;<i><sub>Y</sub></i> = <i>c</i>, donde <i>c</i> es cualquier n&uacute;mero real.</font></p>  		    <p align="justify"><font face="verdana" size="2"><i>3. Definir un estad&iacute;stico de contraste.</i> Un estad&iacute;stico se calcula a partir de los datos de la muestra. En nuestro ejemplo, el investigador considerar&aacute; como estad&iacute;stico de contraste:</font></p> 	</blockquote>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/iem/v1n4/a10ec1.jpg"></font></p>  	    <blockquote> 		    <p align="justify"><font face="verdana" size="2">donde <img src="/img/revistas/iem/v1n4/a10x.jpg" align="absmiddle">y &#562; son las medias muestrales en ambos grupos, S <sup>2</sup><i><sub>X</sub></i> y S <sup>2</sup><i><sub>Y</sub></i> las varianzas muestrales, y <i>n</i> el n&uacute;mero de observaciones en cada grupo (25 en este caso).</font></p>  		    <p align="justify"><font face="verdana" size="2"><i>4. Identificar la distribuci&oacute;n del estad&iacute;stico de contraste bajo los supuestos del modelo.</i> Por ejemplo, se ha comprobado que el estad&iacute;stico <i>t</i> en la Ecuaci&oacute;n (1) se distribuye seg&uacute;n la distribuci&oacute;n <i>t</i> de Student con 48 (en general: 2<i>n</i> &#151; 2) grados de libertad.<sup>34</sup></font></p>  		    <p align="justify"><font face="verdana" size="2"><i>5. Calcular, bajo el supuesto de la hip&oacute;tesis nula, el valor del estad&iacute;stico de contraste en la muestra observada.</i> Supongamos que el investigador observ&oacute; que la media en el grupo que asisti&oacute; a las clases presenciales era de <img src="/img/revistas/iem/v1n4/a10x.jpg" align="absmiddle">= 13 y en el grupo del curso a distancia &#562; = 9 y que las varianzas observadas son S <sup>2</sup><i><sub>X</sub></i> = 30 y S <sup>2</sup><i><sub>Y</sub></i>= 45. En este caso,</font></p> 	</blockquote>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/iem/v1n4/a10ec2.jpg"></font></p>  	    <blockquote> 		    <p align="justify"><font face="verdana" size="2"><i>6. Calcular la probabilidad de observar t<sub>obs</sub> o un valor m&aacute;s extremo en la distribuci&oacute;n de referencia.</i> Dicha probabilidad es el valor <i>p</i>. En este caso se consideran todos los valores mayores a 2.309 y menores a &#151;2.309 m&aacute;s extremos que el valor observado. En la distribuci&oacute;n <i>t</i> de Student con 48 grados de libertad, la probabilidad de observar un valor m&aacute;s extremo que <i>t</i><sub>obs</sub> es 0.03.</font></p>  		    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><i>7. Aceptar o rechazar la hip&oacute;tesis nula.</i> Si el valor <i>p</i> es menor que el criterio &#945; de significancia (especificado <i>a priori</i>), se rechaza la hip&oacute;tesis nula; en el caso contrario se acepta. Usualmente se elige &#945; = 0.05; en el ejemplo se rechazar&iacute;a la hip&oacute;tesis nula.</font></p> 	</blockquote>  	    <p align="justify"><font face="verdana" size="2">Para una interpretaci&oacute;n correcta del valor <i>p</i> es indispensable tener claro que la PSHN, se desarroll&oacute; dentro del marco <i>frecuentista</i> (o cl&aacute;sico) de la estad&iacute;stica. Dos ideas son fundamentales en esta perspectiva. Primero, los par&aacute;metros del modelo estad&iacute;stico se consideran constantes, es decir, tienen un valor determinado y fijo; segundo, conceptualmente ser&iacute;a posible repetir el experimento un n&uacute;mero infinito de veces (de ah&iacute;, "frecuentista"). En las diferentes repeticiones, los par&aacute;metros tienen el mismo valor pero las muestras (y, por lo tanto, los datos) fluct&uacute;an. La distribuci&oacute;n del estad&iacute;stico de contraste precisamente describe c&oacute;mo el valor de dicho estad&iacute;stico, variar&iacute;a entre las diferentes repeticiones del experimento.</font></p>  	    <p align="justify"><font face="verdana" size="2">Entonces, el valor <i>p</i> se interpreta como la proporci&oacute;n de veces, en el n&uacute;mero infinito de repeticiones conceptuales del experimento, que el estad&iacute;stico de contraste tiene un valor tan extremo o m&aacute;s extremo que el valor observado en la ejecuci&oacute;n del experimento actual. Al respecto es primordial entender que estas repeticiones se realizan (y que la distribuci&oacute;n del estad&iacute;stico de contraste se deriva) bajo los supuestos del modelo estad&iacute;stico y la hip&oacute;tesis nula. El valor <i>p</i> es la probabilidad de observar un resultado tan raro o m&aacute;s raro que en la muestra actual, <i>condicional a que el modelo estad&iacute;stico y la hip&oacute;tesis nula sean correctos</i>. Si el valor <i>p</i> es (muy) bajo (por ejemplo <i>p</i> &lt; 0.05), entonces hay dos posibilidades: hemos observado un resultado (muy) raro, o bien, los supuestos del modelo estad&iacute;stico o la hip&oacute;tesis nula no son correctos. En este caso, generalmente, se opta por rechazar la hip&oacute;tesis nula. En nuestro ejemplo, se excluye el valor de cero como plausible valor para la diferencia entre las dos poblaciones (m&eacute;dicos que toman el curso de forma asistencial y aquellos que lo toman en modo virtual), respecto del aprovechamiento del curso (es decir, el cambio pre&#45;post).</font></p>  	    <p align="justify"><font face="verdana" size="2">El procedimiento que se acaba de describir se acerca m&aacute;s al paradigma desarrollado por Fisher. La perspectiva de Neyman y Pearson sigue las mismas l&iacute;neas, pero es importante resaltar las siguientes dos diferencias:</font></p>  	    <blockquote> 		    <p align="justify"><font face="verdana" size="2">1. Neyman y Pearson se ci&ntilde;eron estrictamente al principio frecuentista. Seg&uacute;n ellos, no es posible concluir nada sobre un experimento en particular (siempre es posible que se haya observado un resultado "raro"); &uacute;nicamente se sabe que, a largo plazo, al realizar muchas PSHN, se equivoca s&oacute;lo en un porcentaje bajo de los casos (no mayor al nivel de significancia ?). Estos autores aconsejaron mencionar como resultado de la PSHN &uacute;nicamente <i>p</i> &lt; 0.05, sin interpretar m&aacute;s all&aacute; el tama&ntilde;o de <i>p</i> (es decir, tanto para <i>p</i> = 0.049 como para <i>p</i> = 0.0001, el informe estad&iacute;stico simplemente incluye <i>p</i> &lt; 0.05). Fisher, por otro lado, opin&oacute; que "ning&uacute;n investigador mantiene un nivel de significancia fijo con el cual rechaza las hip&oacute;tesis a&ntilde;o tras a&ntilde;o, y en todas las circunstancias; prefiere interpretar cada caso particular a la luz de la evidencia",<sup>35</sup> y defendi&oacute; la interpretaci&oacute;n del valor <i>p</i> como una cuantificaci&oacute;n de la evidencia, aportada por el experimento actual, en contra de (el modelo y) la hip&oacute;tesis nula (donde valores peque&ntilde;os para <i>p</i> aportan m&aacute;s evidencia en contra).</font></p>  		    <p align="justify"><font face="verdana" size="2">2. El paradigma de Neyman y Pearson considera, adem&aacute;s de la hip&oacute;tesis nula (H<sub>0</sub>), tambi&eacute;n una hip&oacute;tesis alternativa (H<sub>1</sub>). Esto convierte la PSHN en un algoritmo para la toma de decisiones (H<sub>0</sub> <i>vs</i> H<sub>1</sub>). En este sentido contrasta con el enfoque de Fisher, donde la PSHN se puede interpretar como un procedimiento para validar un modelo (incluida la hip&oacute;tesis nula). Puesto que la hip&oacute;tesis alternativa afecta tambi&eacute;n las particularidades de la prueba, los resultados de los enfoques de Fisher y Neyman&#45;Pearson pueden diferir. Para una excelente discusi&oacute;n sobre este punto, v&eacute;ase Christensen.<sup>10</sup></font></p> 	</blockquote>  	    <p align="justify"><font face="verdana" size="2">Cabe mencionar que la hip&oacute;tesis alternativa propici&oacute; que Neyman y Pearson introdujeran algunos nuevos conceptos que son parte de cualquier curso actual de estad&iacute;stica inferencial, incluyendo el <i>Error Tipo I</i> (rechazar una hip&oacute;tesis nula que es cierta), <i>Error Tipo II</i> (aceptar una hip&oacute;tesis nula que es falsa) y la <i>potencia</i> (la probabilidad de que se rechace la hip&oacute;tesis nula, cuando la hip&oacute;tesis alternativa es cierta). La recomendaci&oacute;n de presentar valores <i>p</i> exactos (en vez de simplemente <i>p</i> &lt; 0.05 seg&uacute;n Neyman y Pearson), la cual fue adoptada por la mayor&iacute;a de las revistas cient&iacute;ficas, junto con el &eacute;nfasis en la potencia y el tama&ntilde;o de la muestra al dise&ntilde;ar un estudio, es testimonio de que la PSHN &#45;como se practica hoy en d&iacute;a&#45; es verdaderamente un h&iacute;brido de las ideas de Fisher, por un lado, y de Neyman y Pearson, por otro.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Tres cr&iacute;ticas para la PSHN y su relevancia para la medicina</b></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b>La PSHN no proporciona la informaci&oacute;n que los investigadores realmente quieren</b></font></p>  	    <p align="justify"><font face="verdana" size="2">El investigador en nuestro ejemplo busca apoyo para la hip&oacute;tesis de que los participantes aprovechan mejor los cursos de actualizaci&oacute;n, si asisten de forma presencial en vez de si lo toman de forma virtual. Espec&iacute;ficamente quiere saber cu&aacute;nta evidencia aporta el experimento para su hip&oacute;tesis. Interpreta el resultado de la PSHN como que "es poco plausible, a la luz de los datos observados, que la hip&oacute;tesis nula sea cierta", y concluye que la diferencia entre ambas formas de ense&ntilde;anza no es nula.</font></p>  	    <p align="justify"><font face="verdana" size="2">Hay varios puntos que comentar sobre esta forma de llegar a conclusiones derivadas de una PSHN. En primera instancia, n&oacute;tese que el valor <i>p</i>, al excluir el valor de cero como valor plausible para el par&aacute;metro, no aporta informaci&oacute;n sobre los valores que s&iacute; son plausibles. Sin embargo, pocas veces interesa meramente falsear la hip&oacute;tesis de efecto nulo o diferencia nula (estudios sobre percepci&oacute;n extrasensorial sirven tradicionalmente como contraejemplo, pero incluso en esta &aacute;rea no todo el mundo est&aacute; convencido del m&eacute;rito de simplemente refutar la hip&oacute;tesis nula).<sup>36</sup> En el ejemplo, una diferencia promedio real de 0.1 entre las puntuaciones obtenidas por las dos estrategias de ense&ntilde;anza puede ser enteramente irrelevante; sin embargo, la PSHN no provee ninguna informaci&oacute;n sobre la plausibilidad de este valor 0.1. En otras palabras, significancia estad&iacute;stica no implica significancia pr&aacute;ctica o significancia cl&iacute;nica.<sup>16,32,37&#45;39</sup> Ni siquiera un "valor <i>p</i> <i>extremadamente</i> significativo" hace m&aacute;s que excluir el cero como valor plausible para el par&aacute;metro.</font></p>  	    <p align="justify"><font face="verdana" size="2">Adem&aacute;s, incluso esta interpretaci&oacute;n minimalista ha sido atacada por varios autores.<sup>12,16,40</sup> Interpretaciones del valor <i>p</i> en t&eacute;rminos de "evidencia en contra de la hip&oacute;tesis nula" (como lo enunci&oacute; Fisher mismo) o "la plausibilidad de que la hip&oacute;tesis nula sea falsa" pueden llegar f&aacute;cilmente a ser entendidas como la probabilidad de que la hip&oacute;tesis nula sea falsa en consideraci&oacute;n de la evidencia (E) actual, lo cual formalmente corresponde con <i>P</i>(H<sub>0</sub>|E). No obstante, interpretar el valor <i>p</i> como esta &uacute;ltima probabilidad es un error l&oacute;gico por dos razones. Primera, como se explic&oacute; en la secci&oacute;n anterior, el valor <i>p</i> se define dentro del marco frecuentista, donde los par&aacute;metros son constantes, es decir, no tienen una distribuci&oacute;n probabil&iacute;stica (ni siquiera desconocida) y, por consiguiente, no tiene sentido asignar probabilidades a valores distintos del par&aacute;metro. Segunda, tambi&eacute;n explicado en la secci&oacute;n anterior, el valor <i>p</i> se calcula <i>bajo el supuesto de que la hip&oacute;tesis nula es cierta</i>; por lo tanto, es imposible interpretarlo como la probabilidad de que la hip&oacute;tesis nula sea cierta.</font></p>  	    <p align="justify"><font face="verdana" size="2">La probabilidad a la que se refiere el valor <i>p</i> guarda m&aacute;s relaci&oacute;n con la probabilidad inversa, <i>P</i>(E|H<sub>0</sub>). Esto se conoce como la <i>verosimilitud</i>, es decir, la probabilidad de observar los datos que se han observado, condicionales a los supuestos en el modelo estad&iacute;stico y la hip&oacute;tesis nula. La probabilidad que realmente interesa &#45;por ejemplo, al investigador de nuestro ejemplo&#45; es la anteriormente mencionada <i>P</i>(H<sub>0</sub>|E). Aunque no est&aacute; definida dentro del marco frecuentista, en el marco Bayesiano s&iacute; se define y se conoce como la <i>probabilidad posterior</i> (es decir, despu&eacute;s de observar la evidencia). Las probabilidades <i>P</i>(E|H<sub>0</sub>) y <i>P</i>(H<sub>0</sub>|E) no son iguales, pero &iquest;cu&aacute;l es la relaci&oacute;n entre ambas?</font></p>  	    <p align="justify"><font face="verdana" size="2">Al respecto, es muy famosa la paradoja de Lindley,<sup>41</sup> quien mostr&oacute;, dentro de un marco Bayesiano, que existen datos que rechazan una hip&oacute;tesis nula con un bajo valor <i>p</i> y al mismo tiempo llevan a una probabilidad posterior alta. Por ejemplo, es perfectamente posible que, a partir de los mismos datos, se obtenga simult&aacute;neamente <i>P</i>(E|H<sub>0</sub>) = 0.05 y <i>P</i>(H<sub>0</sub>|E) = 0.95. Obviamente, este resultado pone en duda la validez de la interpretaci&oacute;n del valor <i>p</i> como "evidencia en contra de la hip&oacute;tesis nula". Los defensores de la PSHN se&ntilde;alan que la paradoja requiere muestras grandes para manifestarse, y se oponen a los supuestos adicionales que requiere el an&aacute;lisis Bayesiano. Nickerson<sup>32</sup> ha argumentado que bajo condiciones razonables, un bajo valor <i>p</i> generalmente conlleva una baja probabilidad posterior (es decir, poca evidencia) para la hip&oacute;tesis nula. Sin embargo, a pesar de esta correlaci&oacute;n entre el valor <i>p</i> y la probabilidad posterior, Berger y Sellke<sup>42</sup> han demostrado convincentemente que, incluso bajo los supuestos m&aacute;s favorables para el enfoque frecuentista, los valores <i>p</i> sistem&aacute;ticamente sobreestiman la evidencia en contra de la hip&oacute;tesis nula. Especialmente cuando 0.01 &lt; <i>p</i> &lt; 0.05, la conclusi&oacute;n basada en la probabilidad posterior generalmente apunta a evidencia pobre o meramente anecd&oacute;tica<sup>43</sup> (para un rean&aacute;lisis de valores <i>p</i> en estudios publicados y su apreciaci&oacute;n en t&eacute;rminos de la evidencia que aportan, v&eacute;ase Wetzels y cols.).<sup>44</sup> Recientemente, Held<sup>45</sup> propuso un m&eacute;todo gr&aacute;fico para relacionar el valor <i>p</i> con la probabilidad posterior.</font></p>  	    <p align="justify"><font face="verdana" size="2">En resumen, el valor <i>p</i> resultado de una PSHN, no aporta mucha informaci&oacute;n de inter&eacute;s para los investigadores. En primera instancia, aceptar la hip&oacute;tesis nula no permite ninguna conclusi&oacute;n sustancial. Adem&aacute;s, si el valor <i>p</i> es significativo, &uacute;nicamente se excluye un solo valor como valor plausible para el par&aacute;metro. Aunado a esto, el significado de "plausible" en la &uacute;ltima expresi&oacute;n tiene una relaci&oacute;n nebulosa con la probabilidad que s&iacute; le interesa a los investigadores: la probabilidad posterior de que la hip&oacute;tesis del estudio sea cierta a la luz de la evidencia recopilada.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>La PSHN transforma un continuo en una decisi&oacute;n dicot&oacute;mica con base en un criterio arbitrario</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Supongamos que la PSHN para el experimento en nuestro ejemplo hubiese resultado en <i>p</i> = 0.06. En este caso, el investigador probablemente hubiese puesto bastante m&aacute;s reserva en sus interpretaciones, posiblemente concluyendo que se requiere m&aacute;s investigaci&oacute;n para mostrar la eficacia superior de la ense&ntilde;anza en modo presencial. Algunos autores<sup>12,19,46,47</sup> han criticado la pr&aacute;ctica de distinguir tan radicalmente entre una "diferencia real" y una "vicisitud del azar", dependiendo de que el valor <i>p</i> sea justamente menor o justamente mayor que el l&iacute;mite establecido. M&aacute;s probablemente, dicha pr&aacute;ctica tiene su origen en la perspectiva de Neyman y Pearson, que promovieron la PSHN como una metodolog&iacute;a de toma de decisiones y que recomendaron rechazar o no la hip&oacute;tesis nula y actuar correspondientemente. Rozeboom<sup>12</sup> se opone a esta pr&aacute;ctica argumentando que el objetivo final de una investigaci&oacute;n cient&iacute;fica no es una decisi&oacute;n absoluta entre aceptar o rechazar una teor&iacute;a, sino que se requiere evaluar y cuantificar la credibilidad posexperimental de las hip&oacute;tesis derivadas de la misma. Algunos cr&iacute;ticos de la PSHN incluso opinan que la interpretaci&oacute;n absoluta del resultado de la PSHN ha tenido un efecto adverso en el progreso de la ciencia.<sup>48,49</sup></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Aunado a la cr&iacute;tica de dicotomizar el resultado continuo de una PSHN, hay inquietud sobre la arbitrariedad del criterio en el nivel de significancia &#945;.<sup>12,50&#45;52</sup> Usualmente, se fija &#945; = 0.05, aunque ni siquiera los arquitectos de la metodolog&iacute;a defendieron un &uacute;nico nivel de significancia para todos los casos (v&eacute;ase la cita de Fisher en la primera secci&oacute;n y Neyman<sup>53</sup> tambi&eacute;n manifest&oacute; que el nivel de significancia es elecci&oacute;n del investigador). Por ejemplo, al realizar un estudio piloto para explorar el posible beneficio de una nueva medicina para la cual existen sospechas de que genere efectos secundarios peligrosos, es l&oacute;gico exigir que los datos alcancen un nivel de significancia mucho m&aacute;s estricto (digamos, &#945; = 0.001), antes de llevar la investigaci&oacute;n a una siguiente fase. No hay problema con que se elija &#945; "de forma arbitraria", si esto quiere decir "en funci&oacute;n del estudio particular que se est&aacute; planeando".</font></p>  	    <p align="justify"><font face="verdana" size="2">Por otro lado, s&iacute; es problem&aacute;tico elegir &#945; en funci&oacute;n de los resultados, y particularmente del valor <i>p</i>, obtenidos.<sup>54,55</sup> A veces, se lee en un mismo reporte <i>p</i> &lt; 0.05 y <i>p</i> &lt; 0.01, lo cual sugiere que el autor adapt&oacute; el nivel de significancia al valor <i>p</i> hallado en el estudio (por ejemplo, porque encontr&oacute; <i>p</i> = 0.03 en el primer caso, y <i>p</i> = 0.006 en el segundo). Esto es una pr&aacute;ctica errada: o bien se incluye el valor <i>p</i> exacto en el reporte (lo cual permite al lector evaluar la evidencia con su propio nivel de significancia), o bien se fija el nivel de significancia &#945; <i>a priori</i> y se presenta <i>p</i> &lt; &#945; o <i>p</i> &gt; &#945;. Al respecto, es muy pertinente la aclaraci&oacute;n de Engman<sup>55</sup> cuando se&ntilde;ala que, despu&eacute;s de haber rechazado la hip&oacute;tesis nula con &#945; = 0.05, ya es irrelevante el valor <i>p</i> concreto (por ejemplo, si <i>p</i> = 0.04 o <i>p</i> = 0.0002). Aunque esta conclusi&oacute;n se adhiere a la norma ortodoxa de Neyman y Pearson, hay que reconocer que es efectivamente incoherente seguir interpretando el valor <i>p</i>, el cual se define bajo el supuesto de que la hip&oacute;tesis nula es cierta, despu&eacute;s de haber rechazado la misma.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>El resultado de una PSHN depende de decisiones e intenciones, posiblemente no expl&iacute;citas o desconocidas, en el plan de estudio</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Volvamos a suponer que el experimento de nuestro investigador hubiese resultado en un valor <i>p</i> = 0.06. &iquest;C&oacute;mo proceder&iacute;a puesto que el resultado no alcanz&oacute; el nivel de significancia tradicional de &#945; = 0.05? Una de las opciones que muchos investigadores tendr&iacute;an en cuenta es la de ampliar la muestra, en consideraci&oacute;n de que ampliar la muestra generalmente aumenta la probabilidad de rechazar una hip&oacute;tesis nula falsa.</font></p>  	    <p align="justify"><font face="verdana" size="2">Sin embargo, varios autores<sup>31,56,57</sup> han se&ntilde;alado que esta decisi&oacute;n implicar&iacute;a un cambio en c&oacute;mo se debe calcular el valor <i>p</i> de la PSHN. La raz&oacute;n es que se cambia el modelo estad&iacute;stico en el que se fundamenta la PSHN y, por lo tanto, el conjunto infinito de repeticiones conceptuales del experimento con que se compara (a trav&eacute;s del estad&iacute;stico de contraste) el experimento actual. Para ilustrar este punto, supongamos que el investigador opta por la siguiente estrategia: si la PSHN inicial, basada en la muestra de 50 personas, resulta en <i>p</i> &le; 0.05 o bien <i>p</i> &gt; 0.20, el experimento se detiene; si, por otro lado, encuentra 0.05 &lt; <i>p</i> &le; 0.20, entonces extiende la muestra con 24 personas m&aacute;s (de las cuales 12 reciben el curso de modo presencial y las otras 12 a distancia), y se recalcula el valor <i>p</i>, basado en los 74 participantes. Por consiguiente, el conjunto de repeticiones del experimento incluye cuatro tipos de resultados: (i) <i>p</i> &le; 0.05 con <i>n</i> = 50, (ii) <i>p</i> &le; 0.05 con <i>n</i> = 74, (iii) <i>p</i> &gt; 0.05 con <i>n</i> = 74 y (iv) <i>p</i> &gt; 0.20 con <i>n</i> = 50. Bajo el supuesto de que la hip&oacute;tesis nula es cierta, se puede calcular que las probabilidades correspondientes de rechazar la hip&oacute;tesis nula son 0.05, 0.02, 0.13 y 0.80, respectivamente. Es decir, la probabilidad de rechazar la hip&oacute;tesis nula, siendo cierta, es 0.05 + 0.02 = 0.07. Aunque este valor parece no diferir mucho del valor nominal de &#945; = 0.05, el ejemplo ense&ntilde;a que el cambio de estrategia requiere un ajuste del valor <i>p</i> para cada una de las dos pruebas (la primera basada en 50 personas y la segunda con 74 personas), para que el nivel de significancia global corresponda con &#945; = 0.05 (adem&aacute;s, como se&ntilde;alaron Lindley<sup>41</sup> y Armitage y cols.,<sup>58</sup> si existe la posibilidad de extender ilimitadamente la muestra, paso por paso, la probabilidad de rechazar la hip&oacute;tesis nula, aunque sea cierta, se acerca a 1).</font></p>  	    <p align="justify"><font face="verdana" size="2">Por la naturaleza de la investigaci&oacute;n en las ciencias m&eacute;dicas, la interrupci&oacute;n/extensi&oacute;n de un experimento no es la excepci&oacute;n. Por ejemplo, si un estudio incluye a pacientes como participantes, &eacute;stos t&iacute;picamente llegan secuencialmente y el experimento se aplica a todos aquellos que lleguen a alg&uacute;n centro de atenci&oacute;n en un periodo de, por ejemplo, seis meses. Si los resultados disponibles para una parte de los pacientes indican claramente un efecto adverso del tratamiento bajo estudio, ser&iacute;a poco &eacute;tico seguir con el experimento. La pr&aacute;ctica de realizar evaluaciones intermedias se conoce como la estrategia de <i>an&aacute;lisis secuenciales</i>, para la cual se han desarrollado adaptaciones a los procedimientos estad&iacute;sticos tradicionales para que los valores <i>p</i> correspondan con los niveles de significancia nominales.<sup>59&#45;64</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">El ejemplo anterior y las adaptaciones a los procedimientos para an&aacute;lisis secuenciales ponen en evidencia que para la PSHN, es necesario involucrar el dise&ntilde;o muestral del estudio al calcular el valor <i>p</i>. Es decir, aunque los datos sean id&eacute;nticos (por ejemplo, 50 participantes del curso estudiados con el plan original, o bien, los mismos 50 participantes estudiados bajo la estrategia adaptada), los valores <i>p</i> resultan diferentes para los distintos dise&ntilde;os muestrales.</font></p>  	    <p align="justify"><font face="verdana" size="2">Sin embargo, no s&oacute;lo el dise&ntilde;o muestral, tambi&eacute;n otros aspectos y decisiones del plan de estudio pueden afectar el resultado de una PSHN. Unos ejemplos incluyen:</font></p>  	    <blockquote> 		    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&bull; &iquest;Qu&eacute; har&iacute;a el investigador si los datos de algunos participantes resultasen poco confiables, por ejemplo, porque sospecha que durante la administraci&oacute;n de las pruebas copiaron sus respuestas? &iquest;Les volver&iacute;a a aplicar las mismas pruebas en otro momento? &iquest;Reemplazar&iacute;a estos participantes con otros? &iquest;Eliminar&iacute;a simplemente sus datos y terminar&iacute;a el estudio con un n&uacute;mero menor que los 50 participantes inicialmente planeados?</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull; &iquest;C&oacute;mo tratar&iacute;a los datos faltantes, por ejemplo, porque, por cualquier raz&oacute;n, algunos participantes no pod&iacute;an participar en una o m&aacute;s de las cuatro pruebas? &iquest;Usar&iacute;a m&eacute;todos de imputaci&oacute;n? &iquest;Qu&eacute; m&eacute;todo usar&iacute;a?</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull; &iquest;C&oacute;mo proceder&iacute;a el investigador si la PSHN diese un resultado "marginalmente" significativo (como el <i>p</i> = 0.06 mencionado anteriormente)? Adem&aacute;s de ampliar la muestra, podr&iacute;a decidir analizar los datos de otra forma, por ejemplo, evaluando la puntuaci&oacute;n de cada prueba por separado, o analizar las puntuaciones de las pruebas mediante un an&aacute;lisis de varianza multivariada (MANOVA).</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull; &iquest;Realizar&aacute; pruebas de significancia bilaterales o unilaterales? En el caso de que se investigasen otros aspectos de los datos, &iquest;considerar&iacute;a aplicar ajustes para comparaciones m&uacute;ltiples (tipo Bonferroni, Duncan o Tukey)? &iquest;Qu&eacute; m&eacute;todo elegir&iacute;a?</font></p> 	</blockquote>  	    <p align="justify"><font face="verdana" size="2">En todos estos casos, las decisiones afectan, en mayor o menor medida, al conjunto de repeticiones hipot&eacute;ticas del experimento con las cuales se compara el experimento actual y, por consiguiente, el valor <i>p</i>. En este sentido, se puede decir que el resultado de la PSHN depende de datos que no han sido observados, o en palabras de Sir Harold Jeffreys, uno de los pioneros de la estad&iacute;stica Bayesiana del siglo XX:</font></p>  	    <p align="justify"><font face="verdana" size="2">"Lo que el uso del <i>p</i> implica, entonces, es que una hip&oacute;tesis que puede ser cierta, puede ser rechazada porque no ha predicho resultados observables que no ocurrieron. <i>Esto parece un procedimiento extra&ntilde;o".</i><sup>65</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">En general, los investigadores no planean de antemano todas las decisiones que tomar&aacute;n durante la ejecuci&oacute;n de un experimento y el an&aacute;lisis de los datos. Adem&aacute;s, en muchas ocasiones es simplemente imposible contemplar todos los imprevistos que pudieran ocurrir. Esto no significa que un investigador no deba explorar sus datos m&aacute;s all&aacute; de lo originalmente planeado, o tomar decisiones en funci&oacute;n de los resultados que obtenga. M&aacute;s bien, es importante tener claro que estas intenciones y decisiones no expl&iacute;citas influyen en el resultado de la PSHN &#45;independientemente de que realmente se apliquen o no en el experimento actual&#45;, lo cual constituye una fuerte cr&iacute;tica para las pruebas de significancia dentro del marco frecuentista.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Remedios y alternativas para la PSHN</b></font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Intervalos de confianza</b></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Con el fin de resolver algunos de los inconvenientes de la PSHN, varios autores han recomendado acompa&ntilde;ar o sustituir el valor <i>p</i> por un intervalo de confianza (IC).<sup>16,66&#45;69</sup> Un IC se define por el conjunto de valores para los cuales no se rechaza la hip&oacute;tesis nula. En nuestro ejemplo, es como si se realizara una prueba de significancia de la hip&oacute;tesis nula H<sub>0</sub> : &#181;<sub><i>X</i></sub> &#151;&#181;<sub><i>Y</i></sub> = <i>c</i>, para todos los n&uacute;meros reales <i>c</i>, y se anotara para cu&aacute;les valores de <i>c</i> la prueba no rechaza. En este caso, se obtendr&iacute;a que para 0.52 &le; <i>c</i> &le; 7.48 no se rechaza la hip&oacute;tesis nula y en consideraci&oacute;n que fijamos &#945; = 0.05, se dice que &#91;0.52, 7.48&#93; es un IC de 95% para la diferencia entre las medias de las dos poblaciones. Como tal, la pr&aacute;ctica de presentar ICs (posiblemente en conjunto con el valor <i>p</i>) constituye una respuesta a la cr&iacute;tica de que la PSHN excluye &uacute;nicamente un valor como valor plausible para el par&aacute;metro. Adem&aacute;s de proporcionar informaci&oacute;n sobre significancia (si el IC no incluye el valor de cero, entonces una PSHN declarar&iacute;a el resultado estad&iacute;sticamente significativo), el IC informa tambi&eacute;n sobre el posible tama&ntilde;o del efecto.</font></p>  	    <p align="justify"><font face="verdana" size="2">En t&eacute;rminos generales, se podr&iacute;a decir que el IC representa los valores plausibles para el par&aacute;metro. Sin embargo, es importante mantener claro el enfoque frecuentista en el que el IC se inscribe, lo cual implica que el par&aacute;metro es una constante.<sup>70</sup> Por lo tanto, la interpretaci&oacute;n del IC de nuestro ejemplo como que "el valor del par&aacute;metro se encuentra con 95% de probabilidad entre 0.52 y 7.48", a pesar de ser muy com&uacute;n entre los usuarios de la t&eacute;cnica, es incorrecta. El problema con esta interpretaci&oacute;n es que no reconoce que son los l&iacute;mites del IC los que var&iacute;an (entre las repeticiones conceptuales del experimento), no el valor del par&aacute;metro, y que la variaci&oacute;n deja de existir al momento de fijar dichos l&iacute;mites (en otras palabras, considerando el n&uacute;mero infinito de repeticiones conceptuales del experimento, el valor del par&aacute;metro se encuentra o bien en ninguno de los casos, o bien en todos, entre 0.52 y 7.48; es decir, la probabilidad es 0 o 1). La interpretaci&oacute;n correcta del IC apela al principio frecuentista: "A largo plazo, realizando muchos experimentos, los ICs incluir&aacute;n el valor del par&aacute;metro en por lo menos el 95% de los casos".</font></p>  	    <p align="justify"><font face="verdana" size="2">Es claro que los intervalos de confianza integran m&aacute;s informaci&oacute;n que el mero <i>p</i> &lt; 0.05 como resultado de una PSHN, informaci&oacute;n que es valiosa a la hora de evaluar el impacto de un estudio. No obstante, puesto que el IC se define en t&eacute;rminos de la PSHN, est&aacute; abierto a las mismas cr&iacute;ticas que dicho procedimiento.<sup>18,31,71</sup> Por ejemplo, la arbitrariedad en la selecci&oacute;n del nivel de confianza (com&uacute;nmente se fija &#945; = 0.05, llevando a ICs de 95%), y la dependencia de las intenciones y decisiones en el plan de estudio son cr&iacute;ticas que igualmente aplican a los ICs. Adem&aacute;s, cabe mencionar que el IC no es una alternativa para la PSHN en todas las ocasiones, por ejemplo, en el caso de la popular prueba de <i>ji cuadrada</i>, que contrasta el supuesto de independencia entre variables o que una muestra se ha extra&iacute;do de alguna familia de distribuciones (por ejemplo, la normal), no resulta tan claro c&oacute;mo definir el IC que corresponde en este caso.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Tama&ntilde;o del efecto</b></font></p>  	    <p align="justify"><font face="verdana" size="2">En alg&uacute;n sentido, los ICs brindan informaci&oacute;n sobre el tama&ntilde;o del efecto, por ejemplo, la diferencia entre la educaci&oacute;n presencial y la educaci&oacute;n a distancia en el estudio de nuestro investigador. Sin embargo, los n&uacute;meros en el IC se expresan en t&eacute;rminos de las unidades originales con las que se expresan las medias de ambos grupos; alguien que desconoce los detalles del estudio (y, espec&iacute;ficamente, si no est&aacute; familiarizado con las pruebas de conocimiento aplicadas e ignora c&oacute;mo se deriva la puntuaci&oacute;n global), tendr&aacute; dificultades para valorar la significancia pr&aacute;ctica de una diferencia entre 0.52 y 7.48. Usando otro ejemplo, al evaluar un tratamiento para reducir la fiebre en beb&eacute;s que sufren alguna enfermedad (medida en grados cent&iacute;grados), un efecto de 0.5 de diferencia con otro tratamiento ser&iacute;a espectacular, mientras que al evaluar el efecto de alguna medicina en la presi&oacute;n sangu&iacute;nea sist&oacute;lica (medida en mil&iacute;metros de mercurio mmHg), la misma diferencia num&eacute;rica de 0.5, ser&iacute;a despreciable. Sin conocimiento del error muestral o la desviaci&oacute;n t&iacute;pica de la variable bajo estudio, es imposible interpretar adecuadamente los valores en un IC.</font></p>  	    <p align="justify"><font face="verdana" size="2">Por estas razones se han desarrollado estad&iacute;sticas cuyos valores gozan de una interpretaci&oacute;n directa, llamadas &iacute;ndices del tama&ntilde;o del efecto.<sup>72&#45;77</sup> Existen docenas de este tipo de &iacute;ndices que se pueden clasificar en cuatro grupos:<sup>75</sup></font></p>  	    <blockquote> 		    <p align="justify"><font face="verdana" size="2"><i>a. Los &iacute;ndices de diferencias entre grupos</i> expresan el tama&ntilde;o de la diferencia entre dos, o m&aacute;s, grupos. Ejemplos incluyen la <i>d</i> de Cohen78 y la &#916; de Glass.<sup>79</sup> Se trata de diferencias estandarizadas, es decir, se interpretan en t&eacute;rminos de la desviaci&oacute;n est&aacute;ndar que existe dentro de los grupos.</font></p>  		    <p align="justify"><font face="verdana" size="2"><i>b. Los &iacute;ndices de la fuerza de asociaci&oacute;n</i> usualmente cuantifican la cantidad de varianza que dos o m&aacute;s variables comparten. Como ejemplo m&aacute;s conocido de &iacute;ndices en esta categor&iacute;a destaca la correlaci&oacute;n <i>r</i> de Pearson. Otros ejemplos incluyen la correlaci&oacute;n m&uacute;ltiple <i>R</i>, <i>&#951;</i><sup>2</sup>,<sup>80</sup> el coeficiente &#966; y el <i>V</i> de Cram&eacute;r.<sup>81</sup></font></p>  		    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><i>c. Los &iacute;ndices ajustados</i> incluyen una correcci&oacute;n de los &iacute;ndices de la categor&iacute;a anterior tomando en cuenta el error muestral o la varianza explicada por otras variables, por ejemplo, la correlaci&oacute;n m&uacute;ltiple ajustada, &#949;<sup>2</sup> y &#969;<sup>2</sup> (que son alternativas para <i>&#951;</i><sup>2</sup>),<sup>82</sup> y la correlaci&oacute;n parcial.</font></p>  		    <p align="justify"><font face="verdana" size="2"><i>d. Las estimaciones de riesgo</i> comparan el riesgo para alg&uacute;n resultado (por ejemplo, fallecimiento despu&eacute;s de un infarto) entre dos, o m&aacute;s grupos. Ejemplos incluyen el riesgo relativo (RR) y la raz&oacute;n de momios (OR, por sus siglas en ingl&eacute;s, <i>odds ratio</i>).<sup>83</sup></font></p> 	</blockquote>  	    <p align="justify"><font face="verdana" size="2">La elecci&oacute;n de uno de los &iacute;ndices del tama&ntilde;o del efecto depende de varios factores, incluyendo el tipo de variable (categ&oacute;rica o continua), el tipo de an&aacute;lisis (an&aacute;lisis de varianza, an&aacute;lisis de regresi&oacute;n, etc.) y tambi&eacute;n el &aacute;rea de estudios (por ejemplo, en las ciencias m&eacute;dicas y de salud son muy comunes los distintos &iacute;ndices de estimaciones de riesgo, mientras que en psicolog&iacute;a se presentan con mucha frecuencia &iacute;ndices de diferencias entre grupos). Cabe se&ntilde;alar que se han propuesto procedimientos para transformar entre s&iacute; los diferentes tipos de &iacute;ndices (para algunos ejemplos, v&eacute;ase Borenstein).<sup>76</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">Obviamente, los &iacute;ndices del tama&ntilde;o del efecto se calculan a partir de los datos recopilados de la muestra, y como tal sirven para estimar el tama&ntilde;o del efecto en la poblaci&oacute;n. Es decir, se puede distinguir entre el tama&ntilde;o del efecto como estad&iacute;stico (calculado a partir de la muestra) y como par&aacute;metro (caracter&iacute;stica de una poblaci&oacute;n). Siguiendo dentro del marco frecuentista, se pueden conceptualizar diferentes repeticiones del experimento y considerar la distribuci&oacute;n muestral del (estad&iacute;stico) tama&ntilde;o del efecto. Esta l&oacute;gica permite construir ICs para el tama&ntilde;o del efecto en la poblaci&oacute;n.<sup>84</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Adoptar el marco Bayesiano</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Varios autores que han criticado la PSHN proponen como soluci&oacute;n un cambio del paradigma frecuentista al paradigma Bayesiano.<sup>31,65,85&#45;87</sup> Los estad&iacute;sticos Bayesianos no hacen referencia a las repeticiones hipot&eacute;ticas de un experimento para definir el concepto de probabilidad, sino que lo valoran en t&eacute;rminos de la incertidumbre o el "grado de creencia" acerca del evento bajo consideraci&oacute;n<sup>88</sup> (cabe mencionar que adem&aacute;s de esta visi&oacute;n subjetivista, se ha propuesto otra definici&oacute;n de probabilidad Bayesiana, basada en el teorema de Cox, que se ha llamado la visi&oacute;n <i>objetivista</i>).<sup>89</sup> La interpretaci&oacute;n Bayesiana permite conceptualizar de igual forma la probabilidad de que al tirar una moneda aparezca cruz, la probabilidad de que M&eacute;xico gane 10 o m&aacute;s medallas en los pr&oacute;ximos juegos ol&iacute;mpicos, y la probabilidad de que supere a alg&uacute;n valor de inter&eacute;s la diferencia entre las medias poblacionales en las pruebas de conocimiento aplicadas a m&eacute;dicos que recibieron un curso de actualizaci&oacute;n de modo presencial y a aquellos que participan a distancia.</font></p>  	    <p align="justify"><font face="verdana" size="2">Una discusi&oacute;n profunda de los conceptos b&aacute;sicos de la estad&iacute;stica Bayesiana est&aacute; fuera del alcance de este art&iacute;culo; el lector interesado puede consultar el libro de texto de Bolstad<sup>90</sup> o el de Gelman y cols.<sup>88</sup> A continuaci&oacute;n, introduzco algunos elementos clave que permitir&aacute;n comprender el papel del enfoque Bayesiano en el debate sobre la PSHN.</font></p>  	    <p align="justify"><font face="verdana" size="2">Primero, la distribuci&oacute;n (de probabilidad o densidad) <i>posterior</i>, <i>P</i>(&#952;|<i>X</i>), describe la incertidumbre respecto de los valores de un par&aacute;metro &#952;, despu&eacute;s de haber tomado en cuenta los datos observados <i>X</i>. La interpretaci&oacute;n de la distribuci&oacute;n posterior, que permite derivar conclusiones v&aacute;lidas en t&eacute;rminos de, por ejemplo, "la probabilidad de que el valor del par&aacute;metro supere a 0", es sencilla y corresponde directamente con el inter&eacute;s del investigador. Adem&aacute;s de la distribuci&oacute;n posterior, el enfoque Bayesiano incluye tambi&eacute;n la distribuci&oacute;n <i>previa</i>, <i>P</i>(&#952;). Describe la incertidumbre sobre el par&aacute;metro &#952; que el investigador tiene antes de haber considerado los datos. El teorema de Bayes relaciona la distribuci&oacute;n posterior con la distribuci&oacute;n previa:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/iem/v1n4/a10ec3.jpg"></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">En esta ecuaci&oacute;n, <i>P</i>(<i>X</i>|&#952;) es la <i>funci&oacute;n de verosimilitud</i> (que da la probabilidad de los datos condicional al valor del par&aacute;metro); el t&eacute;rmino en el denominador <i>P</i>(<i>X</i>) representa la probabilidad incondicional de los datos. Para las aplicaciones Bayesianas es conveniente reconocer que <i>P</i>(<i>X</i>) es una constante, en el sentido de que no depende de &#952; (es decir, no influye en la plausibilidad relativa de los valores para &#952;; simplemente garantiza que el &aacute;rea total debajo de la distribuci&oacute;n posterior sea igual a 1, similar al t&eacute;rmino <img src="/img/revistas/iem/v1n4/a10raiz.jpg" align="absmiddle">en la f&oacute;rmula de la distribuci&oacute;n normal estandarizada). Es la raz&oacute;n por qu&eacute; a menudo, se encuentra en los textos con el enfoque Bayesiano la siguiente expresi&oacute;n:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/iem/v1n4/a10ec4.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">donde &infin; se lee como "es proporcional a".</font></p>  	    <p align="justify"><font face="verdana" size="2">Los opositores del enfoque Bayesiano rechazan las conclusiones que se sacan de la distribuci&oacute;n posterior, ya que las consideran subjetivas por su dependencia de la distribuci&oacute;n previa. Efectivamente, diferentes investigadores pueden tener creencias previas distintas sobre los valores plausibles de un par&aacute;metro y, por lo tanto, pueden llegar a conclusiones diferentes. Sin embargo, como defensa a esta cr&iacute;tica, los Bayesianos han levantado los siguientes cinco argumentos:</font></p>  	    <blockquote> 		    <p align="justify"><font face="verdana" size="2">a. Para cualquier an&aacute;lisis estad&iacute;stico es crucial investigar c&oacute;mo las conclusiones var&iacute;an en funci&oacute;n de los supuestos del modelo utilizado. En el enfoque Bayesiano t&iacute;picamente se examina qu&eacute; tan sensibles son los resultados a la distribuci&oacute;n previa (entre otros aspectos del modelo), lo cual implica reajustar el modelo especificando diferentes distribuciones previas y evaluar la robustez de las conclusiones.</font></p>  		    <p align="justify"><font face="verdana" size="2">b. En general, la sensibilidad de los resultados a la distribuci&oacute;n previa disminuye conforme las muestras son m&aacute;s grandes.</font></p>  		    <p align="justify"><font face="verdana" size="2">c. Para muchos tipos de par&aacute;metros se han propuesto distribuciones previas que afectan m&iacute;nimamente la distribuci&oacute;n posterior, denominadas distribuciones previas <i>no informativas</i>.<sup>91</sup> Una aproximaci&oacute;n relacionada utiliza distribuciones previas <i>jer&aacute;rquicas</i>, lo cual implica que se especifica una familia de distribuciones (en vez de una distribuci&oacute;n previa particular), cuyos par&aacute;metros se estiman a partir de los datos recopilados.</font></p>  		    <p align="justify"><font face="verdana" size="2">d. Algunos autores propugnan por la necesidad de considerar informaci&oacute;n previa al evaluar la evidencia proporcionada por un estudio, enfatizando la importancia del contexto en el cual se realiza la investigaci&oacute;n y reconociendo el car&aacute;cter acumulativo de la ciencia.<sup>18,85</sup> En este sentido, la distribuci&oacute;n previa se convierte en una ventaja del enfoque Bayesiano.</font></p>  		    <p align="justify"><font face="verdana" size="2">e. Dentro del enfoque Bayesiano, se han desarrollado &iacute;ndices que no dependen de la distribuci&oacute;n previa. Un ejemplo es el factor de Bayes, que se define en el contexto de contrastar dos modelos (por ejemplo, una "hip&oacute;tesis nula" y una "hip&oacute;tesis alternativa") y que indica, como una raz&oacute;n de momios, cu&aacute;nto apoyo brindan los datos a un modelo en comparaci&oacute;n con el otro.<sup>87,92</sup></font></p> 	</blockquote>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">A pesar de que el enfoque Bayesiano parece resolver la mayor&iacute;a de los inconvenientes de la PSHN y los valores <i>p</i>, su uso sigue siendo escaso. Las razones por la resistencia hacia la incorporaci&oacute;n de m&eacute;todos Bayesianos en la investigaci&oacute;n incluyen (a) la ense&ntilde;anza acad&eacute;mica, que en la mayor&iacute;a de las facultades se limita a la estad&iacute;stica cl&aacute;sica y que lleva a (b) la poca familiaridad de los investigadores con los conceptos Bayesianos, y (c) la escasa disponibilidad de programas de computo amigables para los an&aacute;lisis Bayesianos. A pesar de que las versiones recientes de los paquetes estad&iacute;sticos populares como SAS, SPSS y Stata incluyen m&oacute;dulos que permiten emprender an&aacute;lisis Bayesianos, y a pesar de la popularizaci&oacute;n del software WinBUGS/OpenBUGS (BUGS significa <i>Bayesian inference Using Gibbs Sampling</i>), un obst&aacute;culo importante sigue siendo la participaci&oacute;n que se requiere del usuario, que es inevitable en un an&aacute;lisis Bayesiano (en comparaci&oacute;n con un an&aacute;lisis cl&aacute;sico que se puede realizar con un par de clics al rat&oacute;n, sin conocer a fondo los procedimientos detr&aacute;s de ellos). Reconociendo este problema, algunos autores<sup>31,93</sup> han desarrollado adaptaciones de &iacute;ndices Bayesianos que son f&aacute;cilmente calculables a partir de la salida de un an&aacute;lisis cl&aacute;sico y que simult&aacute;neamente ofrecen la ventaja de una interpretaci&oacute;n Bayesiana.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Discusi&oacute;n</b></font></p>  	    <p align="justify"><font face="verdana" size="2">En este art&iacute;culo se revisaron algunas de las cr&iacute;ticas dirigidas a las pruebas de significancia desarrolladas dentro del marco cl&aacute;sico de la estad&iacute;stica y se dieron algunos ejemplos para ilustrar su relevancia en el contexto m&eacute;dico. Se trata de una selecci&oacute;n, ya que las cr&iacute;ticas hacia la PSHN son diversas y sacan a la luz tanto problemas de interpretaci&oacute;n como de construcci&oacute;n formal. A pesar de la intensidad que tuvo el debate durante las &uacute;ltimas d&eacute;cadas del siglo pasado, al parecer hoy en d&iacute;a &eacute;ste ha disminuido y actualmente la mayor&iacute;a de los expertos reconoce las limitaciones del procedimiento. No obstante, las pruebas de significancia siguen siendo la herramienta m&aacute;s popular en la estad&iacute;stica aplicada, tanto en las ciencias m&eacute;dicas y de salud como en las ciencias sociales y del comportamiento. Probablemente esta tenacidad se deba a que no existe "una alternativa m&aacute;gica a la PSHN, alg&uacute;n otro ritual mec&aacute;nico objetivo para reemplazarlo"<sup>16</sup> y que la alternativa principal &#45;adoptar el enfoque Bayesiano&#45; no permite un an&aacute;lisis automatizado, que lleve a un resultado sin que el investigador intervenga. En este contexto cabe se&ntilde;alar que varios autores<sup>94&#45;97</sup> rompen una lanza en favor de una educaci&oacute;n en estad&iacute;stica que otorga plena importancia al entendimiento correcto de los conceptos b&aacute;sicos (contrario a la ense&ntilde;anza de recetas &#45;&iquest;en qu&eacute; botones hay que dar clic?&#45; para llevar a cabo un an&aacute;lisis estad&iacute;stico); promueven una educaci&oacute;n que se fundamenta en el contexto de la investigaci&oacute;n cient&iacute;fica y, cuando est&aacute; dirigida a futuros m&eacute;dicos, incluye ejemplos relevantes de la pr&aacute;ctica cl&iacute;nica. Invitar a los estudiantes a que reflexionen cr&iacute;ticamente sobre los procedimientos estad&iacute;sticos, es un primer paso para que las diversas herramientas se apliquen con sensatez e inteligencia.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Agradecimientos</b></font></p>  	    <p align="justify"><font face="verdana" size="2">El autor agradece a Pablo C&aacute;ceres Serrano de la Pontificia Universidad Cat&oacute;lica de Valpara&iacute;so, Chile, por sus valiosos comentarios y sugerencias sobre una versi&oacute;n anterior del presente art&iacute;culo.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Referencias</b></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">1. Cowles M, Davis C. On the origins of the. 05 level of statistical significance. Am Psychol 1982;37:553&#45;558.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590223&pid=S2007-5057201200040001000001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">2. Fisher RA. Statistical methods for research workers. Edimburgo, Reino Unido. Oliver and Boyd. 1925.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590225&pid=S2007-5057201200040001000002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">3. Fisher RA. The design of experiments. Edimburgo, Reino Unido. Oliver and Boyd. 1935.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590227&pid=S2007-5057201200040001000003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">4. Neyman J, Pearson ES. On the use and interpretation of certain test criteria for purposes of statistical inference: Part I. Biometrika 1928;20A:175&#45;240.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590229&pid=S2007-5057201200040001000004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">5. Neyman J, Pearson ES. On the use and interpretation of certain test criteria for purposes of statistical inference: Part II. Biometrika 1928;20A:263&#45;294.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590231&pid=S2007-5057201200040001000005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">6. Neyman J, Pearson ES. On the problem of the most efficient tests of statistical hypotheses. Phil Trans R Soc Lond A 1933;231:289&#45;337.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590233&pid=S2007-5057201200040001000006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">7. Lehmann EL. The Fisher, Neyman&#45;Pearson theories of testing hypotheses: One theory or two? J Am Stat Assoc 1993. 88:1242&#45;1249.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590235&pid=S2007-5057201200040001000007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">8. Berger JO. Could Fisher, Jeffreys and Neyman have agreed on testing? Stat Sci 2003. 18:1&#45;32.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590237&pid=S2007-5057201200040001000008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">9. Hubbard R, Bayarri MJ. Confusion over measures of evidence (p's) versus errors (&#945;'s) in classical statistical testing. Am Stat 2003;3:171&#45;182.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590239&pid=S2007-5057201200040001000009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">10. Christensen R. Testing Fisher, Neyman, Pearson, and Bayes. Am Stat 2005;59:121&#45;126.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590241&pid=S2007-5057201200040001000010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">11. Berkson J. Some difficulties of interpretation encountered in the application of the chi&#45;square test. J Am Stat Assoc 1938;33:526&#45;536.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590243&pid=S2007-5057201200040001000011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">12. Rozeboom WW. The fallacy of the null&#45;hypothesis significance test. Psychol Bull 1960;57:416&#45;428.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590245&pid=S2007-5057201200040001000012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">13. Meehl PE. Theory&#45;testing in psychology and physics: A methodological paradox. Philos Sci 1967;34:103&#45;115.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590247&pid=S2007-5057201200040001000013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">14. Bakan D. The test of significance in psychological research. Psychol Bull 1966;66:423&#45;437.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590249&pid=S2007-5057201200040001000014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">15. Carver RP. The case against statistical significance testing. Harv Educ Rev 1978;48:378&#45;399.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590251&pid=S2007-5057201200040001000015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">16. Cohen J. The earth is round (p &lt; . 05). Am Psychol 1994;49:997&#45;1003.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590253&pid=S2007-5057201200040001000016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">17. Thompson B. In praise of brilliance: Where that praise really belongs. Am Psychol 1998;53:799&#45;800.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590255&pid=S2007-5057201200040001000017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">18. Goodman SN. Toward evidence&#45;based medical statistics. 1: The P value fallacy. Ann Intern Med 1999;130:995&#45;1004.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590257&pid=S2007-5057201200040001000018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">19. Gigerenzer G. Mindless statistics. J Socio Econ 2004;33:587&#45;606.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590259&pid=S2007-5057201200040001000019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">20. Hubbard R, Lindsay RM. Why P values are not a useful measure of evidence in statistical significance testing. Theory Psychol 2008;18:69&#45;88.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590261&pid=S2007-5057201200040001000020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">21. McCloskey DN, Ziliak ST. The unreasonable ineffectiveness of Fisherian "tests" in biology, and especially in medicine. Biol Theory 2009;4:44&#45;53.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590263&pid=S2007-5057201200040001000021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">22. Stang A, Poole C, Kuss O. The ongoing tyranny of statistical significance testing in biomedical research. Eur J Epidemiol 2010;25:225&#45;230.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590265&pid=S2007-5057201200040001000022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">23. Lambdin C. Significance tests as sorcery: Science is empirical&#45;significance tests are not. Theory Psychol 2012;22:67&#45;90.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590267&pid=S2007-5057201200040001000023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">24. Cortina JM, Dunlap WP. On the logic and purpose of significance testing. Psychol Methods 1997;2:161&#45;172.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590269&pid=S2007-5057201200040001000024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">25. Hagen RL. In praise of the null hypothesis statistical test. Am Psychol 1997;52:15&#45;24.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590271&pid=S2007-5057201200040001000025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">26. Chow SL. Pr&eacute;cis of statistical significance: Rationale, validity, and utility (con discusi&oacute;n). Behav Brain Sci 1998;21:169&#45;239.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590273&pid=S2007-5057201200040001000026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">27. Gregg AP, Sedikides C. Is social psychology research really so negatively biased? Behav Brain Sci 2004. 27:340&#45;341.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590275&pid=S2007-5057201200040001000027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">28. Mogie M. In support of null hypothesis significance testing. Proc R Soc Lond B Biol Sci 2004;271:S82&#45;S84.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590277&pid=S2007-5057201200040001000028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">29. Stephens PA, Buskirk SW, Hayward GD, Mart&iacute;nez del Rio C. Information theory and hypothesis testing: A call for pluralism. J Appl Ecol 2005;42:4&#45;12.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590279&pid=S2007-5057201200040001000029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">30. Stephens PA, Buskirk SW, Mart&iacute;nez del Rio C. Inference in ecology and evolution. Trends Ecol Evol 2007;22:192&#45;197.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590281&pid=S2007-5057201200040001000030&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">31. Wagenmakers EJ. A practical solution to the pervasive problems of p values. Psychon Bull Rev 2007;14:779&#45;804.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590283&pid=S2007-5057201200040001000031&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">32. Nickerson RS. Null hypothesis significance testing: A review of an old and continuing controversy. Psychol Methods 2000;5:241&#45;301.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590285&pid=S2007-5057201200040001000032&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">33. Balluerka N, G&oacute;mez J, Hidalgo D. The controversy over null hypothesis significance testing revisited. Methodology 2005;1:55&#45;70.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590287&pid=S2007-5057201200040001000033&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">34. Mood AM, Graybill FA, Boes DC. Introduction to the theory of statistics. 3a ed. Nueva York, EE.UU. McGraw&#45;Hill. 1974.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590289&pid=S2007-5057201200040001000034&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">35. Fisher RA. Statistical methods and scientific inferences. 3a ed. Nueva York, EE.UU. Hafner. 1973.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590291&pid=S2007-5057201200040001000035&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">36. Alcock JE. Give the null hypothesis a chance: Reasons to remain doubtful about the existence of psi. J Conscious Stud 2003;10(67):29&#45;50.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590293&pid=S2007-5057201200040001000036&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">37. LeFort SM. The statistical versus clinical significance debate. J Nurs Scholarsh 1993;25:57&#45;62.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590295&pid=S2007-5057201200040001000037&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">38. Kane RC. The clinical significance of statistical significance. Oncologist 2008;13:1129&#45;1133.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590297&pid=S2007-5057201200040001000038&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">39. Silva&#45;Ayc&cedil;aguer LC, Su&aacute;rez&#45;Gil P, Fern&aacute;ndez&#45;Somoano A. The null hypothesis significance test in health sciences research (1995&#45;2006): Statistical analysis and interpretation. BMC Med Res Methodol 2010;10:44.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590299&pid=S2007-5057201200040001000039&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">40. Falk R, Greenbaum CW. Significance tests die hard: The amazing persistence of a probabilistic misconception. Theory Psychol 1995;5:75&#45;98.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590301&pid=S2007-5057201200040001000040&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">41. Lindley DV. A statistical paradox. Biometrika 1957;44:187&#45;192.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590303&pid=S2007-5057201200040001000041&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">42. Berger JO, Sellke T. Testing a point null hypothesis: The irreconcilability of P values and evidence. J Am Stat Assoc 1987;82:112&#45;122.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590305&pid=S2007-5057201200040001000042&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">43. Sellke T, Bayarri MJ, Berger JO. Calibration of p values for testing precise null hypotheses. Am Stat 2001;55:62&#45;71.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590307&pid=S2007-5057201200040001000043&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">44. Wetzels R, Matzke D, Lee MD, et al. Statistical evidence in experimental psychology: An empirical comparison using 855 t tests. Perspect Psychol Sci 2011;6:291&#45;298.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590309&pid=S2007-5057201200040001000044&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">45. Held L. A nomogram for P values. BMC Med Res Methodol 2010;10:21.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590311&pid=S2007-5057201200040001000045&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">46. Rosnow RL, Rosenthal R. Statistical procedures and the justification of knowledge in psychological science. Am Psychol 1989;44:1276&#45;1284.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590313&pid=S2007-5057201200040001000046&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">47. Hoekstra R, Finch S, Kiers HAL, et al. Probability as certainty: Dichotomous thinking and the misuse of p values. Psychon Bull Rev 2006;13:1033&#45;1037.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590315&pid=S2007-5057201200040001000047&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">48. Savage IR. Nonparametric statistics. J Am Stat Assoc 1957;52:331&#45;344.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590317&pid=S2007-5057201200040001000048&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">49. Schmidt FL. Statistical significance testing and cumulative knowledge in psychology: Implications for training of researchers. Psychol Methods 1996;1:115&#45;29</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590319&pid=S2007-5057201200040001000049&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">50. Glass GV, McGaw B, Smith ML. Meta&#45;analysis in social research. Beverly Hills, CA, EE.UU. Sage. 1981.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590320&pid=S2007-5057201200040001000050&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">51. Anderson DR, Burnham KP, Thompson WL. Null hypothesis testing: Problems, prevalence, and an alternative. J Wildl Manage 2000;64:912&#45;923.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590322&pid=S2007-5057201200040001000051&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">52. Mudge JF, Baker LF, Edge CB, et al. Setting an optimal &#2011; that minimizes errors in null hypothesis signiicance tests. PLoS One 2012;7(2):e32734.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590324&pid=S2007-5057201200040001000052&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">53. Neyman J. Basic ideas and some recent results of the theory of testing statistical hypothesis. J R Stat Soc 1942;105:292&#45;327.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590326&pid=S2007-5057201200040001000053&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">54. Goodman S. A dirty dozen: Twelve P&#45;value misconceptions. Semin Hematol 2008;45:135&#45;140.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590328&pid=S2007-5057201200040001000054&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">55. Engman A. Is there life after P &lt; 0.05? Statistical significance and quantitative sociology. Quality Quantity 2011, DOI: 10. 1007/ s11135&#45;011&#45;9516&#45;z.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590330&pid=S2007-5057201200040001000055&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">56. Berger JO, Berry DA. The relevance of stopping rules in statistical inference (con discusi&oacute;n). in: Gupta SS, Berger JO, (editors). Statistical Decision Theory and Related Topics IV. vol. 1. Nueva York, NY, EE.UU. Springer. 1988. 29&#45;72.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590332&pid=S2007-5057201200040001000056&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">57. Lindley DV. The analysis of experimental data: The appreciation of tea and wine. Teach Stat 1993;15:22&#45;25.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590334&pid=S2007-5057201200040001000057&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">58. Armitage P, McPherson CK, Rowe BC. Repeated significance tests on accumulating data. J R Stat Soc Ser A 1969;132:235&#45;244.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590336&pid=S2007-5057201200040001000058&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">59. Wald A. Sequential analysis. Nueva York, NY, EE.UU. Wiley. 1947.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590338&pid=S2007-5057201200040001000059&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">60. Armitage P. Sequential medical trials. 2a ed. Nueva York, NY, EE.UU. Wiley. 1975.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590340&pid=S2007-5057201200040001000060&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">61. Pocock SJ. Group sequential methods in the design and analysis of clinical trials. Biometrika 1977;64:191&#45;199.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590342&pid=S2007-5057201200040001000061&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">62. Fairbanks K, Madsen R. P values for tests using a repeated significance test design. Biometrika 1982;69:69&#45;74.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590344&pid=S2007-5057201200040001000062&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">63. Whitehead J. The design and analysis of sequential clinical trials. 2a ed. Statistics in Practice. Chichester, Reino Unido. Wiley. 1997.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590346&pid=S2007-5057201200040001000063&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">64. Goodman SN. Stopping trials for efficacy: An almost unbiased view. Clin Trials 2009;6:133&#45;135.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590348&pid=S2007-5057201200040001000064&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">65. Jeffreys H. Theory of probability. 3a ed. Oxford, Reino Unido. University Press. 1961.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590350&pid=S2007-5057201200040001000065&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">66. Gardner MJ, Altman DG. Confidence intervals rather than P values: Estimation rather than hypothesis testing. Br Med J 1986;292:746&#45;750.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590352&pid=S2007-5057201200040001000066&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">67. Brandst&auml;tter E. Confidence intervals as an alternative to significance testing. Methods Psychol Res Online 1999;4(2):33&#45;46.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590354&pid=S2007-5057201200040001000067&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">68. Sterne JAC, Smith GD. Sifting the evidence&#45;what's wrong with significance tests? Br Med J 2001. 322:226&#45;231.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590356&pid=S2007-5057201200040001000068&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">69. Ranstam J. Why the P&#45;value culture is bad and confidence intervals a better alternative. Osteoarthritis Cartilage 2012;20(8):805&#45;808.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590358&pid=S2007-5057201200040001000069&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">70. Howson C, Urbach P. Bayesian reasoning in science. Nature 1991;350:371&#45;374.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590360&pid=S2007-5057201200040001000070&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">71. Feinstein AR. P&#45;values and confidence intervals: Two sides of the same unsatisfactory coin. J Clin Epidemiol 1998;52:355&#45;360.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590362&pid=S2007-5057201200040001000071&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">72. Thompson B. "Statistical," "practical," and "clinical": How many kinds of significance do counselors need to consider? J Couns Dev 2002. 80:64&#45;71.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590364&pid=S2007-5057201200040001000072&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">73. Rosnow RL, Rosenthal R. Effect size for experimenting psychologists. Can J Exp Psychol 2003;57:221&#45;237.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590366&pid=S2007-5057201200040001000073&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">74. Vacha&#45;Haase T, Thompson B. How to estimate and interpret various effect sizes. J Couns Psychol 2004;51:473&#45;481.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590368&pid=S2007-5057201200040001000074&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">75. Ferguson CJ. An effect size primer: A guide for clinicians and researchers. Prof Psychol Res Pr 2009;40:532&#45;538.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590370&pid=S2007-5057201200040001000075&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">76. Borenstein M. Effect sizes for continuous data. En: Cooper H, Hedges LV, Valentine JC, editores. The Handbook of Research Synthesis and Meta&#45;Analysis. 2a ed. Nueva York, NY, EE.UU. Russell Sage Foundation. 2009. 221&#45;235.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590372&pid=S2007-5057201200040001000076&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">77. Fleiss JV, Berlin JA. Effect sizes for dichotomous data. In: Cooper H, Hedges LV, Valentine JC, (editors). The Handbook of Research Synthesis and Meta&#45;Analysis. 2a ed. Nueva York, NY, EE.UU. Russell Sage Foundation. 2009. 237&#45;253.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590374&pid=S2007-5057201200040001000077&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">78. Cohen J. Statistical power analysis for the behavioral sciences. 2a ed. Hillsdale, NJ. Lawrence Erlbaum. 1988.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590376&pid=S2007-5057201200040001000078&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">79. Glass GV. Primary, secondary, and meta&#45;analysis of research. Educ Res 1976;5(10):3&#45;8.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590378&pid=S2007-5057201200040001000079&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">80. Peters CC, Van Voorhis WR. Statistical procedures and their mathematical bases. Nueva York, NY, EE.UU. McGraw&#45;Hill. 1940.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590380&pid=S2007-5057201200040001000080&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">81. Cram&eacute;r H. Mathematical methods of statistics. Princeton, NJ, EE.UU. University Press. 1946.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590382&pid=S2007-5057201200040001000081&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">82. Hays WL. Statistics. 5a ed. Nueva York, NY, EE.UU. Harcourt Brace. 1994.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590384&pid=S2007-5057201200040001000082&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">83. Sistrom CL, Garvan CW. Proportions, odds, and risk. Radiology 2004;230:12&#45;9.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590386&pid=S2007-5057201200040001000083&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">84. Thompson B. What future quantitative social science research could look like: Confidence intervals for effect sizes. Educ Res 2002;13(3):25&#45;32.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590388&pid=S2007-5057201200040001000084&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">85. Browner WS, Newman TB. Are all significant P values created equal? The analogy between diagnostic tests and clinical research. JAMA 1987;257:2459&#45;2463.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590390&pid=S2007-5057201200040001000085&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">86. Trafimow D. Hypothesis testing and theory evaluation at the boundaries: Surprising insights from Bayes's theorem. Psychol Rev 2003;110:526&#45;535.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590392&pid=S2007-5057201200040001000086&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">87. Goodman SN. Toward evidence&#45;based medical statistics. 2: The Bayes factor. Ann Intern Med 1999;130:1005&#45;1013.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590394&pid=S2007-5057201200040001000087&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">88. Gelman A, Carlin JB, Stern HS, et al. Bayesian data analysis. 2a ed. Londres, Reino Unido. Chapman &amp; Hall. 2004.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590396&pid=S2007-5057201200040001000088&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">89. Jaynes ET. Probability theory: The logic of science. Cambridge, Reino Unido. University Press. 2003.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590398&pid=S2007-5057201200040001000089&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">90. Bolstad WM. Introduction to Bayesian statistics. 2a ed. Hoboken, NJ, EE.UU. John Wiley &amp; Sons. 2007.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590400&pid=S2007-5057201200040001000090&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">91. Kass RE, Wasserman L. The selection of prior distributions by formal rules. J Am Stat Assoc 1996;91:1343&#45;1370.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590402&pid=S2007-5057201200040001000091&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">92. Kass RE, Raftery AE. Bayes factors. J Am Stat Assoc 1995;90:773&#45;795.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590404&pid=S2007-5057201200040001000092&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">93. Johnson VE. Bayes factors based on test statistics. J R Stat Soc Series B Stat Methodol 2005;67:689&#45;701.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590406&pid=S2007-5057201200040001000093&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">94. Gelman A, Nolan D. Teaching statistics: A bag of tricks. Nueva York, NY, EE.UU. Oxford University Press. 2002.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590408&pid=S2007-5057201200040001000094&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">95. Herman A, Notzer N, Libman Z, et al. Statistical education for medical students&#45;Concepts are what remain when the details are forgotten. Stat Med 2007;26:4344&#45;4351.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590410&pid=S2007-5057201200040001000095&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">96. Freeman JV, Collier S, Staniforth D, et al. Innovations in curriculum design: A multi&#45;disciplinary approach to teaching statistics to undergraduate medical students 2008;8:28.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590412&pid=S2007-5057201200040001000096&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">97. Gelman A. Teaching Bayes to graduate students in political science, sociology, public health, education, economics,.... Am Stat 2008;62:202&#45;205.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4590414&pid=S2007-5057201200040001000097&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cowles]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Davis]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[On the origins of the: 05 level of statistical significance]]></article-title>
<source><![CDATA[Am Psychol]]></source>
<year>1982</year>
<volume>37</volume>
<page-range>553-558</page-range></nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fisher]]></surname>
<given-names><![CDATA[RA]]></given-names>
</name>
</person-group>
<source><![CDATA[Statistical methods for research workers]]></source>
<year>1925</year>
<publisher-loc><![CDATA[Edimburgo ]]></publisher-loc>
<publisher-name><![CDATA[Oliver and Boyd]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fisher]]></surname>
<given-names><![CDATA[RA]]></given-names>
</name>
</person-group>
<source><![CDATA[The design of experiments]]></source>
<year>1935</year>
<publisher-loc><![CDATA[Edimburgo ]]></publisher-loc>
<publisher-name><![CDATA[Oliver and Boyd]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Neyman]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Pearson]]></surname>
<given-names><![CDATA[ES]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[On the use and interpretation of certain test criteria for purposes of statistical inference: Part I]]></article-title>
<source><![CDATA[Biometrika]]></source>
<year>1928</year>
<volume>20A</volume>
<page-range>175-240</page-range></nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Neyman]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Pearson]]></surname>
<given-names><![CDATA[ES]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[On the use and interpretation of certain test criteria for purposes of statistical inference: Part II]]></article-title>
<source><![CDATA[Biometrika]]></source>
<year>1928</year>
<volume>20A</volume>
<page-range>263-294</page-range></nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Neyman]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Pearson]]></surname>
<given-names><![CDATA[ES]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[On the problem of the most efficient tests of statistical hypotheses]]></article-title>
<source><![CDATA[Phil Trans R Soc Lond A]]></source>
<year>1933</year>
<volume>231</volume>
<page-range>289-337</page-range></nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lehmann]]></surname>
<given-names><![CDATA[EL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Fisher, Neyman-Pearson theories of testing hypotheses: One theory or two?]]></article-title>
<source><![CDATA[J Am Stat Assoc]]></source>
<year>1993</year>
<volume>88</volume>
<page-range>1242-1249</page-range></nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Berger]]></surname>
<given-names><![CDATA[JO]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Could Fisher, Jeffreys and Neyman have agreed on testing?]]></article-title>
<source><![CDATA[Stat Sci]]></source>
<year>2003</year>
<volume>18</volume>
<page-range>1-32</page-range></nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hubbard]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Bayarri]]></surname>
<given-names><![CDATA[MJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Confusion over measures of evidence (p's) versus errors (&#945;'s) in classical statistical testing]]></article-title>
<source><![CDATA[Am Stat]]></source>
<year>2003</year>
<volume>3</volume>
<page-range>171-182</page-range></nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Christensen]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Testing Fisher, Neyman, Pearson, and Bayes]]></article-title>
<source><![CDATA[Am Stat]]></source>
<year>2005</year>
<volume>59</volume>
<page-range>121-126</page-range></nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Berkson]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Some difficulties of interpretation encountered in the application of the chi-square test]]></article-title>
<source><![CDATA[J Am Stat Assoc]]></source>
<year>1938</year>
<volume>33</volume>
<page-range>526-536</page-range></nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rozeboom]]></surname>
<given-names><![CDATA[WW]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The fallacy of the null-hypothesis significance test]]></article-title>
<source><![CDATA[Psychol Bull]]></source>
<year>1960</year>
<volume>57</volume>
<page-range>416-428</page-range></nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Meehl]]></surname>
<given-names><![CDATA[PE]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Theory-testing in psychology and physics: A methodological paradox]]></article-title>
<source><![CDATA[Philos Sci]]></source>
<year>1967</year>
<volume>34</volume>
<page-range>103-115</page-range></nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bakan]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The test of significance in psychological research]]></article-title>
<source><![CDATA[Psychol Bull]]></source>
<year>1966</year>
<volume>66</volume>
<page-range>423-437</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Carver]]></surname>
<given-names><![CDATA[RP]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The case against statistical significance testing]]></article-title>
<source><![CDATA[Harv Educ Rev]]></source>
<year>1978</year>
<volume>48</volume>
<page-range>378-399</page-range></nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cohen]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The earth is round (p <: 05)]]></article-title>
<source><![CDATA[Am Psychol]]></source>
<year>1994</year>
<volume>49</volume>
<page-range>997-1003</page-range></nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Thompson]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[In praise of brilliance: Where that praise really belongs]]></article-title>
<source><![CDATA[Am Psychol]]></source>
<year>1998</year>
<volume>53</volume>
<page-range>799-800</page-range></nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Goodman]]></surname>
<given-names><![CDATA[SN]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Toward evidence-based medical statistics: 1: The P value fallacy]]></article-title>
<source><![CDATA[Ann Intern Med]]></source>
<year>1999</year>
<volume>130</volume>
<page-range>995-1004</page-range></nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gigerenzer]]></surname>
<given-names><![CDATA[G]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Mindless statistics]]></article-title>
<source><![CDATA[J Socio Econ]]></source>
<year>2004</year>
<volume>33</volume>
<page-range>587-606</page-range></nlm-citation>
</ref>
<ref id="B20">
<label>20</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hubbard]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Lindsay]]></surname>
<given-names><![CDATA[RM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Why P values are not a useful measure of evidence in statistical significance testing]]></article-title>
<source><![CDATA[Theory Psychol]]></source>
<year>2008</year>
<volume>18</volume>
<page-range>69-88</page-range></nlm-citation>
</ref>
<ref id="B21">
<label>21</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McCloskey]]></surname>
<given-names><![CDATA[DN]]></given-names>
</name>
<name>
<surname><![CDATA[Ziliak]]></surname>
<given-names><![CDATA[ST]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The unreasonable ineffectiveness of Fisherian "tests" in biology, and especially in medicine]]></article-title>
<source><![CDATA[Biol Theory]]></source>
<year>2009</year>
<volume>4</volume>
<page-range>44-53</page-range></nlm-citation>
</ref>
<ref id="B22">
<label>22</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Stang]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Poole]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Kuss]]></surname>
<given-names><![CDATA[O]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The ongoing tyranny of statistical significance testing in biomedical research]]></article-title>
<source><![CDATA[Eur J Epidemiol]]></source>
<year>2010</year>
<volume>25</volume>
<page-range>225-230</page-range></nlm-citation>
</ref>
<ref id="B23">
<label>23</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lambdin]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Significance tests as sorcery: Science is empirical-significance tests are not]]></article-title>
<source><![CDATA[Theory Psychol]]></source>
<year>2012</year>
<volume>22</volume>
<page-range>67-90</page-range></nlm-citation>
</ref>
<ref id="B24">
<label>24</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cortina]]></surname>
<given-names><![CDATA[JM]]></given-names>
</name>
<name>
<surname><![CDATA[Dunlap]]></surname>
<given-names><![CDATA[WP]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[On the logic and purpose of significance testing]]></article-title>
<source><![CDATA[Psychol Methods]]></source>
<year>1997</year>
<volume>2</volume>
<page-range>161-172</page-range></nlm-citation>
</ref>
<ref id="B25">
<label>25</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hagen]]></surname>
<given-names><![CDATA[RL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[In praise of the null hypothesis statistical test]]></article-title>
<source><![CDATA[Am Psychol]]></source>
<year>1997</year>
<volume>52</volume>
<page-range>15-24</page-range></nlm-citation>
</ref>
<ref id="B26">
<label>26</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chow]]></surname>
<given-names><![CDATA[SL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Précis of statistical significance: Rationale, validity, and utility (con discusión)]]></article-title>
<source><![CDATA[Behav Brain Sci]]></source>
<year>1998</year>
<volume>21</volume>
<page-range>169-239</page-range></nlm-citation>
</ref>
<ref id="B27">
<label>27</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gregg]]></surname>
<given-names><![CDATA[AP]]></given-names>
</name>
<name>
<surname><![CDATA[Sedikides]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Is social psychology research really so negatively biased?]]></article-title>
<source><![CDATA[Behav Brain Sci]]></source>
<year>2004</year>
<volume>27</volume>
<page-range>340-341</page-range></nlm-citation>
</ref>
<ref id="B28">
<label>28</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mogie]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[In support of null hypothesis significance testing]]></article-title>
<source><![CDATA[Proc R Soc Lond B Biol Sci]]></source>
<year>2004</year>
<volume>271</volume>
<page-range>S82-S84</page-range></nlm-citation>
</ref>
<ref id="B29">
<label>29</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Stephens]]></surname>
<given-names><![CDATA[PA]]></given-names>
</name>
<name>
<surname><![CDATA[Buskirk]]></surname>
<given-names><![CDATA[SW]]></given-names>
</name>
<name>
<surname><![CDATA[Hayward]]></surname>
<given-names><![CDATA[GD]]></given-names>
</name>
<name>
<surname><![CDATA[Martínez del Rio]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Information theory and hypothesis testing: A call for pluralism]]></article-title>
<source><![CDATA[J Appl Ecol]]></source>
<year>2005</year>
<volume>42</volume>
<page-range>4-12</page-range></nlm-citation>
</ref>
<ref id="B30">
<label>30</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Stephens]]></surname>
<given-names><![CDATA[PA]]></given-names>
</name>
<name>
<surname><![CDATA[Buskirk]]></surname>
<given-names><![CDATA[SW]]></given-names>
</name>
<name>
<surname><![CDATA[Martínez del Rio]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Inference in ecology and evolution]]></article-title>
<source><![CDATA[Trends Ecol Evol]]></source>
<year>2007</year>
<volume>22</volume>
<page-range>192-197</page-range></nlm-citation>
</ref>
<ref id="B31">
<label>31</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wagenmakers]]></surname>
<given-names><![CDATA[EJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A practical solution to the pervasive problems of p values]]></article-title>
<source><![CDATA[Psychon Bull Rev]]></source>
<year>2007</year>
<volume>14</volume>
<page-range>779-804</page-range></nlm-citation>
</ref>
<ref id="B32">
<label>32</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Nickerson]]></surname>
<given-names><![CDATA[RS]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Null hypothesis significance testing: A review of an old and continuing controversy]]></article-title>
<source><![CDATA[Psychol Methods]]></source>
<year>2000</year>
<volume>5</volume>
<page-range>241-301</page-range></nlm-citation>
</ref>
<ref id="B33">
<label>33</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Balluerka]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Gómez]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Hidalgo]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The controversy over null hypothesis significance testing revisited]]></article-title>
<source><![CDATA[Methodology]]></source>
<year>2005</year>
<volume>1</volume>
<page-range>55-70</page-range></nlm-citation>
</ref>
<ref id="B34">
<label>34</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mood]]></surname>
<given-names><![CDATA[AM]]></given-names>
</name>
<name>
<surname><![CDATA[Graybill]]></surname>
<given-names><![CDATA[FA]]></given-names>
</name>
<name>
<surname><![CDATA[Boes]]></surname>
<given-names><![CDATA[DC]]></given-names>
</name>
</person-group>
<source><![CDATA[Introduction to the theory of statistics]]></source>
<year>1974</year>
<edition>3</edition>
<publisher-loc><![CDATA[Nueva York ]]></publisher-loc>
<publisher-name><![CDATA[McGraw-Hill]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B35">
<label>35</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fisher]]></surname>
<given-names><![CDATA[RA]]></given-names>
</name>
</person-group>
<source><![CDATA[Statistical methods and scientific inferences]]></source>
<year>1973</year>
<edition>3</edition>
<publisher-loc><![CDATA[Nueva York ]]></publisher-loc>
<publisher-name><![CDATA[Hafner]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B36">
<label>36</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Alcock]]></surname>
<given-names><![CDATA[JE]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Give the null hypothesis a chance: Reasons to remain doubtful about the existence of psi]]></article-title>
<source><![CDATA[J Conscious Stud]]></source>
<year>2003</year>
<volume>10</volume>
<numero>67</numero>
<issue>67</issue>
<page-range>29-50</page-range></nlm-citation>
</ref>
<ref id="B37">
<label>37</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[LeFort]]></surname>
<given-names><![CDATA[SM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The statistical versus clinical significance debate]]></article-title>
<source><![CDATA[J Nurs Scholarsh]]></source>
<year>1993</year>
<volume>25</volume>
<page-range>57-62</page-range></nlm-citation>
</ref>
<ref id="B38">
<label>38</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kane]]></surname>
<given-names><![CDATA[RC]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The clinical significance of statistical significance]]></article-title>
<source><![CDATA[Oncologist]]></source>
<year>2008</year>
<volume>13</volume>
<page-range>1129-1133</page-range></nlm-citation>
</ref>
<ref id="B39">
<label>39</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Silva-Ayc]]></surname>
</name>
<name>
<surname><![CDATA[aguer]]></surname>
<given-names><![CDATA[LC.]]></given-names>
</name>
<name>
<surname><![CDATA[Suárez-Gil]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Fernández-Somoano]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The null hypothesis significance test in health sciences research (1995-2006): Statistical analysis and interpretation]]></article-title>
<source><![CDATA[BMC Med Res Methodol]]></source>
<year>2010</year>
<volume>10</volume>
<page-range>44</page-range></nlm-citation>
</ref>
<ref id="B40">
<label>40</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Falk]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Greenbaum]]></surname>
<given-names><![CDATA[CW]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Significance tests die hard: The amazing persistence of a probabilistic misconception]]></article-title>
<source><![CDATA[Theory Psychol]]></source>
<year>1995</year>
<volume>5</volume>
<page-range>75-98</page-range></nlm-citation>
</ref>
<ref id="B41">
<label>41</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lindley]]></surname>
<given-names><![CDATA[DV]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A statistical paradox]]></article-title>
<source><![CDATA[Biometrika]]></source>
<year>1957</year>
<volume>44</volume>
<page-range>187-192</page-range></nlm-citation>
</ref>
<ref id="B42">
<label>42</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Berger]]></surname>
<given-names><![CDATA[JO]]></given-names>
</name>
<name>
<surname><![CDATA[Sellke]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Testing a point null hypothesis: The irreconcilability of P values and evidence]]></article-title>
<source><![CDATA[J Am Stat Assoc]]></source>
<year>1987</year>
<volume>82</volume>
<page-range>112-122</page-range></nlm-citation>
</ref>
<ref id="B43">
<label>43</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sellke]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Bayarri]]></surname>
<given-names><![CDATA[MJ]]></given-names>
</name>
<name>
<surname><![CDATA[Berger]]></surname>
<given-names><![CDATA[JO]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Calibration of p values for testing precise null hypotheses]]></article-title>
<source><![CDATA[Am Stat]]></source>
<year>2001</year>
<volume>55</volume>
<page-range>62-71</page-range></nlm-citation>
</ref>
<ref id="B44">
<label>44</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wetzels]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Matzke]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
<name>
<surname><![CDATA[Lee]]></surname>
<given-names><![CDATA[MD]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Statistical evidence in experimental psychology: An empirical comparison using 855 t tests]]></article-title>
<source><![CDATA[Perspect Psychol Sci]]></source>
<year>2011</year>
<volume>6</volume>
<page-range>291-298</page-range></nlm-citation>
</ref>
<ref id="B45">
<label>45</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Held]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A nomogram for P values]]></article-title>
<source><![CDATA[BMC Med Res Methodol]]></source>
<year>2010</year>
<volume>10</volume>
<page-range>21</page-range></nlm-citation>
</ref>
<ref id="B46">
<label>46</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rosnow]]></surname>
<given-names><![CDATA[RL]]></given-names>
</name>
<name>
<surname><![CDATA[Rosenthal]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Statistical procedures and the justification of knowledge in psychological science]]></article-title>
<source><![CDATA[Am Psychol]]></source>
<year>1989</year>
<volume>44</volume>
<page-range>1276-1284</page-range></nlm-citation>
</ref>
<ref id="B47">
<label>47</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hoekstra]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Finch]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Kiers]]></surname>
<given-names><![CDATA[HAL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Probability as certainty: Dichotomous thinking and the misuse of p values]]></article-title>
<source><![CDATA[Psychon Bull Rev]]></source>
<year>2006</year>
<volume>13</volume>
<page-range>1033-1037</page-range></nlm-citation>
</ref>
<ref id="B48">
<label>48</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Savage]]></surname>
<given-names><![CDATA[IR]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Nonparametric statistics]]></article-title>
<source><![CDATA[J Am Stat Assoc]]></source>
<year>1957</year>
<volume>52</volume>
<page-range>331-344</page-range></nlm-citation>
</ref>
<ref id="B49">
<label>49</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Schmidt]]></surname>
<given-names><![CDATA[FL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Statistical significance testing and cumulative knowledge in psychology: Implications for training of researchers]]></article-title>
<source><![CDATA[Psychol Methods]]></source>
<year>1996</year>
<volume>1</volume>
<page-range>115-29</page-range></nlm-citation>
</ref>
<ref id="B50">
<label>50</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Glass]]></surname>
<given-names><![CDATA[GV]]></given-names>
</name>
<name>
<surname><![CDATA[McGaw]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
<name>
<surname><![CDATA[Smith]]></surname>
<given-names><![CDATA[ML]]></given-names>
</name>
</person-group>
<source><![CDATA[Meta-analysis in social research]]></source>
<year>1981</year>
<publisher-loc><![CDATA[Beverly Hills^eCA CA]]></publisher-loc>
<publisher-name><![CDATA[Sage]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B51">
<label>51</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Anderson]]></surname>
<given-names><![CDATA[DR]]></given-names>
</name>
<name>
<surname><![CDATA[Burnham]]></surname>
<given-names><![CDATA[KP]]></given-names>
</name>
<name>
<surname><![CDATA[Thompson]]></surname>
<given-names><![CDATA[WL]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Null hypothesis testing: Problems, prevalence, and an alternative]]></article-title>
<source><![CDATA[J Wildl Manage]]></source>
<year>2000</year>
<volume>64</volume>
<page-range>912-923</page-range></nlm-citation>
</ref>
<ref id="B52">
<label>52</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mudge]]></surname>
<given-names><![CDATA[JF]]></given-names>
</name>
<name>
<surname><![CDATA[Baker]]></surname>
<given-names><![CDATA[LF]]></given-names>
</name>
<name>
<surname><![CDATA[Edge]]></surname>
<given-names><![CDATA[CB]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Setting an optimal: that minimizes errors in null hypothesis signiicance tests]]></article-title>
<source><![CDATA[PLoS One]]></source>
<year>2012</year>
<volume>7</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>e32734</page-range></nlm-citation>
</ref>
<ref id="B53">
<label>53</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Neyman]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Basic ideas and some recent results of the theory of testing statistical hypothesis]]></article-title>
<source><![CDATA[J R Stat Soc]]></source>
<year>1942</year>
<volume>105</volume>
<page-range>292-327</page-range></nlm-citation>
</ref>
<ref id="B54">
<label>54</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Goodman]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A dirty dozen: Twelve P-value misconceptions]]></article-title>
<source><![CDATA[Semin Hematol]]></source>
<year>2008</year>
<volume>45</volume>
<page-range>135-140</page-range></nlm-citation>
</ref>
<ref id="B55">
<label>55</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Engman]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Is there life after P < 0.05?: Statistical significance and quantitative sociology]]></article-title>
<source><![CDATA[Quality Quantity]]></source>
<year>2011</year>
</nlm-citation>
</ref>
<ref id="B56">
<label>56</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Berger]]></surname>
<given-names><![CDATA[JO]]></given-names>
</name>
<name>
<surname><![CDATA[Berry]]></surname>
<given-names><![CDATA[DA]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The relevance of stopping rules in statistical inference (con discusión)]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Gupta]]></surname>
<given-names><![CDATA[SS]]></given-names>
</name>
<name>
<surname><![CDATA[Berger]]></surname>
<given-names><![CDATA[JO]]></given-names>
</name>
</person-group>
<source><![CDATA[Statistical Decision Theory and Related Topics IV]]></source>
<year>1988</year>
<volume>1</volume>
<page-range>29-72</page-range><publisher-loc><![CDATA[Nueva York^eNY NY]]></publisher-loc>
<publisher-name><![CDATA[Springer]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B57">
<label>57</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lindley]]></surname>
<given-names><![CDATA[DV]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The analysis of experimental data: The appreciation of tea and wine]]></article-title>
<source><![CDATA[Teach Stat]]></source>
<year>1993</year>
<volume>15</volume>
<page-range>22-25</page-range></nlm-citation>
</ref>
<ref id="B58">
<label>58</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Armitage]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
<name>
<surname><![CDATA[McPherson]]></surname>
<given-names><![CDATA[CK]]></given-names>
</name>
<name>
<surname><![CDATA[Rowe]]></surname>
<given-names><![CDATA[BC]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Repeated significance tests on accumulating data]]></article-title>
<source><![CDATA[J R Stat Soc Ser A]]></source>
<year>1969</year>
<volume>132</volume>
<page-range>235-244</page-range></nlm-citation>
</ref>
<ref id="B59">
<label>59</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wald]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<source><![CDATA[Sequential analysis]]></source>
<year>1947</year>
<publisher-loc><![CDATA[Nueva York^eNY NY]]></publisher-loc>
<publisher-name><![CDATA[Wiley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B60">
<label>60</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Armitage]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<source><![CDATA[Sequential medical trials]]></source>
<year>1975</year>
<edition>2</edition>
<publisher-loc><![CDATA[Nueva York^eNY NY]]></publisher-loc>
<publisher-name><![CDATA[Wiley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B61">
<label>61</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pocock]]></surname>
<given-names><![CDATA[SJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Group sequential methods in the design and analysis of clinical trials]]></article-title>
<source><![CDATA[Biometrika]]></source>
<year>1977</year>
<volume>64</volume>
<page-range>191-199</page-range></nlm-citation>
</ref>
<ref id="B62">
<label>62</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fairbanks]]></surname>
<given-names><![CDATA[K]]></given-names>
</name>
<name>
<surname><![CDATA[Madsen]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[P values for tests using a repeated significance test design]]></article-title>
<source><![CDATA[Biometrika]]></source>
<year>1982</year>
<volume>69</volume>
<page-range>69-74</page-range></nlm-citation>
</ref>
<ref id="B63">
<label>63</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Whitehead]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<source><![CDATA[The design and analysis of sequential clinical trials]]></source>
<year>1997</year>
<edition>2</edition>
<publisher-loc><![CDATA[Chichester ]]></publisher-loc>
<publisher-name><![CDATA[Wiley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B64">
<label>64</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Goodman]]></surname>
<given-names><![CDATA[SN]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Stopping trials for efficacy: An almost unbiased view]]></article-title>
<source><![CDATA[Clin Trials]]></source>
<year>2009</year>
<volume>6</volume>
<page-range>133-135</page-range></nlm-citation>
</ref>
<ref id="B65">
<label>65</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jeffreys]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
</person-group>
<source><![CDATA[Theory of probability]]></source>
<year>1961</year>
<edition>3</edition>
<publisher-loc><![CDATA[Oxford ]]></publisher-loc>
<publisher-name><![CDATA[University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B66">
<label>66</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gardner]]></surname>
<given-names><![CDATA[MJ]]></given-names>
</name>
<name>
<surname><![CDATA[Altman]]></surname>
<given-names><![CDATA[DG]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Confidence intervals rather than P values: Estimation rather than hypothesis testing]]></article-title>
<source><![CDATA[Br Med J]]></source>
<year>1986</year>
<volume>292</volume>
<page-range>746-750</page-range></nlm-citation>
</ref>
<ref id="B67">
<label>67</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brandstätter]]></surname>
<given-names><![CDATA[E]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Confidence intervals as an alternative to significance testing]]></article-title>
<source><![CDATA[Methods Psychol Res Online]]></source>
<year>1999</year>
<volume>4</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>33-46</page-range></nlm-citation>
</ref>
<ref id="B68">
<label>68</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sterne]]></surname>
<given-names><![CDATA[JAC]]></given-names>
</name>
<name>
<surname><![CDATA[Smith]]></surname>
<given-names><![CDATA[GD]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Sifting the evidence-what's wrong with significance tests?]]></article-title>
<source><![CDATA[Br Med J]]></source>
<year>2001</year>
<volume>322</volume>
<page-range>226-231</page-range></nlm-citation>
</ref>
<ref id="B69">
<label>69</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ranstam]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Why the P-value culture is bad and confidence intervals a better alternative]]></article-title>
<source><![CDATA[Osteoarthritis Cartilage]]></source>
<year>2012</year>
<volume>20</volume>
<numero>8</numero>
<issue>8</issue>
<page-range>805-808</page-range></nlm-citation>
</ref>
<ref id="B70">
<label>70</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Howson]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Urbach]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Bayesian reasoning in science]]></article-title>
<source><![CDATA[Nature]]></source>
<year>1991</year>
<volume>350</volume>
<page-range>371-374</page-range></nlm-citation>
</ref>
<ref id="B71">
<label>71</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Feinstein]]></surname>
<given-names><![CDATA[AR]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[P-values and confidence intervals: Two sides of the same unsatisfactory coin]]></article-title>
<source><![CDATA[J Clin Epidemiol]]></source>
<year>1998</year>
<volume>52</volume>
<page-range>355-360</page-range></nlm-citation>
</ref>
<ref id="B72">
<label>72</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Thompson]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Statistical," "practical," and "clinical: How many kinds of significance do counselors need to consider?]]></article-title>
<source><![CDATA[J Couns Dev]]></source>
<year>2002</year>
<volume>80</volume>
<page-range>64-71</page-range></nlm-citation>
</ref>
<ref id="B73">
<label>73</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rosnow]]></surname>
<given-names><![CDATA[RL]]></given-names>
</name>
<name>
<surname><![CDATA[Rosenthal]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Effect size for experimenting psychologists]]></article-title>
<source><![CDATA[Can J Exp Psychol]]></source>
<year>2003</year>
<volume>57</volume>
<page-range>221-237</page-range></nlm-citation>
</ref>
<ref id="B74">
<label>74</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Vacha-Haase]]></surname>
<given-names><![CDATA[T]]></given-names>
</name>
<name>
<surname><![CDATA[Thompson]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[How to estimate and interpret various effect sizes]]></article-title>
<source><![CDATA[J Couns Psychol]]></source>
<year>2004</year>
<volume>51</volume>
<page-range>473-481</page-range></nlm-citation>
</ref>
<ref id="B75">
<label>75</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ferguson]]></surname>
<given-names><![CDATA[CJ]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An effect size primer: A guide for clinicians and researchers]]></article-title>
<source><![CDATA[Prof Psychol Res Pr]]></source>
<year>2009</year>
<volume>40</volume>
<page-range>532-538</page-range></nlm-citation>
</ref>
<ref id="B76">
<label>76</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Borenstein]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Effect sizes for continuous data]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Cooper]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Hedges]]></surname>
<given-names><![CDATA[LV]]></given-names>
</name>
<name>
<surname><![CDATA[Valentine]]></surname>
<given-names><![CDATA[JC]]></given-names>
</name>
</person-group>
<source><![CDATA[The Handbook of Research Synthesis and Meta-Analysis]]></source>
<year>2009</year>
<edition>2</edition>
<page-range>221-235</page-range><publisher-loc><![CDATA[Nueva York^eNY NY]]></publisher-loc>
<publisher-name><![CDATA[Russell Sage Foundation]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B77">
<label>77</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fleiss]]></surname>
<given-names><![CDATA[JV]]></given-names>
</name>
<name>
<surname><![CDATA[Berlin]]></surname>
<given-names><![CDATA[JA]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Effect sizes for dichotomous data]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Cooper]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[Hedges]]></surname>
<given-names><![CDATA[LV]]></given-names>
</name>
<name>
<surname><![CDATA[Valentine]]></surname>
<given-names><![CDATA[JC]]></given-names>
</name>
</person-group>
<source><![CDATA[The Handbook of Research Synthesis and Meta-Analysis]]></source>
<year>2009</year>
<edition>2</edition>
<page-range>237-253</page-range><publisher-loc><![CDATA[Nueva York^eNY NY]]></publisher-loc>
<publisher-name><![CDATA[Russell Sage Foundation]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B78">
<label>78</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cohen]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<source><![CDATA[Statistical power analysis for the behavioral sciences]]></source>
<year>1988</year>
<edition>2</edition>
<publisher-loc><![CDATA[Hillsdale^eNJ NJ]]></publisher-loc>
<publisher-name><![CDATA[Lawrence Erlbaum]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B79">
<label>79</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Glass]]></surname>
<given-names><![CDATA[GV]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Primary, secondary, and meta-analysis of research]]></article-title>
<source><![CDATA[Educ Res]]></source>
<year>1976</year>
<volume>5</volume>
<numero>10</numero>
<issue>10</issue>
<page-range>3-8</page-range></nlm-citation>
</ref>
<ref id="B80">
<label>80</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Peters]]></surname>
<given-names><![CDATA[CC]]></given-names>
</name>
<name>
<surname><![CDATA[Van Voorhis]]></surname>
<given-names><![CDATA[WR]]></given-names>
</name>
</person-group>
<source><![CDATA[Statistical procedures and their mathematical bases]]></source>
<year>1940</year>
<publisher-loc><![CDATA[Nueva York^eNY NY]]></publisher-loc>
<publisher-name><![CDATA[McGraw-Hill]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B81">
<label>81</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cramér]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
</person-group>
<source><![CDATA[Mathematical methods of statistics]]></source>
<year>1946</year>
<publisher-loc><![CDATA[Princeton^eNJ NJ]]></publisher-loc>
<publisher-name><![CDATA[University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B82">
<label>82</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hays]]></surname>
<given-names><![CDATA[WL]]></given-names>
</name>
</person-group>
<source><![CDATA[Statistics]]></source>
<year>1994</year>
<edition>5</edition>
<publisher-loc><![CDATA[Nueva York^eNY NY]]></publisher-loc>
<publisher-name><![CDATA[Harcourt Brace]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B83">
<label>83</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sistrom]]></surname>
<given-names><![CDATA[CL]]></given-names>
</name>
<name>
<surname><![CDATA[Garvan]]></surname>
<given-names><![CDATA[CW]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Proportions, odds, and risk]]></article-title>
<source><![CDATA[Radiology]]></source>
<year>2004</year>
<volume>230</volume>
<page-range>12-9</page-range></nlm-citation>
</ref>
<ref id="B84">
<label>84</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Thompson]]></surname>
<given-names><![CDATA[B]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[What future quantitative social science research could look like: Confidence intervals for effect sizes]]></article-title>
<source><![CDATA[Educ Res]]></source>
<year>2002</year>
<volume>13</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>25-32</page-range></nlm-citation>
</ref>
<ref id="B85">
<label>85</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Browner]]></surname>
<given-names><![CDATA[WS]]></given-names>
</name>
<name>
<surname><![CDATA[Newman]]></surname>
<given-names><![CDATA[TB]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Are all significant P values created equal: The analogy between diagnostic tests and clinical research]]></article-title>
<source><![CDATA[JAMA]]></source>
<year>1987</year>
<volume>257</volume>
<page-range>2459-2463</page-range></nlm-citation>
</ref>
<ref id="B86">
<label>86</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Trafimow]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="pt"><![CDATA[Hypothesis testing and theory evaluation at the boundaries: Surprising insights from Bayes''s theorem]]></article-title>
<source><![CDATA[Psychol Rev]]></source>
<year>2003</year>
<volume>110</volume>
<page-range>526-535</page-range></nlm-citation>
</ref>
<ref id="B87">
<label>87</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Goodman]]></surname>
<given-names><![CDATA[SN]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Toward evidence-based medical statistics: 2: The Bayes factor]]></article-title>
<source><![CDATA[Ann Intern Med]]></source>
<year>1999</year>
<volume>130</volume>
<page-range>1005-1013</page-range></nlm-citation>
</ref>
<ref id="B88">
<label>88</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gelman]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Carlin]]></surname>
<given-names><![CDATA[JB]]></given-names>
</name>
<name>
<surname><![CDATA[Stern]]></surname>
<given-names><![CDATA[HS]]></given-names>
</name>
</person-group>
<source><![CDATA[Bayesian data analysis]]></source>
<year>2004</year>
<edition>2</edition>
<publisher-loc><![CDATA[Londres ]]></publisher-loc>
<publisher-name><![CDATA[Chapman & Hall]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B89">
<label>89</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jaynes]]></surname>
<given-names><![CDATA[ET]]></given-names>
</name>
</person-group>
<source><![CDATA[Probability theory: The logic of science]]></source>
<year>2003</year>
<publisher-loc><![CDATA[Cambridge ]]></publisher-loc>
<publisher-name><![CDATA[University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B90">
<label>90</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bolstad]]></surname>
<given-names><![CDATA[WM]]></given-names>
</name>
</person-group>
<source><![CDATA[Introduction to Bayesian statistics]]></source>
<year>2007</year>
<edition>2</edition>
<publisher-loc><![CDATA[Hoboken^eNJ NJ]]></publisher-loc>
<publisher-name><![CDATA[John Wiley & Sons]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B91">
<label>91</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kass]]></surname>
<given-names><![CDATA[RE]]></given-names>
</name>
<name>
<surname><![CDATA[Wasserman]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The selection of prior distributions by formal rules]]></article-title>
<source><![CDATA[J Am Stat Assoc]]></source>
<year>1996</year>
<volume>91</volume>
<page-range>1343-1370</page-range></nlm-citation>
</ref>
<ref id="B92">
<label>92</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kass]]></surname>
<given-names><![CDATA[RE]]></given-names>
</name>
<name>
<surname><![CDATA[Raftery]]></surname>
<given-names><![CDATA[AE]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Bayes factors]]></article-title>
<source><![CDATA[J Am Stat Assoc]]></source>
<year>1995</year>
<volume>90</volume>
<page-range>773-795</page-range></nlm-citation>
</ref>
<ref id="B93">
<label>93</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Johnson]]></surname>
<given-names><![CDATA[VE]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Bayes factors based on test statistics]]></article-title>
<source><![CDATA[J R Stat Soc Series B Stat Methodol]]></source>
<year>2005</year>
<volume>67</volume>
<page-range>689-701</page-range></nlm-citation>
</ref>
<ref id="B94">
<label>94</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gelman]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Nolan]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<source><![CDATA[Teaching statistics: A bag of tricks]]></source>
<year>2002</year>
<publisher-loc><![CDATA[Nueva York^eNY NY]]></publisher-loc>
<publisher-name><![CDATA[Oxford University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B95">
<label>95</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Herman]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Notzer]]></surname>
<given-names><![CDATA[N]]></given-names>
</name>
<name>
<surname><![CDATA[Libman]]></surname>
<given-names><![CDATA[Z]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Statistical education for medical students-Concepts are what remain when the details are forgotten]]></article-title>
<source><![CDATA[Stat Med]]></source>
<year>2007</year>
<volume>26</volume>
<page-range>4344-4351</page-range></nlm-citation>
</ref>
<ref id="B96">
<label>96</label><nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Freeman]]></surname>
<given-names><![CDATA[JV]]></given-names>
</name>
<name>
<surname><![CDATA[Collier]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
<name>
<surname><![CDATA[Staniforth]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<source><![CDATA[Innovations in curriculum design: A multi-disciplinary approach to teaching statistics to undergraduate medical students]]></source>
<year>2008</year>
<page-range>8:28</page-range></nlm-citation>
</ref>
<ref id="B97">
<label>97</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gelman]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="de"><![CDATA[Teaching Bayes to graduate students in political science, sociology, public health, education, economics,: ... Am]]></article-title>
<source><![CDATA[Stat]]></source>
<year>2008</year>
<volume>62</volume>
<page-range>202-205</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
