<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>1665-2436</journal-id>
<journal-title><![CDATA[Revista latinoamericana de investigación en matemática educativa]]></journal-title>
<abbrev-journal-title><![CDATA[Relime]]></abbrev-journal-title>
<issn>1665-2436</issn>
<publisher>
<publisher-name><![CDATA[Comité Latinoamericano de Matemática Educativa A.C.]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S1665-24362013000200003</article-id>
<article-id pub-id-type="doi">10.12802/relime.13.1622</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Caracterización del razonamiento estadístico de estudiantes universitarios acerca de las pruebas de hipótesis]]></article-title>
<article-title xml:lang="en"><![CDATA[The characteristics of college students' statistical reasoning on hypothesis testing]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Inzunsa Cazares]]></surname>
<given-names><![CDATA[Santiago]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Jiménez Ramírez]]></surname>
<given-names><![CDATA[José Vidal]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Autónoma de Sinaloa.  ]]></institution>
<addr-line><![CDATA[México ]]></addr-line>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Autónoma de Sinaloa.  ]]></institution>
<addr-line><![CDATA[México ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>07</month>
<year>2013</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>07</month>
<year>2013</year>
</pub-date>
<volume>16</volume>
<numero>2</numero>
<fpage>179</fpage>
<lpage>211</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_arttext&amp;pid=S1665-24362013000200003&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&amp;pid=S1665-24362013000200003&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_pdf&amp;pid=S1665-24362013000200003&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[En este artículo se presentan resultados de una investigación sobre el aprendizaje de la inferencia estadística en estudiantes de la carrera de matemáticas, en particular sobre su nivel de razonamiento estadístico acerca de los conceptos y el proceso que involucran las pruebas de hipótesis. Los resultados se analizaron de acuerdo con el modelo taxonómico SOLO (Structure of Observed Learning Outcomes) y muestran que los estudiantes se ubican principalmente en los niveles preestructuraly uniestructural, es decir, que poseen información aislada de los diversos conceptos que intervienen en una prueba de hipótesis y/o toman en cuenta algún aspecto relevante del proceso pero sin lograr comprender lo que hacen; además, se observaron concepciones erróneas sobre la naturaleza de las pruebas de hipótesis y los principales conceptos involucrados como el nivel de significancia, valor de p y planteamiento de hipótesis.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[This article shows the results from a research on college students' statistical inference learning process from the major in mathematics. It was specially focused on the students' statistical reasoning on the concepts and processes that involved hypothesis testing. The results were analyzed based on the Structure of Observed Learning Outcomes (SOLO). They showed that students are primarly in the prestructural and unistructural level, which means that they have isolated information about the different concepts involved in hypothesis testing and/or that they take into consideration some relevant aspect of the process without having full awareness of what they are doing. Moreover, it was noticed that there are misguided conceptions on the nature of hypothesis testing and the main concepts involved such as the level of significance, value p and the formulation of the hypothesis.]]></p></abstract>
<abstract abstract-type="short" xml:lang="pt"><p><![CDATA[Neste artigo, apresentam-se resultados de uma pesquisa sobre a aprendizagem da inferência estatística em estudantes do curso de matemática, em particular sobre seu nível de raciocínio estatístico sobre os conceitos e o processo que envolve as provas de hipótese. Os resultados são analisados de acordo com o modelo taxonômico SOLO (Structure of Observed Learning Outcomes) e mostram que os estudantes estão localizados principalmente nos níveis pre-estrutural e uni-estrutural , ou seja, que possuem informação isolada dos diversos conceitos que intervêm em uma prova de hipótese e/ou têm em conta algum aspecto relevante do processo mas sem conseguir compreender o que fazem; além disso, foram observadas concepções errôneas sobre a natureza das provas de hipótese e os principais conceitos envolvidos como o nível de significância, valor p e abordagem hipotética.]]></p></abstract>
<abstract abstract-type="short" xml:lang="fr"><p><![CDATA[Dans cet article on présente les résultats d'une recherche sur l'apprentissage de l'inférence statistique des étudiants de la licence en mathématiques, plus en particulier, leur niveau de raisonnement statistique par rapport aux concepts et au processus des tests d'hypothèses. Les résultats ont été analysés avec le modéle taxonomique SOLO (Structure of Observed Learning Outcomes) et montrent que les étudiants se trouvent principalement aux niveaux pre-structural et uni-structural, c'est-à-dire, qu'ils possèdent information isolée des différents concepts des tests d'hypothèses ou son processus, mais ils n'arrivent pas à tout comprendre. On observe aussi que les étudiants ont des conceptions erronées sur la nature des tests d'hypothèses et sur les principaux concepts associés comme le rapport de vraisemblance, p-valeur et formulation d'hypothèses.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Razonamiento estadístico]]></kwd>
<kwd lng="es"><![CDATA[Inferencia estadística]]></kwd>
<kwd lng="es"><![CDATA[Pruebas de hipótesis]]></kwd>
<kwd lng="es"><![CDATA[Concepciones erróneas]]></kwd>
<kwd lng="es"><![CDATA[Estudiantes universitarios]]></kwd>
<kwd lng="en"><![CDATA[Statistical reasoning]]></kwd>
<kwd lng="en"><![CDATA[Statistical inference]]></kwd>
<kwd lng="en"><![CDATA[Hypothesis testing]]></kwd>
<kwd lng="en"><![CDATA[Misconceptions]]></kwd>
<kwd lng="en"><![CDATA[College students]]></kwd>
<kwd lng="pt"><![CDATA[Raciocínio estatístico]]></kwd>
<kwd lng="pt"><![CDATA[Inferência estatística]]></kwd>
<kwd lng="pt"><![CDATA[Provas de hipótese]]></kwd>
<kwd lng="pt"><![CDATA[Concepções errôneas]]></kwd>
<kwd lng="pt"><![CDATA[Estudantes universitários]]></kwd>
<kwd lng="fr"><![CDATA[Raisonnement statistique]]></kwd>
<kwd lng="fr"><![CDATA[Inférence statistique]]></kwd>
<kwd lng="fr"><![CDATA[Tests d'hypothèses]]></kwd>
<kwd lng="fr"><![CDATA[Conceptions erronées]]></kwd>
<kwd lng="fr"><![CDATA[Étudiants universitaires]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  	    <p align="justify"><font face="verdana" size="4">Art&iacute;culos</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="4"><b>Caracterizaci&oacute;n del razonamiento estad&iacute;stico de estudiantes universitarios acerca de las pruebas de hip&oacute;tesis</b></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="3"><b>The characteristics of college students' statistical reasoning on hypothesis testing</b></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="2"><b>Santiago Inzunsa Cazares*, Jos&eacute; Vidal Jim&eacute;nez Ram&iacute;rez**</b></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><i>* Universidad Aut&oacute;noma de Sinaloa, M&eacute;xico.</i> <a href="mailto:sinzunza@uas.edu.mx">sinzunza@uas.edu.mx</a></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><i>** Universidad Aut&oacute;noma de Sinaloa, M&eacute;xico.</i> <a href="mailto:vidaljr@uas.edu.mx">vidaljr@uas.edu.mx</a></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2">Recepci&oacute;n: Abril 5, 2011;    <br> 	Aceptaci&oacute;n: Febrero 13, 2013.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Resumen</b></font></p>  	    <p align="justify"><font face="verdana" size="2">En este art&iacute;culo se presentan resultados de una investigaci&oacute;n sobre el aprendizaje de la inferencia estad&iacute;stica en estudiantes de la carrera de matem&aacute;ticas, en particular sobre su nivel de razonamiento estad&iacute;stico acerca de los conceptos y el proceso que involucran las pruebas de hip&oacute;tesis. Los resultados se analizaron de acuerdo con el modelo taxon&oacute;mico SOLO (Structure of Observed Learning Outcomes) y muestran que los estudiantes se ubican principalmente en los niveles preestructuraly uniestructural, es decir, que poseen informaci&oacute;n aislada de los diversos conceptos que intervienen en una prueba de hip&oacute;tesis y/o toman en cuenta alg&uacute;n aspecto relevante del proceso pero sin lograr comprender lo que hacen; adem&aacute;s, se observaron concepciones err&oacute;neas sobre la naturaleza de las pruebas de hip&oacute;tesis y los principales conceptos involucrados como el nivel de significancia, valor de p y planteamiento de hip&oacute;tesis.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Palabras Clave:</b> Razonamiento estad&iacute;stico, Inferencia estad&iacute;stica, Pruebas de hip&oacute;tesis, Concepciones err&oacute;neas, Estudiantes universitarios.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Abstract</b></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">This article shows the results from a research on college students' statistical inference learning process from the major in mathematics. It was specially focused on the students' statistical reasoning on the concepts and processes that involved hypothesis testing. The results were analyzed based on the Structure of Observed Learning Outcomes (SOLO). They showed that students are primarly in the prestructural and unistructural level, which means that they have isolated information about the different concepts involved in hypothesis testing and/or that they take into consideration some relevant aspect of the process without having full awareness of what they are doing. Moreover, it was noticed that there are misguided conceptions on the nature of hypothesis testing and the main concepts involved such as the level of significance, value p and the formulation of the hypothesis.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Key Words:</b> Statistical reasoning, Statistical inference, Hypothesis testing, Misconceptions, College students.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Resumo</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Neste artigo, apresentam&#45;se resultados de uma pesquisa sobre a aprendizagem da infer&ecirc;ncia estat&iacute;stica em estudantes do curso de matem&aacute;tica, em particular sobre seu n&iacute;vel de racioc&iacute;nio estat&iacute;stico sobre os conceitos e o processo que envolve as provas de hip&oacute;tese. Os resultados s&atilde;o analisados de acordo com o modelo taxon&ocirc;mico SOLO (Structure of Observed Learning Outcomes) e mostram que os estudantes est&atilde;o localizados principalmente nos n&iacute;veis pre&#45;estrutural e uni&#45;estrutural , ou seja, que possuem informa&#231;&atilde;o isolada dos diversos conceitos que interv&ecirc;m em uma prova de hip&oacute;tese e/ou t&ecirc;m em conta algum aspecto relevante do processo mas sem conseguir compreender o que fazem; al&eacute;m disso, foram observadas concep&#231;&otilde;es err&ocirc;neas sobre a natureza das provas de hip&oacute;tese e os principais conceitos envolvidos como o n&iacute;vel de signific&acirc;ncia, valor p e abordagem hipot&eacute;tica.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Palavras Chave:</b> Racioc&iacute;nio estat&iacute;stico, Infer&ecirc;ncia estat&iacute;stica, Provas de hip&oacute;tese, Concep&#231;&otilde;es err&ocirc;neas, Estudantes universit&aacute;rios.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>R&eacute;sum&eacute;</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Dans cet article on pr&eacute;sente les r&eacute;sultats d'une recherche sur l'apprentissage de l'inf&eacute;rence statistique des &eacute;tudiants de la licence en math&eacute;matiques, plus en particulier, leur niveau de raisonnement statistique par rapport aux concepts et au processus des tests d'hypoth&egrave;ses. Les r&eacute;sultats ont &eacute;t&eacute; analys&eacute;s avec le mod&eacute;le taxonomique SOLO (Structure of Observed Learning Outcomes) et montrent que les &eacute;tudiants se trouvent principalement aux niveaux pre&#45;structural et uni&#45;structural, c'est&#45;&agrave;&#45;dire, qu'ils poss&egrave;dent information isol&eacute;e des diff&eacute;rents concepts des tests d'hypoth&egrave;ses ou son processus, mais ils n'arrivent pas &agrave; tout comprendre. On observe aussi que les &eacute;tudiants ont des conceptions erron&eacute;es sur la nature des tests d'hypoth&egrave;ses et sur les principaux concepts associ&eacute;s comme le rapport de vraisemblance, p&#45;valeur et formulation d'hypoth&egrave;ses.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Mots Cl&eacute;s:</b> Raisonnement statistique, Inf&eacute;rence statistique, Tests d'hypoth&egrave;ses, Conceptions erron&eacute;es, &Eacute;tudiants universitaires.</font></p>      ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>1. Planteamiento del problema</b></font></p>  	    <p align="justify"><font face="verdana" size="2"><b>1.1. <i>Introducci&oacute;n</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">En los &uacute;ltimos a&ntilde;os la estad&iacute;stica se ha convertido en una disciplina cient&iacute;fica que ocupa un lugar muy importante en el curr&iacute;culo de muchas carreras universitarias debido al papel que juega como herramienta metodol&oacute;gica para el estudio de diversos fen&oacute;menos y por el desarrollo del razonamiento y pensamiento estad&iacute;stico para interpretar adecuadamente informaci&oacute;n de diversos acontecimientos cotidianos, de las profesiones y de las ciencias. En particular, la inferencia estad&iacute;stica &#45;campo al que corresponde el tema de esta investigaci&oacute;n&#45;, constituye una de las &aacute;reas de mayor utilidad de la estad&iacute;stica, ya que mediante la utilizaci&oacute;n de sus m&eacute;todos, se pueden obtener conclusiones acerca de una poblaci&oacute;n con base en la informaci&oacute;n que proporcionan los datos de una muestra.</font></p>  	    <p align="justify"><font face="verdana" size="2">Los principales m&eacute;todos de inferencia estad&iacute;stica son la <i>estimaci&oacute;n de par&aacute;metros</i> y las <i>pruebas de hip&oacute;tesis</i> (tambi&eacute;n llamadas <i>contraste de hip&oacute;tesis</i> o <i>pruebas de significancia).</i> La estimaci&oacute;n de par&aacute;metros puede ser <i>puntual</i> o mediante <i>intervalos de confianza,</i> en ambos casos se tiene como prop&oacute;sito estimar el valor de un par&aacute;metro desconocido de una poblaci&oacute;n (por ejemplo la media o el coeficiente de correlaci&oacute;n) a partir de los datos de una muestra. En una estimaci&oacute;n puntual se proporciona un valor &uacute;nico como estimaci&oacute;n del par&aacute;metro, mientras que en una estimaci&oacute;n por intervalo de confianza se establece un intervalo aleatorio y un nivel de confianza 1&#45; <i>a</i> que mide la probabilidad de contener al par&aacute;metro. Por su parte, una prueba de hip&oacute;tesis, es un m&eacute;todo que permite verificar una aseveraci&oacute;n acerca del valor de un par&aacute;metro poblacional; dado que los datos son proporcionados por una muestra, los resultados pueden estar sujetos a variaciones aleatorias, por lo que una prueba de hip&oacute;tesis permite decidir si peque&ntilde;as desviaciones observadas respecto al resultado que idealmente deber&iacute;a haber ocurrido seg&uacute;n nuestra hip&oacute;tesis, son atribuibles al azar o efectivamente los resultados no se corresponden con la hip&oacute;tesis que se ha planteado sobre el valor del par&aacute;metro. Por otra parte, la sociedad actual requiere ciudadanos estad&iacute;sticamente cultos que puedan comprender argumentos estad&iacute;sticos de moderada complejidad y comprender conceptos y vocabulario estad&iacute;stico sobre las pruebas de hip&oacute;tesis que les permitan interpretar adecuadamente resultados de diversos estudios (McLean, 2002). En este mismo sentido, Garfield y Ben&#45;Zvi (2008) se&ntilde;alan: "hacer inferencias a partir de los datos es ahora parte de la vida cotidiana y la revisi&oacute;n cr&iacute;tica de los resultados de inferencia estad&iacute;stica a partir de estudios de investigaci&oacute;n es una capacidad importante para todos los adultos" (p. 262).</font></p>  	    <p align="justify"><font face="verdana" size="2">Sin embargo, la experiencia de muchos profesores y resultados de investigaci&oacute;n (Liu &amp; Thompson, 2005; Vallecillos, 1997; Williams, 1998; Good &amp; Hardin, 2009; Cumming, 2010; Ya&ntilde;ez &amp; Behar, 2010; Grings &amp; Viali, 2011) muestran que la comprensi&oacute;n de la l&oacute;gica que subyace a los m&eacute;todos de inferencia estad&iacute;stica y la interpretaci&oacute;n de sus resultados es compleja para muchos estudiantes y profesores, incluso para profesionales que aplican la estad&iacute;stica en su desempe&ntilde;o profesional. Entre las causas que se ofrecen como explicaci&oacute;n de tal dificultad est&aacute; la diversidad de conceptos abstractos que intervienen para realizar una inferencia (Chance, del Mas &amp; Garfield, 2004; Lipson, 2002), as&iacute; como el enfoque formal deductivo a trav&eacute;s del cual es abordada su ense&ntilde;anza (Moore, 1992; Lipson, 2000). En particular, en el caso de las pruebas de hip&oacute;tesis se requiere comprender la integraci&oacute;n y la relaci&oacute;n que guardan entre s&iacute; en el proceso de prueba conceptos como poblaci&oacute;n, muestra, estad&iacute;stico de prueba, distribuci&oacute;n muestral del estad&iacute;stico de prueba, nivel de significancia, hip&oacute;tesis nula, hip&oacute;tesis alternativa, valor de p, regiones de rechazo y regiones de no rechazo, entre otros.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>1.2. <i>Origen y controversias sobre las pruebas de hip&oacute;tesis</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">Los elementos l&oacute;gicos que dieron origen a las pruebas de hip&oacute;tesis fueron presentados en art&iacute;culos cient&iacute;ficos a principios del siglo XVIII (Stigler, 1986). Sin embargo, formalmente las pruebas de hip&oacute;tesis surgen en las d&eacute;cadas de 1920 y 1930 como resultado del trabajo de dos grupos o escuelas de pensamiento: por un lado, Ronald Fisher (1890&#45;1962), y por el otro, Jerzy Neyman (1894&#45;1981) y Egon Pearson (1895&#45;1980). Los enfoques conceptuales sobre el significado y desarrollo de las pruebas de hip&oacute;tesis en los cuales se basaron estos dos grupos de investigaci&oacute;n parten de posiciones filos&oacute;ficas distintas, por lo que la historia de las pruebas de hip&oacute;tesis no ha estado exenta de controversias y desacuerdos desde su origen, factor que ha conducido a diversas dificultades para su aplicaci&oacute;n e interpretaci&oacute;n (Levin, 1998; Kirk, 2001).</font></p>  	    <p align="justify"><font face="verdana" size="2">De acuerdo con Kline (2004), el enfoque de Fisher se caracteriza por definir &uacute;nicamente una hip&oacute;tesis (hip&oacute;tesis nula) y a partir de la ella y con base en la distribuci&oacute;n muestral del estad&iacute;stico de prueba, se estima la probabilidad de una muestra de datos para decidir sobre el rechazo o no rechazo de la hip&oacute;tesis. Los datos solo permiten rechazar la hip&oacute;tesis pero no pueden confirmarla. El enfoque de Neyman&#45;Pearson se caracteriza por la adici&oacute;n de una hip&oacute;tesis alternativa en contraposici&oacute;n con la hip&oacute;tesis nula, lo que conduce a la definici&oacute;n de regiones (de rechazo y no rechazo) y errores asociados a la decisi&oacute;n sobre <i>H<sub>0</sub></i> denominados errores Tipo I y Tipo II. En este sentido, en el enfoque de Neyman&#45;Pearson una prueba de hip&oacute;tesis es una regla de comportamiento inductivo que permite elegir entre una hip&oacute;tesis nula y una hip&oacute;tesis alternativa. La evidencia de los datos obtenidos puede conducir a no rechazar la hip&oacute;tesis nula, lo cual no implica que &eacute;sta sea cierta (Vallecillos, 1996). Al respecto, Batanero (2000) considera que la principal diferencia entre estas dos teor&iacute;as no radica en los c&aacute;lculos, sino en las concepciones y el razonamiento subyacente.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Sin embargo, la integraci&oacute;n de los dos modelos por parte de estad&iacute;sticos, investigadores y autores de libros de texto se hizo pr&aacute;ctica com&uacute;n desde 1935 (Huberty, 1993). Es decir, al aplicar las pruebas de hip&oacute;tesis com&uacute;nmente se utilizan elementos de los dos enfoques de forma ecl&eacute;ctica; Gigerenzer (1993) se refiere a este modelo integrado como <i>l&oacute;gica h&iacute;brida de la inferencia estad&iacute;stica.</i> Esta l&oacute;gica h&iacute;brida en la aplicaci&oacute;n de las pruebas de hip&oacute;tesis ha sido una de las fuentes de controversias y cr&iacute;ticas desde su surgimiento hasta nuestros d&iacute;as (Carver, 1978; McLean &amp; Ernest, 1998; Morrison &amp; Henkel, 1970; Levin, 1998; Triola, 2009). Entre las cr&iacute;ticas que se hacen a las pruebas de hip&oacute;tesis se encuentra el hecho que no reportan mayor informaci&oacute;n que la significancia estad&iacute;stica, la cual puede ser insuficiente para tomar una decisi&oacute;n sobre los efectos de una variable o tratamiento en una investigaci&oacute;n.</font></p>  	    <p align="justify"><font face="verdana" size="2">En tanto las pruebas de hip&oacute;tesis han constituido uno de los principales m&eacute;todos estad&iacute;sticos para el an&aacute;lisis de datos utilizados en las ciencias experimentales y de la conducta, en los a&ntilde;os recientes se ha generado un debate entre investigadores y organizaciones como la Asociaci&oacute;n Americana de Psicolog&iacute;a (APA por sus siglas en ingl&eacute;s) para discutir si las cr&iacute;ticas sobre las pruebas de hip&oacute;tesis tienen el suficiente m&eacute;rito, y de ser as&iacute;, buscar alternativas adicionales que las complementen al ser utilizadas en la investigaci&oacute;n. En este contexto, la APA realiz&oacute; en 1999 un reporte de investigaci&oacute;n titulado <i>Task Force on Statistical Inference</i> (TFSI por sus siglas en ingl&eacute;s) en el cual, entre otros aspectos, se concluye que debe haber cambios en las formas de presentar los resultados para publicarlos en las revistas de investigaci&oacute;n. En general, tanto el reporte TSFI como investigadores (Mittag &amp; Thompson, 2000; Xitao, 2001; Robinson &amp; Levin, 1997) recomiendan complementar las pruebas de hip&oacute;te sis con el reporte de tama&ntilde;o de los efectos y c&aacute;lculo de intervalos de confianza. Estas recomendaciones se encuentran incorporadas en la quinta edici&oacute;n del Manual de Publicaciones de la Asociaci&oacute;n Americana de Psicolog&iacute;a<sup><a href="#nota">1</a></sup> y de igual forma est&aacute;n siendo requeridas en revistas de investigaci&oacute;n de otras disciplinas.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>1.3. <i>Fundamentos y conceptos de las pruebas de hip&oacute;tesis</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">Las pruebas de hip&oacute;tesis involucran diversos conceptos y t&eacute;rminos que son necesarios comprender para su correcta aplicaci&oacute;n e interpretaci&oacute;n. Nos parece muy ilustrativo el mapa conceptual elaborado  por Lipson (2000), donde se muestran los conceptos que intervienen en una prueba de hip&oacute;tesis y la forma como estos se relacionan, desde una perspectiva h&iacute;brida de los enfoques de Fisher y Neyman&#45;Pearson (ver <a href="/img/revistas/relime/v16n2/a3f1.jpg" target="_blank">Figura 1</a>).</font></p>  	    <p align="justify"><font face="verdana" size="2">Para comprender la l&oacute;gica que subyace a las pruebas de hip&oacute;tesis estad&iacute;sticas es importante partir del concepto de hip&oacute;tesis de investigaci&oacute;n. Una hip&oacute;tesis de investigaci&oacute;n es un enunciado que establece un investigador en el cual se ofrece una posible respuesta a una pregunta de investigaci&oacute;n. Por ejemplo, un investigador educativo puede plantear la siguiente hip&oacute;tesis: el uso de software educativo con representaciones din&aacute;micas de los datos (simb&oacute;licas, gr&aacute;ficas, num&eacute;ricas) acompa&ntilde;ado del uso de datos reales, facilita la exploraci&oacute;n y contribuye a una mejor comprensi&oacute;n del an&aacute;lisis descriptivo de datos. Dicho enunciado como tal tiene dos valores de "verdad": verdadero o falso. En este sentido, la investigaci&oacute;n se realiza para determinar el valor de verdad que corresponde a la hip&oacute;tesis de investigaci&oacute;n; es decir, se realiza un estudio para obtener los datos que contengan la informaci&oacute;n necesaria para dar respuesta a la pregunta de investigaci&oacute;n y decidir si la hip&oacute;tesis de investigaci&oacute;n se rechaza o no (Monterrey &amp; G&oacute;mez&#45;Restrepo, 2007).</font></p>  	    <p align="justify"><font face="verdana" size="2">Por su parte, las hip&oacute;tesis estad&iacute;sticas son afirmaciones acerca de los par&aacute;metros, por lo que para probar la validez de una hip&oacute;tesis de investigaci&oacute;n es necesario plantearla en t&eacute;rmino de hip&oacute;tesis estad&iacute;sticas. De esta manera y teniendo en cuenta el ejemplo del software educativo mencionado anteriormente, consideremos que se selecciona una muestra de estudiantes a partir de la cual se forman dos grupos en forma aleatoria con condiciones iguales en todas las variables sobre el conocimiento del tema para evitar que los resultados puedan deberse a otros factores que no son de inter&eacute;s; uno toma la clase de an&aacute;lisis descriptivo de datos de forma tradicional (grupo control) y otro que toma la clase usando el software educativo (grupo experimental). Al final del curso se aplica un mismo cuestionario para determinar los puntajes promedio de cada grupo. La decisi&oacute;n involucra el planteamiento de hip&oacute;tesis sobre los puntajes promedio de ambas poblaciones te&oacute;ricas de estudiantes (los que recibieron la ense&ntilde;anza tradicional y los que recibieron la ense&ntilde;anza con software educativo).</font></p>  	    <p align="justify"><font face="verdana" size="2">En el enfoque de Fisher se plantea una sola hip&oacute;tesis estad&iacute;stica (hip&oacute;tesis nula), que suele ser expresada en t&eacute;rminos de no diferencia; para nuestro ejemplo podemos partir de que el aprendizaje con los dos m&eacute;todos de ense&ntilde;anza es igual de efectivo, lo que nos conduce a la siguiente hip&oacute;tesis nula <i>&#956;<sub>s</sub></i> = <i>&#956;<sub>t</sub> ;</i> es decir, de ser cierta la hip&oacute;tesis, no debe haber diferencia entre los puntajes promedio en el cuestionario de ambas poblaciones de estudiantes, s&oacute;lo la que pudiera deberse a la aleatoriedad del muestreo. Si el investigador encuentra una diferencia positiva entre los puntajes promedio de los dos grupos, esto es, <i>&#956;<sub>s</sub></i> = <i>&#956;<sub>t</sub></i> &gt; 0, es un resultado que apoya su hip&oacute;tesis de investigaci&oacute;n. En el caso que la diferencia sea negativa, es decir, <i>&#956;<sub>s</sub></i> = <i>&#956;<sub>t</sub></i> &lt; 0, el resultado contradice la hip&oacute;tesis nula. La decisi&oacute;n depende del resultado del valor de p, que nos informa la probabilidad que tienen los datos de la muestra de acuerdo con la distribuci&oacute;n muestral del estad&iacute;stico de prueba, misma que es determinada bajo el supuesto de que la hip&oacute;tesis nula es cierta. De esta manera, valores muy peque&ntilde;os del valor de p representan una evidencia fuerte contra la hip&oacute;tesis nula pues significan que los datos obtenidos son muy improbables, por lo que se rechaza &eacute;sta hip&oacute;tesis ante la falta de evidencia experimental. Los l&iacute;mites m&aacute;s comunes para rechazar la hip&oacute;tesis nula, popularizados por el mismo Fisher, son valores menores de 0.05 y menores que 0.01. Sin embargo, la elecci&oacute;n de estos valores depende de las caracter&iacute;sticas del problema y de la magnitud del error que desea asumir el investigador.</font></p>  	    <p align="justify"><font face="verdana" size="2">Por su parte, en el enfoque de Neyman&#45;Pearson, las pruebas de hip&oacute;tesis se planten como un proceso de decisi&oacute;n entre dos hip&oacute;tesis. En &eacute;l se consideran una hip&oacute;tesis alternativa <i>(H<sub>1</sub>)</i> que es la negaci&oacute;n o complemento de la hip&oacute;tesis nula (H<sub>o</sub>). Se definen regiones de rechazo y no rechazo sobre la distribuci&oacute;n muestral del estad&iacute;stico de prueba y los siguientes tipos de errores que se pueden cometer:</font></p>  	    <blockquote> 		    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">1. Error tipo 1: Rechazar <i>H<sub>o</sub></i> dado que <i>H<sub>o</sub></i> es cierta. Su probabilidad se denota por <i>a,</i> m&aacute;s formalmente <i>P (rechazar H<sub>o</sub>&#124;H<sub>o</sub></i> es cierta) = &#945;, tambi&eacute;n se conoce como <i>nivel de significancia.</i></font></p>  		    <p align="justify"><font face="verdana" size="2">2. Error tipo 2: No rechazar H<sub>o</sub> dado que H<sub>o</sub> es falsa. Su probabilidad se denota por <i>&#946;</i>, esto es <i>P (no rechazar H<sub>o</sub></i>&#124;H<sub>o</sub> es falsa) = <i>&#946;</i>.</font></p> 	</blockquote>  	    <p align="justify"><font face="verdana" size="2">El nivel de significancia se fija previo a la prueba y permite a su vez delimitar las regiones de rechazo y no rechazo de la hip&oacute;tesis nula. Si el valor del estad&iacute;stico de prueba cae en la regi&oacute;n de rechazo, la hip&oacute;tesis nula es rechazada; en caso contrario, la hip&oacute;tesis nula no es rechazada. En el contexto del problema del software educativo para el an&aacute;lisis de datos, las hip&oacute;tesis podr&iacute;an quedar de la siguiente forma:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3fo.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Sin embargo, como se&ntilde;alamos anteriormente, es com&uacute;n que investigadores y autores de libros de texto utilicen una l&oacute;gica h&iacute;brida de los enfoques de Fisher y Neyman&#45;Pearson en el proceso de una prueba de hip&oacute;tesis, y usualmente se compara el valor de p con el nivel de significancia <i>a</i> para decidir sobre el rechazo de la hip&oacute;tesis nula. Para asegurar que se cumpla con el nivel m&aacute;ximo de error tipo I definido por el nivel de significancia, el criterio consiste en que si <i>p</i> &lt; <i>&#945;</i> se rechaza la hip&oacute;tesis nula. De esta manera se mezclan los enfoques de Fisher y Neyman&#45;Pearson al comparar el valor de p que es un c&aacute;lculo <i>a posteriori</i> y distintivo del enfoque de Fisher, con el valor de <i>a</i> que es un valor definido <i>a priori</i> distintivo del enfoque de Neyman&#45;Pearson.</font></p>  	    <p align="justify"><font face="verdana" size="2">Para ejemplificar lo anterior, en la <a href="/img/revistas/relime/v16n2/a3f2.jpg" target="_blank">Figura 2</a> se muestra una distribuci&oacute;n muestral del estad&iacute;stico de prueba<sup><a href="#nota">2</a></sup> para ciertos datos, la cual ilustra la regi&oacute;n de rechazo y no rechazo de una prueba de hip&oacute;tesis de cola derecha.</font></p>  	    <p align="justify"><font face="verdana" size="2">El valor Z<sub>0.95</sub> = 1.645 que corresponde a un &#945; = 0.05 representa el cuantil que define el l&iacute;mite de ambas regiones y para los datos del programa que se representan en dicha disiribuci&oacute;n se tiene un valor calculado del <i>estad&iacute;stico de poueba</i> z =3.26 el cual cae en la regi&oacute;n de rechazo de la hip&oacute;tesis nula. Es decir, la muestra que se ha seleccionado ha producido un estad&iacute;stico que tiene una peque&ntilde;a probabilidad de ocurrir (p = 0.00064) partiendo de que es cierta la hip&oacute;tesis nula, y es precisamente por ello que se le rechaza.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><i><b>1.3. Algunos resultados de investigaci&oacute;n sobre concepciones err&oacute;neas en las pruebas de hip&oacute;tesis</b></i></font></p>  	    <p align="justify"><font face="verdana" size="2">Los problemas de la ense&ntilde;anza y aprendizaje de la inferencia estad&iacute;stica, particularmente de las pruebas de hip&oacute;tesis, han sido poco estudiados hasta ahora por la investigaci&oacute;n educativa, no obstante la complejidad y la importancia que representan en los cursos de estad&iacute;stica universitarios y en la aplicaci&oacute;n en diversas disciplinas cient&iacute;ficas. Castro Sotos, Vanhoof, Van den Noortgate y Onghena (2007) realizaron una investigaci&oacute;n minuciosa en importantes fuentes bibliogr&aacute;ficas para conocer las principales dificultades y concepciones err&oacute;neas que tienen los estudiantes universitarios sobre los conceptos de inferencia estad&iacute;stica. En dicha investigaci&oacute;n encontraron s&oacute;lo diecisiete estudios que proporcionaban evidencia emp&iacute;rica en un total de m&aacute;s de 500 art&iacute;culos que fueron publicados sobre el tema en el per&iacute;odo de 1990 a 2006. Dichos autores concluyen que muchas de las concepciones err&oacute;neas sobre las pruebas de hip&oacute;tesis son derivadas de los libros de texto y que los profesores, incluso algunos estad&iacute;sticos, comparten las mismas concepciones err&oacute;neas de estudiantes. En la <a href="#t1">Tabla I</a> se muestran las concepciones identificadas por dichos autores acerca de los conceptos que intervienen en el proceso de una prueba de hip&oacute;tesis.</font></p>  	    ]]></body>
<body><![CDATA[<p align="center"><font face="verdana" size="2"><a name="t1" id="t1"></a></font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3t1.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">En resumen, las principales concepciones err&oacute;neas asociadas al aprendizaje y uso de las pruebas de hip&oacute;tesis derivadas de la investigaci&oacute;n de Castro Sotos y otros (2007), en general son atribuidas a dos aspectos fundamentalmente: la filosof&iacute;a que subyace a las pruebas derivadas del manejo h&iacute;brido de los enfoques de Fisher y Neyman&#45;Pearson y a la interpretaci&oacute;n de conceptos y resultados.</font></p>  	    <p align="justify"><font face="verdana" size="2">Con base en lo anterior, en el presente trabajo se plantea investigar sobre la caracterizaci&oacute;n y nivel de razonamiento estad&iacute;stico que estudiantes universitarios de matem&aacute;ticas han alcanzado sobre las pruebas de hip&oacute;tesis despu&eacute;s de tomar un curso de inferencia estad&iacute;stica. En particular, la pregunta que gu&iacute;a esta investigaci&oacute;n es: &iquest;cu&aacute;l es el nivel de desarrollo y c&oacute;mo se caracteriza el razonamiento estad&iacute;stico de estudiantes universitarios de matem&aacute;ticas acerca de las pruebas de hip&oacute;tesis estad&iacute;sticas?</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>2. Marco te&oacute;rico</b></font></p>  	    <p align="justify"><font face="verdana" size="2"><b>2.1. <i>Significado de razonamiento estad&iacute;stico</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">El razonamiento y el pensamiento estad&iacute;stico son procesos a los que en a&ntilde;os recientes se les ha prestado mucha atenci&oacute;n por parte de los investigadores en educaci&oacute;n estad&iacute;stica. En particular, Garfield (2002) se&ntilde;ala que el razonamiento estad&iacute;stico puede ser definido como la manera en la cual las personas razonan con ideas estad&iacute;sticas y el sentido que le dan a la informaci&oacute;n estad&iacute;stica, lo cual implica hacer interpretaciones basadas en conjuntos de datos y sus representaciones; incluso el razonamiento estad&iacute;stico puede implicar conectar un concepto con otro y combinar ideas sobre datos y azar; en suma, razonar estad&iacute;sticamente significa entender y explicar los procesos estad&iacute;sticos e interpretar completamente los resultados estad&iacute;sticos. De esta manera, el razonamiento estad&iacute;stico acerca de las pruebas de hip&oacute;tesis implica comprender que la muestra que aporta la evidencia para probar la hip&oacute;tesis del valor previamente definido de un par&aacute;metro de la poblaci&oacute;n, es solo una del conjunto de posibles muestras que pueden ser extra&iacute;das de una poblaci&oacute;n, y que por lo tanto, existe el riesgo de cometer errores con cualquiera de las dos decisiones que se tomen (rechazo o no rechazo de la hip&oacute;tesis nula). En el proceso de prueba, los estudiantes deben de ser conscientes de la importancia de conocer la distribuci&oacute;n muestral del estad&iacute;stico de prueba y la definici&oacute;n de un criterio a partir del cual se decide el rechazo o no rechazo de la hip&oacute;tesis nula.</font></p>  	    <p align="justify"><font face="verdana" size="2">Para evaluar y caracterizar el razonamiento estad&iacute;stico acerca de un concepto o grupo de conceptos se pueden definir categor&iacute;as que delimitan particularidades de dicho razonamiento, los cuales a su vez permiten clasificar por niveles a los sujetos que desarrollan cierta tarea o resuelven un problema estad&iacute;stico. En este contexto, el modelo taxon&oacute;mico SOLO <i>(Structure of Observed Learning Outcomes)</i> desarrollado por Biggs y Collis (1982) ha sido utilizado para definir categor&iacute;as de desarrollo cognitivo de diversos conceptos estad&iacute;sticos (por ejemplo Pfannkuch, 2005; Vizcarra &amp; Inzunsa, 2009; Reading &amp; Reid, 2006). En el modelo SOLO los conceptos y procesos utilizados por los sujetos al dar respuesta a las preguntas o tareas planteadas se pueden clasificar en un determinado nivel de los cinco niveles que se contemplan. En la segunda columna de la <a href="#t2">Tabla II</a> se describe cada nivel del modelo en forma gen&eacute;rica, mientras que en la tercera columna describimos el modelo adaptado para el caso de las pruebas de hip&oacute;tesis.</font></p>  	    <p align="center"><font face="verdana" size="2"><a name="t2" id="t2"></a></font></p>  	    ]]></body>
<body><![CDATA[<p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3t2.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>3. Metodolog&iacute;a</b></font></p>  	    <p align="justify"><font face="verdana" size="2"><b>3.1. <i>Sujetos de estudio y escenario de la investigaci&oacute;n</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">Los sujetos de estudio que participaron en la investigaci&oacute;n fueron once estudiantes voluntarios del &uacute;ltimo grado de la Licenciatura en Matem&aacute;ticas en la Universidad Aut&oacute;noma de Sinaloa que tomaron como parte de su formaci&oacute;n un curso de estad&iacute;stica matem&aacute;tica que conten&iacute;a el tema de las pruebas de hip&oacute;tesis. El investigador verific&oacute; con el profesor que imparte la materia que todos los estudiantes hubiesen tomado el curso completo y que los conceptos y aspectos a evaluar en el estudio sobre las pruebas de hip&oacute;tesis hab&iacute;an hubiesen sido cubiertos.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>3.2. <i>Instrumentos de recolecci&oacute;n y an&aacute;lisis de los datos</i></b></font></p>  	    <p align="justify"><font face="verdana" size="2">Se dise&ntilde;&oacute; un cuestionario para evaluar el razonamiento estad&iacute;stico con &iacute;tems tomados de otras investigaciones sobre el tema y de libros de texto (ver <a href="/img/revistas/relime/v16n2/html/a2anexo.html" target="_blank">Anexo 1</a>). El an&aacute;lisis de los datos ha sido b&aacute;sicamente cualitativo, para lo cual cada &iacute;tem requer&iacute;a una justificaci&oacute;n de la respuesta. No todos los &iacute;tems fueron dise&ntilde;ados para contemplar los cinco niveles del modelo SOLO y ning&uacute;n &iacute;tem fue dise&ntilde;ado para el nivel abstracto extendido. Con base en el an&aacute;lisis de las respuestas y la actividad matem&aacute;tica desarrollada por los estudiantes se ubic&oacute; a cada uno de ellos en alguno de los niveles del modelo SOLO que fueron considerados. La <a href="#t3">Tabla III</a> muestra el nivel m&aacute;ximo esperado de cada &iacute;tem y los porcentajes de estudiantes ubicados en cada nivel de acuerdo con la descripci&oacute;n que se hace en la <a href="#t2">Tabla II</a>. Los conceptos que se evaluaron fueron: l&oacute;gica global del proceso de prueba de hip&oacute;tesis, definici&oacute;n de nivel de significaci&oacute;n, formulaci&oacute;n de hip&oacute;tesis, relaci&oacute;n del valor de p con el tama&ntilde;o de muestra y significancia estad&iacute;stica, procesos de prueba en contexto de una distribuci&oacute;n <i>t</i> de Student y muestras con datos apareados.</font></p> 	    <p align="center"><font face="verdana" size="2"><a name="t3"></a></font></p>         <p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3t3.jpg"></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>4. Resultados y discusi&oacute;n</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Los resultados obtenidos del an&aacute;lisis de los cuestionarios teniendo en cuenta la descripci&oacute;n de los niveles del modelo SOLO para el caso del razonamiento con pruebas de hip&oacute;tesis se muestran en la <a href="#t3">Tabla III</a>. Posteriormente se hace un an&aacute;lisis de respuestas que proporcionaron algunos estudiantes para algunos &iacute;tems, con el prop&oacute;sito de mostrar la comprensi&oacute;n o dificultades que tuvieron en su razonamiento.</font></p>     <p align="justify"><font face="verdana" size="2">El an&aacute;lisis de la <a href="#t3">Tabla III</a> nos muestra que un alto porcentaje de estudiantes (del 45 al 82%, seg&uacute;n el &iacute;tem) se encuentran en el nivel m&aacute;s bajo de razonamiento estad&iacute;stico (nivel preestructural), en un grupo de &iacute;tems que evaluaban conceptos como nivel de significancia, valor de p y su relaci&oacute;n con el tama&ntilde;o de muestra, significado de una prueba de hip&oacute;tesis e interpretaci&oacute;n de resultados de una prueba de hip&oacute;tesis. De este grupo de &iacute;tems, los &iacute;tems 1, 2 y 3 ten&iacute;an como nivel m&aacute;ximo el nivel uniestructural mientras que los &iacute;tems 6, 7 y 9 el nivel multiestructural. En el otro grupo de &iacute;tems (4, 5, 8 y 10) que evaluaban conceptos como efecto del tama&ntilde;o de muestra en el valor de p, elecci&oacute;n adecuada del proceso de prueba con datos apareados e identificaci&oacute;n y proceso que involucra una prueba <i>t</i> de Student, el porcentaje de estudiantes que se ubicaron en el nivel preestructural fue del 9 al 27%, lo que significa que tuvieron una ligera mejor&iacute;a en el nivel de razonamiento estad&iacute;stico en estos conceptos respecto a los del primer grupo de &iacute;tems. En este grupo de &iacute;tems, los &iacute;tems 4 y 5 ten&iacute;an como nivel m&aacute;ximo el nivel uniestructural, el &iacute;tem 8 el nivel multiestructural y el &iacute;tem 10 el nivel relacional.</font></p>  	    <p align="justify"><font face="verdana" size="2">En la misma <a href="#t3">Tabla III</a> se observa que en el primer grupo de &iacute;tems (1, 2, 3, 6, 7 y 9) se ubicaron del 9 al 36% de los estudiantes en el segundo nivel de razonamiento (nivel uniestructural), mientras que en el segundo grupo de &iacute;tems (4, 5, 8 y 10) se ubicaron del 60 al 90% de los estudiantes. En los &iacute;tems que fueron dise&ntilde;ados para mayores niveles de razonamiento (6, 7, 8, 9 y 10) se ubicaron muy pocos estudiantes en los niveles multiestructural y relacional. Es importante se&ntilde;alar que en los &iacute;tems 3, 4 y 5 se ubicaron del 54 al 72% de estudiantes en el nivel uniestructural, nivel m&aacute;ximo evaluado para estos &iacute;tems, por lo que fueron los &iacute;tems relativos a los conceptos de formulaci&oacute;n de hip&oacute;tesis y relaci&oacute;n de valor de p con la significancia estad&iacute;stica los que tuvieron mejor desempe&ntilde;o.</font></p>  	    <p align="justify"><font face="verdana" size="2">Esto significa que, de acuerdo al modelo, los estudiantes que se ubicaron en el nivel preestructural poseen informaci&oacute;n aislada de los conceptos que intervienen en una prueba de hip&oacute;tesis, cometen errores en el planteamiento, tienen dificultades para realizar el procedimiento de prueba y no interpretan correctamente resultados de pruebas realizadas mediante un software. No se tiene clara la diferencia entre una prueba matem&aacute;tica y una prueba de hip&oacute;tesis, ni se comprenden conceptos de suma importancia como el nivel de significancia y el valor de p. Los estudiantes que se ubicaron en el nivel uniestructural se enfocaron en alg&uacute;n aspecto relevante de las pruebas de hip&oacute;tesis y son capaces de realizar conexiones sencillas entre conceptos y procesos simples de c&aacute;lculo. Por ejemplo, pueden identificar las hip&oacute;tesis involucradas correctamente pero comenten errores en su planteamiento, realizan c&aacute;lculos correctamente pero desconocen las reglas de decisi&oacute;n o tienen errores de c&aacute;lculo. Pueden distinguir entre una prueba matem&aacute;tica y una prueba de hip&oacute;tesis y tienen claro el significado de conceptos como nivel de significancia y valor de p. Los estudiantes que se ubicaron en el nivel multiestructural se enfocaron en m&aacute;s de un aspecto relevante en el proceso de una prueba de hip&oacute;tesis, pero no lograron integrar de forma coherente todos los conceptos y procesos que intervienen, lo que los condujo a cometer errores y a no concluir el procedimiento de prueba de forma correcta. Finalmente, los estudiantes que se ubicaron en el nivel relacional tuvieron la capacidad para integrar todos los conceptos que intervienen en una prueba de hip&oacute;tesis y resolvieron los problemas que se les plantearon en forma correcta, con una comprensi&oacute;n del proceso de la prueba. En general, los estudiantes mostraron dificultades en todas las etapas del proceso de una prueba de hip&oacute;tesis, desde el planteamiento hasta la interpretaci&oacute;n de los resultados, mostrando falta de dominio de procedimientos y sobre todo de aspectos conceptuales.</font></p>  	    <p align="justify"><font face="verdana" size="2">Un an&aacute;lisis conceptual y procedimental m&aacute;s detallado nos permite ver que 63% de los estudiantes encuestados incurrieron en la concepci&oacute;n err&oacute;nea &#45;ya documentada en otros estudios&#45;de considerar una prueba de hip&oacute;tesis como prueba matem&aacute;tica que establece la verdad. Se esperaba que estos estudiantes, dada su formaci&oacute;n matem&aacute;tica, tuvieran claro que las pruebas de hip&oacute;tesis no son una prueba matem&aacute;tica. A continuaci&oacute;n se muestran dos ejemplos de argumentaciones de los alumnos, una correcta y la otra incorrecta:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3n1.jpg"></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2">En cuanto al nivel de significancia, los estudiantes lo utilizaron en su mayor&iacute;a en forma adecuada en los procesos de prueba de hip&oacute;tesis como elemento de decisi&oacute;n para rechazar o no rechazar la prueba, pero fallaron notablemente en el &iacute;tem 2 donde se solicitaba su comprensi&oacute;n. Un ejemplo de razonamiento incorrecto lo mostramos a continuaci&oacute;n:</font></p>  	    ]]></body>
<body><![CDATA[<p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3n2.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Dos aspectos relevantes en el planteamiento de una hip&oacute;tesis nula consisten en lo siguiente: la hip&oacute;tesis nula hace referencia a un valor num&eacute;rico del par&aacute;metro poblacional y la hip&oacute;tesis nula se define como una igualdad respecto al valor supuesto del par&aacute;metro. El primer caso result&oacute; m&aacute;s complicado pues s&oacute;lo el 55% de los estudiantes lograron responder correctamente el &iacute;tem 3, en el segundo caso (&iacute;tem 4) s&oacute;lo un estudiante tuvo dificultades para identificar la relaci&oacute;n de igualdad de la hip&oacute;tesis con el valor supuesto del par&aacute;metro. a continuaci&oacute;n se muestra un ejemplo de respuesta correcta en el &iacute;tem 3:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3n3.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Por su parte, en cuanto al significado del valor de p y sus implicaciones en la significancia estad&iacute;stica, el 73% de los estudiantes mostraron una comprensi&oacute;n adecuada, no as&iacute; en el caso de relaci&oacute;n entre el tama&ntilde;o de la muestra y el valor de p que result&oacute; ser dif&iacute;cil para los sujetos de estudio (&iacute;tems 5 y 6 respectivamente). Un ejemplo de respuesta correcta se muestra a continuaci&oacute;n:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3n4.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Un ejemplo de respuesta incorrecta a estos &iacute;tems es el siguiente:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3n5.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Finalmente, en cuanto a la aplicaci&oacute;n de procedimientos para realizar correctamente una prueba de hip&oacute;tesis, los resultados muestran que se utilizaron tanto los criterios del valor de p como los de regiones de rechazo y no rechazo sobre la distribuci&oacute;n muestral del estad&iacute;stico de prueba. Sin embargo, se observaron diversas dificultades para realizar en forma completa y correcta el proceso de prueba. Las principales dificultades consistieron en confundir t&eacute;rminos como el estad&iacute;stico de prueba y el valor de Z definido por el nivel de significaci&oacute;n, no tener claro el criterio de decisi&oacute;n, no elegir el proceso de prueba adecuado para datos apareados e interpretaci&oacute;n de resultados.</font></p>  	    <p align="justify"><font face="verdana" size="2">Por ejemplo, en el &iacute;tem 7, un estudiante calcula el estad&iacute;stico de prueba correctamente pero no tiene claro el criterio de decisi&oacute;n y decide incorrectamente no rechazar la hip&oacute;tesis nula a pesar de que el estad&iacute;stico de prueba cae en la regi&oacute;n de rechazo.</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3n6.jpg"></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Otro estudiante, por su parte, realiza todo el proceso correctamente. Es la &uacute;nica respuesta que se ubic&oacute; en el nivel multiestructural de este &iacute;tem.</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3n7.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Por su parte en el &iacute;tem 8 que consist&iacute;a en elegir uno de los dos procedimientos de prueba mostrados (la opci&oacute;n correcta es la de datos apareados), de acuerdo con la dependencia de las muestras. El estudiante selecciona el m&eacute;todo de forma correcta en el inciso a) y rechaza correctamente la hip&oacute;tesis del inciso b).</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3n8.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">En el &iacute;tem 9 nos proponemos evaluar la capacidad de interpretar correctamente los resultados que se obtienen cuando se utiliza software para el desarrollo de una prueba de hip&oacute;tesis. El &iacute;tem no requiere c&aacute;lculos, s&oacute;lo an&aacute;lisis de la informaci&oacute;n que proporcionan los datos del problema y los resultados del software.</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3n9.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">La respuesta anterior muestra que el estudiante utiliza el valor de p (p = 0.071) que produce el software y lo compara con el nivel de significancia <i>&#945; =</i> 0.05. Decide correctamente sobre el resultado de la prueba utilizando el lenguaje de aceptarla en lugar de utilizar el t&eacute;rmino apropiado: no rechazarla.</font></p>  	    <p align="justify"><font face="verdana" size="2">Finalmente, en el &iacute;tem 10 que trata de un problema abierto, nos propusimos obtener informaci&oacute;n de todo el proceso de prueba, desde el planteamiento de las hip&oacute;tesis hasta la interpretaci&oacute;n de los resultados. S&oacute;lo un estudiante desarroll&oacute; el proceso completo como se muestra a continuaci&oacute;n:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/relime/v16n2/a3n10.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Se observ&oacute; que los estudiantes cometieron diversos errores que van desde c&aacute;lculos incorrectos de la media, la desviaci&oacute;n y el error est&aacute;ndar, hasta errores en el planteamiento de hip&oacute;tesis y en el uso de estad&iacute;sticos de prueba.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>5. Conclusiones</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Los resultados de la investigaci&oacute;n muestran que las pruebas de hip&oacute;tesis son un concepto complejo para los estudiantes universitarios, a&uacute;n cuando han tomado cursos de estad&iacute;stica matem&aacute;tica y fundamentos de teor&iacute;a de la probabilidad. Un alto porcentaje de estudiantes se ubicaron en el nivel preestructural, en &iacute;tems que evaluaban conceptos clave tales como nivel de significancia, valor de p y su relaci&oacute;n con el tama&ntilde;o de muestra, significado de una prueba de hip&oacute;tesis e interpretaci&oacute;n de resultados de una prueba de hip&oacute;tesis. En los &iacute;tems que contemplaban los niveles superiores del modelo SOLO, muy pocos estudiantes se ubicaron en los niveles multiestructural y relacional. Los &iacute;tems de mejor desempe&ntilde;o abordaron conceptos de formulaci&oacute;n de hip&oacute;tesis y relaci&oacute;n de valor de p con la significancia estad&iacute;stica.</font></p>  	    <p align="justify"><font face="verdana" size="2">En este sentido, el razonamiento estad&iacute;stico de los estudiantes que participaron en la investigaci&oacute;n se caracteriza por ser aislado en relaci&oacute;n con los diversos conceptos que se involucran en las pruebas de hip&oacute;tesis, esto derivado de la falta de comprensi&oacute;n y por creencias err&oacute;neas sobre diversos conceptos involucrados. Ello trae como consecuencia que de acuerdo con las categor&iacute;as del modelo SOLO se ubiquen en un nivel de razonamiento estad&iacute;stico de preestructural a uniestructural principalmente. En la forma que Garfield (2002) define al razonamiento estad&iacute;stico, estos estudiantes tienen dificultades para comprender y explicar la l&oacute;gica y los procesos estad&iacute;sticos que subyacen a las pruebas de hip&oacute;tesis, as&iacute; como dar sentido a informaci&oacute;n estad&iacute;stica que se les presente en medios de comunicaci&oacute;n o en la lectura de alg&uacute;n reporte de investigaci&oacute;n que presente resultados estad&iacute;sticos basados en esta metodolog&iacute;a estad&iacute;stica.</font></p>  	    <p align="justify"><font face="verdana" size="2">Entre las implicaciones que se derivan del presente estudio est&aacute; la sugerencia para que los cursos de inferencia estad&iacute;stica hagan mayor &eacute;nfasis en aspectos conceptuales y procedimentales que consideren los dos enfoques de las pruebas de hip&oacute;tesis, para desarrollar el razonamiento estad&iacute;stico inferencial de los estudiantes. Por ello es importante que los estudiantes comprendan los fundamentos y la l&oacute;gica que subyace a las pruebas de hip&oacute;tesis, as&iacute; como la relaci&oacute;n que guardan entre s&iacute; los diversos conceptos que intervienen en el proceso de prueba; de tal forma que tengan sentido para ellos los procedimientos que utilizan y est&eacute;n conscientes de las limitaciones de los resultados.</font></p>  	    <p align="justify"><font face="verdana" size="2">En esta direcci&oacute;n, la literatura en educaci&oacute;n estad&iacute;stica ya reporta estudios y propuestas de diversos investigadores (Rossman &amp; Chance, 1999; Inzunsa, 2010; Lipson, 2002; Garfield &amp; Ben&#45;Zvi, 2008) para el desarrollo de ambientes de aprendizaje que promuevan en los estudiantes un razonamiento estad&iacute;stico adecuado sobre la inferencia estad&iacute;stica. En dichos estudios y propuestas, la tecnolog&iacute;a computacional aparece como un elemento importante a considerar en la ense&ntilde;anza, dada la multiplicidad de representaciones y el potencial cognitivo que proporcionan algunas herramientas.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Referencias bibliogr&aacute;ficas</b></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Batanero, C. (2000). Controversies around the role of statistical tests in experimental research. <i>Mathematical Thinking and Learning: An International Journal</i> 2(1&#45;2), 75&#45;97.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349026&pid=S1665-2436201300020000300001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Biggs, J. B.; Collis, K. F. (1982). <i>Evaluating the Quality of Learning: The Solo Taxonomy.</i> New York: Academic Press.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349028&pid=S1665-2436201300020000300002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Carver, R. (1978). The case against statistical significance testing. <i>Harvard Educational Review 48(3),</i> 378&#45;399.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349030&pid=S1665-2436201300020000300003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Castro Sotos, A. E., Vanhoof, S., Van den Noortgate, W.; Onghena, P. (2007). Students' misconceptions of statistical inference: A review of the empirical evidence from research on statistics education. <i>Educational Research Review</i> 2(2), 98&#45;113.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349032&pid=S1665-2436201300020000300004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Chance, B., del Mas, R.; Garfield, J. (2004). Reasoning about sampling distributions. In D. Ben&#45;Zvi &amp; J. Garfield (Eds.), <i>The challenge of developing statistical literacy, reasoning, and thinking</i> (pp. 295&#45;323). Netherlands: Kluwer Academic Publishers.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349034&pid=S1665-2436201300020000300005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Cumming, G. (2010). Understanding, teaching and using p values &#91;CD&#45;ROM&#93;. In Ch. Reading (Ed.), <i>Proceedings of the 8<sup>th</sup> International Conference on Teaching Statistics.</i> Ljubljiana Slovenia: University of Slovenia.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349036&pid=S1665-2436201300020000300006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Garfield, J. (2002). The Challenge of Developing Statistical Reasoning. <i>Journal of Statistics Education 10(3).</i> Recuperado el 08 de octubre de 2010 de <a href="http://www.amstat.org/publications/jse/v10n3/garfield.html" target="_blank">http://www.amstat.org/publications/jse/v10n3/garfield.html</a></font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349038&pid=S1665-2436201300020000300007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Garfield, J.; Ben&#45;Zvi, D. (2008). <i>Developing Students 'Statistical Reasoning. Connecting Research</i> <i>and Teaching Practice.</i> The Netherlands: Springer.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349039&pid=S1665-2436201300020000300008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Gigerenzer, G. (1993). The superego, the ego and the id in statistical reasoning. In G. Keren &amp; C. Lewis (Eds.), <i>A handbook for data analysis in the behavioral sciences</i> (Vol. 1, pp. 311&#45;339). Hillsdale: Erlbaum.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349041&pid=S1665-2436201300020000300009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Good, P. I. &amp; Hardin, J. W. (2009). <i>Common Errors in Statistics (and how to avoid them).</i> (3th ed.). New Jersey: John Wiley and Sons, Inc.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349043&pid=S1665-2436201300020000300010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Grings, R.; Viali, L. (2011). Teste de Hip&oacute;teses: uma an&aacute;lise dos erros cometidos por alunos de engenharia. <i>Boletim de Educaqao Matem&aacute;tica</i> 24(40), 835&#45;854.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349045&pid=S1665-2436201300020000300011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Huberty, C. J. (1993). Historical origins of statistical testing practices: The treatment of Fisher versus Neyman&#45;Pearson views in the textbooks. <i>Journal of Experimental Education 61(4),</i> 317&#45;333.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349047&pid=S1665-2436201300020000300012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Inzunsa, S. (2010). Entornos virtuales de aprendizaje: un enfoque alternativo para la ense&ntilde;anza y aprendizaje de la inferencia estad&iacute;stica. <i>Revista Mexicana de Investigaci&oacute;n Educativa</i> 15(45), 423&#45;452.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349049&pid=S1665-2436201300020000300013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Kirk, R. (2001). Promoting good statistical practices: some sugestions. <i>Educational and Psychological</i> <i>Measurement</i> 61(2), 213&#45;218.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349051&pid=S1665-2436201300020000300014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Kline, R. B. (2004). <i>Beyond Significance Testing. Reforming Data Analysis Methods in Behavioral</i> <i>Research.</i> Washington: American Psychological Association.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349053&pid=S1665-2436201300020000300015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Levin, J. R. (1998). What If There Were No More Bickering About Statistical Significance Tests? <i>Research in Schools 5</i>(2), 43&#45;53.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349055&pid=S1665-2436201300020000300016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Lipson, K. (2000). <i>The role of the sampling distribution in developing understanding of statistical</i> <i>inference.</i> Doctoral Thesis unpublished, Swinburne University of Technology, Swinburne, Australia.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349057&pid=S1665-2436201300020000300017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Lipson, K. (2002). The role of computer based technology in developing understanding of the concept of sampling distribution &#91;CD&#45;ROM&#93;. <i>Proceedings of the 6<sup>th</sup> International Conference on Teaching of Statistics.</i> Cape Town South Africa: South African Statistical Association.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349059&pid=S1665-2436201300020000300018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Liu, Y.; Thompson, P. W. (2005). Teachers' understanding of hypothesis testing &#91;CD&#45;ROM&#93;. In S. Wilson (Ed.), <i>Proceedings of the 27<sup>th</sup>Annual Meeting of the International Group for the Psychology of Mathematics Education.</i> Virginia: Virginia Tech University.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349061&pid=S1665-2436201300020000300019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">McLean, A. (2002). Statistacy: Vocabulary and Hypothesis Testing &#91;CD&#45;ROM&#93;. In B. Phillips (Ed.), <i>Proceedings of the 6<sup>th</sup> International Conference on Teaching of Statistic.</i> Cape Town South Africa: South African Statistical Association.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349063&pid=S1665-2436201300020000300020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">McLean, J. E; Ernest, J. M. (1998). The Role of Statistical Significance Testing In Educational Research. <i>Research in Schools 5</i> (2), 15&#45;22.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349065&pid=S1665-2436201300020000300021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Mittag, K. C.; Thompson, B. (2000). A National Survey of AERA Member's Perceptions of Statistical Significance Tests and Other Statistical Issues. <i>Educational Researcher 29(4),</i> 14&#45;20.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349067&pid=S1665-2436201300020000300022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Monterrey, P.; G&oacute;mez&#45;Restrepo, C. (2007). Aplicaci&oacute;n de las pruebas de hip&oacute;tesis en la investigaci&oacute;n en salud: &iquest;estamos en lo correcto? <i>Universitas M&eacute;dica 48(3),</i> 193&#45;206.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349069&pid=S1665-2436201300020000300023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Moore, D. S. (1992). &iquest;What is Statistics? In D. C. Hoaglin &amp; D. S. Moore (Eds.), <i>Perspectives on Contemporary Statistics</i> (pp. 1&#45;17). Washington: Mathematical Association of America.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349071&pid=S1665-2436201300020000300024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Morrison, D. E. &amp; Henkel, R. E. (1970). <i>The Significance Test Controversy.</i> New Brunswick: Transactions Publishers.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349073&pid=S1665-2436201300020000300025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Pfannkuch, M. (2005). Characterizing year 11 student's evaluation of a statistical process. <i>Statistics Education Research Journal 4(2),</i> 5&#45;25. Recuperado el 08 de dieciembre de 2010. de <a href="http://www.stat.auckland.ac.nz/serj" target="_blank">http://www.stat.auckland.ac.nz/serj</a>.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349075&pid=S1665-2436201300020000300026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Reading, Ch.; Reid, J. (2006). An emerging hierarchy of reasoning about distribution: from a variation perspective. <i>Statistics Education Research Journal 5(2),</i> 46&#45;68. Recuperado el 15 de diciembre de 2010 de <a href="http://www.stat.auckland.ac.nz/serj" target="_blank">http://www.stat.auckland.ac.nz/serj</a>.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349077&pid=S1665-2436201300020000300027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Robinson, D. H.; Levin, J.R. (1997). Reflections on statistical and substantive significance with a slice of replication. <i>Educational Researcher 26</i>(5), 21&#45;26.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349079&pid=S1665-2436201300020000300028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Rossman A.; Chance, B. (1999). Teaching the reasoning of statistical inference: A "top ten" list. <i>College Mathematical Journal 30(4),</i> 297&#45;305. Recuperado el 20 de octubre de 2010 de <a href="http://rossmanchance.com/papers/topten.html" target="_blank">http://rossmanchance.com/papers/topten.html</a></font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349081&pid=S1665-2436201300020000300029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Stigler, S. M. (1986). <i>The history of statistics: The measurement of the uncertainty before 1900.</i> Cambridge, MA: Belknap.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349082&pid=S1665-2436201300020000300030&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Triola, M. F. (2009). <i>Estad&iacute;stica.</i> M&eacute;xico: Pearson Educaci&oacute;n.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349084&pid=S1665-2436201300020000300031&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Vallecillos, A. (1996). <i>Inferencia estad&iacute;stica y ense&ntilde;anza: un an&aacute;lisis did&aacute;ctico del contraste de</i> <i>hip&oacute;tesis estad&iacute;sticas.</i> Granada: Editorial Colmenares.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349086&pid=S1665-2436201300020000300032&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Vallecillos, A. (1997). El papel de las hip&oacute;tesis estad&iacute;sticas en los contrastes: Concepciones y dificultades de aprendizaje. <i>Educaci&oacute;n Matem&aacute;tica 9</i>(2), 5&#45;20.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349088&pid=S1665-2436201300020000300033&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Vizcarra, F.; Inzunsa, S. (2009). Un estudio sobre la caracterizaci&oacute;n del razonamiento estad&iacute;stico de estudiantes de preparatoria: el caso de los promedios y las gr&aacute;ficas &#91;CD&#45;ROM&#93;. <i>Memorias del</i> <i>XXII Congreso Nacional de Ense&ntilde;anza de las Matem&aacute;ticas,</i> Tuxtla Guti&eacute;rrez Chiapas, M&eacute;xico: Asociaci&oacute;n Nacional de Profesores de Matem&aacute;ticas.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349090&pid=S1665-2436201300020000300034&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Williams, A. M. (1998). Students' understanding of the significance level concept. In L. Pereira Mendoza, L. Seu Kea, T. Wee Kee &amp; W. Wong ( (Eds.), <i>Proceedings of the 5<sup>th</sup> International</i> <i>Conference on Teaching Statistics.</i> Singapur Korea: University of Korea.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349092&pid=S1665-2436201300020000300035&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Xitao, F. (2001). Statistical Significance and Effect Size in Education Research: Two Sides of a Coin. <i>The Journal of Educational Research</i> 94(5), 275&#45;282.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349094&pid=S1665-2436201300020000300036&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Ya&ntilde;ez, G.; Behar, R. (2010). The confidence intervals: a difficult matter, even for experts &#91;CD&#45;ROM&#93;. In Ch. Reading (Ed.), <i>Proceedings of the 8<sup>th</sup> International Conference on Teaching</i> <i>Statistics.</i> Ljubljiana Slovenia: University of Slovenia.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7349096&pid=S1665-2436201300020000300037&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p> 	    <p align="justify"><font face="verdana" size="2"><b><a name="nota"></a>Notas</b></font></p>     <p align="justify"><font face="verdana" size="2"><sup>1</sup> APA&#45;American Psychological Association (2001). <i>Publication Manual of the American Psychological Association</i> (5th. ed.)<i>.</i> Washington, DC: Autor.</font></p>  	    <p align="justify"><font face="verdana" size="2"><sup>2</sup> El estad&iacute;stico de prueba es una variable aleatoria que com&uacute;nmente se denota mediante una may&uacute;scula (Z). El valor del estad&iacute;stico de prueba con los datos de una muestra es su valor calculado y es usual representarlo mediante letra min&uacute;scula (z). El valor cr&iacute;tico que delimita una regi&oacute;n de la distribuci&oacute;n muestral de rechazo o no rechazo corresponde a un determinado cuantil de la distribuci&oacute;n del estad&iacute;stico de prueba (por ejemplo Z<sub>0.95</sub> = 1.645 con un &#945; = 0.05). Como puede verse se trata de tres conceptos diferentes que no deben confundirse.</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Batanero]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Controversies around the role of statistical tests in experimental research]]></article-title>
<source><![CDATA[Mathematical Thinking and Learning: An International Journal]]></source>
<year>2000</year>
<volume>2</volume>
<numero>1-2</numero>
<issue>1-2</issue>
<page-range>75-97</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Biggs]]></surname>
<given-names><![CDATA[J. B.]]></given-names>
</name>
<name>
<surname><![CDATA[Collis]]></surname>
<given-names><![CDATA[K. F.]]></given-names>
</name>
</person-group>
<source><![CDATA[Evaluating the Quality of Learning: The Solo Taxonomy]]></source>
<year>1982</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Academic Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Carver]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The case against statistical significance testing]]></article-title>
<source><![CDATA[Harvard Educational Review]]></source>
<year>1978</year>
<volume>48</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>378-399</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Castro Sotos]]></surname>
<given-names><![CDATA[A. E.]]></given-names>
</name>
<name>
<surname><![CDATA[Vanhoof]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Van den Noortgate]]></surname>
<given-names><![CDATA[W.]]></given-names>
</name>
<name>
<surname><![CDATA[Onghena]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Students' misconceptions of statistical inference: A review of the empirical evidence from research on statistics education]]></article-title>
<source><![CDATA[Educational Research Review]]></source>
<year>2007</year>
<volume>2</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>98-113</page-range></nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chance]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
<name>
<surname><![CDATA[del Mas]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Garfield]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Reasoning about sampling distributions]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Ben-Zvi]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
<name>
<surname><![CDATA[Garfield]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<source><![CDATA[The challenge of developing statistical literacy, reasoning, and thinking]]></source>
<year>2004</year>
<page-range>295-323</page-range><publisher-loc><![CDATA[Netherlands ]]></publisher-loc>
<publisher-name><![CDATA[Kluwer Academic Publishers]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cumming]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Understanding, teaching and using p values [CD-ROM]]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Reading]]></surname>
<given-names><![CDATA[Ch.]]></given-names>
</name>
</person-group>
<source><![CDATA[Proceedings of the 8th International Conference on Teaching Statistics]]></source>
<year>2010</year>
<publisher-loc><![CDATA[Ljubljiana ]]></publisher-loc>
<publisher-name><![CDATA[University of Slovenia]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Garfield]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Challenge of Developing Statistical Reasoning]]></article-title>
<source><![CDATA[Journal of Statistics Education]]></source>
<year>2002</year>
<month>08</month>
<day> d</day>
<volume>10</volume>
<numero>3</numero>
<issue>3</issue>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Garfield]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
<name>
<surname><![CDATA[Ben-Zvi]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
</person-group>
<source><![CDATA[Developing Students 'Statistical Reasoning. Connecting Research and Teaching Practice]]></source>
<year>2008</year>
<publisher-name><![CDATA[Springer]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gigerenzer]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The superego, the ego and the id in statistical reasoning]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Keren]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
<name>
<surname><![CDATA[Lewis]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<source><![CDATA[A handbook for data analysis in the behavioral sciences]]></source>
<year>1993</year>
<volume>1</volume>
<page-range>311-339</page-range><publisher-name><![CDATA[Erlbaum]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Good]]></surname>
<given-names><![CDATA[P. I.]]></given-names>
</name>
<name>
<surname><![CDATA[Hardin]]></surname>
<given-names><![CDATA[J. W.]]></given-names>
</name>
</person-group>
<source><![CDATA[Common Errors in Statistics (and how to avoid them)]]></source>
<year>2009</year>
<edition>3</edition>
<publisher-loc><![CDATA[^eNew Jersey New Jersey]]></publisher-loc>
<publisher-name><![CDATA[John Wiley and Sons, Inc.]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Grings]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Viali]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
</person-group>
<article-title xml:lang="pt"><![CDATA[Teste de Hipóteses: uma análise dos erros cometidos por alunos de engenharia]]></article-title>
<source><![CDATA[Boletim de Educaqao Matemática]]></source>
<year>2011</year>
<volume>24</volume>
<numero>40</numero>
<issue>40</issue>
<page-range>835-854</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Huberty]]></surname>
<given-names><![CDATA[C. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Historical origins of statistical testing practices: The treatment of Fisher versus Neyman-Pearson views in the textbooks]]></article-title>
<source><![CDATA[Journal of Experimental Education]]></source>
<year>1993</year>
<volume>61</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>317-333</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Inzunsa]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Entornos virtuales de aprendizaje: un enfoque alternativo para la enseñanza y aprendizaje de la inferencia estadística]]></article-title>
<source><![CDATA[Revista Mexicana de Investigación Educativa]]></source>
<year>2010</year>
<volume>15</volume>
<numero>45</numero>
<issue>45</issue>
<page-range>423-452</page-range></nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kirk]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Promoting good statistical practices: some sugestions]]></article-title>
<source><![CDATA[Educational and Psychological Measurement]]></source>
<year>2001</year>
<volume>61</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>213-218</page-range></nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kline]]></surname>
<given-names><![CDATA[R. B.]]></given-names>
</name>
</person-group>
<source><![CDATA[Beyond Significance Testing. Reforming Data Analysis Methods in Behavioral Research]]></source>
<year>2004</year>
<publisher-loc><![CDATA[Washington ]]></publisher-loc>
<publisher-name><![CDATA[American Psychological Association]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Levin]]></surname>
<given-names><![CDATA[J. R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[What If There Were No More Bickering About Statistical Significance Tests?]]></article-title>
<source><![CDATA[Research in Schools]]></source>
<year>1998</year>
<volume>5</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>43-53</page-range></nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lipson]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
</person-group>
<source><![CDATA[The role of the sampling distribution in developing understanding of statistical inference]]></source>
<year>2000</year>
</nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lipson]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
</person-group>
<source><![CDATA[The role of computer based technology in developing understanding of the concept of sampling distribution [CD-ROM]. Proceedings of the 6th International Conference on Teaching of Statistics]]></source>
<year>2002</year>
<publisher-loc><![CDATA[Cape Town ]]></publisher-loc>
<publisher-name><![CDATA[South African Statistical Association]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Liu]]></surname>
<given-names><![CDATA[Y.]]></given-names>
</name>
<name>
<surname><![CDATA[Thompson]]></surname>
<given-names><![CDATA[P. W.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Teachers' understanding of hypothesis testing [CD-ROM]]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Wilson]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<source><![CDATA[Proceedings of the 27thAnnual Meeting of the International Group for the Psychology of Mathematics Education]]></source>
<year>2005</year>
<publisher-loc><![CDATA[^eVirginia Virginia]]></publisher-loc>
<publisher-name><![CDATA[Virginia Tech University]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McLean]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Statistacy: Vocabulary and Hypothesis Testing [CD-ROM]]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Phillips]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
</person-group>
<source><![CDATA[Proceedings of the 6th International Conference on Teaching of Statistic]]></source>
<year>2002</year>
<publisher-loc><![CDATA[Cape Town ]]></publisher-loc>
<publisher-name><![CDATA[South African Statistical Association]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McLean]]></surname>
<given-names><![CDATA[J. E]]></given-names>
</name>
<name>
<surname><![CDATA[Ernest]]></surname>
<given-names><![CDATA[J. M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Role of Statistical Significance Testing In Educational Research]]></article-title>
<source><![CDATA[Research in Schools]]></source>
<year>1998</year>
<volume>5</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>15-22</page-range></nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mittag]]></surname>
<given-names><![CDATA[K. C.]]></given-names>
</name>
<name>
<surname><![CDATA[Thompson]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A National Survey of AERA Member's Perceptions of Statistical Significance Tests and Other Statistical Issues]]></article-title>
<source><![CDATA[Educational Researcher]]></source>
<year>2000</year>
<volume>29</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>14-20</page-range></nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Monterrey]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
<name>
<surname><![CDATA[Gómez-Restrepo]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Aplicación de las pruebas de hipótesis en la investigación en salud: ¿estamos en lo correcto?]]></article-title>
<source><![CDATA[Universitas Médica]]></source>
<year>2007</year>
<volume>48</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>193-206</page-range></nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Moore]]></surname>
<given-names><![CDATA[D. S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[¿What is Statistics?]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Hoaglin]]></surname>
<given-names><![CDATA[D. C.]]></given-names>
</name>
<name>
<surname><![CDATA[Moore]]></surname>
<given-names><![CDATA[D. S.]]></given-names>
</name>
</person-group>
<source><![CDATA[Perspectives on Contemporary Statistics]]></source>
<year>1992</year>
<page-range>1-17</page-range><publisher-loc><![CDATA[Washington ]]></publisher-loc>
<publisher-name><![CDATA[Mathematical Association of America]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Morrison]]></surname>
<given-names><![CDATA[D. E.]]></given-names>
</name>
<name>
<surname><![CDATA[Henkel]]></surname>
<given-names><![CDATA[R. E.]]></given-names>
</name>
</person-group>
<source><![CDATA[The Significance Test Controversy]]></source>
<year>1970</year>
<publisher-name><![CDATA[Transactions Publishers]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pfannkuch]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Characterizing year 11 student's evaluation of a statistical process]]></article-title>
<source><![CDATA[Statistics Education Research Journal]]></source>
<year>2005</year>
<volume>4</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>5-25</page-range></nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Reading]]></surname>
<given-names><![CDATA[Ch.]]></given-names>
</name>
<name>
<surname><![CDATA[Reid]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An emerging hierarchy of reasoning about distribution: from a variation perspective]]></article-title>
<source><![CDATA[Statistics Education Research Journal]]></source>
<year>2006</year>
<volume>5</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>46-68</page-range></nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Robinson]]></surname>
<given-names><![CDATA[D. H.]]></given-names>
</name>
<name>
<surname><![CDATA[Levin]]></surname>
<given-names><![CDATA[J.R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Reflections on statistical and substantive significance with a slice of replication]]></article-title>
<source><![CDATA[Educational Researcher]]></source>
<year>1997</year>
<volume>26</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>21-26</page-range></nlm-citation>
</ref>
<ref id="B29">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rossman]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Chance]]></surname>
<given-names><![CDATA[B.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Teaching the reasoning of statistical inference: A "top ten" list]]></article-title>
<source><![CDATA[College Mathematical Journal]]></source>
<year>1999</year>
<volume>30</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>297-305</page-range></nlm-citation>
</ref>
<ref id="B30">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Stigler]]></surname>
<given-names><![CDATA[S. M.]]></given-names>
</name>
</person-group>
<source><![CDATA[The history of statistics: The measurement of the uncertainty before 1900]]></source>
<year>1986</year>
<publisher-loc><![CDATA[Cambridge^eMA MA]]></publisher-loc>
<publisher-name><![CDATA[Belknap]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B31">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Triola]]></surname>
<given-names><![CDATA[M. F.]]></given-names>
</name>
</person-group>
<source><![CDATA[Estadística]]></source>
<year>2009</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Pearson Educación]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B32">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Vallecillos]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<source><![CDATA[Inferencia estadística y enseñanza: un análisis didáctico del contraste de hipótesis estadísticas]]></source>
<year>1996</year>
<publisher-loc><![CDATA[Granada ]]></publisher-loc>
<publisher-name><![CDATA[Editorial Colmenares]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B33">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Vallecillos]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[El papel de las hipótesis estadísticas en los contrastes: Concepciones y dificultades de aprendizaje]]></article-title>
<source><![CDATA[Educación Matemática]]></source>
<year>1997</year>
<volume>9</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>5-20</page-range></nlm-citation>
</ref>
<ref id="B34">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Vizcarra]]></surname>
<given-names><![CDATA[F.]]></given-names>
</name>
<name>
<surname><![CDATA[Inzunsa]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<source><![CDATA[Un estudio sobre la caracterización del razonamiento estadístico de estudiantes de preparatoria: el caso de los promedios y las gráficas [CD-ROM]. Memorias del XXII Congreso Nacional de Enseñanza de las Matemáticas]]></source>
<year>2009</year>
<publisher-loc><![CDATA[Tuxtla Gutiérrez^eChiapas Chiapas]]></publisher-loc>
<publisher-name><![CDATA[Asociación Nacional de Profesores de Matemáticas]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B35">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Williams]]></surname>
<given-names><![CDATA[A. M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Students' understanding of the significance level concept]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Pereira Mendoza]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
<name>
<surname><![CDATA[Seu Kea]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
<name>
<surname><![CDATA[Wee Kee]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
<name>
<surname><![CDATA[Wong]]></surname>
<given-names><![CDATA[W.]]></given-names>
</name>
</person-group>
<source><![CDATA[Proceedings of the 5th International Conference on Teaching Statistics]]></source>
<year>1998</year>
<publisher-name><![CDATA[University of Korea]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B36">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Xitao]]></surname>
<given-names><![CDATA[F.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Statistical Significance and Effect Size in Education Research: Two Sides of a Coin]]></article-title>
<source><![CDATA[The Journal of Educational Research]]></source>
<year>2001</year>
<volume>94</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>275-282</page-range></nlm-citation>
</ref>
<ref id="B37">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Yañez]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
<name>
<surname><![CDATA[Behar]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The confidence intervals: a difficult matter, even for experts [CD-ROM]]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Reading]]></surname>
<given-names><![CDATA[Ch.]]></given-names>
</name>
</person-group>
<source><![CDATA[Proceedings of the 8th International Conference on Teaching Statistics]]></source>
<year>2010</year>
<publisher-loc><![CDATA[Ljubljiana ]]></publisher-loc>
<publisher-name><![CDATA[University of Slovenia]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
