<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>1607-4041</journal-id>
<journal-title><![CDATA[Revista electrónica de investigación educativa]]></journal-title>
<abbrev-journal-title><![CDATA[REDIE]]></abbrev-journal-title>
<issn>1607-4041</issn>
<publisher>
<publisher-name><![CDATA[Universidad Autónoma de Baja California, Instituto de Investigación y Desarrollo Educativo]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S1607-40412011000200009</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Calibración de una prueba de química por el modelo de Rasch]]></article-title>
<article-title xml:lang="en"><![CDATA[Calibration of a Chemistry Test Using the Rasch Model]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Martín Guaregua]]></surname>
<given-names><![CDATA[Nancy]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Díaz Torres]]></surname>
<given-names><![CDATA[Consuelo]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Córdoba Herrera]]></surname>
<given-names><![CDATA[Gilberto]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Picquart]]></surname>
<given-names><![CDATA[Michel]]></given-names>
</name>
<xref ref-type="aff" rid="A03"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Autónoma Metropolitana Departamento de Química Unidad Iztapalapa]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Autónoma Metropolitana Departamento de Matemáticas Unidad Iztapalapa]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<aff id="A03">
<institution><![CDATA[,Universidad Autónoma Metropolitana Departamento de Física Unidad Iztapalapa]]></institution>
<addr-line><![CDATA[ D. F.]]></addr-line>
<country>México</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>00</month>
<year>2011</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>00</month>
<year>2011</year>
</pub-date>
<volume>13</volume>
<numero>2</numero>
<fpage>132</fpage>
<lpage>148</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_arttext&amp;pid=S1607-40412011000200009&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&amp;pid=S1607-40412011000200009&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_pdf&amp;pid=S1607-40412011000200009&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Se aplicó el modelo de Rasch para calibrar una prueba de química general con el fin de analizar las ventajas y la información que proporciona el modelo. La muestra fue de 219 alumnos del primer año universitario. Se logró un buen ajuste del modelo en 10 reactivos de un total de 12. Además se evidenció que la prueba cuenta con reactivos de diferentes índices de dificultad, con intervalos vacíos en la escala para los que se tendrán que diseñar nuevos reactivos para que la prueba sea completa.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[The Rasch model was used to calibrate a general chemistry test for the purpose of analyzing the advantages and information the model provides. The sample was composed of 219 college freshmen. Of the 12 questions used, good fit was achieved in 10. The evaluation shows that although there are items of variable difficulty, there are gaps on the scale; in order to make the test complete, it will be necessary to design new items to fill in these gaps.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Teoría de Respuesta al Reactivo (TRR)]]></kwd>
<kwd lng="es"><![CDATA[modelo de Rasch]]></kwd>
<kwd lng="es"><![CDATA[Curva Característica del Reactivo (CCR)]]></kwd>
<kwd lng="es"><![CDATA[química]]></kwd>
<kwd lng="en"><![CDATA[Item Response Theory (IRT)]]></kwd>
<kwd lng="en"><![CDATA[Rasch model]]></kwd>
<kwd lng="en"><![CDATA[Characteristic Graphical of Item (CGI)]]></kwd>
<kwd lng="en"><![CDATA[chemistry]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  	    <p align="justify"><font face="verdana" size="4">Art&iacute;culos arbitrados</font></p> 	    <p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    <p align="center"><font face="verdana" size="4"><b>Calibraci&oacute;n de una prueba de qu&iacute;mica por el modelo de Rasch</b></font></p> 	    <p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    <p align="center"><font face="verdana" size="3"><b>Calibration of a Chemistry Test Using the Rasch Model</b></font></p> 	    <p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    <p align="center"><font face="verdana" size="2"><b>Nancy Mart&iacute;n Guaregua<sup>1</sup>, Consuelo D&iacute;az Torres<sup>2</sup>,   Gilberto C&oacute;rdoba Herrera<sup>1</sup>,  Michel Picquart<sup>3</sup></b></font></p> 	    <p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    <p align="justify"><font face="verdana" size="2"><i><sup>1 </sup>Universidad Aut&oacute;noma Metropolitana&#45;Iztapalapa Departamento de Qu&iacute;mica</i> <a href="mailto:mgnc@xanum.uam.mx">mgnc@xanum.uam.mx</a> <a href="mailto:gil@xanum.uam.mx">gil@xanum.uam.mx</a></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"> <i><sup>2  </sup>Departamento de Matem&aacute;ticas</i> <a href="mailto:ditc@xanum.uam.mx">ditc@xanum.uam.mx</a></font></p>  	    <p align="justify"><font face="verdana" size="2"><i><sup>3  </sup>Departamento de F&iacute;sica Av. San Rafael Atlixco 186. C.P. 09340 D. F., M&eacute;xico</i> <a href="mailto:mp@xanum.uam.mx">mp@xanum.uam.mx</a></font></p>  	    <p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    <p align="justify"><font face="verdana" size="2">Recibido: 9 de diciembre de 2010;    <br>     aceptado para su publicaci&oacute;n: 29 de julio de 2011</font></p> 	    <p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    <p align="justify"><font face="verdana" size="2"><b>Resumen</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Se aplic&oacute; el modelo de Rasch para calibrar una prueba de qu&iacute;mica general con el fin de analizar las ventajas y la informaci&oacute;n que proporciona el modelo. La muestra fue de 219 alumnos del primer a&ntilde;o universitario. Se logr&oacute; un buen ajuste del modelo en 10 reactivos de un total de 12. Adem&aacute;s se evidenci&oacute; que la prueba cuenta con reactivos de diferentes &iacute;ndices de dificultad, con intervalos vac&iacute;os en la escala para los que se tendr&aacute;n que dise&ntilde;ar nuevos reactivos para que la prueba sea completa.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Palabras clave:</b> Teor&iacute;a de Respuesta al Reactivo (TRR), modelo de Rasch, Curva Caracter&iacute;stica del Reactivo (CCR), qu&iacute;mica.</font></p>  	    <p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b>Abstract</b></font></p> 	    <p align="justify"><font face="verdana" size="2">The Rasch model was used to calibrate a general chemistry test for the purpose of analyzing the advantages and information the model provides. The sample was composed of 219 college freshmen. Of the 12 questions used, good fit was achieved in 10. The evaluation shows that although there are items of variable difficulty, there are gaps on the scale; in order to make the test complete, it will be necessary to design new items to fill in these gaps.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Key words:</b> Item Response Theory (IRT); Rasch model; Characteristic Graphical of Item (CGI), chemistry.</font></p>  	    <p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    <p align="justify"><font face="verdana" size="2"><b>I. Introducci&oacute;n</b></font></p> 	    <p align="justify"><font face="verdana" size="2">Un instrumento de medici&oacute;n de buena calidad debe tener validez, confiabilidad y objetividad. Tiene validez si mide lo que se pretende medir, es confiable si es independiente del tiempo y es objetivo si es independiente de evaluadores y evaluados. Por lo tanto, la validez, la confiabilidad y la objetividad de una prueba son aspectos importantes a considerar cuando se lleva a cabo su elaboraci&oacute;n. En educaci&oacute;n se considera al instrumento de medici&oacute;n como el medio a trav&eacute;s del cual se recaba informaci&oacute;n y se registran los datos que permiten una valoraci&oacute;n sobre la habilidad o el conocimiento de los alumnos.</font></p>  	    <p align="justify"><font face="verdana" size="2">Entre las diferentes pruebas de evaluaci&oacute;n que existen est&aacute;n: oral, escrito y pr&aacute;ctico&#45;procedimental. Todos ellos pueden ser complementarios. La evaluaci&oacute;n escrita es la m&aacute;s com&uacute;nmente usada como prueba de conocimiento y dentro de esta clasificaci&oacute;n, se pueden mencionar, a las pruebas abiertas, las de opci&oacute;n m&uacute;ltiple, estudios de casos, etc.</font></p>  	    <p align="justify"><font face="verdana" size="2">Las pruebas de opci&oacute;n m&uacute;ltiple est&aacute;n compuestas por reactivos o &iacute;tems cerrados con varias opciones de respuesta de las que una sola es correcta y las otras son distractores. &Eacute;stas presentan ciertas ventajas sobre las pruebas abiertas en que permiten rapidez al calificar y pueden ser aplicadas a grupos grandes de alumnos. Entre las desventajas est&aacute;n, que pueden ser respondidas al azar y la dificultad para dise&ntilde;ar reactivos de buena calidad.</font></p>  	    <p align="justify"><font face="verdana" size="2">De all&iacute;, la importancia que tiene la calibraci&oacute;n de la pruebas de evaluaci&oacute;n que se aplica a fin de asegurar su calidad, de forma que se pueda evaluar con eficiencia el conocimiento.</font></p>  	    <p align="justify"><font face="verdana" size="2">En la Universidad Aut&oacute;noma Metropolitana&#45;Iztapalapa (UAMI) no se tiene establecido ning&uacute;n tipo de norma para el dise&ntilde;o de los ex&aacute;menes. Tampoco se aplica ning&uacute;n tipo de valoraci&oacute;n o an&aacute;lisis que permita comprobar la validez y la confiabilidad de la evaluaci&oacute;n que hacemos a los alumnos.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">El prop&oacute;sito del presente estudio es analizar y calibrar los reactivos de una prueba de opci&oacute;n m&uacute;ltiple usada como examen diagn&oacute;stico de qu&iacute;mica general en los alumnos del primer a&ntilde;o universitario de la Divisi&oacute;n de Ciencias B&aacute;sicas e Ingenier&iacute;a (DCBI) de la UAMI. Despu&eacute;s de la revisi&oacute;n de los diferentes m&eacute;todos que existen para el an&aacute;lisis de instrumentos se decidi&oacute; aplicar el modelo de Rasch con el fin de analizar el modelo y su ajuste a los reactivos de esta prueba.</font></p>  	    <p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    <p align="justify"><font face="verdana" size="2"><b>II. Antecedentes</b></font></p> 	    <p align="justify"><font face="verdana" size="2">Entre los modelos estad&iacute;sticos m&aacute;s antiguos para an&aacute;lisis de instrumentos est&aacute; el de la Teor&iacute;a Cl&aacute;sica de la Medida (TCM) desarrollado por Spearman (Spearman, 1904, Stevens, 1946, Mu&ntilde;iz, 1997), el cual es un modelo de regresi&oacute;n lineal que ha sido aplicado a pruebas sicom&eacute;tricas. (Embretson y Reise, 1986).</font></p>  	    <p align="justify"><font face="verdana" size="2">La principal limitaci&oacute;n de la TCM consiste en que las caracter&iacute;sticas de la prueba y las puntuaciones de los evaluados no pueden ser separadas, ya que las caracter&iacute;sticas de los reactivos dependen del grupo de personas al que se han aplicado y la puntuaci&oacute;n de una persona depende del conjunto particular de reactivos utilizados.</font></p>  	    <p align="justify"><font face="verdana" size="2">Estas limitaciones han llevado a la propuesta de modelos alternativos. Uno de ellos, surgido en los a&ntilde;os 60 para complementar el primero es el atribuido a Cronbach (1971) y llamado de la generalizabilidad, el cual gracias al uso espec&iacute;fico del an&aacute;lisis de variancia hace posible analizar las distintas fuentes de error que se presentan en los puntajes mediante el concepto de faceta, t&eacute;rmino introducido por Cronbach para designar cada una de las caracter&iacute;sticas de la medici&oacute;n y puede modificarse de una ocasi&oacute;n a otra; por tanto, hace variar los resultados obtenidos (por ejemplo, los reactivos de una prueba, las formas de codificar las respuestas, los tipos de examen, etc.).</font></p>  	    <p align="justify"><font face="verdana" size="2">Un m&eacute;todo adicional para la validaci&oacute;n de un instrumento de opci&oacute;n m&uacute;ltiple es el de Sympson y Haladyna (1988) quienes desarrollaron un m&eacute;todo de ponderaci&oacute;n m&uacute;ltiple de las respuestas a los reactivos de una prueba (Backhoff, 2000).</font></p>  	    <p align="justify"><font face="verdana" size="2">Un enfoque m&aacute;s reciente es el de la Teor&iacute;a de la Respuesta al Reactivo (TRR) (Hambleton y Swaminathan, 1985, Embretson y Reise, 2000) que se centra m&aacute;s en las propiedades de los reactivos individuales que en las propiedades globales de la prueba. Se trata de llegar a la elaboraci&oacute;n de instrumentos de medici&oacute;n cuyas caracter&iacute;sticas no sean demasiado influenciadas por un grupo de referencia dado. Se basa en el postulado de que la respuesta de un individuo al reactivo, en particular su probabilidad de dar una respuesta correcta, est&aacute; determinada por dos tipos de factores: por una parte, algunos atributos del sujeto, su competencia por ejemplo, que no son directamente accesibles a la observaci&oacute;n y a la medici&oacute;n y que son generalmente calificados de rasgos latentes y por otra, las propiedades del reactivo, en particular su dificultad, su poder de discriminaci&oacute;n o el azar en algunos casos. Por lo tanto, se considera la respuesta al reactivo como una funci&oacute;n de las caracter&iacute;sticas del individuo y las del reactivo.</font></p>  	    <p align="justify"><font face="verdana" size="2">La propiedad de invarianza es la caracter&iacute;stica principal de la TRR. Nos dice que las estimaciones relativas a los reactivos (par&aacute;metro de dificultad, de discriminaci&oacute;n y de azar) son independientes de la muestra particular de individuos y que las estimaciones relativas a los individuos (nivel de competencia, de habilidad) son independientes de la muestra de reactivos utilizada. Por esto se tiene que asegurar que el ajuste de los datos al modelo sea satisfactorio. As&iacute;, la relaci&oacute;n matem&aacute;tica se puede representar como la probabilidad de contestar satisfactoriamente el reactivo <i>i</i> en funci&oacute;n del nivel de habilidad (<i>&#952;s</i>) para un sujeto <i>s</i>. El &iacute;ndice de discriminaci&oacute;n del reactivo se define como una medida para determinar si las competencias o habilidades que mide la prueba tambi&eacute;n las mide el reactivo. Un buen reactivo debe discriminar entre aqu&eacute;llos que obtuvieron altas calificaciones en la prueba y aqu&eacute;llos que obtuvieron bajas calificaciones.</font></p>  	    <p align="justify"><font face="verdana" size="2">La relaci&oacute;n anterior se expresa por una funci&oacute;n matem&aacute;tica log&iacute;stica (funci&oacute;n caracter&iacute;stica del reactivo) representada por una gr&aacute;fica de forma de sigmoides (Rojas y col. 2004). En la <a href="#f1">figura 1</a> se representa un ejemplo de este tipo de gr&aacute;fica llamada Curva Caracter&iacute;stica del Reactivo (CCR) que muestra la funci&oacute;n de probabilidad (Pis) en funci&oacute;n de la habilidad (<i>&#952;s</i>). Las tres curvas presentan diferentes pendientes que corresponden a diferentes &iacute;ndices de discriminaci&oacute;n. Las curvas deseables son las que presentan una forma de "S", como las 2 y 3, lo que implica que el paso de acertar o fallar debe ser gradual. En tanto que, la curva 1, de forma lineal, es la menos discriminatoria y menos deseable. Estas curvas pueden variar seg&uacute;n el ajuste del modelo.</font></p>  	    ]]></body>
<body><![CDATA[<p align="center"><font face="verdana" size="2"><a name="f1"></a></font></p> 	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/redie/v13n2/a9f1.jpg"></font></p> 	    <p align="justify"><font size="2" face="verdana"><b>El Modelo de Rasch</b></font></p> 	    <p align="justify"><font face="verdana" size="2">El modelo matem&aacute;tico m&aacute;s sencillo en el marco de la TRR, es el propuesto por Georg Rasch (1960), conocido como modelo de un par&aacute;metro. Es un modelo matem&aacute;tico sencillo que permite analizar la medici&oacute;n conjunta en una misma escala, de las personas y de las puntuaciones obtenidas en una prueba dada.</font></p>  	    <p align="justify"><font face="verdana" size="2">Las ventajas del modelo de Rasch con respecto a otros modelos de la TRR es que es muy simple de aplicar. Otra caracter&iacute;stica, es que permite analizar las interacciones entre los alumnos y los reactivos. Adem&aacute;s, las medidas que se obtienen no dependen de las condiciones espec&iacute;ficas de c&oacute;mo son obtenidas. Otra propiedad, es la unidimensionalidad del instrumento, es decir, que todos los reactivos que lo componen contribuyan a evaluar una sola caracter&iacute;stica o competencia. Finalmente, la independencia local postula que la respuesta a un reactivo no est&aacute; influenciada por las respuestas a los otros reactivos del instrumento.</font></p>  	    <p align="justify"><font face="verdana" size="2">El modelo propuesto por Rasch proporciona una soluci&oacute;n para calibrar pruebas de evaluaci&oacute;n y se basa en las siguientes suposiciones: a) el instrumento a medir se representa en una dimensi&oacute;n, en la que se ubican de manera conjunta a los alumnos y a los reactivos de la prueba; b) el nivel del alumno en el instrumento y la dificultad del reactivo determinan la probabilidad de que la respuesta sea correcta.</font></p>  	    <p align="justify"><font face="verdana" size="2">Haciendo un ajuste adecuado de los datos es posible obtener pruebas m&aacute;s eficientes. La relaci&oacute;n matem&aacute;tica se puede representar como la probabilidad de que un reactivo <i>i</i> tenga una respuesta satisfactoria, para un nivel de habilidad <i>&#952;s</i> del sujeto <i>s</i>, seg&uacute;n:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/redie/v13n2/a9e1.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">La ecuaci&oacute;n (1) se puede representar como el cociente entre la probabilidad de una respuesta correcta a un reactivo Pis y la probabilidad de una respuesta incorrecta (1&#45;Pis) y la diferencia entre el nivel de habilidad de una persona (<i>&#952;s</i>) y el nivel de dificultad de un reactivo (<i>&#946;i</i>):</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/redie/v13n2/a9e2.jpg"></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Entonces, cuando una persona responde a un reactivo equivalente a su umbral de competencia (o habilidad), tendr&aacute; la misma probabilidad de una respuesta correcta y de una respuesta incorrecta. Esto es, &#91;Pis/(1&#45;Pis)&#93; = 0.50/0.50 = 1.0. En este caso, se tiene que la dificultad del reactivo es equivalente al nivel de la habilidad de la persona (<i>&#952;s</i>&#45;<i>&#946;i</i>) = 0. Si la habilidad de la persona es mayor que la requerida por el reactivo la probabilidad de una respuesta correcta ser&aacute; mayor que la de una respuesta incorrecta &#91;(<i>&#952;s</i>&#45;<i>&#946;i</i>)&gt;0&#93;. Por el contrario, si la habilidad de la persona es menor que la requerida por el reactivo la probabilidad de respuesta correcta ser&aacute; menor que la de una respuesta incorrecta &#91;(<i>&#952;s</i>&#45;<i>&#946;i</i>)&lt;0)&#93;. Este modelo ha sido aplicado acertadamente en muchas &aacute;reas como, psicolog&iacute;a, educaci&oacute;n, medicina y socio&#45;econom&iacute;a (Golia, 2011). Un buen ajuste de las medidas obtenidas depende de las suposiciones planteadas y la calidad de la prueba.</font></p>  	    <p align="justify"><font face="verdana" size="2">Existen distintas escalas m&eacute;tricas de los valores de las personas y los reactivos. La m&aacute;s utilizada es la escala l&oacute;gitos, que es el Ln&#91;Pis/(1&#45;Pis)&#93;, es decir (<i>&#952;s</i>&#45;<i>&#946;i</i>). La localizaci&oacute;n del punto cero de la escala es arbitraria, pero por tradici&oacute;n el punto cero indica la habilidad media de los sujetos (Embretson y Reise, 2000). El intervalo de probabilidad, en la gran mayor&iacute;a de los casos, se ubica entre &#45;5 y 5.</font></p>  	    <p align="justify"><font face="verdana" size="2">Por tanto, el inter&eacute;s es estimar a los par&aacute;metros, (<i>&#952;s</i>) habilidad de las personas, (<i>&#946;i</i>) &iacute;ndice de dificultad e &iacute;ndice de discriminaci&oacute;n de los reactivos. Como el ajuste es a un solo par&aacute;metro, el &iacute;ndice de discriminaci&oacute;n toma un valor de uno y el &iacute;ndice de dificultad (<i>&#946;i</i>) es el que se estima en el modelo para explicar las caracter&iacute;sticas de cada reactivo. La interpretaci&oacute;n de la prueba se fundamenta en la probabilidad, alta o baja, que tiene un alumno de contestar correctamente un reactivo. Los procedimientos de c&aacute;lculo de &eacute;stos son largos por lo que es necesario usar programas de computadora como, Winsteps, Bigsteps o Rascal, entre otros. Los procedimientos de an&aacute;lisis permiten detectar a los reactivos y a los alumnos que no se ajustan al modelo.</font></p>  	    <p align="justify"><font face="verdana" size="2">Por tanto, adem&aacute;s de estimar los par&aacute;metros antes mencionados es necesario determinar el grado en que los datos obtenidos se ajustan al modelo. Existen dos medidas de bondad de ajuste en el modelo de Rasch: el INFIT que se interpreta como ajuste interno, es un valor sensible al comportamiento inesperado que afecta a los reactivos cuya dificultad est&aacute; cerca del nivel de habilidad de una persona y el OUTFIT que se interpreta como ajuste externo, es un valor sensible al comportamiento inesperado que afecta a los reactivos cuya dificultad est&aacute; lejos del nivel de habilidad de una persona. Estos estad&iacute;sticos se reportan como medias cuadr&aacute;ticas de residuales (MNSQ) y como residuales estandarizados (ZSTD). En la pr&aacute;ctica el criterio que se aplica es que los valores de la media cuadr&aacute;tica deben estar entre 0.8 y 1.3 y los valores estandarizados deben estar entre &#45;2 y 2, lo cual indica un ajuste razonable (Gonz&aacute;lez, 2008). Los valores INFIT o OUTFIT fuera de este intervalo indican una falta de ajuste al modelo, valores de la media cuadr&aacute;tica menores a 0.8 o valores estandarizados menores a &#150;2 indican datos con demasiado determinismo o poco estoc&aacute;sticos, mientras que valores de la media cuadr&aacute;tica mayores a 1.3 o valores estandarizados mayores a 2 indican alta posibilidad de azar (Trist&aacute;n, 1998).</font></p>  	    <p align="justify"><font face="verdana" size="2">Otro estad&iacute;stico &uacute;til en la calibraci&oacute;n de los reactivos es el coeficiente de correlaci&oacute;n punto&#45;media que mide el grado de asociaci&oacute;n entre el puntaje particular observado para el reactivo individual y el puntaje total observado en la prueba. Valores altos de esta correlaci&oacute;n indican que el reactivo "trabaja en la misma direcci&oacute;n que el conjunto de reactivos" al que pertenece la prueba (Gonz&aacute;lez, 2008).</font></p>  	    <p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    <p align="justify"><font face="verdana" size="2"><b>III. Metodolog&iacute;a</b></font></p> 	    <p align="justify"><font face="verdana" size="2">Con el fin de realizar un diagn&oacute;stico de ideas b&aacute;sicas en qu&iacute;mica general se dise&ntilde;&oacute; un examen diagn&oacute;stico (<a href="/img/revistas/redie/v13n2/html/a9a1.htm" target="_blank">Anexo 1</a>) con algunas preguntas tomadas del Journal of Chemical Education (JCE) y otras tomadas de libros de texto correspondientes a los temas de los primeros cursos de qu&iacute;mica de la UAMI. Los temas que se incluyeron fueron: concepto de mol, relaciones molares, nomenclatura de sales, teor&iacute;a cin&eacute;tica de los gases, conservaci&oacute;n de la masa y transformaci&oacute;n de fases.</font></p>  	    <p align="justify"><font face="verdana" size="2">La prueba fue de opci&oacute;n m&uacute;ltiple con 12 reactivos y 5 opciones de respuestas cada una. S&oacute;lo se ten&iacute;a una respuesta correcta y cuatro distractores. Se dio un tiempo de 40 minutos para la resoluci&oacute;n de la prueba, el cual se consider&oacute; suficiente dado que el 95% de los participantes termin&oacute; en ese tiempo.</font></p>  	    <p align="justify"><font face="verdana" size="2">Particip&oacute; una muestra de 219 alumnos del primer a&ntilde;o universitario de la DCBI de la UAMI. La aplicaci&oacute;n de la prueba tuvo lugar durante primavera de 2009. Los resultados fueron recopilados en una base de datos.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    <p align="justify"><font face="verdana" size="2"><b>IV. Resultados y Discusi&oacute;n</b></font></p> 	    <p align="justify"><font face="verdana" size="2">En primer lugar, se calcularon estad&iacute;sticos descriptivos con los datos obtenidos de la aplicaci&oacute;n de la prueba de evaluaci&oacute;n (<a href="/img/revistas/redie/v13n2/html/a9a1.htm" target="_blank">Anexo 1</a>) con el fin de conocer los resultados del grupo (N=219). Se considera este tama&ntilde;o de muestra (N&gt;100) apropiado para su an&aacute;lisis estad&iacute;stico</font></p>  	    <p align="justify"><font face="verdana" size="2">La prueba fue de 12 reactivos, los cuales fueron clasificados en aciertos y desaciertos, a trav&eacute;s de un conjunto de "distractores" o respuestas incorrectas. La prueba no fue planificada con pesos relativos a los aciertos en los diferentes reactivos. Al respecto, se ha reportado (Golia, 2011) que la precisi&oacute;n del modelo de Rasch va en relaci&oacute;n lineal con el tama&ntilde;o de la prueba. Esto es, al aumentar el n&uacute;mero de reactivos, se logra un mejor ajuste. Sin embargo, el autor demostr&oacute; con una prueba con 10 reactivos que el modelo produce medidas de ajuste precisas y estables.</font></p>  	    <p align="justify"><font face="verdana" size="2">En la <a href="#f2">Figura 2</a> se presenta la distribuci&oacute;n de frecuencia porcentual de aciertos de los alumnos del grupo en cada reactivo. El grupo obtuvo un promedio de aciertos de 45% con una desviaci&oacute;n est&aacute;ndar de 19.7%. Cabe mencionar que hubo un menor n&uacute;mero de aciertos que en grupos previamente evaluados (50%) (Mart&iacute;n <i>et al.</i>, 2009).</font></p> 	    <p align="center"><font size="2" face="verdana"><a name="f2"></a></font></p> 	    <p align="center"><font size="2" face="verdana"><img src="/img/revistas/redie/v13n2/a9f2.jpg"></font></p> 	    <p align="justify"><font face="verdana" size="2">Como se expuso anteriormente lo que se busca es la objetividad de la prueba, en consecuencia, se procedi&oacute; a analizar el ajuste de estos datos con el modelo de Rasch mediante el programa Winsteps versi&oacute;n 3.69.1.4.</font></p>  	    <p align="justify"><font face="verdana" size="2">Se estimaron los &iacute;ndices de dificultad (<i>&#946;i</i>) de los 12 reactivos del examen diagn&oacute;stico (<a href="/img/revistas/redie/v13n2/html/a9a1.htm" target="_blank">Anexo</a>), as&iacute; como los valores INFIT y OUTFIT y la correlaci&oacute;n punto&#45;media. En la <a href="/img/revistas/redie/v13n2/a9t1.jpg" target="_blank">Tabla I</a> se muestran los resultados obtenidos al ajustar el modelo a los datos, los reactivos est&aacute;n ordenados, de acuerdo al &iacute;ndice de dificultad (<i>&#946;i</i>), de mayor a menor valor.</font></p>  	    <p align="justify"><font face="verdana" size="2">Se observa que 10 de los 12 reactivos de la prueba presentan valores INFIT dentro de los intervalos descritos anteriormente, de 0.8 a 1.3 para la media cuadr&aacute;tica y de &#45;2 y 2 para los valores estandarizados. Sin embargo, el reactivo 12 presenta un valor estandarizado INFIT mayor a 2, lo que indica una falta de ajuste debido a respuestas al azar &oacute; a una falta de precisi&oacute;n en el enunciado, mientras que el reactivo 9 presenta un valor OUTFIT mayor a 1.3 para la media cuadr&aacute;tica y en el l&iacute;mite para el valor estandarizado. Tambi&eacute;n se puede observar en la <a href="/img/revistas/redie/v13n2/a9t1.jpg" target="_blank">Tabla I</a> que estos dos reactivos son los que tienen una correlaci&oacute;n punto&#45;media m&aacute;s baja, 0.21 y 0.10 respectivamente, mientras que los dem&aacute;s reactivos muestran correlaciones mayores a 0.30. Es decir, que es conveniente revisarlos ya que no se ajustan adecuadamente al modelo.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Con el fin de analizar, del punto de vista de las respuestas, a los reactivos 9 y 12, en la <a href="/img/revistas/redie/v13n2/a9f3.jpg" target="_blank">Figura 3</a> se muestran las gr&aacute;ficas que corresponden al an&aacute;lisis de distractores (o desaciertos) de estos dos reactivos. Se observa la falta de ajuste de los datos de los dos reactivos al modelo. En ambas curvas (respuesta correcta y distractores) los datos est&aacute;n muy dispersos y se alejan de la curva de ajuste.</font></p> 	    <p align="justify"><font face="verdana" size="2">Cabe mencionar, que estos reactivos corresponden a los temas de nomenclatura y relaci&oacute;n de moles, respectivamente, los cuales se suponen son conocidos por los alumnos. En el reactivo 9 la opci&oacute;n (B) que es incorrecta, es la que responden con mayor frecuencia, esto es, que no tienen conocimientos de las cargas de los elementos qu&iacute;micos. En tanto que el reactivo 12, sobre relaci&oacute;n molar, parece que si discrimina pues los alumnos con mayor habilidad eligen la respuesta correcta, sin embargo, no se ajusta al modelo de Rasch. Por tanto, es importante hacer un an&aacute;lisis m&aacute;s profundo de estos dos reactivos tomando en consideraci&oacute;n adem&aacute;s de los aciertos, a cada uno de los distractores de los reactivos y al enunciado de los mismos.</font></p> 	    <p align="justify"><font face="verdana" size="2">Se repiti&oacute; el an&aacute;lisis sin considerar a los reactivos 9 y 12, los cuales como comentamos antes, deben ser revisados. Los resultados se muestran en la <a href="/img/revistas/redie/v13n2/a9t2.jpg" target="_blank">tabla II</a>. Se observa que con los 10 reactivos los valores INFIT y OUTFIT est&aacute;n dentro de los l&iacute;mites establecidos, lo que indica un ajuste razonable al modelo, y las correlaciones son mayores a 0.30. Por otro lado, los &iacute;ndices de dificultad de los reactivos toman valores de &#45;1.84 (m&aacute;s f&aacute;cil) a 2.35 (m&aacute;s dif&iacute;cil) con un promedio de 0 y una desviaci&oacute;n est&aacute;ndar de 1.17.</font></p>  	    <p align="justify"><font face="verdana" size="2">La <a href="/img/revistas/redie/v13n2/a9f4.jpg" target="_blank">Figura 4</a> es una representaci&oacute;n gr&aacute;fica del escalamiento de la dificultad de los reactivos y de los alumnos en una sola escala (&#45;3 a +3 l&oacute;gitos) y es llamada mapa de alineaci&oacute;n de los reactivos y alumnos del grupo evaluado. Del lado izquierdo est&aacute;n representados los alumnos y del lado derecho los reactivos.</font></p>  	    <p align="justify"><font face="verdana" size="2">La estimaci&oacute;n de la habilidad de los alumnos est&aacute; entre &#45;2.66 l&oacute;gitos (menor habilidad) a 2.73 l&oacute;gitos (mayor habilidad), con un promedio de &#45;0.12 y una desviaci&oacute;n est&aacute;ndar de 1.21. Se observa que la distribuci&oacute;n de la habilidad de los alumnos es aproximadamente normal, que la diferencia entre la media de habilidad de los alumnos y la media de dificultad de los reactivos es peque&ntilde;a y que hay alumnos con habilidad por debajo de la dificultad de los reactivos y tambi&eacute;n por arriba. Adem&aacute;s, la dificultad de los reactivos no es uniforme, ya que se observan huecos entre los reactivos 10 y 7, 3 y 11, as&iacute; como entre los reactivos 1 y 4. Esto es, que es necesario ampliar la prueba dise&ntilde;ando m&aacute;s reactivos.</font></p>  	    <p align="justify"><font face="verdana" size="2">Es evidente que, un examen que sea 100% confiable no es siempre posible de alcanzar, de all&iacute; que sea necesario complementar la evaluaci&oacute;n de los conocimientos de los alumnos con otros tipos de evaluaci&oacute;n y que sean continuamente analizadas. De igual forma, aun cuando se demostr&oacute; la utilidad del modelo de Rash como una herramienta que permite conocer a la habilidad que tiene el alumno en responder a los reactivos que dise&ntilde;amos, como una funci&oacute;n de su dificultad, tambi&eacute;n permite visualizar factores que con frecuencia ignoramos como son, la elaboraci&oacute;n de un buen enunciado y respuestas y distractores adecuados.</font></p>  	    <p align="justify"><font face="verdana" size="2">En la UAMI, no se tiene la costumbre de analizar los ex&aacute;menes que se aplican. Siempre se consideran como buenos. Sin embargo, no siempre se tienen ex&aacute;menes homog&eacute;neos y confiables que sean aplicables a cualquier grupo, con cualquier profesor y en cualquier momento; de all&iacute;, que sea necesaria su valoraci&oacute;n continua.</font></p>  	    <p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    <p align="justify"><font face="verdana" size="2"><b>V. Conclusiones</b></font></p> 	    <p align="justify"><font face="verdana" size="2">El grupo obtuvo un porcentaje promedio de 45% de aciertos con una desviaci&oacute;n est&aacute;ndar de 19.7%.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">A trav&eacute;s del modelo de Rasch fue posible conocer la calidad de los reactivos de nuestra prueba mediante los datos estad&iacute;sticos que reporta el paquete. Se comprob&oacute; que s&oacute;lo dos de los reactivos (9 y 12), de un total de 12 del instrumento de medici&oacute;n, no se ajustaron al modelo de Rasch, los cuales deben revisarse y analizarlos con mayor profundidad a trav&eacute;s de los distractores de cada uno para lograr mejorarlos y reutilizarlos.</font></p>  	    <p align="justify"><font face="verdana" size="2">Adem&aacute;s, el an&aacute;lisis permiti&oacute; comprobar que los reactivos usados presentaron diferentes grados de dificultad, los cuales estuvieron en funci&oacute;n de la habilidad de los alumnos del grupo evaluado. Asimismo, se detect&oacute; la ausencia de reactivos en algunos intervalos de la escala de &iacute;ndices de dificultad, por lo que deben agregarse nuevos reactivos a la prueba de evaluaci&oacute;n para lograr que &eacute;ste sea m&aacute;s completo.</font></p>  	    <p align="justify"><font face="verdana" size="2">Es importante se&ntilde;alar que la aplicaci&oacute;n del m&eacute;todo de Rasch para evaluar la calidad de los ex&aacute;menes, adem&aacute;s de servir para poder mejorar el instrumento, que a veces se considera muy bueno, permite realizar una evaluaci&oacute;n m&aacute;s confiable de los estudiantes. En resumen, el modelo de Rasch es una herramienta valiosa para la calibraci&oacute;n de pruebas de evaluaci&oacute;n.</font></p>  	    <p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    <p align="justify"><font face="verdana" size="2"><b><a href="/img/revistas/redie/v13n2/html/a9a1.htm" target="_blank">ANEXO 1</a></b></font></p> 	    <p align="justify"><font size="2" face="verdana">&nbsp;</font></p> 	    <p align="justify"><font face="verdana" size="2"><b>Referencias</b></font></p> 	    <!-- ref --><p align="justify"><font face="verdana" size="2">Backhoff E., Larrazolo N. y Rosas N. (2000). Nivel de dificultad y poder de discriminaci&oacute;n del examen de habilidades y conocimientos b&aacute;sicos (EXHCOBA). <i>Revista Electr&oacute;nica de Investigaci&oacute;n Educativa, 2</i>(1).    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018652&pid=S1607-4041201100020000900001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Backhoff, E., Tirado F. y Larrazolo N. (2001). Ponderaci&oacute;n diferencial de reactivos para mejorar la validez de una prueba de ingreso a la universidad. <i>RevistaElectr&oacute;nica de Investigaci&oacute;n Educativa</i>, <i>3</i>(1).    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018654&pid=S1607-4041201100020000900002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Budescu, D. V. (1979). <i>Differential weighting of multiple choice items</i>. Princeton: Educational Testing Service.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018656&pid=S1607-4041201100020000900003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Cronbach, L. J. (1971). Test validation. En R. L. Thorndike (Ed.), <i>Educational measurement</i> (2a. ed.). Washington: Consejo Americano en Educaci&oacute;n.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018658&pid=S1607-4041201100020000900004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Embretson S. E. y Reise S. P. (2000). Item response theory for psychologists. Mahwah, NJ: LEA.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018660&pid=S1607-4041201100020000900005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Golia, S. (2011). The impact of questionnaire size on the accurace of the Rasch measure. <i>Journalof Applied Science, 11</i>(4), 707&#45;712.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018662&pid=S1607-4041201100020000900006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Gonz&aacute;lez M., M. J. (2008). <i>El an&aacute;lisis de reactivos en el modelo de Rasch.</i> Manual T&eacute;cnico A. Serie Medici&oacute;n y Metodolog&iacute;a. M&eacute;xico: Universidad de Sonora, Instituto Nacional para la Evaluaci&oacute;n de la Educaci&oacute;n.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018664&pid=S1607-4041201100020000900007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Hambleton, R. K. y Swaminathan, H. (1985). <i>Item Response Theory: Principles and applications</i>. Boston, MA: Kluwer&#45;Nijhoff Publishing.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018666&pid=S1607-4041201100020000900008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Martin&#45;Guaregua, N., C&oacute;rdoba&#45;Herrrera, G., Lomas&#45;Romero, L., Rojas H. A. y Picquart, M. (2009). <i>Errores conceptuales de qu&iacute;mica b&aacute;sica en alumnos delprimer a&ntilde;o universitario</i>. Ense&ntilde;anza de la ciencias, VIII CIDEC, pp. 950&#45;951. <a href="http://ensciencias.uab.es/congreso09/numeroextra/art-950-951.pdf" target="_blank">http://ensciencias.uab.es/congreso09/numeroextra/art&#45;950&#45;951.pdf</a></font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018668&pid=S1607-4041201100020000900009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Mu&ntilde;iz, J. (1997). <i>Introducci&oacute;n a la Teor&iacute;a de Respuestas a los &Iacute;tems</i>. Madrid: Pir&aacute;mide.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018669&pid=S1607-4041201100020000900010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Planinic, M., Ivanjek, L. y Susac, A. (2009). The Rasch model based analysis of the Force Concept Iventory. <i>Physical Review Special Topics&#45;Physics Education Research, 6</i>(1), 1&#45;9.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018671&pid=S1607-4041201100020000900011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Prieto, G. y Delgado A. R. (2003). An&aacute;lisis de un test mediante el modelo de Rasch. <i>Psicothema, 15</i>(1), 94&#45;100.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018673&pid=S1607-4041201100020000900012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Rasch, G. (1960). <i>Probabilistic models for some intelligence and attainment tests.</i> Copenague: Danish Institute for Educational Research.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018675&pid=S1607-4041201100020000900013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Rojas, R. M., Manriquez LL., G., Gatica A., Y. y Salcedo A, L. P. (2004). Curso de UML Multiplataforma Adaptativo basado en la Teor&iacute;a de Respuesta al Item. <i>Revista Ingenier&iacute;a Inform&aacute;tica</i>, <i>10</i>.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018677&pid=S1607-4041201100020000900014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Spearman, C. E. (1904). The proof and measurement of association between two things, <i>American Journal of Psychology, 15</i>, 75&#45;101.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018679&pid=S1607-4041201100020000900015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Stevens, S. S. (1946). On the theory of scales of measurement. <i>Science, 103</i>, 667&#45;680.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018681&pid=S1607-4041201100020000900016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Sympson, J. B. y Haladyna, T. M. (1988). An evaluation of "polyweighting" in domain referenced testing. Trabajo presentado en la Reuni&oacute;n Anual de la American Educational Research Association, Nueva Orleans, EE.UU.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018683&pid=S1607-4041201100020000900017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Trist&aacute;n L. A. (2001). <i>An&aacute;lisis de Rasch para todos: una gu&iacute;a simplificada para evaluadores educativos</i>. M&eacute;xico: Centro Nacional de Evaluaci&oacute;n.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7018685&pid=S1607-4041201100020000900018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>       ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Backhoff]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
<name>
<surname><![CDATA[Larrazolo]]></surname>
<given-names><![CDATA[N.]]></given-names>
</name>
<name>
<surname><![CDATA[Rosas]]></surname>
<given-names><![CDATA[N.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Nivel de dificultad y poder de discriminación del examen de habilidades y conocimientos básicos (EXHCOBA)]]></article-title>
<source><![CDATA[Revista Electrónica de Investigación Educativa]]></source>
<year>2000</year>
<volume>2</volume>
<numero>1</numero>
<issue>1</issue>
</nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Backhoff]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
<name>
<surname><![CDATA[Tirado]]></surname>
<given-names><![CDATA[F.]]></given-names>
</name>
<name>
<surname><![CDATA[Larrazolo]]></surname>
<given-names><![CDATA[N.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Ponderación diferencial de reactivos para mejorar la validez de una prueba de ingreso a la universidad]]></article-title>
<source><![CDATA[RevistaElectrónica de Investigación Educativa]]></source>
<year>2001</year>
<volume>3</volume>
<numero>1</numero>
<issue>1</issue>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Budescu]]></surname>
<given-names><![CDATA[D. V.]]></given-names>
</name>
</person-group>
<source><![CDATA[Differential weighting of multiple choice items]]></source>
<year>1979</year>
<publisher-loc><![CDATA[Princeton ]]></publisher-loc>
<publisher-name><![CDATA[Educational Testing Service]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cronbach]]></surname>
<given-names><![CDATA[L. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Test validation]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Thorndike]]></surname>
<given-names><![CDATA[R. L.]]></given-names>
</name>
</person-group>
<source><![CDATA[Educational measurement]]></source>
<year>1971</year>
<edition>2a</edition>
<publisher-loc><![CDATA[Washington ]]></publisher-loc>
<publisher-name><![CDATA[Consejo Americano en Educación]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Embretson]]></surname>
<given-names><![CDATA[S. E.]]></given-names>
</name>
<name>
<surname><![CDATA[Reise]]></surname>
<given-names><![CDATA[S. P.]]></given-names>
</name>
</person-group>
<source><![CDATA[Item response theory for psychologists]]></source>
<year>2000</year>
<publisher-loc><![CDATA[Mahwah^eNJ NJ]]></publisher-loc>
<publisher-name><![CDATA[LEA]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Golia]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The impact of questionnaire size on the accurace of the Rasch measure]]></article-title>
<source><![CDATA[Journalof Applied Science]]></source>
<year>2011</year>
<volume>11</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>707-712</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[González M.]]></surname>
<given-names><![CDATA[M. J.]]></given-names>
</name>
</person-group>
<source><![CDATA[El análisis de reactivos en el modelo de Rasch]]></source>
<year>2008</year>
<publisher-name><![CDATA[Universidad de Sonora, Instituto Nacional para la Evaluación de la Educación]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hambleton]]></surname>
<given-names><![CDATA[R. K.]]></given-names>
</name>
<name>
<surname><![CDATA[Swaminathan]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
</person-group>
<source><![CDATA[Item Response Theory: Principles and applications]]></source>
<year>1985</year>
<publisher-loc><![CDATA[Boston^eMA MA]]></publisher-loc>
<publisher-name><![CDATA[Kluwer-Nijhoff Publishing]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Martin-Guaregua]]></surname>
<given-names><![CDATA[N.]]></given-names>
</name>
<name>
<surname><![CDATA[Córdoba-Herrrera]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
<name>
<surname><![CDATA[Lomas-Romero]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
<name>
<surname><![CDATA[Rojas]]></surname>
<given-names><![CDATA[H. A.]]></given-names>
</name>
<name>
<surname><![CDATA[Picquart]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Errores conceptuales de química básica en alumnos delprimer año universitario]]></article-title>
<source><![CDATA[Enseñanza de la ciencias]]></source>
<year>2009</year>
<volume>VIII</volume>
<page-range>950-951</page-range><publisher-name><![CDATA[CIDEC]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Muñiz]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<source><![CDATA[Introducción a la Teoría de Respuestas a los Ítems]]></source>
<year>1997</year>
<publisher-loc><![CDATA[Madrid ]]></publisher-loc>
<publisher-name><![CDATA[Pirámide]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Planinic]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[Ivanjek]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
<name>
<surname><![CDATA[Susac]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Rasch model based analysis of the Force Concept Iventory]]></article-title>
<source><![CDATA[Physical Review Special Topics-Physics Education Research]]></source>
<year>2009</year>
<volume>6</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>1-9</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Prieto]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
<name>
<surname><![CDATA[Delgado]]></surname>
<given-names><![CDATA[A. R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Análisis de un test mediante el modelo de Rasch]]></article-title>
<source><![CDATA[Psicothema]]></source>
<year>2003</year>
<volume>15</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>94-100</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rasch]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
</person-group>
<source><![CDATA[Probabilistic models for some intelligence and attainment tests]]></source>
<year>1960</year>
<publisher-loc><![CDATA[Copenague ]]></publisher-loc>
<publisher-name><![CDATA[Danish Institute for Educational Research]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rojas]]></surname>
<given-names><![CDATA[R. M.]]></given-names>
</name>
<name>
<surname><![CDATA[Manriquez LL.]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
<name>
<surname><![CDATA[Gatica A.]]></surname>
<given-names><![CDATA[Y.]]></given-names>
</name>
<name>
<surname><![CDATA[Salcedo A]]></surname>
<given-names><![CDATA[L. P.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Curso de UML Multiplataforma Adaptativo basado en la Teoría de Respuesta al Item]]></article-title>
<source><![CDATA[Revista Ingeniería Informática]]></source>
<year>2004</year>
<volume>10</volume>
</nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Spearman]]></surname>
<given-names><![CDATA[C. E.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The proof and measurement of association between two things]]></article-title>
<source><![CDATA[American Journal of Psychology]]></source>
<year>1904</year>
<volume>15</volume>
<page-range>75-101</page-range></nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Stevens]]></surname>
<given-names><![CDATA[S. S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[On the theory of scales of measurement]]></article-title>
<source><![CDATA[Science]]></source>
<year>1946</year>
<volume>103</volume>
<page-range>667-680</page-range></nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="confpro">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sympson]]></surname>
<given-names><![CDATA[J. B.]]></given-names>
</name>
<name>
<surname><![CDATA[Haladyna]]></surname>
<given-names><![CDATA[T. M.]]></given-names>
</name>
</person-group>
<source><![CDATA[An evaluation of "polyweighting" in domain referenced testing]]></source>
<year>1988</year>
<conf-name><![CDATA[ Reunión Anual de la American Educational Research Association]]></conf-name>
<conf-loc>Nueva Orleans </conf-loc>
</nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tristán]]></surname>
<given-names><![CDATA[L. A.]]></given-names>
</name>
</person-group>
<source><![CDATA[Análisis de Rasch para todos: una guía simplificada para evaluadores educativos]]></source>
<year>2001</year>
<publisher-name><![CDATA[Centro Nacional de Evaluación]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
