<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2007-5057</journal-id>
<journal-title><![CDATA[Investigación en educación médica]]></journal-title>
<abbrev-journal-title><![CDATA[Investigación educ. médica]]></abbrev-journal-title>
<issn>2007-5057</issn>
<publisher>
<publisher-name><![CDATA[Universidad Nacional Autónoma de México, Facultad de Medicina]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2007-50572013000200007</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Confiabilidad en la medición]]></article-title>
<article-title xml:lang="en"><![CDATA[Reliability of measurement]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Reidl-Martínez]]></surname>
<given-names><![CDATA[Lucy María]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Nacional Autónoma de México Facultad de Psicología División de Estudios de Posgrado]]></institution>
<addr-line><![CDATA[México D.F.]]></addr-line>
<country>México</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>06</month>
<year>2013</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>06</month>
<year>2013</year>
</pub-date>
<volume>2</volume>
<numero>6</numero>
<fpage>107</fpage>
<lpage>111</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_arttext&amp;pid=S2007-50572013000200007&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&amp;pid=S2007-50572013000200007&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_pdf&amp;pid=S2007-50572013000200007&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[En la investigación educativa de tipo cuantitativo, los instrumentos para la recopilación de información deben llevar a la validez y confiabilidad de los resultados. Una pregunta que los investigadores se hacen con frecuencia es la referida, a qué tan alto o de qué tamaño tiene que ser el coeficiente de confiabilidad. Esto dependerá del propósito e importancia de las decisiones que se tomarán con base en los puntajes obtenidos por los sujetos. La confiabilidad es un atributo necesario en todas las pruebas cuantitativas que se utilicen para evaluar a alguien. El presente escrito tiene como propósito abordar la confiabilidad de la medición. Para lograrlo se revisan los siguientes puntos: teoría de la medición del error, modelo dominio-muestra, estabilidad temporal o coeficiente de estabilidad, formas paralelas o coeficiente de estabilidad y equivalencia y los coeficientes de consistencia interna más usuales.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[In quantitative educational research, instruments for data collection should lead to the validity and reliability of results. A question that researchers are frequently referred to is how high or how large must the reliability coefficient be. This depends on the purpose and importance of the decisions to be made, based on the scores obtained by the subjects. Reliability is a necessary attribute in all quantitative tests used to assess someone. The present paper aims to address the reliability of the measurement. To achieve the following chapters are reviewed: theory of measurement error, domain-sample model, temporal stability or stability coefficient, parallel forms or stability coefficient and equivalence and some of the most used internal consistency coefficients.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Confiabilidad]]></kwd>
<kwd lng="es"><![CDATA[investigación educativa]]></kwd>
<kwd lng="es"><![CDATA[análisis de datos]]></kwd>
<kwd lng="es"><![CDATA[México]]></kwd>
<kwd lng="en"><![CDATA[Reliability]]></kwd>
<kwd lng="en"><![CDATA[educational research]]></kwd>
<kwd lng="en"><![CDATA[data analysis]]></kwd>
<kwd lng="en"><![CDATA[Mexico]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  	    <p align="justify"><font face="verdana" size="4">Metodolog&iacute;a de investigaci&oacute;n en educaci&oacute;n m&eacute;dica</font></p>      <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="4"><b>Confiabilidad en la medici&oacute;n</b></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="3"><b>Reliability of measurement</b></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="2"><b>Lucy Mar&iacute;a Reidl&#45;Mart&iacute;nez</b></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><i>Divisi&oacute;n de Estudios de Posgrado, Facultad de Psicolog&iacute;a, Universidad Nacional Aut&oacute;noma de M&eacute;xico. M&eacute;xico D.F., M&eacute;xico.</i></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Correspondencia:    <br> 	</b><i>Lucy Mar&iacute;a Reidl&#45;Mart&iacute;nez.    <br> 	Divisi&oacute;n de Estudios de Posgrado,    <br> 	Facultad de Psicolog&iacute;a, Universidad Nacional Aut&oacute;noma de M&eacute;xico.    <br> 	Edificio de los Consejos Acad&eacute;micos, Ciudad Universitaria,    <br> 	Delegaci&oacute;n Coyoac&aacute;n, C.P. 04510, M&eacute;xico D.F., M&eacute;xico.</i>    <br> 	Correo electr&oacute;nico: <a href="mailto:lucym@unam.mx">lucym@unam.mx</a></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2">Recepci&oacute;n 25 de diciembre de 2012.    ]]></body>
<body><![CDATA[<br> 	Aceptaci&oacute;n 25 de enero de 2013</font>.</p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Resumen</b></font></p>  	    <p align="justify"><font face="verdana" size="2">En la investigaci&oacute;n educativa de tipo cuantitativo, los instrumentos para la recopilaci&oacute;n de informaci&oacute;n deben llevar a la validez y confiabilidad de los resultados. Una pregunta que los investigadores se hacen con frecuencia es la referida, a qu&eacute; tan alto o de qu&eacute; tama&ntilde;o tiene que ser el coeficiente de confiabilidad. Esto depender&aacute; del prop&oacute;sito e importancia de las decisiones que se tomar&aacute;n con base en los puntajes obtenidos por los sujetos. La confiabilidad es un atributo necesario en todas las pruebas cuantitativas que se utilicen para evaluar a alguien. El presente escrito tiene como prop&oacute;sito abordar la confiabilidad de la medici&oacute;n. Para lograrlo se revisan los siguientes puntos: teor&iacute;a de la medici&oacute;n del error, modelo dominio&#45;muestra, estabilidad temporal o coeficiente de estabilidad, formas paralelas o coeficiente de estabilidad y equivalencia y los coeficientes de consistencia interna m&aacute;s usuales.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Palabras clave:</b> Confiabilidad; investigaci&oacute;n educativa; an&aacute;lisis de datos; M&eacute;xico.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Abstract</b></font></p>  	    <p align="justify"><font face="verdana" size="2">In quantitative educational research, instruments for data collection should lead to the validity and reliability of results. A question that researchers are frequently referred to is how high or how large must the reliability coefficient be. This depends on the purpose and importance of the decisions to be made, based on the scores obtained by the subjects. Reliability is a necessary attribute in all quantitative tests used to assess someone. The present paper aims to address the reliability of the measurement. To achieve the following chapters are reviewed: theory of measurement error, domain&#45;sample model, temporal stability or stability coefficient, parallel forms or stability coefficient and equivalence and some of the most used internal consistency coefficients.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Keywords:</b> Reliability; educational research; data analysis; Mexico.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Un elemento esencial en los proyectos de investigaci&oacute;n educativa son los instrumentos para la recopilaci&oacute;n de informaci&oacute;n. Estos deben llevar a la validez y confiabilidad de los resultados. El presente documento tiene como prop&oacute;sito abordar la confiabilidad de la medici&oacute;n.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Teor&iacute;a de la medici&oacute;n del error</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Es en el campo de la psicolog&iacute;a donde se desarroll&oacute; desde hace ya tiempo, alrededor de los a&ntilde;os 50 del siglo pasado, <i>la teor&iacute;a de la medici&oacute;n del error,</i> con el objetivo de poder construir instrumentos que midieran de manera confiable y v&aacute;lida, muchas de las variables que estudia esta disciplina: la inteligencia, la personalidad, las actitudes, las opiniones, la ansiedad, los diferentes motivos que impulsan al ser humano, las expresiones emocionales, los sentimientos, los s&iacute;ntomas y los trastornos de personalidad, las habilidades, las intenciones, las creencias, entre otras muchas cuestiones de inter&eacute;s para la disciplina.<sup>1</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">Y un tiempo despu&eacute;s, se desarrolla otro modelo de medici&oacute;n, que al mismo tiempo que da mayor sentido al primero, resuelve las deficiencias que &eacute;ste ten&iacute;a, surgiendo as&iacute;, el <i>modelo dominio&#45;muestra.</i> Al ser la psicolog&iacute;a una disciplina que pretende explicar el comportamiento humano, as&iacute; como sus sentimientos, estados de &aacute;nimo, sus creencias y expectativas, y muchas cuestiones m&aacute;s, tambi&eacute;n se ha visto utilizada o abordada por otras disciplinas, como es el caso de la medicina humana, la sociolog&iacute;a, la mercadotecnia, la pol&iacute;tica, entre otras.</font></p>  	    <p align="justify"><font face="verdana" size="2">Lo anterior llev&oacute; a definir a la medici&oacute;n de diversas maneras: a) como la asignaci&oacute;n de n&uacute;meros a las cantidades de propiedades de los objetos de acuerdo con reglas dadas cuya validez puede probarse emp&iacute;ricamente; </font><font face="verdana" size="2">b)&nbsp;en t&eacute;rminos m&aacute;s sencillos se puede definir como la asignaci&oacute;n de la magnitud en que un objeto o sujeto posee cierta propiedad, con ayuda del sistema num&eacute;rico<sup>2</sup> o, </font><font face="verdana" size="2">c)&nbsp;en t&eacute;rminos de dos conceptos relativamente sencillos: de un conjunto de reglas para asignar s&iacute;mbolos a objetos de manera que representen num&eacute;ricamente, cantidades de atributos (escalamiento) y definir si los objetos pertenecen a la misma o diferentes categor&iacute;as, en relaci&oacute;n con un atributo dado (clasificaci&oacute;n).<sup>3</sup></font></p>     <p align="justify"><font face="verdana" size="2">En medici&oacute;n se parte del supuesto de que el procedimiento de aplicar pruebas objetivas, consiste en presentar a la persona un n&uacute;mero de reactivos (preguntas o aseveraciones) que debe contestar, y cada respuesta se califica como correcta/incorrecta, de acuerdo/en desacuerdo (1 y 0), o en una escala que puede ir del 1 al 5 (7, 9 o 4, 6, 8 o alg&uacute;n otro n&uacute;mero), donde en la medida en que incrementa el valor num&eacute;rico escogido por el respondiente, se reporta una mayor cantidad de la variable (cualquiera que &eacute;sta sea) pose&iacute;da o descriptora del sujeto.<sup>4</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">Los n&uacute;meros usados pueden proporcionar diferentes cantidades de informaci&oacute;n, que permite distinguir entre tres niveles de medida; las magnitudes o n&uacute;meros asignados pueden corresponder a una escala ordinal, una de intervalo o una de proporci&oacute;n. La primera proporciona informaci&oacute;n sobre el orden de los objetos o sujetos respecto al rasgo o variable que se mide; la segunda proporciona informaci&oacute;n acerca del tama&ntilde;o de las diferencias entre los objetos o sujetos respecto a la magnitud del rasgo o variable medida; y la tercera da informaci&oacute;n no s&oacute;lo del orden de rango de los sujetos u objetos y del tama&ntilde;o relativo de las diferencias, sino tambi&eacute;n de la relaci&oacute;n entre las proporciones o mediciones mismas.</font></p>  	    <p align="justify"><font face="verdana" size="2">La calificaci&oacute;n obtenida por el respondiente ser&aacute; la suma de los n&uacute;meros escogidos por &eacute;l, a lo largo de los diversos reactivos, preguntas, aseveraciones o problemas respondidos. Y es aqu&iacute; donde surge el problema de determinar la exactitud de dicha medici&oacute;n. El error de medici&oacute;n en este tipo de instrumentos, como se puede imaginar, es mucho mayor que lo que podr&iacute;a ser en otras &aacute;reas como la f&iacute;sica.</font></p>  	    <p align="justify"><font face="verdana" size="2">Para atender esta problem&aacute;tica se requiere hacer una serie de suposiciones al respecto de la relaci&oacute;n existente entre los <i>puntajes verdaderos</i> (T) y los de <i>error</i> (E). Se parte del supuesto de que cada calificaci&oacute;n observada (X) tiene dos componentes: a) la calificaci&oacute;n verdadera del sujeto en la variable que se est&aacute; midiendo (T), que es m&aacute;s o menos estable siempre y cuando se est&eacute; midiendo lo mismo en diversas ocasiones; y b) el componente de error (E), que puede deberse a que el sujeto responda de manera correcta el reactivo o pregunta por cuestiones de azar, o que responda correctamente por que conoce la respuesta (pruebas de conocimiento); en el caso de medir por ejemplo, actitudes o rasgos de personalidad, el sujeto puede responder, por ejemplo, de manera socialmente deseable (atribuy&eacute;ndose una actitud o rasgo valorado como negativo con menor intensidad a lo que realmente siente o lo describe), o independientemente de ello. Cualquiera que sea la situaci&oacute;n, se supone que las calificaciones o puntajes obtenidos por los individuos (puntajes observados, X), quedan constituidos por la suma de los puntajes verdaderos (T) y los de error (E). Existen dos tipos de error, el aleatorio y el sistem&aacute;tico o constante. Si el procedimiento de medici&oacute;n da puntajes consistentemente mayores (o menores) de lo que deber&iacute;an de ser, se denomina error constante; si en ocasiones el error es grande, en otras es peque&ntilde;o, o a veces es positivo y otras es negativo, se habla del error aleatorio o al azar.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Los supuestos b&aacute;sicos de la teor&iacute;a de la medici&oacute;n por medio de pruebas o escalas, parten del supuesto del comportamiento aleatorio del error, que se&ntilde;ala que si &eacute;ste se presenta en un n&uacute;mero suficientemente grande de casos, en la medida en que este n&uacute;mero aumente, la media o promedio de la suma de estos errores se acerca a cero. Este supuesto puede referirse a reactivos o preguntas, o a personas o sujetos que los contesten. Derivado de lo anterior, tambi&eacute;n se puede suponer que en la medida en que aumente el n&uacute;mero de casos, la correlaci&oacute;n entre los puntajes verdaderos y los de error, se acerca a cero.</font></p>  	    <p align="justify"><font face="verdana" size="2">Otra manera de definir el error aleatorio tiene que ver con la correlaci&oacute;n del error en una prueba y el error de otra prueba (paralela, que mida lo mismo). Es decir, el modelo plantea que la correlaci&oacute;n entre dos conjuntos de errores aleatorios es cero, o se acerca a cero en la medida en que incrementa el n&uacute;mero de casos. Aunque este supuesto s&oacute;lo es cierto en la medida en que el n&uacute;mero de casos se acerca al infinito, en la pr&aacute;ctica, se supone que esto se mantiene para cualquier conjunto dado de datos.</font></p>  	    <p align="justify"><font face="verdana" size="2">Resumiendo, los supuestos de los que se parte en la teor&iacute;a de la medici&oacute;n del error aleatorio son los siguientes:</font></p>  	    <p align="justify"><font face="verdana" size="2">a) el error promedio es igual a cero; b) la correlaci&oacute;n entre la calificaci&oacute;n del error y la calificaci&oacute;n verdadera es cero; y c) la correlaci&oacute;n entre los errores de una prueba y los de otra prueba paralela es igual a cero. Obviamente estos supuestos s&oacute;lo se mantienen cuando el n&uacute;mero de casos es muy grande (cercano al &infin;), pero se utilizan como punto de partida para cualquier conjunto de datos obtenido por pruebas, escalas o cuestionarios.</font></p>  	    <p align="justify"><font face="verdana" size="2">Entre las diversas teor&iacute;as de la medici&oacute;n del error, algunas suponen que la calificaci&oacute;n verdadera obtenida por el sujeto ser&iacute;a la calificaci&oacute;n promedio que se obtendr&iacute;a si se repitiera la aplicaci&oacute;n de la prueba en un n&uacute;mero infinitamente grande de ocasiones, situaci&oacute;n que nunca ocurre. Este error en la medici&oacute;n se denomina error est&aacute;ndar de la medici&oacute;n, de acuerdo a algunos modelos de medici&oacute;n, y se considera que se distribuye de manera normal alrededor de las calificaciones verdaderas, y que es una constante para cualquier objeto que se mida.<sup>3,5</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Modelo dominio&#45;muestra</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Otro modelo particular que da lugar a poder hablar de calificaciones verdaderas es el que parte del muestreo de un dominio donde se construye una prueba seleccionando un n&uacute;mero espec&iacute;fico de preguntas al azar, de un conjunto infinitamente grande y homog&eacute;neo de reactivos. Este modelo, denominado modelo dominio&#45;muestra, parte del supuesto de que la variedad de reactivos o preguntas que componen a una prueba, tienen efectos semejantes a aquellos que procedieran de un muestreo realmente aleatorio de los mismos. Se&ntilde;ala tambi&eacute;n, que el prop&oacute;sito de cualquier medici&oacute;n es el de estimar la medida que se obtendr&iacute;a si uno utilizara todos los reactivos del dominio. La calificaci&oacute;n verdadera corresponder&iacute;a a la que obtendr&iacute;a el sujeto si respondiera a todas las preguntas del dominio, y por ello una prueba, (un conjunto de reactivos o preguntas) ser&aacute; confiable en el grado en que la calificaci&oacute;n que arroje correlacione en buena medida con las calificaciones verdaderas.</font></p>  	    <p align="justify"><font face="verdana" size="2">Como modelo que es, supone que existe una matriz de correlaciones infinitamente grande, y la correlaci&oacute;n promedio de esta matriz indica la medida en que existe un n&uacute;cleo o elemento entre todas las variables (preguntas o reactivos); y la dispersi&oacute;n de los valores de las posibles correlaciones, se&ntilde;ala el grado en que las variables var&iacute;an en compartir este n&uacute;cleo o elemento com&uacute;n.<sup>3,5,6</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">El modelo de pruebas paralelas es una de las alternativas del modelo dominio&#45;muestra, y supone que dos o m&aacute;s pruebas producen calificaciones verdaderas iguales, pero que generan errores de medici&oacute;n independientes para cada una de ellas. El uso de formas paralelas o alternas de una prueba es una manera de evitar las dificultades de la confiabilidad de <i>test&#45;retest,</i> que queda establecida por la correlaci&oacute;n entre ambas aplicaciones, donde la varianza de error puede provenir de fluctuaciones aleatorias de la ejecuci&oacute;n de una sesi&oacute;n a otra, de condiciones no controladas de la aplicaci&oacute;n, condiciones de los examinados (fatiga, tensi&oacute;n, etc.).<sup>6</sup></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Confiabilidad</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Ahora bien, de los supuestos anteriores derivan las diversas formas de determinar la confiabilidad de las pruebas. La confiabilidad de una prueba se refiere a la consistencia de las calificaciones obtenidas por las mismas personas en ocasiones diferentes o con diferentes conjuntos de reactivos equivalentes.<sup>7</sup> El concepto de confiabilidad subyace al error de medici&oacute;n de una sola calificaci&oacute;n que permite predecir el rango de fluctuaci&oacute;n que puede ocurrir en la calificaci&oacute;n de un sujeto, como resultado de factores irrelevantes aleatorios, como ya se ha mencionado.</font></p>     <p align="justify"><font face="verdana" size="2">En el sentido m&aacute;s amplio, la confiabilidad de una prueba indica el grado en que las diferencias individuales en las calificaciones de una prueba son atribuibles al error aleatorio de medici&oacute;n y en la medida en que son atribuibles a diferencias reales en la caracter&iacute;stica o variable que se est&aacute; midiendo. Esencialmente, cualquier condici&oacute;n que es irrelevante al prop&oacute;sito de la prueba representa error de la varianza; cuando el investigador trata de mantener condiciones de prueba uniformes, controlando el ambiente en el que se lleva a cabo, las instrucciones, los tiempos l&iacute;mites, el <i>"rapport"</i> y otros factores similares, est&aacute; tratando de reducir el error de la varianza y hacer que las calificaciones de las pruebas sean m&aacute;s confiables. Como esto es imposible de conseguir aunque se tuvieran las condiciones &oacute;ptimas, ninguna prueba es totalmente confiable y por ello, cada una de ellas debe establecer su confiabilidad. Esta medida de confiabilidad es caracter&iacute;stica de la prueba si se aplica en condiciones est&aacute;ndar, y en sujetos similares a aquellos con los que se estableci&oacute; la muestra normativa. Por ello, se deben especificar las caracter&iacute;sticas de la tal muestra junto con el tipo de confiabilidad que se estableci&oacute; en cada ocasi&oacute;n en que se construye o adapta una prueba para una muestra con caracter&iacute;sticas diferentes a las de la muestra original.</font></p>  	    <p align="justify"><font face="verdana" size="2">Existen diferentes tipos de confiabilidad: a) estabilidad temporal o coeficiente de estabilidad; b) formas paralelas o coeficiente de estabilidad y equivalencia; c) divisi&oacute;n por mitades o coeficiente de consistencia interna; y d) consistencia interna pura.<sup>1&#45;9</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>a.&nbsp;Estabilidad temporal o coeficiente de estabilidad</b></font></p>      <p align="justify"><font face="verdana" size="2">Cada una de ellas se calcula teniendo un objetivo en mente. Por ejemplo, la estabilidad temporal indica el grado en el que las calificaciones de una prueba se ven modificadas por fluctuaciones aleatorias diarias en la condici&oacute;n del sujeto o en el ambiente de prueba. Esta estabilidad depende en parte de la longitud del intervalo en el que se mantiene, y es indispensable establecerla, si el objetivo del investigador es medir cambios a lo largo del tiempo. Es decir, asegurar que si se presentan cambios en la variable de inter&eacute;s, se debieron al paso del tiempo (por ejemplo, la hora del d&iacute;a o debido al desarrollo) y no al instrumento de medici&oacute;n. En este caso, los mismos sujetos responden a dos administraciones diferentes de la misma prueba, y se espera que la variable no cambie con el transcurso del tiempo, la correlaci&oacute;n entre los puntajes obtenidos tendr&aacute; que ser alta.<sup>5</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>b.&nbsp;Formas paralelas o coeficiente de estabilidad y equivalencia</b></font></p>      ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Las formas paralelas o equivalentes, representan otro tipo de confiabilidad que se requiere cuando se espera que una situaci&oacute;n (experimental o cotidiana), modifique la variable de inter&eacute;s, en un lapso muy corto, que no permitir&iacute;a aplicar el mismo instrumento, pues los sujetos podr&iacute;an recordar las respuestas dadas con anterioridad y/o contestar diferente por creer que es lo que se espera de ellos, o contestar de manera muy semejante a como lo hicieron con anterioridad, porque recuerdan las respuestas dadas en la primera ocasi&oacute;n. En este caso, se necesitan dos versiones del instrumento, que midan lo mismo, pero con diferentes reactivos, est&iacute;mulos o preguntas. Al coeficiente que se calcula para determinar la medida en que se mide los mismo con ambas versiones, se denomina coeficiente de equivalencia.<sup>5</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>c.&nbsp;Divisi&oacute;n por mitades o coeficiente de consistencia interna</b></font></p>      <p align="justify"><font face="verdana" size="2">La confiabilidad de divisi&oacute;n por mitades, se determina dividiendo a la prueba en mitades, asegurando que los reactivos o preguntas se hayan ordenado de acuerdo a su grado de dificultad (de los m&aacute;s f&aacute;ciles a los m&aacute;s dif&iacute;ciles); se constituye una especie de prueba paralela, con los reactivos pares en uno de los conjuntos, y los impares en el otro, asegurando de alguna manera que los reactivos sean igualmente dif&iacute;ciles en ambos conjuntos, o en t&eacute;rminos estad&iacute;sticos, propiciando que las distribuciones de ambos conjuntos tengan medias y varianzas semejantes. El coeficiente de consistencia interna se determina en este caso con la f&oacute;rmula de Spearman&#45;Brown, que s&oacute;lo se puede aplicar a pruebas homog&eacute;neas y sin l&iacute;mite de tiempo para resolverlas.<sup>2,4,5,9</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">Si la prueba es heterog&eacute;nea, el coeficiente de equivalencia debe calcularse con las mitades de la prueba, igualada, no s&oacute;lo en t&eacute;rminos de dificultad sino tambi&eacute;n en t&eacute;rminos del contenido.</font></p>  	    <p align="justify"><font face="verdana" size="2">En las pruebas con l&iacute;mite de tiempo, los individuos necesariamente no tienen el tiempo suficiente para resolver todos los reactivos (pruebas de velocidad <i>vs.</i> las pruebas de poder, en las que no existe tiempo l&iacute;mite) y por ello la determinaci&oacute;n de la confiabilidad quedar&aacute; establecida por la correlaci&oacute;n entre los reactivos pares y nones.<sup>2</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">La consistencia interna tiene que ver con la equivalencia de los reactivos y la homogeneidad de los mismos; y est&aacute; basada en la consistencia de las respuestas de los sujetos en todos los reactivos de la prueba. Un coeficiente de consistencia interna proporciona tanto una medici&oacute;n de equivalencia como de homogeneidad. De tal manera que dos pruebas que tienen una alta confiabilidad en t&eacute;rminos de formas paralelas o coeficientes por mitades, pueden variar en sus coeficientes de consistencia interna si difieren en el grado de homogeneidad de sus reactivos. De hecho, la diferencia de la consistencia interna entre mitades de la prueba y el coeficiente de consistencia interna, se deber&iacute;a utilizar como un indicador de la heterogeneidad de los reactivos o aseveraciones de una prueba o escala. Esto &uacute;ltimo sucede con mayor frecuencia en el caso de que una prueba mida diversos rasgos (de personalidad) o habilidades (de inteligencia), por ejemplo.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>d.&nbsp;Consistencia interna pura</b></font></p>      <p align="justify"><font face="verdana" size="2">El procedimiento m&aacute;s com&uacute;n para determinar la consistencia interna de instrumentos o pruebas constituidas por respuestas dicot&oacute;micas (correcto&#45;incorrecto; de acuerdo&#45;en desacuerdo) es el desarrollado por Kudder y Richardson (KR&#45;20), que se calcula a partir de una sola administraci&oacute;n de una prueba. Esta t&eacute;cnica se basa en el examen de la ejecuci&oacute;n en cada uno de los reactivos o preguntas de la prueba. A menos de que los reactivos sean muy homog&eacute;neos, este coeficiente siempre ser&aacute; menor que el de la confiabilidad por mitades. Ambos coeficientes (mitades y KR&#45;20) igual que cualquier otro coeficiente de confiabilidad derivado de una sola administraci&oacute;n de una sola forma de la prueba, se denominan coeficientes de consistencia interna. Sin embargo, la informaci&oacute;n que proporcionan los diferentes modelos de determinaci&oacute;n de la consistencia interna, no es id&eacute;ntica, por lo cual siempre se deber&aacute; de establecer cu&aacute;l coeficiente se utiliz&oacute; para determinarla.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Hasta ahora, se ha hablado de diferentes tipos de coeficientes de confiabilidad. De acuerdo al procedimiento seguido, cuando se repite una prueba, con la misma forma pero en diferente ocasi&oacute;n, se habla del coeficiente de estabilidad, y la varianza de error queda explicada por la fluctuaci&oacute;n temporal; cuando se repite la prueba pero con una forma paralela, y en diferente ocasi&oacute;n, se habla de un coeficiente de estabilidad y de equivalencia, siendo la fuente de error la fluctuaci&oacute;n temporal y la especificidad de los reactivos; cuando se repite la prueba, la misma forma y en la misma ocasi&oacute;n, se habla de un coeficiente de equivalencia y la fuente de error es la especificidad de los reactivos; cuando se divide a la mitad una prueba (pares&#45;nones, u otra divisi&oacute;n paralela) se habla del coeficiente de consistencia interna y la fuente de error es la especificidad de los reactivos; y cuando se utilizan las pruebas Kudder&#45;Richardson y el Alfa de Cronbach, se habla de un coeficiente de consistencia interna y la fuente del error son la especificidad de los reactivos, as&iacute; como su heterogeneidad.<sup>3,8,9</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Coeficiente Alfa de Cronbach</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Ahora bien, el coeficiente Alfa, desarrollado por Cronbach en 1951, puede considerarse como equivalente a la media de todas las posibles correlaciones por mitades, corregidas con la f&oacute;rmula de Spearman&#45;Brown, y se utiliza en el caso de aquellas pruebas que tienen m&aacute;s de dos opciones de respuestas posibles. Su f&oacute;rmula es:</font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/iem/v2n6/a7fo1.jpg"></font></p>      <p align="justify"><font face="verdana" size="2">donde: r<sub>&#945;</sub> = coeficiente alfa.</font></p>  	    <p align="justify"><font face="verdana" size="2">k= n&uacute;mero de reactivos.</font></p>  	    <p align="justify"><font face="verdana" size="2">&#963;<i>j</i><sup>2</sup>= varianza de un reactivo.</font></p>  	    <p align="justify"><font face="verdana" size="2">&#931;&#963;<i>j</i><sup>2</sup> = suma de las varianzas de cada reactivo.</font></p>  	    <p align="justify"><font face="verdana" size="2">&#963;<sup>2</sup> = varianza de todas las calificaciones de la prueba</font>.</p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">La prueba alfa es la estad&iacute;stica preferida para obtener una estimaci&oacute;n de la confiabilidad de consistencia interna, y se usa como una medida de confiabilidad, en parte, debido a que se requiere de una sola aplicaci&oacute;n al grupo de sujetos. Los valores t&iacute;picos de esta prueba van de 0 a 1, porque conceptualmente, este coeficiente, al igual que los otros coeficientes de confiabilidad, se calcula para responder a la pregunta de qu&eacute; tan semejante es ese conjunto de datos. Lo que se determina, esencialmente, es la semejanza en una escala que va de 0 (absolutamente no semejante), a 1 (perfectamente id&eacute;nticos). Debe tomarse en consideraci&oacute;n, que cuando el valor del coeficiente alfa es demasiado alto (mayor a 0.90), ello puede deberse a la existencia de redundancia entre los reactivos, est&iacute;mulos o preguntas.</font></p>  	    <p align="justify"><font face="verdana" size="2">Vale la pena poner &eacute;nfasis en el hecho de que todos los indicadores de confiabilidad, proporcionan un &iacute;ndice que es caracter&iacute;stico del grupo particular de calificaciones obtenidas en esa prueba, y no de la prueba en s&iacute; misma; las medidas de confiabilidad son estimaciones, y &eacute;stas est&aacute;n sujetas a error. La cantidad precisa de error inherente en la estimaci&oacute;n de la confiabilidad variar&aacute; de acuerdo con la muestra de respondientes con quienes se haya calculado; la confiabilidad publicada en el manual de la prueba puede ser impresionante, sin embargo, &eacute;sta se debe al grupo particular de sujetos con el que se determin&oacute;. Si se utiliza a un nuevo grupo de sujetos, muy diferente a aquel con el que se determin&oacute; la confiabilidad publicada en el manual, el coeficiente que se obtenga puede no ser tan impresionante, y en ocasiones, hasta puede ser inaceptable.</font></p>  	    <p align="justify"><font face="verdana" size="2">Lo anteriormente se&ntilde;alado se debe principalmente, a las diferencias culturales que pueden existir entre las respuestas dadas por la muestra de sujetos con la que se desarroll&oacute; el instrumento y la de inter&eacute;s actual del investigador, como se se&ntilde;ala en la obra de D&iacute;az&#45;Guerrero, al hablar de las premisas hist&oacute;rico socio culturales del mexicano.<sup>10,11</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">En t&eacute;rminos generales se puede decir que el prop&oacute;sito de establecer el coeficiente de confiabilidad de cualquier instrumento que se use para medir cualquier variable se debe a la naturaleza de las variables por un lado, y las circunstancias que rodean a la aplicaci&oacute;n de la prueba, por el otro. El error de medici&oacute;n puede ser de diferentes tipos: errores no identificados, errores en la calificaci&oacute;n, errores en la administraci&oacute;n, y tambi&eacute;n errores en la construcci&oacute;n del instrumento.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Comentarios finales</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Otras consideraciones que se deben tomar en cuenta se pueden referir a la naturaleza de la prueba: a) los reactivos son homog&eacute;neos o heterog&eacute;neos: las pruebas dise&ntilde;adas para medir un solo factor como una habilidad o un rasgo, se espera que sean m&aacute;s homog&eacute;neas y por lo tanto con un mayor grado de consistencia interna; b) la caracter&iacute;stica, habilidad o rasgo medido, es din&aacute;mico o est&aacute;tico: si el rasgo fuera din&aacute;mico, se esperar&iacute;a una menor consistencia interna, en respuesta a su modificaci&oacute;n o cambio en funci&oacute;n de experiencias emocionales o cognoscitivas; c) la prueba es de velocidad (instrumento con reactivos de nivel de dificultad uniforme, que dando suficiente tiempo para responderla, todos los respondientes deber&iacute;an de completarla de manera correcta), o de poder (cuando a pesar de dar suficiente tiempo para responder a todos los reactivos, siendo algunos tan dif&iacute;ciles que es poco probable que alguno de los sujetos obtenga una calificaci&oacute;n perfecta), en el primer caso se obtendr&iacute;a un coeficiente de confiabilidad espuriamente alto; d) el rango de las calificaciones es o no, restringido en virtud del tama&ntilde;o de la muestra empleada, la confiabilidad ser&aacute; menor en el caso restringido, y mayor en el otro; e) la prueba est&aacute; relacionada con un criterio o no, y en este caso, la confiabilidad no dice gran cosa, pues lo importante es si el sujeto alcanz&oacute; el puntaje criterio prestablecido o no lo alcanz&oacute;.</font></p>  	    <p align="justify"><font face="verdana" size="2">Una pregunta que los investigadores se hacen con frecuencia es la referida a que tan alto o de qu&eacute; tama&ntilde;o tiene que ser el coeficiente de confiabilidad. Esto depender&aacute; del prop&oacute;sito e importancia de las decisiones que se tomar&aacute;n con base en los puntajes obtenidos por los sujetos. La confiabilidad es un atributo necesario en todas las pruebas que se utilicen para evaluar a alguien; en algunas ocasiones se requerir&aacute; de un valor m&aacute;s alto y en otras puede no ser tan importante. Si el resultado de las calificaciones obtenidas por los sujetos implica la toma de una decisi&oacute;n de vida o muerte, por supuesto que deber&aacute; ser lo m&aacute;s alto que se pueda. Si la prueba se utiliza en combinaci&oacute;n con muchas otras, y no forma parte importante del proceso de la decisi&oacute;n que se haya de tomar, puede ser un poco m&aacute;s baja; los coeficientes de 0.90 y m&aacute;s, son los mejores (incluyendo la posibilidad de la existencia de redundancia en los reactivos, se&ntilde;alada anteriormente), equivaldr&iacute;a a un 10 de calificaci&oacute;n; los coeficientes de 0.80 y m&aacute;s, ser&iacute;an equivalentes a un 9; de 0.65 a 0.&nbsp;79. ser&iacute;a una calificaci&oacute;n de 6 a 7 ("de panzazo"); m&aacute;s bajos de 0.65, son inaceptables.</font></p>  	    <p align="justify"><font face="verdana" size="2">Cuando una prueba o escala mide una variable compleja (por ejemplo personalidad, inteligencia, salud mental, aprendizaje, etc.) constituida por diversas subvariables, como podr&iacute;an ser diferentes rasgos de personalidad, o tipos de inteligencia, o diversos s&iacute;ntomas, o conocimientos y habilidades, parte del procedimiento consiste en establecer el n&uacute;mero de factores existentes, por medio de alguno de los tipos de an&aacute;lisis factorial existentes. El m&eacute;todo m&aacute;s adecuado para establecer la confiabilidad de dicho tipo de pruebas suele ser el Coeficiente Alfa de Cronbach, que se calcula para cada una de las subvariables o factores arrojados por la factorizaci&oacute;n llevada a cabo. Solo se aceptan como confiables, aquellos factores con valores alfa iguales o mayores a .65, como se se&ntilde;al&oacute; anteriormente. Los dem&aacute;s factores, que no hayan alcanzado dicho valor, deber&aacute;n ser rechazados. Y tambi&eacute;n se acostumbra a calcular el valor Alfa general, o del total de la prueba.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b>Referencias</b></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">1.&nbsp;Cronbach LJ. Essentials of psychological testing. United States of America, New York: Harper and Row Publishers; 1960.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4587417&pid=S2007-5057201300020000700001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">2.&nbsp;Magnusson D. Teor&iacute;a de los tests. M&eacute;xico: Editorial Trillas; 1969.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4587419&pid=S2007-5057201300020000700002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">3.&nbsp;Nunnally JC, Bernstein IH. Psychometric Theory. United States of America, New York: McGraw&#45;Hill Inc; 1994.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4587421&pid=S2007-5057201300020000700003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">4.&nbsp;Gulliksen H. Theory of mental tests. United States of America, New York: John Wiley and Sons; 1967.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4587423&pid=S2007-5057201300020000700004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">5.&nbsp;Cohen RJ, Swerdlik ME. Psychological testing and assessment. New Delhi: Tata McGraw&#45;Hill Publishing Company Limited; 2005.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4587425&pid=S2007-5057201300020000700005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">6.&nbsp;Anastasi A, Urbina S. Tests psicol&oacute;gicos. M&eacute;xico: Prentice Hall; 1998.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4587427&pid=S2007-5057201300020000700006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">7.&nbsp;Anastasi A. Psychological testing. United States of America, New York: The Macmillan Company; 1966.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4587429&pid=S2007-5057201300020000700007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">8.&nbsp;Guilford JP. Psychometric methods. United States of America, New York: McGraw&#45;Hill Book Company; 1954.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4587431&pid=S2007-5057201300020000700008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">9.&nbsp;Nunnally JC. Psychometric theory. United States of America, New York: McGraw&#45;Hill Book Company; 1967.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4587433&pid=S2007-5057201300020000700009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">10.&nbsp;D&iacute;az&#45;Guerrero R. Psicolog&iacute;a el Mexicano: Descubrimiento de la etnopsicolog&iacute;a. M&eacute;xico: Editorial Trillas; 1996.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4587435&pid=S2007-5057201300020000700010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">11.&nbsp;D&iacute;az&#45;Guerrero R. Bajo las garras de la cultura: Psicolog&iacute;a del Mexicano 2. M&eacute;xico: Editorial Trillas; 2003.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4587437&pid=S2007-5057201300020000700011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cronbach]]></surname>
<given-names><![CDATA[LJ]]></given-names>
</name>
</person-group>
<source><![CDATA[Essentials of psychological testing.United States of America,]]></source>
<year>1960</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Harper and Row Publishers]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Magnusson]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<source><![CDATA[Teoría de los tests]]></source>
<year>1969</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Editorial Trillas]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Nunnally]]></surname>
<given-names><![CDATA[JC]]></given-names>
</name>
<name>
<surname><![CDATA[Bernstein]]></surname>
<given-names><![CDATA[IH]]></given-names>
</name>
</person-group>
<source><![CDATA[Psychometric Theory.United States of America,]]></source>
<year>1994</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[McGraw-Hill Inc]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gulliksen]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
</person-group>
<source><![CDATA[Theory of mental tests.United States of America,]]></source>
<year>1967</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[John Wiley and Sons]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cohen]]></surname>
<given-names><![CDATA[RJ]]></given-names>
</name>
<name>
<surname><![CDATA[Swerdlik]]></surname>
<given-names><![CDATA[ME]]></given-names>
</name>
</person-group>
<source><![CDATA[Psychological testing and assessment]]></source>
<year>2005</year>
<publisher-loc><![CDATA[New Delhi ]]></publisher-loc>
<publisher-name><![CDATA[Tata McGraw-Hill Publishing Company Limited]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Anastasi]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Urbina]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<source><![CDATA[Tests psicológicos]]></source>
<year>1998</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Prentice Hall]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Anastasi]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<source><![CDATA[Psychological testing.United States of America,]]></source>
<year>1966</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[The Macmillan Company]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Guilford]]></surname>
<given-names><![CDATA[JP]]></given-names>
</name>
</person-group>
<source><![CDATA[Psychometric methods.United States of America,]]></source>
<year>1954</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[McGraw-Hill Book Company]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Nunnally]]></surname>
<given-names><![CDATA[JC]]></given-names>
</name>
</person-group>
<source><![CDATA[Psychometric theory.United States of America,]]></source>
<year>1967</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[McGraw-Hill Book Company]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Díaz-Guerrero]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[Psicología el Mexicano: Descubrimiento de la etnopsicología]]></source>
<year>1996</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Editorial Trillas]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Díaz-Guerrero]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<source><![CDATA[Bajo las garras de la cultura: Psicología del Mexicano 2]]></source>
<year>2003</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Editorial Trillas]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
