<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>1607-4041</journal-id>
<journal-title><![CDATA[Revista electrónica de investigación educativa]]></journal-title>
<abbrev-journal-title><![CDATA[REDIE]]></abbrev-journal-title>
<issn>1607-4041</issn>
<publisher>
<publisher-name><![CDATA[Universidad Autónoma de Baja California, Instituto de Investigación y Desarrollo Educativo]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S1607-40412013000200003</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[La evaluación en el aula: reflexiones sobre sus propósitos, validez y confiabilidad]]></article-title>
<article-title xml:lang="en"><![CDATA[Classroom-Based Assessment: Reflections on its Purposes, Validity and Reliability]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Medina Gual]]></surname>
<given-names><![CDATA[Luis]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Iberoamericana Departamento de Educación ]]></institution>
<addr-line><![CDATA[Huixquilucan Estado de México]]></addr-line>
<country>México</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>00</month>
<year>2013</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>00</month>
<year>2013</year>
</pub-date>
<volume>15</volume>
<numero>2</numero>
<fpage>34</fpage>
<lpage>50</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_arttext&amp;pid=S1607-40412013000200003&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&amp;pid=S1607-40412013000200003&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_pdf&amp;pid=S1607-40412013000200003&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[El presente trabajo tiene como fin presentar un análisis sobre la evaluación en el aula a través de la discusión de sus propósitos, validez y confiabilidad. En este sentido, se delimitan los propósitos con base en los actores y conceptos de calidad, para posteriormente plantear los criterios de validez y confiabilidad a la luz de la naturaleza del proceso educativo. El artículo propone tres tipos de estrategias para la valoración de la validez y confiabilidad de la evaluación en el aula.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[This paper presents an analysis of classroom-based assessment by means of a discussion of its purposes, validity and reliability. To this end, its purposes were defined based on the stakeholders and concepts of quality; subsequently, validity and reliability criteria were posited in light of the nature of the educative process. The article proposes three types of strategies for appraising the validity and reliability of classroom-based assessments.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Evaluación del aprendizaje]]></kwd>
<kwd lng="es"><![CDATA[evaluación del estudiante]]></kwd>
<kwd lng="es"><![CDATA[validez]]></kwd>
<kwd lng="en"><![CDATA[Learning assessment]]></kwd>
<kwd lng="en"><![CDATA[student evaluation]]></kwd>
<kwd lng="en"><![CDATA[validity]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  	    <p align="justify"><font face="verdana" size="4">Art&iacute;culos</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="4"><b>La evaluaci&oacute;n en el aula: reflexiones sobre sus prop&oacute;sitos, validez y confiabilidad<sup><a href="#nota">1</a></sup></b></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="3"><b>Classroom&#45;Based Assessment: Reflections on its Purposes, Validity and Reliability</b></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="2"><b>Luis Medina Gual</b></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><i>Departamento de Educaci&oacute;n, Universidad Iberoamericana. Av. Lomas An&aacute;huac 46, Col. Lomas An&aacute;huac C.P. 53786, Huixquilucan, Estado de M&eacute;xico, M&eacute;xico.</i> <a href="mailto:luis.medina@semperaltius.org">luis.medina@semperaltius.org</a></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2">Recibido: 25 de abril de 2012;    <br> 	Aceptado para su publicaci&oacute;n: 21 de enero de 2013.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Resumen</b></font></p>  	    <p align="justify"><font face="verdana" size="2">El presente trabajo tiene como fin presentar un an&aacute;lisis sobre la evaluaci&oacute;n en el aula a trav&eacute;s de la discusi&oacute;n de sus prop&oacute;sitos, validez y confiabilidad. En este sentido, se delimitan los prop&oacute;sitos con base en los actores y conceptos de calidad, para posteriormente plantear los criterios de validez y confiabilidad a la luz de la naturaleza del proceso educativo. El art&iacute;culo propone tres tipos de estrategias para la valoraci&oacute;n de la validez y confiabilidad de la evaluaci&oacute;n en el aula.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Palabras clave:</b> Evaluaci&oacute;n del aprendizaje, evaluaci&oacute;n del estudiante, validez.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Abstract</b></font></p>  	    <p align="justify"><font face="verdana" size="2">This paper presents an analysis of classroom&#45;based assessment by means of a discussion of its purposes, validity and reliability. To this end, its purposes were defined based on the stakeholders and concepts of quality; subsequently, validity and reliability criteria were posited in light of the nature of the educative process. The article proposes three types of strategies for appraising the validity and reliability of classroom&#45;based assessments.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b>Keywords:</b> Learning assessment, student evaluation, validity.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>I. Introducci&oacute;n</b></font></p>  	    <p align="justify"><font face="verdana" size="2">La relaci&oacute;n entre la psicolog&iacute;a y la educaci&oacute;n ha sido y sigue siendo enriquecedora y conflictiva al mismo tiempo, "sobre todo porque a la hora de alimentarse rec&iacute;procamente, no siempre se han tenido las precauciones necesarias para evitar las transpolaciones mec&aacute;nicas" (Bixio, 2006, pp. 119&#45;120).</font></p>  	    <p align="justify"><font face="verdana" size="2">El caso de la evaluaci&oacute;n del aprendizaje no es la excepci&oacute;n. Desde hace casi 70 a&ntilde;os, Scates (1943) reflexion&oacute; sobre las diferencias y similitudes que exist&iacute;an entre lo que identific&oacute; como la medici&oacute;n cient&iacute;fica y lo que hace un docente en el aula para evaluar a sus alumnos:</font></p>  	    <blockquote> 		    <p align="justify"><font face="verdana" size="2">(...) los cient&iacute;ficos est&aacute;n interesados en la verdad para lograr generalizaciones, mientras que los profesores buscan informaci&oacute;n por su valor pr&aacute;ctico; (...) los especialistas en medici&oacute;n no pueden medir de forma constante &#91;a los sujetos&#93; pero el profesor necesita y debe hacerlo; el cient&iacute;fico mide rasgos a trav&eacute;s de una escala pero el profesor mide el desarrollo &#91;o aprendizaje&#93; en etapas; y el especialista de la medici&oacute;n, mide habilidades formales &#91;en situaciones controladas o as&eacute;pticas&#93; a trav&eacute;s de pruebas, pero al docente le importan las din&aacute;micas y conductas de sus estudiantes en situaciones diarias.</font></p> 	</blockquote>  	    <p align="justify"><font face="verdana" size="2">Hist&oacute;ricamente el desarrollo en la psicometr&iacute;a se ha realizado en contextos de las pruebas a gran escala, por expertos en estad&iacute;stica y rara vez por docentes o expertos de una disciplina (Shepard, 2001), y posteriormente se han "transferido" dichos conocimientos al contexto de la evaluaci&oacute;n del sal&oacute;n de clases (Brookhart, 2003). En otras palabras, en lugar de desarrollar una teor&iacute;a y pensamiento propios y emergidos del sal&oacute;n de clase, se procedi&oacute; a "pedir prestada" la teor&iacute;a formulada para contextos de la evaluaci&oacute;n de gran escala o masiva (Brookhart, 2003). Ello se evidencia en el hecho de que los est&aacute;ndares desarrollados hist&oacute;ricamente por la American Psychological Association (APA), la American Educational Research Association (AERA) y el National Council on Measurement for Education (NCME) desde 1966, no se ocupan de las evaluaciones emanadas del aula o elaboradas por docentes de forma directa (Cronbach, 1998), y no fue sino hasta el a&ntilde;o 2003 que el Joint Commitee on Standards for Educational Evaluation elabor&oacute; un documento que expl&iacute;citamente atend&iacute;a a las evaluaciones en el aula; el mismo documento indica que &eacute;ste es el primer intento de discusi&oacute;n sobre c&oacute;mo planear, conducir, usar y valorar las evaluaciones en el aula (Joint Commitee, 2003).</font></p>  	    <p align="justify"><font face="verdana" size="2">Si bien, tanto la evaluaci&oacute;n en contextos escolares como la estandarizada tienen como funci&oacute;n b&aacute;sica el determinar cu&aacute;nto sabe una persona o qu&eacute; tan bien puede poner en pr&aacute;ctica determinadas habilidades (Aiken, 1996), la literatura se&ntilde;ala dos &aacute;reas de tensi&oacute;n:</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Sobre la naturaleza del acto educativo:</b> Donde (1) la mayor&iacute;a de las teor&iacute;as del test trabajan con muestras de gran tama&ntilde;o mientras que los docentes tienen un tama&ntilde;o proporcionalmente peque&ntilde;o de estudiantes (Brookhart, 2003), (2) la evaluaci&oacute;n a gran escala eval&uacute;a contenidos o habilidades gen&eacute;ricos o comunes (pensamiento o comprensi&oacute;n) mientras que la evaluaci&oacute;n escolar tiene gran inter&eacute;s en contenidos curriculares disciplinares o muy espec&iacute;ficos y propios de un curso y una metodolog&iacute;a did&aacute;ctica (Aiken, 1996), (3) la evaluaci&oacute;n en el sal&oacute;n de clases y la instrucci&oacute;n se encuentran estrechamente ligadas (Brookhart, 2003; McMillan, 2003) por lo que (4) la evaluaci&oacute;n en el aula es esencialmente de car&aacute;cter formativo (Brookhart, 2003; McMillan, 2003).</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b>Diferencias sobre las nuevas corrientes psicopedag&oacute;gicas:</b> Autores como Shepard (2000, p. 1) afirman que: "La disonancia actual (...) emerge por la incompatibilidad entre las viejas ideas de los tests y las ideas transformadas de la ense&ntilde;anza", y ello adquiere especial relevancia si se considera la premisa de De la Orden (2011) que sugiere que el enfoque de la educaci&oacute;n determina el qu&eacute; evaluar (su objeto), el c&oacute;mo evaluar (su m&eacute;todo) y el cu&aacute;ndo evaluar (su planeaci&oacute;n). En otras palabras, "lo que eval&uacute;as es lo que obtienes" (Shepard, 2000, p. 36).</font></p>  	    <p align="justify"><font face="verdana" size="2">Al respecto resulta de inter&eacute;s que como Ayers (1918 en Shepard, 2000) argumenta, no es ninguna coincidencia que Edward Thorndike fuera tanto el creador de la teor&iacute;a asociacionista del aprendizaje como el "padre" de la "medici&oacute;n cient&iacute;fica". Como muestra de lo anterior es posible advertir c&oacute;mo las teor&iacute;as del test parecen acercarse en mayor medida a teor&iacute;as asociacionistas ("Greeno, Collins y Resnick, 1996; Shepard, 1996; Shepard, 1991b; Shulman y Quinlan (como se cit&oacute; en Shepard, 2000).</font></p>  	    <p align="justify"><font face="verdana" size="2">Desde nuevas corrientes pedag&oacute;gicas que apoyan a movimientos como la instrucci&oacute;n diferenciada (Tomlinson e Imbeau, 2010), el "Understanding by design" (Shepard, 2000; Wiggins y McTighe, 2005), las corrientes de "auto, co y hetero evaluaci&oacute;n" que hacen responsable al alumno de la evaluaci&oacute;n misma (Hidalgo, 2005) o el "aprendizaje para todos" y el "aprendizaje para toda la vida" (OCDE, 2012) se pueden pensar como opuestas a algunas nociones compartidas por casi la totalidad de las teor&iacute;as de la medida (como la "discriminaci&oacute;n" y "dificultad" de un reactivo) debido a que en estas corrientes, el prop&oacute;sito de la evaluaci&oacute;n yace en que el alumno demuestre lo que ha aprendido a trav&eacute;s de los medios que le den m&aacute;s ventaja (Shepard, 2000). Esto contrasta claramente con la idea de que la evaluaci&oacute;n tiene que ser id&eacute;ntica para todos en aras de la "justicia" y la "objetividad" de la medici&oacute;n (McMillan, 2003; Shepard, 2000).</font></p>  	    <p align="justify"><font face="verdana" size="2">Ante esto la literatura revela tres caminos: desarrollar el razonamiento probabil&iacute;stico a situaciones de evaluaci&oacute;n para el sal&oacute;n de clases (Mislevy, 2004), adaptar las teor&iacute;as de la medici&oacute;n al aula (Brookhart, 2003; Li, 2003), o desarrollar una teor&iacute;a alternativa que emerja desde la pr&aacute;ctica docente en el sal&oacute;n (Moss, 1994 y 2004), forjando una teor&iacute;a &uacute;nica que pertenezca al aula (Brookhart, 2003). Incluso se advierte la posibilidad de combinar las tres posturas (Mislevy, 2004; Shepard, 2000).</font></p>  	    <p align="justify"><font face="verdana" size="2">Lo cierto es que la discusi&oacute;n contin&uacute;a y aunque algunas veces es acalorada (Li, 2003; Mislevy, 2004; Moss, 1994; Moss, 2004) tiene como &uacute;nico prop&oacute;sito proporcionar a los docentes herramientas y estrategias para desarrollar "evaluaciones de calidad" (Stiggins, 2001 en Brookhart, 2003). En coherencia con lo anterior, el presente trabajo tiene por objeto el reflexionar sobre la idea de la calidad de la evaluaci&oacute;n en el aula a trav&eacute;s de la discusi&oacute;n de sus prop&oacute;sitos, validez y confiabilidad.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>II. El prop&oacute;sito de la evaluaci&oacute;n en el aula</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Existe un relativo consenso en plantear que el mejor punto de partida para definir la "evaluaci&oacute;n del aprendizaje de calidad" es la definici&oacute;n de los prop&oacute;sitos sustantivos de este proceso (Brookhart, 2009, 2011; De la Orden, 2011). Con este fin, Brookhart (2011, p. 12) propone reflexionar sobre las preguntas: "&iquest;Qu&eacute; significados queremos que la evaluaci&oacute;n tenga?" y "&iquest;Qui&eacute;n(es) es/son la(s) audiencia(s) primaria(s) de los mensajes que se derivan de la evaluaci&oacute;n?" y ello complementa a la funci&oacute;n que se&ntilde;ala De la Orden (2009, en De la Orden 2011, p. 2) para la evaluaci&oacute;n en la educaci&oacute;n: "optimizar su estructura &#91;(de la educaci&oacute;n)&#93;, proceso y producto actuando como un mecanismo de retroalimentaci&oacute;n de tales sistemas para asegurar su permanencia, eficacia y funcionalidad".</font></p>  	    <p align="justify"><font face="verdana" size="2">Por lo tanto, la evaluaci&oacute;n del aprendizaje deber&iacute;a servir al prop&oacute;sito de ser un mecanismo que, desde una perspectiva sist&eacute;mica, vigile las diferentes "relaciones de coherencia" (De la Orden <i>et al</i>., 1997) entre insumos, procesos, productos, contextos y prop&oacute;sitos/metas en aula, a trav&eacute;s de la dotaci&oacute;n de "significados" pertinentes y dirigidos &#150;a los diferentes actores implicados&#150; en pos de su actuaci&oacute;n para la mejora continua. Dichas "relaciones de coherencia" (De la Orden <i>et al</i>., 1997) se traducen en concepciones de calidad como: eficacia, eficiencia y pertinencia&#45;relevancia (Mu&ntilde;oz&#45;Izquierdo, 2009).</font></p>  	    <p align="justify"><font face="verdana" size="2">En este sentido, el siguiente cuadro tiene como prop&oacute;sito clarificar la premisa anterior al clasificar diferentes "prop&oacute;sitos" de la evaluaci&oacute;n del aprendizaje con base en las "relaciones de coherencia" de De la Orden <i>et al</i>. (1997; 2011) al conceptualizarlos como "tipos de calidad" (Mu&ntilde;oz&#45;Izquierdo, 2009) y de los actores que deber&iacute;an de ser considerados (Brookhart, 2011):</font></p>  	    ]]></body>
<body><![CDATA[<p align="center"><font face="verdana" size="2"><a href="/img/revistas/redie/v15n2/a3t1.jpg" target="_blank">Tabla I</a></font></p>  	    <p align="justify"><font face="verdana" size="2">Una vez que se clarifica el tipo de finalidades que se desea, se deber&aacute; replantear el significado de los procesos mismos de evaluaci&oacute;n (Brookhart, 2003). Ello remite a la existencia de "caracter&iacute;sticas", "criterios" o "elementos" que el proceso de evaluaci&oacute;n, sus herramientas, instrumentos y estrategias deber&iacute;an de poseer. Algunos de &eacute;stos, que emergen de la literatura sobre la evaluaci&oacute;n del aprendizaje en el aula son: "precisi&oacute;n", "especificidad", "momento adecuado de aplicaci&oacute;n" (Reeves, 2011), "justicia" (Brookhart, 2004; Camara y Lane, 2006; Reeves, 2011) y "utilidad" (Brookhart, 2004). Sin embargo, se contin&uacute;a considerando como imprescindibles para la evaluaci&oacute;n en aula a la "validez" y "confiabilidad" (Allen, 2005; Brookhart, 2004; De la Orden, 2011; Gullickson, 2003; Hidalgo, 2005; Hopkins, 1998; Li, 2003; McMillan, 2003; Mislevy, 2004; Moss, 1994; Moss, 2004; Shepard, 2000; Stiggins, 2004; Teasdale y Leung, 2000). Es por esto que se ha optado por que las siguientes secciones del presente trabajo tengan como cometido el repensar estos conceptos en el aula.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>III. Validez en el aula</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Hist&oacute;ricamente, la "validez" ha sufrido una metamorfosis o evoluci&oacute;n durante la segunda mitad del siglo XXI (Goodwin y Leech, 2003). En un primer momento, se conceptualizaba en funci&oacute;n a la capacidad de correlaci&oacute;n de los puntajes de un test con alg&uacute;n criterio externo (Guilford, 1946 en NCME&#45;ACE, 1993). Con el surgimiento de los primeros est&aacute;ndares elaborados por la APA&#45;AERA&#45;NCME (1966), la validez fue entendida en funci&oacute;n al grado en que el test produce informaci&oacute;n &uacute;til y con un prop&oacute;sito espec&iacute;fico. Es en este primer documento de los est&aacute;ndares, que se hace alusi&oacute;n a la idea de tres tipos de validez (contenido, criterio y constructo) propuesta por Cronbach y Meehl en 1955 (Goodwin y Leech, 2003). Posteriormente, fue el mismo Cronbach quien en 1980 comenz&oacute; a desdibujar la necesidad de "unificar" a la validez, argumentando que la esencia de &eacute;sta se encontraba en la validez de constructo (NCME&#45;ACE, 1993). Ello condujo a que, en el a&ntilde;o del 1985, los nuevos est&aacute;ndares de la APA&#45;AERA&#45;NCME advirtieran que el uso de tres categor&iacute;as o etiquetas de la validez no deber&iacute;a conducir a inferir la existencia de tres tipos de validez (Goodwin y Leech, 2003). Finalmente fue en 1999 que la APA&#45;AERA&#45;NCME remplaz&oacute; la idea de validez de contenido, criterio y constructo a una validez que puede ser valorada a trav&eacute;s de cinco tipos de evidencias: del contenido del test, de los procesos de respuesta, de su estructura interna, de la relaci&oacute;n con otras variables y de las consecuencias producto de su aplicaci&oacute;n e interpretaciones (Goodwin y Leech, 2003). As&iacute; pues, el concepto de validez volvi&oacute; a unificarse (Jonson y Plake, 1998; NCME&#45;ACE, 1993) al entenderla como un criterio multidimensional y complejo (Goodwin y Leech, 2003) que se define como el grado en que la evidencia y teor&iacute;a apoyan a la interpretaci&oacute;n de los puntajes derivados de un test, sus usos y prop&oacute;sitos (APA&#45;AERA&#45;NCME, 1999).</font></p>  	    <p align="justify"><font face="verdana" size="2">A pesar de ello, al d&iacute;a de hoy el t&eacute;rmino de validez parece ser usado de forma distinta por diferentes autores, en diferentes contextos (Pedhazur y Pedhazur, 1991) y no necesariamente alineada (en la teor&iacute;a o en la praxis) a los est&aacute;ndares (Jonson y Plake, 1998).</font></p>  	    <p align="justify"><font face="verdana" size="2">Ahora bien, como ya se ha comenzado a discutir, algunas consideraciones de la evaluaci&oacute;n en el aula son que esta debe: (1) tener el significado de informar decisiones instruccionales &#150;de car&aacute;cter formativo&#150; (Brookhart, 2005; McMillan, 2003); (2) no necesariamente aludir a inferencias sobre un proceso interno a un sujeto sino sobre un sujeto en relaci&oacute;n con otros y que muchas veces es de suma importancia el entender la evaluaci&oacute;n en un contexto (Brookhart, 2003; Moss, 2004); (3) no necesariamente tiene que ser el mismo contexto o ambiente para todos los evaluados (Moss, 2004).</font></p>  	    <p align="justify"><font face="verdana" size="2">Es por esto que diferentes autores sugieren que una evidencia de especial relevancia que se deber&iacute;a de retomar es la coherencia entre los criterios y modos de evaluaci&oacute;n, el proceso did&aacute;ctico, el curr&iacute;culum y la finalidad (o significado) misma de la evaluaci&oacute;n en un contexto determinado (Brookhart, 2003; Brookhart, 2004; De Caimillani <i>et al</i>., 2001; De la Orden, 2011; McMillan, 2003; Smith, 2003). En otras palabras y como afirma De la Orden (2011), la validez de la informaci&oacute;n, interpretaciones y consecuencias de la evaluaci&oacute;n del aprendizaje en el sal&oacute;n de clase implicar&iacute;a una validez "axiol&oacute;gica", "curricular" e "instrumental". Por ello, la validez en el aula no podr&iacute;a ser determinada de manera absoluta sino en relaci&oacute;n con su adecuaci&oacute;n a los prop&oacute;sitos y situaci&oacute;n espec&iacute;fica de aplicaci&oacute;n (De Camillan <i>et al</i>., 2001; Moss, 2004; Winter, 2000) y de los contextos en que los alumnos son evaluados y que, por tanto, influyeron en los desempe&ntilde;os (Moss, 2004). As&iacute; pues, la validez en contextos escolares deber&iacute;a hacer un especial &eacute;nfasis en los an&aacute;lisis e interpretaciones hechas sobre el rendimiento de un estudiante (Hidalgo, 2005; Joint Commitee, 2003; Moss, 2004).</font></p>  	    <p align="justify"><font face="verdana" size="2">Y, si la validez se encuentra en relaci&oacute;n estrecha con el coadyuvar al proceso educativo, preocupaciones como "cu&aacute;ntas evaluaciones son necesarias para la representatividad" pasan a un segundo t&eacute;rmino en tanto que la interacci&oacute;n del contexto del sal&oacute;n y el curr&iacute;culum aseguran la validez de lo que es evaluado (Teasdale y Leung, 2000).</font></p>  	    <p align="justify"><font face="verdana" size="2">Por tanto, se plantear&iacute;a valorar la validez de la evaluaci&oacute;n en el aula a trav&eacute;s de estrategias interpretativas para contextos sociales particulares donde no se considere como deseable o posible la estandarizaci&oacute;n (Moss, 2004), sino que m&aacute;s bien, los m&eacute;todos de evaluaci&oacute;n sean relevantes y representativos a los contenidos evaluados (Joint Commitee, 2003). Para lograr lo anterior, una alternativa es la "hermen&eacute;utica" como estrategia interpretativa de la informaci&oacute;n. Este enfoque se ver&iacute;a complementado a trav&eacute;s del uso de estrategias para el rigor en investigaciones cualitativas (Ali y Yusof, 2011; Barusch, Gringer y George, 2011; Denzin y Lincon, 2005; Golafshani, 2003), o a trav&eacute;s de estrategias propias del ambiente del sal&oacute;n de clases como entrevistas a los alumnos y padres de familia (Moss, 2004).</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Por otra parte, tambi&eacute;n se propone valorar la validez a trav&eacute;s de "las consecuencias de la evaluaci&oacute;n" (Moss, 2004). En otras palabras, se le plantear&iacute;a como el logro de consecuencias deseadas para el aprendizaje, la instrucci&oacute;n y sociales, donde a mayor importancia tenga una evidencia para la toma de decisiones, se deber&iacute;a vigilar con mayor rigor su validez (Moss, 2004; Joint Commitee, 2003).</font></p>  	    <p align="justify"><font face="verdana" size="2">Por todo lo discutido, si la validez en el aula se conceptualiza como aquel criterio con el que se verifica que las evaluaciones est&aacute;n desarrolladas e implementadas de forma tal, que las interpretaciones sobre los estudiantes no est&eacute;n abierta a malinterpretaciones (Joint Commitee, 2003, p. 127), se podr&iacute;a pensar en la existencia de tres tipos de evidencia para su valoraci&oacute;n:</font></p>  	    <p align="justify"><font face="verdana" size="2"><i><b>Evidencias curriculares o de concreci&oacute;n curricular</b></i>, que valorar&iacute;an el grado en que los datos o mediciones reflejen lo que se pretende conocer del estudiante (&Aacute;lvarez&#45;Gayou, 2010; Brookhart, 2009; Cronbach, 1980 en NCME&#45;ACE, 1993; Hern&aacute;ndez, Collado y Bapstista, 2007; Denzin y Lincon, 2005; Winter, 2000).</font></p>  	    <p align="justify"><font face="verdana" size="2"><i><b>Evidencias interpretativas</b></i>, que tendr&iacute;an a bien el valorar que las interpretaciones o inferencias a partir de los datos reflejen lo que se pretend&iacute;a conocer (APA&#45;AERA&#45;NCME, 1985; APA&#45;AERA&#45;NCME, 1999; Brookhart, 2003; Cronbach, 1998; Denzin y Lincon, 2005; Hopkins, 1998; NCME&#45;ACE, 1993; Moss, 2004) y que tiene como consecuencia tambi&eacute;n el sopesar la importancia de la rigurosidad de la interpretaci&oacute;n (Denzin y Lincon, 2005; Miles y Huberman, 1984).</font></p>  	    <p align="justify"><font face="verdana" size="2"><i><b>Evidencias instrumentales</b></i>, que valorar&iacute;an la existencia de consecuencias did&aacute;cticas, instruccionales y/o sociales deseables. Este tipo de evidencias se retomada autores cl&aacute;sicos como Cronbach ("1980, 1988" en Moss, 1994;), Thorndike y Hagen (1996), Linn et al. (1993) y los est&aacute;ndares de la APA&#45;AERA&#45;NCME (1996; 1985, 1999). Tambi&eacute;n se sugiere la importancia de que la validez demuestre c&oacute;mo cumple una funci&oacute;n para la que fue pretendida inicialmente (Eisner, 1998; Gronlund, 1971; Hopkins, 1998).</font></p>  	    <p align="justify"><font face="verdana" size="2">Al igual que en el caso de los est&aacute;ndares de APA&#45;AERA&#45;NCME (1999) definen diferentes estrategias para valorar la validez en las puntuaciones e interpretaciones emanadas de pruebas de gran escala, la <a href="/img/revistas/redie/v15n2/a3t2.jpg" target="_blank">tabla II</a> tiene como cometido mostrar las evidencias y estrategias para su valoraci&oacute;n en el aula:</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>IV. La confiabilidad en el aula</b></font></p>  	    <p align="justify"><font face="verdana" size="2">A la confiabilidad se le reconoce un papel de especial importancia social y cient&iacute;fica (Parkes, 2007). De igual forma que la validez, varios acad&eacute;micos solicitan la clarificaci&oacute;n del concepto de confiabilidad como una propiedad de un conjunto de puntajes o interpretaciones y no as&iacute; de los instrumentos o tests (Brennan, 2011; Fribie, 2005).</font></p>  	    <p align="justify"><font face="verdana" size="2">De forma general es posible advertir que la confiabilidad es entendida como "la estabilidad o consistencia de los resultados o interpretaciones" (Gronlund, 1971; NCME&#45;ACE, 1993; Salkind, 2006; Vogt, 1993) respondiendo con ello a las preguntas: "si la gente fuera examinada dos veces, &iquest;Coincidir&iacute;an las dos puntuaciones? &iquest;Hasta qu&eacute; punto?" (Cronbach, 1998, p. 219). Dichos resultados deber&iacute;an de ser independientes a la influencia de factores que podr&iacute;an alterar la medici&oacute;n (Brookhart, 2003). Desde esta interpretaci&oacute;n surge el concepto de error de la medida (sistem&aacute;tico o asistem&aacute;tico) que deber&iacute;a de ser minimizado o evitado (Pedhazur y Pedhazur, 1991; Vogt, 1993) con el fin de vigilar la exactitud y precisi&oacute;n del procedimiento de medici&oacute;n (Thorndike y Hagen, 1996). Muchas veces, la confiabilidad se piensa como equivalente a los &iacute;ndices que lo representan (Fern&aacute;ndez, Noelia y P&eacute;rez, 2009).</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Ahora bien, espec&iacute;ficamente para las evaluaciones del aula, valdr&iacute;a la pena preguntarse: "&iquest;Qu&eacute; significar&iacute;a entonces la confiabilidad de una medici&oacute;n o interpretaci&oacute;n que s&oacute;lo se va a administrar una &uacute;nica vez para una &uacute;nica persona?" (Smith, 2003). En este sentido, resulta interesante la definici&oacute;n de la confiabilidad de la evaluaci&oacute;n en el aula propuesta por el Joint Commitee (2003): el grado de consistencia entre las puntuaciones o informaci&oacute;n obtenida de un proceso de recolecci&oacute;n de datos.</font></p>  	    <p align="justify"><font face="verdana" size="2">Coherente con lo anterior, algunos autores argumentan que las evaluaciones estandarizadas &#150;y externas&#150; deben de ser m&aacute;s confiables en tanto que sirven para tomar decisiones m&aacute;s importantes (para todo un sistema educativo), mientras que la confiabilidad de la evaluaci&oacute;n del aprendizaje en el aula no es de suma relevancia al contexto escolar debido a que es posible corregir malas decisiones del docente en el d&iacute;a a d&iacute;a o minuto a minuto, gracias a la nueva informaci&oacute;n que emerge constantemente del mismo sal&oacute;n (Brookhart, 2003; Joint Commitee, 2003; Shepard, 2000; Smith, 2003). Sin embargo no se desde&ntilde;a este criterio debido al reconocimiento de que una mala se&ntilde;al para el alumno ser&iacute;an el ofrecerle datos o interpretaciones err&aacute;ticas por parte del docente (Shepard, 2000).</font></p>  	    <p align="justify"><font face="verdana" size="2">A pesar de lo anterior, las teor&iacute;as de la medida de pruebas a gran escala tienen como supuestos la independencia de las respuestas, en su mayor&iacute;a no contemplan al evaluador como parte del c&aacute;lculo de la confiabilidad (Moss, 1994) y si se pensara en la confiabilidad como el logro de consistencia entre dos o m&aacute;s mediciones, este criterio pareciera ser la ant&iacute;tesis misma del prop&oacute;sito central del acto educativo: el aprendizaje (Lamprinou y Christie, 2009; Parkes, 2007).</font></p>  	    <p align="justify"><font face="verdana" size="2">Otros ejemplos de la falta de coherencia entre las teor&iacute;as del test y las evaluaciones en el aula son el hecho de que: (1) en la teor&iacute;a cl&aacute;sica, la diferencia entre los puntajes de una aplicaci&oacute;n y otra no ser&iacute;a consideradas como aprendizaje sino como un error en la administraci&oacute;n o un efecto de la pr&aacute;ctica sobre el test (Lamprinou y Christie, 2009; Smith, 2009); (2) en las teor&iacute;as de la medida los reactivos deber&iacute;an poder discriminar entre los sujetos que saben y no saben (Trist&aacute;n, 1998; Ch&aacute;vez y Saade, 2010). Es decir, un &iacute;tem que todos los estudiantes respondan bien o mal, no contribuir&iacute;a a la confiabilidad (Smith, 2003). En este sentido, este tipo de &iacute;tems (que por ejemplo, obtendr&iacute;an correlaciones biseriales cercanas a 0.0) deber&iacute;an de ser descartados bajo las sugerencias cl&aacute;sicas de la teor&iacute;a del test (cfr. Ch&aacute;vez y Saade, 2010). Una vez m&aacute;s, esto ir&iacute;a en contra de lograr el "aprendizaje para todos" o de movimientos instruccionales como el "Mastery Learning" (Araisan, Bloom y Carroll, 1971). Por ello, habr&iacute;a que cuestionarse si, al menos en contextos &aacute;ulicos, existir&iacute;a la posibilidad de definir (o incluso fijar) los par&aacute;metros o la probabilidad de ejecuci&oacute;n de un &iacute;tem o de un sujeto. Y, por &uacute;ltimo, (3) tanto la teor&iacute;a cl&aacute;sica como la de generazibilidad y la de respuesta al &iacute;tem funcionan bajo el supuesto de unidimensionalidad, donde los constructos de inter&eacute;s son ortogonales (no se relacionan) (Parkes, 2007). En la educaci&oacute;n y m&aacute;s a&uacute;n con nuevas corrientes como la educaci&oacute;n basada en competencias, esto implicar&iacute;a ir en contra de la integraci&oacute;n de los aprendizajes.</font></p>  	    <p align="justify"><font face="verdana" size="2">Sin embargo, existen ejemplos como en el caso de Marzano (2000), quien ha buscado repensar la confiabilidad y las calificaciones en el aula a trav&eacute;s de propuestas como el c&aacute;lculo del desempe&ntilde;o del estudiante por medio de funciones de potencia, de relativa facilidad de c&oacute;mputo para el docente y que se asemejan con c&oacute;mo la psicolog&iacute;a educativa indica que aprende el ser humano. Otros ejemplos del mismo autor (Marzano, 2000) son las consideraciones y adecuaciones de los supuestos y aportaciones de corrientes como la teor&iacute;a de respuesta al &iacute;tem para enriquecer los procesos de evaluaci&oacute;n alineados a est&aacute;ndares. Estos esfuerzos no parecieran de ning&uacute;n modo ser aislados y han continuado hasta el d&iacute;a de hoy, repensando la confiabilidad de la evaluaci&oacute;n en el aula (v&eacute;ase Reeves, 2011). A pesar de esto y como se&ntilde;ala Mislevy (2004), los retos de los especialistas del test para hacer "sentido" de la evidencia contin&uacute;an.</font></p>  	    <p align="justify"><font face="verdana" size="2">Coherente con las alternativas anteriores y al igual que en el caso de la validez, ser&iacute;a posible de sugerir algunas evidencias y estrategias para la valoraci&oacute;n de la confiabilidad de la evaluaci&oacute;n en el aula:</font></p>  	    <p align="center"><font face="verdana" size="2"><a href="/img/revistas/redie/v15n2/a3t3.jpg" target="_blank">Tabla III</a></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>V. Conclusiones</b></font></p>  	    <p align="justify"><font face="verdana" size="2">El presente trabajo ha tenido como prop&oacute;sito central el reflexionar sobre la evaluaci&oacute;n en el aula a trav&eacute;s de la discusi&oacute;n de sus prop&oacute;sitos, validez y confiabilidad. Lo anterior, debido al hecho de que hist&oacute;ricamente, la psicolog&iacute;a ha aportado a la educaci&oacute;n de teor&iacute;as que no necesariamente surgieron en y para el aula. Una de estas &aacute;reas es la evaluaci&oacute;n del aprendizaje.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">En este sentido, una primera discusi&oacute;n es la delimitaci&oacute;n de los prop&oacute;sitos sustantivos de la evaluaci&oacute;n del aprendizaje en el aula que se definen con base en los diferentes actores del proceso educativo y de las concepciones de calidad y que condicionan o regulan la necesidad de su validez y confiabilidad.</font></p>  	    <p align="justify"><font face="verdana" size="2">As&iacute;, se procede a definir a la validez como un criterio de calidad complejo, que en el aula debe hacer especial &eacute;nfasis en los an&aacute;lisis e interpretaciones hechas sobre el rendimiento de los estudiantes (Joint Commitee, 2003). En una misma t&oacute;nica y coherente con las sugerencias de evidencias en lugar de tipos de validez propuestos en los est&aacute;ndares la APA&#45;AERA&#45;NCME (1999), se sugiere la existencia de tres tipos de evidencias que el docente o tutor podr&iacute;a utilizar para valorar la validez de sus evaluaciones: curriculares, interpretativas e instrumentales.</font></p>  	    <p align="justify"><font face="verdana" size="2">Para finalizar, se discute el criterio de confiabilidad a la luz de las particularidades de evaluaciones en contextos &aacute;ulicos. Como se podr&iacute;a pensar, debido al hecho de que las teor&iacute;as del test no surgen para estos contextos, se evidencian algunas incoherencias con las necesidades propias de un sal&oacute;n de clases. A pesar de lo anterior, se muestran propuestas de autores americanos que han hecho adecuaciones a las mismas con el fin de vigilar su pertinencia para su uso en la cotidianidad escolar. Por tanto, se procede a hacer una propuesta de tres tipos de evidencias (interpretativas, de estabilidad e instrumentales) para valorar la confiabilidad de la evaluaci&oacute;n en el aula.</font></p>  	    <p align="justify"><font face="verdana" size="2">A manera de cierre habr&iacute;a que mencionar que, a lo largo de este trabajo, se ha intentado realizar una reflexi&oacute;n sobre la calidad de la evaluaci&oacute;n en el aula. Todo esto con el fin de evitar lo que en algunos campos de la educaci&oacute;n se ha hecho: copiar o trasladar de forma mec&aacute;nica, las teor&iacute;as y propuestas de la psicolog&iacute;a al contexto escolar.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Referencias</b></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Ali, A. M. y Yusof, H. (2012). Quality in qualitative studies: The case of validity, reliability and generalizability. <i>Issues in Social and Environmental Accounting</i>, <i>5</i>(1&#45;2), 25&#45;64.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034185&pid=S1607-4041201300020000300001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Allen, J. D. (2005). Grades as valid measures of academic achievement of classroom learning. <i>The Clearing House</i>, <i>78</i>(5), 218&#45;223.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034187&pid=S1607-4041201300020000300002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">&Aacute;lvarez&#45;Gayou, J. L. (2010). <i>C&oacute;mo hacer investigaci&oacute;n cualitativa: Fundamentos y metodolog&iacute;a</i>. M&eacute;xico: Paid&oacute;s.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034189&pid=S1607-4041201300020000300003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">American Psychological Association, American Educational Research Association y National Council on Measurement in Education. (1985). <i>Standards for educational and psychological testing</i>. Washington, DC: American Psychological Association.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034191&pid=S1607-4041201300020000300004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">American Psychological Association, American Educational Research Association y National Council on Measurement in Education. (1999). <i>Standards for educational and psychological testing</i>. Washington, DC: American Educational Research Association.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034193&pid=S1607-4041201300020000300005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Barusch, A., Gringeri, C. y George, M. (2011). Rigor in qualitative social work research: A review of strategies used in published articles. <i>Social Work Research</i>, <i>35</i>(1), 11&#45;19.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034195&pid=S1607-4041201300020000300006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Brennan, R. L. (2001). An essay on the history and future of reliability from the perspective of replications. <i>Journal of Educational Measurement</i>, <i>38</i>(4), 295&#45;317.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034197&pid=S1607-4041201300020000300007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Brookhart, S. M. (2003). Developing measurement theory for classroom assessment purposes and uses. <i>Educational Measurement: Issues and Practice</i>, <i>22</i>(4), 5&#45;12.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034199&pid=S1607-4041201300020000300008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Brookhart, S. M. (2004). Assessment theory for college classrooms. <i>New Directions for Teaching &amp; Learning</i>, <i>100</i>, 5&#45;14.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034201&pid=S1607-4041201300020000300009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Brookhart, S. M. (2009). The many meaning of "multiple measures". <i>Educational Leadership</i>, <i>67</i>(3), 6&#45;12.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034203&pid=S1607-4041201300020000300010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Brookhart, S. M. (2011). Starting the conversation about grading. <i>Educational Leadership</i>, <i>69</i>(3), 10&#45;14.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034205&pid=S1607-4041201300020000300011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Camara, W. J. y Lane, S. (2006). A historical perspective and current views on the standards for educational and psychological testing. <i>Educational Measurement: Issues &amp; Practice</i>, <i>25</i>(3), 35&#45;41.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034207&pid=S1607-4041201300020000300012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Chappuis, S. y Stiggins, R. J. (2002). Classroom assessment for learning. <i>Educational Leadership</i>, <i>60</i>(1), 40.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034209&pid=S1607-4041201300020000300013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Ch&aacute;vez, C. y Saade, A. (2010). <i>Procedimientos b&aacute;sicos para el an&aacute;lisis de reactivos</i>. M&eacute;xico: Centro Nacional de Evaluaci&oacute;n para la Educaci&oacute;n Superior.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034211&pid=S1607-4041201300020000300014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">De Camilloni, A. R. W., Celman, S., Litwin, E. y Palou de Mat&eacute;, M. C. (2001). <i>La evaluaci&oacute;n de los aprendizajes en el debate did&aacute;ctico contempor&aacute;neo</i>. Argentina: Paid&oacute;s Educador.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034213&pid=S1607-4041201300020000300015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">De la Orden, A. (2011). Reflexiones en torno a las competencias como objeto de evaluaci&oacute;n en el &aacute;mbito educativo reflections on competency based assessment in education. <i>Revista Electr&oacute;nica de Investigaci&oacute;n Educativa</i>, <i>13</i>(2), 2.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034215&pid=S1607-4041201300020000300016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">De la Orden, A., Asensio, I., Carballo, R., Fern&aacute;ndez D&iacute;az, J., Fuentes, A., Garc&iacute;a Ramos, J. et al. (1997). Desarrollo y validaci&oacute;n de un modelo de calidad universitaria como base para su evaluaci&oacute;n. <i>Revista Electr&oacute;nica de Investigaci&oacute;n y Evaluaci&oacute;n Educativa</i>, <i>3</i>(1&#45;2).    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034217&pid=S1607-4041201300020000300017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Eisner, E. (1998). <i>El ojo ilustrado: Indagaci&oacute;n cualitativa y mejora de la pr&aacute;ctica educativa</i>. Barcelona: Paid&oacute;s.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034219&pid=S1607-4041201300020000300018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Fern&aacute;ndez, M., Noelia, A. y P&eacute;rez, M. A. (2009). <i>Curso b&aacute;sico de psicometr&iacute;a: Teor&iacute;a cl&aacute;sica</i>. Buenos Aires: Lugar Editorial.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034221&pid=S1607-4041201300020000300019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Frisbie, D. A. (2005). Measurement 101: Some fundamentals revisited. <i>Educational Measurement: Issues &amp; Practice</i>, <i>24</i>(3), 21&#45;28.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034223&pid=S1607-4041201300020000300020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Garc&iacute;a, S. (2002). La validez y la confiabilidad en la evaluaci&oacute;n del aprendizaje desde la perspectiva hermen&eacute;utica. <i>Rev. Ped. 23</i>(67), 297&#45;318.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034225&pid=S1607-4041201300020000300021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Golafshani, N. (2003). Understanding reliability and validity in qualitative research. <i>The Qualitative Report</i>, <i>8</i>(4), 597&#45;607.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034227&pid=S1607-4041201300020000300022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Gullickson, A. y Joint Committee on Standards for Educational Evaluation. (2003). <i>The student evaluation standards: How to improve evaluations of students</i>. Thousand Oaks, CA: Sage.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034229&pid=S1607-4041201300020000300023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Hern&aacute;ndez, R., Fern&aacute;ndez&#45;Collado, C. y Baptista, P. (2007). <i>Metodolog&iacute;a de la investigaci&oacute;n</i> (4a. ed.). M&eacute;xico: McGraw&#45;Hill.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034231&pid=S1607-4041201300020000300024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Hopkins, K. (1998). <i>Educational and psychological measurement and evaluation</i>. Needham Heights, MA: Allyn and Bacon.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034233&pid=S1607-4041201300020000300025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Joint Committee on Standards for Educational Evaluation. (2003). <i>The student evaluation standards</i>. California: Corwin Press.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034235&pid=S1607-4041201300020000300026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Jonson, J. L. y Plake, B. S. (1998). A historical comparison of validity standards and validity practices. <i>Educational and Psychological Measurement</i>, <i>58</i>(5), 736&#45;753.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034237&pid=S1607-4041201300020000300027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Lamprianou, I. y Christie, T. (2009). Why school based assessment is not a universal feature of high stakes assessment systems? <i>Educational Assessment, Evaluation &amp; Accountability</i>, <i>21</i>(4), 329&#45;345.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034239&pid=S1607-4041201300020000300028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Lewis, R. (1996). <i>Tests psicol&oacute;gicos y evaluaci&oacute;n</i>. M&eacute;xico: Aiken Editorial&#45;Prentice Hall.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034241&pid=S1607-4041201300020000300029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Li, H. (2003). The resolution of some paradoxes related to reliability and validity. <i>Journal of Educational and Behavioral Statistics</i>, <i>28</i>(2), 89&#45;95.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034243&pid=S1607-4041201300020000300030&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">McMillan, J. H. (2003). Understanding and improving teachers' classroom assessment decision making: Implications for theory and practice. <i>Educational Measurement: Issues and Practice</i>, <i>22</i>(4), 34&#45;43.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034245&pid=S1607-4041201300020000300031&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Miles, M. y Huberman, M. (1984). <i>Qualitative data analysis: A sourcebook of new methods</i>. EUA: Sage.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034247&pid=S1607-4041201300020000300032&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Mislevy, R. J. (2004). Can there be reliability without reliability? <i>Journal of Educational and Behavioral Statistics</i>, <i>29</i>(2), pp. 241&#45;244.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034249&pid=S1607-4041201300020000300033&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Moss, P. A. (1994). Can there be validity without reliability? <i>Educational Researcher</i>, <i>23</i>(2), pp. 5&#45;12.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034251&pid=S1607-4041201300020000300034&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Moss, P. A. (2004). The meaning and consequences of reliability. <i>Journal of Educational and Behavioral Statistics</i>, <i>29</i>(2), 245&#45;249.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034253&pid=S1607-4041201300020000300035&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Mu&ntilde;oz&#45;Izquierdo, C. (2009). &iquest;C&oacute;mo puede la educaci&oacute;n contribuir a la movilidad social. Resultados de cuatro d&eacute;cadas de investigaci&oacute;n sobre la calidad y los efectos socioecon&oacute;micos de la educaci&oacute;n. M&eacute;xico: Universidad Iberoamericana.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034255&pid=S1607-4041201300020000300036&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Parkes, J. (2007). Reliability as argument. <i>Educational Measurement: Issues &amp; Practice</i>, <i>26</i>(4), 2&#45;10.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034257&pid=S1607-4041201300020000300037&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Pedhazur, E. y Pedhazur, L. (1991). <i>Measurement, design and analysis: An integrated approach</i>. Hillsdale, NJ: LAwrence Erlbaum Associates.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034259&pid=S1607-4041201300020000300038&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Sadovnik, A. R. (2001). Basil Bernstein (1924&#150;2000). <i>Prospects</i>, <i>31</i>(4), 607&#45;620.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034261&pid=S1607-4041201300020000300039&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Salkind, N. (2006). <i>Test &amp; measurement for people who (they think) hate tests &amp; measurement</i>. Thounsand Oaks, CA: Sage.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034263&pid=S1607-4041201300020000300040&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Scates, D. E. (1943). Differences between measurement criteria of pure scientists and of classroom teachers. <i>The Journal of Educational Research</i>, <i>37</i>(1), 1&#45;13.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034265&pid=S1607-4041201300020000300041&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Shepard, L. A., Center for Research on Education, Diversity &amp; Excellence, &amp; University of California, Los Angeles. Center for Research on Evaluation, Standards, and Student Testing. (2000). <i>The role of classroom assessment in teaching and learning</i>. Los &Aacute;ngeles, CA: Center for the Study of Evaluation, National Center for Research on Evaluation, Standards, and Student Testing, Graduate School of Education &amp; Information Studies, UCLA.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034267&pid=S1607-4041201300020000300042&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Smith, J. K. (2003). Reconsidering reliability in classroom assessment and grading. <i>Educational Measurement: Issues and Practice</i>, <i>22</i>(4), 26&#45;33.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034269&pid=S1607-4041201300020000300043&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Stiggins, R. J. (1992). High quality classroom assessment: What does it really mean? <i>Educational Measurement: Issues and Practice</i>, <i>11</i>(2), 35&#45;39.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034271&pid=S1607-4041201300020000300044&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Stiggins, R. J. (1997). Dealing with the practical matter of quality performance assessment. <i>Measurement in Physical Education and Exercise Science</i>, <i>1</i>(1), 5&#45;17.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034273&pid=S1607-4041201300020000300045&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Teasdale, A. y Leung, C. (2000). Teacher assessment and psychometric theory: A case of paradigm crossing? <i>Language Testing</i>, <i>17</i>(2), 163&#45;184.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034275&pid=S1607-4041201300020000300046&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">Trist&aacute;n, A. (1998). <i>An&aacute;lisis de rasch para todos: Una gu&iacute;a simplificada para evaluadores educativos</i>. M&eacute;xico: Centro Nacional de Evaluaci&oacute;n para la Educaci&oacute;n Superior.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034277&pid=S1607-4041201300020000300047&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    ]]></body>
<body><![CDATA[<!-- ref --><p align="justify"><font face="verdana" size="2">Winter, G. (2000). A comparative discussion of the notion of validity in qualitative and quantitative research. <i>The Qualitative Report</i>, <i>4</i>(3), 4.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=7034279&pid=S1607-4041201300020000300048&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p> 	    <p align="justify">&nbsp;</p> 	    <p align="justify"><font face="verdana" size="2"><b><a name="nota"></a>Nota</b></font></p> 	    <p align="justify"><font face="verdana" size="2"><sup>1</sup> Las traducciones literales de los textos en ingl&eacute;s fueron realizadas por el autor del art&iacute;culo.</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ali]]></surname>
<given-names><![CDATA[A. M.]]></given-names>
</name>
<name>
<surname><![CDATA[Yusof]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Quality in qualitative studies: The case of validity, reliability and generalizability]]></article-title>
<source><![CDATA[Issues in Social and Environmental Accounting]]></source>
<year>2012</year>
<volume>5</volume>
<numero>1-2</numero>
<issue>1-2</issue>
<page-range>25-64</page-range></nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Allen]]></surname>
<given-names><![CDATA[J. D.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Grades as valid measures of academic achievement of classroom learning]]></article-title>
<source><![CDATA[The Clearing House]]></source>
<year>2005</year>
<volume>78</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>218-223</page-range></nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Álvarez-Gayou]]></surname>
<given-names><![CDATA[J. L.]]></given-names>
</name>
</person-group>
<source><![CDATA[Cómo hacer investigación cualitativa: Fundamentos y metodología]]></source>
<year>2010</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Paidós]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="book">
<collab>American Psychological Association</collab>
<collab>American Educational Research Association</collab>
<collab>National Council on Measurement in Education</collab>
<source><![CDATA[Standards for educational and psychological testing]]></source>
<year>1985</year>
<publisher-loc><![CDATA[Washington^eDC DC]]></publisher-loc>
<publisher-name><![CDATA[American Psychological Association]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<collab>American Psychological Association</collab>
<collab>American Educational Research Association</collab>
<collab>National Council on Measurement in Education</collab>
<source><![CDATA[Standards for educational and psychological testing]]></source>
<year>1999</year>
<publisher-loc><![CDATA[Washington^eDC DC]]></publisher-loc>
<publisher-name><![CDATA[American Educational Research Association]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Barusch]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Gringeri]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
<name>
<surname><![CDATA[George]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Rigor in qualitative social work research: A review of strategies used in published articles]]></article-title>
<source><![CDATA[Social Work Research]]></source>
<year>2011</year>
<volume>35</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>11-19</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brennan]]></surname>
<given-names><![CDATA[R. L.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An essay on the history and future of reliability from the perspective of replications]]></article-title>
<source><![CDATA[Journal of Educational Measurement]]></source>
<year>2001</year>
<volume>38</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>295-317</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brookhart]]></surname>
<given-names><![CDATA[S. M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Developing measurement theory for classroom assessment purposes and uses]]></article-title>
<source><![CDATA[Educational Measurement: Issues and Practice]]></source>
<year>2003</year>
<volume>22</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>5-12</page-range></nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brookhart]]></surname>
<given-names><![CDATA[S. M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Assessment theory for college classrooms]]></article-title>
<source><![CDATA[New Directions for Teaching & Learning]]></source>
<year>2004</year>
<volume>100</volume>
<page-range>5-14</page-range></nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brookhart]]></surname>
<given-names><![CDATA[S. M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The many meaning of "multiple measures"]]></article-title>
<source><![CDATA[Educational Leadership]]></source>
<year>2009</year>
<volume>67</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>6-12</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Brookhart]]></surname>
<given-names><![CDATA[S. M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Starting the conversation about grading]]></article-title>
<source><![CDATA[Educational Leadership]]></source>
<year>2011</year>
<volume>69</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>10-14</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Camara]]></surname>
<given-names><![CDATA[W. J.]]></given-names>
</name>
<name>
<surname><![CDATA[Lane]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A historical perspective and current views on the standards for educational and psychological testing]]></article-title>
<source><![CDATA[Educational Measurement: Issues & Practice]]></source>
<year>2006</year>
<volume>25</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>35-41</page-range></nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chappuis]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Stiggins]]></surname>
<given-names><![CDATA[R. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Classroom assessment for learning]]></article-title>
<source><![CDATA[Educational Leadership]]></source>
<year>2002</year>
<volume>60</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>40</page-range></nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chávez]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
<name>
<surname><![CDATA[Saade]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<source><![CDATA[Procedimientos básicos para el análisis de reactivos]]></source>
<year>2010</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Centro Nacional de Evaluación para la Educación Superior]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[De Camilloni]]></surname>
<given-names><![CDATA[A. R. W.]]></given-names>
</name>
<name>
<surname><![CDATA[Celman]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Litwin]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
<name>
<surname><![CDATA[Palou de Maté]]></surname>
<given-names><![CDATA[M. C.]]></given-names>
</name>
</person-group>
<source><![CDATA[La evaluación de los aprendizajes en el debate didáctico contemporáneo]]></source>
<year>2001</year>
<publisher-name><![CDATA[Paidós Educador]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[De la Orden]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Reflexiones en torno a las competencias como objeto de evaluación en el ámbito educativo]]></article-title>
<source><![CDATA[Revista Electrónica de Investigación Educativa]]></source>
<year>2011</year>
<volume>13</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>2</page-range></nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[De la Orden]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Asensio]]></surname>
<given-names><![CDATA[I.]]></given-names>
</name>
<name>
<surname><![CDATA[Carballo]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Fernández Díaz]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
<name>
<surname><![CDATA[Fuentes]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[García Ramos]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Desarrollo y validación de un modelo de calidad universitaria como base para su evaluación]]></article-title>
<source><![CDATA[Revista Electrónica de Investigación y Evaluación Educativa]]></source>
<year>1997</year>
<volume>3</volume>
<numero>1-2</numero>
<issue>1-2</issue>
</nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Eisner]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
</person-group>
<source><![CDATA[El ojo ilustrado: Indagación cualitativa y mejora de la práctica educativa]]></source>
<year>1998</year>
<publisher-loc><![CDATA[Barcelona ]]></publisher-loc>
<publisher-name><![CDATA[Paidós]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Fernández]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[Noelia]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Pérez]]></surname>
<given-names><![CDATA[M. A.]]></given-names>
</name>
</person-group>
<source><![CDATA[Curso básico de psicometría: Teoría clásica]]></source>
<year>2009</year>
<publisher-loc><![CDATA[Buenos Aires ]]></publisher-loc>
<publisher-name><![CDATA[Lugar Editorial]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Frisbie]]></surname>
<given-names><![CDATA[D. A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Measurement 101: Some fundamentals revisited]]></article-title>
<source><![CDATA[Educational Measurement: Issues & Practice]]></source>
<year>2005</year>
<volume>24</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>21-28</page-range></nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[García]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[La validez y la confiabilidad en la evaluación del aprendizaje desde la perspectiva hermenéutica]]></article-title>
<source><![CDATA[Rev. Ped.]]></source>
<year>2002</year>
<volume>23</volume>
<numero>67</numero>
<issue>67</issue>
<page-range>297-318</page-range></nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Golafshani]]></surname>
<given-names><![CDATA[N.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Understanding reliability and validity in qualitative research]]></article-title>
<source><![CDATA[The Qualitative Report]]></source>
<year>2003</year>
<volume>8</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>597-607</page-range></nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gullickson]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<collab>Joint Committee on Standards for Educational Evaluation</collab>
<source><![CDATA[The student evaluation standards: How to improve evaluations of students]]></source>
<year>2003</year>
<publisher-loc><![CDATA[Thousand Oaks^eCA CA]]></publisher-loc>
<publisher-name><![CDATA[Sage]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hernández]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
<name>
<surname><![CDATA[Fernández-Collado]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
<name>
<surname><![CDATA[Baptista]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
</person-group>
<source><![CDATA[Metodología de la investigación]]></source>
<year>2007</year>
<edition>4</edition>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[McGraw-Hill]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hopkins]]></surname>
<given-names><![CDATA[K.]]></given-names>
</name>
</person-group>
<source><![CDATA[Educational and psychological measurement and evaluation]]></source>
<year>1998</year>
<publisher-loc><![CDATA[Needham Heights^eMA MA]]></publisher-loc>
<publisher-name><![CDATA[Allyn and Bacon]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="book">
<collab>Joint Committee on Standards for Educational Evaluation</collab>
<source><![CDATA[The student evaluation standards]]></source>
<year>2003</year>
<publisher-loc><![CDATA[^eCalifornia California]]></publisher-loc>
<publisher-name><![CDATA[Corwin Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Jonson]]></surname>
<given-names><![CDATA[J. L.]]></given-names>
</name>
<name>
<surname><![CDATA[Plake]]></surname>
<given-names><![CDATA[B. S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A historical comparison of validity standards and validity practices]]></article-title>
<source><![CDATA[Educational and Psychological Measurement]]></source>
<year>1998</year>
<volume>58</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>736-753</page-range></nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lamprianou]]></surname>
<given-names><![CDATA[I.]]></given-names>
</name>
<name>
<surname><![CDATA[Christie]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Why school based assessment is not a universal feature of high stakes assessment systems?]]></article-title>
<source><![CDATA[Educational Assessment, Evaluation & Accountability]]></source>
<year>2009</year>
<volume>21</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>329-345</page-range></nlm-citation>
</ref>
<ref id="B29">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lewis]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
</person-group>
<source><![CDATA[Tests psicológicos y evaluación]]></source>
<year>1996</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Aiken EditorialPrentice Hall]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B30">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Li]]></surname>
<given-names><![CDATA[H.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The resolution of some paradoxes related to reliability and validity]]></article-title>
<source><![CDATA[Journal of Educational and Behavioral Statistics]]></source>
<year>2003</year>
<volume>28</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>89-95</page-range></nlm-citation>
</ref>
<ref id="B31">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McMillan]]></surname>
<given-names><![CDATA[J. H.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Understanding and improving teachers' classroom assessment decision making: Implications for theory and practice]]></article-title>
<source><![CDATA[Educational Measurement: Issues and Practice]]></source>
<year>2003</year>
<volume>22</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>34-43</page-range></nlm-citation>
</ref>
<ref id="B32">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Miles]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[Huberman]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<source><![CDATA[Qualitative data analysis: A sourcebook of new methods]]></source>
<year>1984</year>
<publisher-name><![CDATA[Sage]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B33">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mislevy]]></surname>
<given-names><![CDATA[R. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Can there be reliability without reliability?]]></article-title>
<source><![CDATA[Journal of Educational and Behavioral Statistics]]></source>
<year>2004</year>
<volume>29</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>241-244</page-range></nlm-citation>
</ref>
<ref id="B34">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Moss]]></surname>
<given-names><![CDATA[P. A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Can there be validity without reliability?]]></article-title>
<source><![CDATA[Educational Researcher]]></source>
<year>1994</year>
<volume>23</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>5-12</page-range></nlm-citation>
</ref>
<ref id="B35">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Moss]]></surname>
<given-names><![CDATA[P. A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The meaning and consequences of reliability]]></article-title>
<source><![CDATA[Journal of Educational and Behavioral Statistics]]></source>
<year>2004</year>
<volume>29</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>245-249</page-range></nlm-citation>
</ref>
<ref id="B36">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Muñoz-Izquierdo]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<source><![CDATA[¿Cómo puede la educación contribuir a la movilidad social. Resultados de cuatro décadas de investigación sobre la calidad y los efectos socioeconómicos de la educación]]></source>
<year>2009</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Universidad Iberoamericana]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B37">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Parkes]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Reliability as argument]]></article-title>
<source><![CDATA[Educational Measurement: Issues & Practice]]></source>
<year>2007</year>
<volume>26</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>2-10</page-range></nlm-citation>
</ref>
<ref id="B38">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pedhazur]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
<name>
<surname><![CDATA[Pedhazur]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
</person-group>
<source><![CDATA[Measurement, design and analysis: An integrated approach]]></source>
<year>1991</year>
<publisher-loc><![CDATA[Hillsdale^eNJ NJ]]></publisher-loc>
<publisher-name><![CDATA[LAwrence Erlbaum Associates]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B39">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sadovnik]]></surname>
<given-names><![CDATA[A. R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Basil Bernstein (1924-2000)]]></article-title>
<source><![CDATA[Prospects]]></source>
<year>2001</year>
<volume>31</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>607-620</page-range></nlm-citation>
</ref>
<ref id="B40">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Salkind]]></surname>
<given-names><![CDATA[N.]]></given-names>
</name>
</person-group>
<source><![CDATA[Test & measurement for people who (they think) hate tests & measurement]]></source>
<year>2006</year>
<publisher-loc><![CDATA[Thounsand Oaks^eCA CA]]></publisher-loc>
<publisher-name><![CDATA[Sage]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B41">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Scates]]></surname>
<given-names><![CDATA[D. E.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Differences between measurement criteria of pure scientists and of classroom teachers]]></article-title>
<source><![CDATA[The Journal of Educational Research]]></source>
<year>1943</year>
<volume>37</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>1-13</page-range></nlm-citation>
</ref>
<ref id="B42">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Shepard]]></surname>
<given-names><![CDATA[L. A.]]></given-names>
</name>
</person-group>
<collab>Center for Research on Education, Diversity & Excellence</collab>
<collab>University of California, Los Angeles</collab>
<collab>Center for Research on Evaluation, Standards, and Student Testing</collab>
<source><![CDATA[The role of classroom assessment in teaching and learning]]></source>
<year>2000</year>
<publisher-loc><![CDATA[Los Ángeles^eCA CA]]></publisher-loc>
<publisher-name><![CDATA[Center for the Study of EvaluationNational Center for Research on Evaluation, Standards, and Student TestingGraduate School of Education & Information Studies, UCLA]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B43">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Smith]]></surname>
<given-names><![CDATA[J. K.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Reconsidering reliability in classroom assessment and grading]]></article-title>
<source><![CDATA[Educational Measurement: Issues and Practice]]></source>
<year>2003</year>
<volume>22</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>26-33</page-range></nlm-citation>
</ref>
<ref id="B44">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Stiggins]]></surname>
<given-names><![CDATA[R. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[High quality classroom assessment: What does it really mean?]]></article-title>
<source><![CDATA[Educational Measurement: Issues and Practice]]></source>
<year>1992</year>
<volume>11</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>35-39</page-range></nlm-citation>
</ref>
<ref id="B45">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Stiggins]]></surname>
<given-names><![CDATA[R. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Dealing with the practical matter of quality performance assessment]]></article-title>
<source><![CDATA[Measurement in Physical Education and Exercise Science]]></source>
<year>1997</year>
<volume>1</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>5-17</page-range></nlm-citation>
</ref>
<ref id="B46">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Teasdale]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Leung]]></surname>
<given-names><![CDATA[C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Teacher assessment and psychometric theory: A case of paradigm crossing?]]></article-title>
<source><![CDATA[Language Testing]]></source>
<year>2000</year>
<volume>17</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>163-</page-range></nlm-citation>
</ref>
<ref id="B47">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tristán]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<source><![CDATA[Análisis de rasch para todos: Una guía simplificada para evaluadores educativos]]></source>
<year>1998</year>
<publisher-loc><![CDATA[México ]]></publisher-loc>
<publisher-name><![CDATA[Centro Nacional de Evaluación para la Educación Superior]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B48">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Winter]]></surname>
<given-names><![CDATA[G.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A comparative discussion of the notion of validity in qualitative and quantitative research]]></article-title>
<source><![CDATA[The Qualitative Report]]></source>
<year>2000</year>
<volume>4</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>4</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
