<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0185-2698</journal-id>
<journal-title><![CDATA[Perfiles educativos]]></journal-title>
<abbrev-journal-title><![CDATA[Perfiles educativos]]></abbrev-journal-title>
<issn>0185-2698</issn>
<publisher>
<publisher-name><![CDATA[Universidad Nacional Autónoma de México, Instituto de Investigaciones sobre la Universidad y la Educación]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0185-26982015000300010</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[La validez en los exámenes de alto impacto: Un enfoque desde la lógica argumentativa]]></article-title>
<article-title xml:lang="en"><![CDATA[Validity of high impact exams: An approach from argumentative logic]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Mendoza Ramos]]></surname>
<given-names><![CDATA[Arturo]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Nacional Autónoma de México Centro de Enseñanza de Lenguas Extranjeras ]]></institution>
<addr-line><![CDATA[México Distrito Federal]]></addr-line>
<country>México</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>09</month>
<year>2015</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>09</month>
<year>2015</year>
</pub-date>
<volume>37</volume>
<numero>149</numero>
<fpage>169</fpage>
<lpage>186</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_arttext&amp;pid=S0185-26982015000300010&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&amp;pid=S0185-26982015000300010&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_pdf&amp;pid=S0185-26982015000300010&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[La validez en la evaluación educativa de alto impacto representa un desafío para las instituciones que se dedican a diseñar y validar exámenes; sin embargo, los organismos internacionales que han provisto estándares de calidad para la evaluación no proporcionan en realidad una guía clara de cómo elaborar exámenes, ni la manera mediante la cual se pueda proveer una evaluación justa y equitativa para los sustentantes. En el presente artículo se expone la importancia de la validez a partir de la segunda mitad del siglo XX, las dificultades latentes al momento de validar exámenes a finales del siglo pasado y, posteriormente, se presenta una novedosa concepción de abordar la validez en la evaluación educativa. Vista desde la lógica de la argumentación, la validez consiste en todo un proceso de inferencias que deben encontrarse sustentadas en la evidencia y en el respaldo de las mismas. Este modelo para validar exámenes desde la lógica argumentativa se está siguiendo en diversas áreas educativas a nivel internacional; sin embargo, ha cobrado especial relevancia en la evaluación de segundas lenguas.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Validity of high impact education assessment represents a challenge for institutions that design and validate exams. However, the international bodies that have provided quality standards in assessment in fact do not provide clear guidelines regarding how to develop exams, nor how to provide exam candidates with fair and equitable evaluations. This paper presents the importance validity has adopted since the second half of the twentieth century, the latent difficulties faced when validating exams at the end of the last century, as well as an innovative idea to approach the validity of education assessment. Seen through the lens of argumentative logic, validity consists of a whole process of inferences that must be evidence-based. This exam validation model based on argumentative logic is being applied in various educational areas internationally, and has become particularly germane to second language evaluation.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Evaluación educativa]]></kwd>
<kwd lng="es"><![CDATA[Evaluación de modelos]]></kwd>
<kwd lng="es"><![CDATA[Evaluación de pruebas]]></kwd>
<kwd lng="es"><![CDATA[Validez de las pruebas]]></kwd>
<kwd lng="es"><![CDATA[Exámenes]]></kwd>
<kwd lng="en"><![CDATA[Education assessment]]></kwd>
<kwd lng="en"><![CDATA[Assessment models]]></kwd>
<kwd lng="en"><![CDATA[Test assessment]]></kwd>
<kwd lng="en"><![CDATA[Test validity]]></kwd>
<kwd lng="en"><![CDATA[Tests]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="justify"><font face="verdana" size="4">Horizontes</font></p>              <p align="justify"><font face="verdana" size="4">&nbsp;</font></p>     <p align="center"><font face="verdana" size="4"><b>La validez en los ex&aacute;menes de alto impacto. Un enfoque desde la l&oacute;gica argumentativa</b></font></p>     <p align="center"><font face="verdana" size="4">&nbsp;</font></p>     <p align="center"><font face="verdana" size="3"><b>Validity of high impact exams.  An approach from argumentative logic</b></font></p>     <p align="center"><font face="verdana" size="3">&nbsp;</font></p>      <p align="center"><font face="verdana" size="2"><b>Arturo Mendoza Ramos*</b></font></p>     <p align="center"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><i>* Profesor asociado "C" tiempo completo en el Centro de Ense&ntilde;anza de Lenguas Extranjeras de la Universidad Nacional Aut&oacute;noma de M&eacute;xico (UNAM). Maestro en Ling&uuml;&iacute;stica Aplicada y estudiante del Doctorado en Ling&uuml;&iacute;stica de la Universidad Nacional Aut&oacute;noma de M&eacute;xico (UNAM). L&iacute;nea de investigaci&oacute;n: evaluaci&oacute;n y certificaci&oacute;n de lenguas. Publicaciones recientes: (2015), "La selecci&oacute;n de las tareas de escritura en los ex&aacute;menes de lengua extranjera destinados al &aacute;mbito acad&eacute;mico", Revista Nebrija de Ling&uuml;&iacute;stica Aplicada a la Ense&ntilde;anza de Lenguas, vol. 9, n&uacute;m. 11, en: </i><a href="http://www.nebrija.com/revista&#45;linguistica/files/articulosPDF/articulo_5500062b360e6.pdf" target="_blank">http://www.nebrija.com/revista&#45;linguistica/files/articulosPDF/articulo_5500062b360e6.pdf</a>;<i> (2014), "Las pr&aacute;cticas de evaluaci&oacute;n docente y las habilidades de escritura requeridas en el nivel posgrado", Innovaci&oacute;n Educativa, vol. 14, n&uacute;m. 66, pp. 147&#45;175. </i>CE: <a href="mailto:a.mendoza@cele.unam.mx">a.mendoza@cele.unam.mx</a></font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Recepci&oacute;n: 9 de junio de 2014.    <br> Aceptaci&oacute;n: 29 de agosto de 2014.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font size="2" face="verdana"><b>Resumen</b></font></p>     <p align="justify"><font face="verdana" size="2">La validez en la evaluaci&oacute;n educativa de alto impacto representa un desaf&iacute;o para las instituciones que se dedican a dise&ntilde;ar y validar ex&aacute;menes; sin embargo, los organismos internacionales que han provisto est&aacute;ndares de calidad para la evaluaci&oacute;n no proporcionan en realidad una gu&iacute;a clara de c&oacute;mo elaborar ex&aacute;menes, ni la manera mediante la cual se pueda proveer una evaluaci&oacute;n justa y equitativa para los sustentantes. En el presente art&iacute;culo se expone la importancia de la validez a partir de la segunda mitad del siglo XX, las dificultades latentes al momento de validar ex&aacute;menes a finales del siglo pasado y, posteriormente, se presenta una novedosa concepci&oacute;n de abordar la validez en la evaluaci&oacute;n educativa. Vista desde la l&oacute;gica de la argumentaci&oacute;n, la validez consiste en todo un proceso de inferencias que deben encontrarse sustentadas en la evidencia y en el respaldo de las mismas. Este modelo para validar ex&aacute;menes desde la l&oacute;gica argumentativa se est&aacute; siguiendo en diversas &aacute;reas educativas a nivel internacional; sin embargo, ha cobrado especial relevancia en la evaluaci&oacute;n de segundas lenguas.</font></p>        <p align="justify"><font face="verdana" size="2"><b>Palabras clave: </b>Evaluaci&oacute;n educativa, Evaluaci&oacute;n de modelos, Evaluaci&oacute;n de pruebas, Validez de las pruebas, Ex&aacute;menes. </font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Abstract</b></font></p>     <p align="justify"><font face="verdana" size="2">Validity of high impact education assessment represents a challenge for institutions that design and validate exams. However, the international bodies that have provided quality standards in assessment in fact do not provide clear guidelines regarding how to develop exams, nor how to provide exam candidates with fair and equitable evaluations. This paper presents the importance validity has adopted since the second half of the twentieth century, the latent difficulties faced when validating exams at the end of the last century, as well as an innovative idea to approach the validity of education assessment. Seen through the lens of argumentative logic, validity consists of a whole process of inferences that must be evidence&#45;based. This exam validation model based on argumentative logic is being applied in various educational areas internationally, and has become particularly germane to second language evaluation.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Keywords</b>: Education assessment, Assessment models, Test assessment, Test validity, Tests. </font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Introducci&oacute;n</b></font></p>           <p align="right">&nbsp;</p>     <p align="right"><font face="verdana" size="2">If validity is to be considered the     <br> most fundamental consideration in    <br> developing and evaluating tests, it    <br> needs to address the suitability of the    <br> test for its intended function (Kane,    <br> 2013: 62).</font></p>           <p align="justify">&nbsp;</p>        ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">En el &aacute;mbito educativo en M&eacute;xico, la evaluaci&oacute;n de alto impacto<sup><a href="#nota">1</a></sup> que llevan a cabo organizaciones nacionales e internacionales ha aumentado considerablemente; esto se debe a la necesidad de contar con mecanismos estandarizados que permitan servir como puntos de comparaci&oacute;n, tanto entre estudiantes connacionales como entre nacionales y extranjeros. En el primer caso, basta mencionar los ex&aacute;menes de ingreso a la educaci&oacute;n media superior (EXANI) o superior de las universidades p&uacute;blicas del &aacute;rea metropolitana, ya que cientos de miles de aspirantes presentan dichos ex&aacute;menes cada a&ntilde;o. En el caso de los ex&aacute;menes internacionales destaca, por ejemplo, la prueba dise&ntilde;ada por el Programa Internacional de Evaluaci&oacute;n de Estudiantes (PISA, por sus siglas en ingl&eacute;s), la cual tiene como objetivo medir las competencias que poseen los j&oacute;venes de 15 a&ntilde;os en matem&aacute;ticas, ciencias y lectura en m&aacute;s de 60 pa&iacute;ses.</font></p>        <p align="justify"><font face="verdana" size="2">Debido a que los ex&aacute;menes de alto impacto juegan un papel primordial en la vida de los examinados, es imprescindible que tales ex&aacute;menes eval&uacute;en de manera justa y equitativa a los candidatos que cada a&ntilde;o los realizan; es por ello que en la evaluaci&oacute;n, la &eacute;tica ha adquirido un lugar tan importante como la validez y confiabilidad de la evaluaci&oacute;n misma. Una de las dificultades que ha girado en torno a la noci&oacute;n de validez se refiere a que los est&aacute;ndares internacionales (APA, AERA y NCME)<sup><a href="#nota">2</a></sup> la conciben como una serie de elementos disgregados y desarticulados que resultan dif&iacute;ciles de incorporar al momento de dise&ntilde;ar y validar ex&aacute;menes; por tal motivo, desde comienzos del siglo XXI la validez se ha concebido como un argumento que requiere de ciertas inferencias, evidencias y sustento que respalde la toma de decisiones.</font></p>       <p align="justify"><font face="verdana" size="2">En el presente texto se presenta, en primer lugar, una breve rese&ntilde;a de los or&iacute;genes de la noci&oacute;n de validez en los ex&aacute;menes, partiendo de los conceptos aportados por Cronbach (1988) y Messick (1989); tambi&eacute;n se aborda el esfuerzo por incluir estos conceptos dentro de los modelos de dise&ntilde;o y de validaci&oacute;n en los ex&aacute;menes durante la d&eacute;cada de los a&ntilde;os noventa. M&aacute;s adelante se describe la problem&aacute;tica que se suscit&oacute; a finales del siglo XX al tratar de poner en pr&aacute;ctica tanto los modelos te&oacute;ricos para validar ex&aacute;menes, como los conceptos de validez fragmentados que eran utilizados por los expertos al evaluar ex&aacute;menes de alto impacto. Posteriormente, se describe el modelo de argumentaci&oacute;n de Toulmin (1958) y la aplicaci&oacute;n que ha tenido en la evaluaci&oacute;n para la generaci&oacute;n de diversos enfoques de validaci&oacute;n de ex&aacute;menes. M&aacute;s adelante, se discuten las ventajas y desventajas de cada uno de los enfoques y se presenta la aplicaci&oacute;n de los conceptos te&oacute;ricos en un esquema dise&ntilde;ado para validar los ex&aacute;menes de comprensi&oacute;n de lectura del Centro de Ense&ntilde;anza de Lenguas Extranjeras de la UNAM. Por &uacute;ltimo, se ofrece una breve conclusi&oacute;n de la validez, vista desde la &oacute;ptica de la l&oacute;gica argumentativa.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b>Los or&iacute;genes de la validez en los ex&aacute;menes</b></font></p>        <p align="justify"><font face="verdana" size="2">La validez de cualquier examen de alto impacto es indispensable para tomar decisiones justas y equitativas con base en informaci&oacute;n veraz respecto de las habilidades/competencias que posee un sustentante. La validez se define antes, durante y despu&eacute;s de la administraci&oacute;n de un examen, y su fin, en t&eacute;rminos generales, es indagar si un examen en realidad mide lo que deber&iacute;a medir; sin embargo, la manera de definir la validez ha variado sustancialmente desde su florecimiento &#45;a mediados del siglo XX&#45; hasta nuestros d&iacute;as.</font></p>          <p align="justify"><font face="verdana" size="2">Durante la primera mitad del siglo XX, el concepto de validez se sustentaba en modelos estad&iacute;sticos basados en el criterio de los ex&aacute;menes; es decir, la validez era definida como la correlaci&oacute;n entre el puntaje de un examen y el puntaje definido como criterio. Este criterio, por lo general, se encontraba dado por ex&aacute;menes similares que evaluaban las mismas habilidades; por lo tanto, un examen se consideraba como v&aacute;lido exclusivamente si med&iacute;a lo mismo que otros instrumentos ya existentes.</font></p>         <p align="justify"><font face="verdana" size="2">Cronbach y Meehl introdujeron cuatro tipos de validez: predictiva, concurrente, de contenido y de constructo, los cuales constituyeron los ejes fundamentales de la validez de los ex&aacute;menes hasta finales del siglo XX. Dentro de estas categor&iacute;as, destaca la validez de constructo, la cual, seg&uacute;n los autores, "se ve involucrada cuando un examen ha de ser interpretado como una medida de alg&uacute;n atributo o cualidad que no es definida operacionalmente" (1955: 282). Esta idea de constructo parti&oacute; de la necesidad de concebir la validez en t&eacute;rminos cient&iacute;ficos, es decir, en la definici&oacute;n del constructo desde la teor&iacute;a y, por lo tanto, en la convicci&oacute;n de que la interpretaci&oacute;n del constructo puede ser evaluada emp&iacute;ricamente junto con la teor&iacute;a que lo sustenta.</font></p>        <p align="justify"><font face="verdana" size="2">En 1974, los organismos estadounidenses encargados de desarrollar los est&aacute;ndares a considerar en la elaboraci&oacute;n de ex&aacute;menes (APA, AERA y NCME), definieron los cuatro tipos de validez descritos por Cronbach y Meehl (1955): predictiva, concurrente, de contenido y de constructo. La problem&aacute;tica que se suscit&oacute; a finales de esta d&eacute;cada fue que los diferentes m&eacute;todos de validez eran tratados como diversos instrumentos que pod&iacute;an ser empleados en distintas situaciones de acuerdo a como los evaluadores consideraban que fuera m&aacute;s conveniente emplearlas. El punto fundamental era que no se contaba con un marco general de validaci&oacute;n para los ex&aacute;menes, puesto que la validez de contenido y concurrente depend&iacute;an del tipo de examen que se quer&iacute;a validar. Consecuentemente, debido a que la validez de constructo era la &uacute;nica que contaba con un sustento cient&iacute;fico, se adopt&oacute; como marco para la validaci&oacute;n de los ex&aacute;menes.</font></p>        <p align="justify"><font face="verdana" size="2">Pese a que la validez de constructo propuesta por Cronbach y Meehl (1955) causaba dificultades en su aplicaci&oacute;n, uno de los mayores logros de los autores fue demostrar que la interpretaci&oacute;n de los resultados no pod&iacute;a darse por hecho, y que se necesitaba de una serie de afirmaciones circunscritas en un marco te&oacute;rico. En realidad, una de las grandes aportaciones de Cronbach y Meehl al concepto de validez se debi&oacute; a su concepci&oacute;n no como un mecanismo matem&aacute;tico, como es el caso de la confiabilidad, sino m&aacute;s bien como todo un proceso denominado "validez de argumento". Posteriormente, &eacute;ste fue retomado por Kane (1992) en su enfoque de validaci&oacute;n para los ex&aacute;menes, que consiste en recabar evidencia para llevar a cabo inferencias, m&aacute;s que exclusivamente para validar instrumentos.</font></p>        ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Gracias al gran trabajo de Cronbach a lo largo de varias d&eacute;cadas, se cimentaron las bases que propiciaron el surgimiento del modelo de validez de Samuel Messick en 1989. Este modelo, a&uacute;n vigente, es el m&aacute;s representativo; sobre &eacute;l versan las discusiones que hoy en d&iacute;a existen en materia de validez en la evaluaci&oacute;n de ex&aacute;menes de alto impacto. Messick defini&oacute; este t&eacute;rmino de la siguiente manera: <i>"Validity is an integrated evaluative judgment of the degree to which empirical evidence and theoretical rationales support the adequacy and appropriateness of inferences and actions based on test scores or other modes of assessment"</i> (1989: 13).</font></p>     <p align="justify"><font face="verdana" size="2">Sin lugar a dudas, la mayor aportaci&oacute;n de Messick fue concebir la validez como un aspecto unitario y no como una serie de elementos disgregados y desarticulados. Como se puede apreciar en el <a href="#c1">Cuadro 1</a>, desde la &oacute;ptica de Messick la evaluaci&oacute;n es un procedimiento para extraer inferencias (toma de decisiones) a partir de ciertas evidencias (ex&aacute;menes); de tal suerte que el objetivo primordial de la validez emp&iacute;rica de los ex&aacute;menes ser&aacute; demostrar que las interpretaciones y la toma de decisiones respecto al desempe&ntilde;o de un sustentante en un examen de dominio son justas y equitativas.</font></p>           <p align="center"><a name="c1"></a></p>     <p align="center"><img src="/img/revistas/peredu/v37n149/a10c1.jpg"></p>           <p align="justify"><font face="verdana" size="2">En suma, una de las grandes aportaciones de Cronbach y Messick fue concebir la validez como un proceso de argumentaci&oacute;n, lo cual tuvo gran influencia en los enfoques de validez de la primera d&eacute;cada del siglo XXI. No obstante, aun cuando el modelo de Messick (1989) constituy&oacute; un parteaguas en la noci&oacute;n unitaria de validez al incluir las consecuencias y el uso del examen dentro de su matriz de facetas de validez, una de las mayores dificultades de este modelo se debi&oacute; a su materializaci&oacute;n; en otras palabras, a lo abstracto y a la poca claridad como gu&iacute;a para aplicarlo al proceso de validaci&oacute;n de ex&aacute;menes (Bachman, 2005; Kane, 1992; Mislevy <i>et al.,</i> 2003). Por tal raz&oacute;n, a finales del siglo XX y comienzos del XXI, la directriz para validar ex&aacute;menes consist&iacute;a, m&aacute;s bien, en una serie de caracter&iacute;sticas necesarias dentro de la validez, pero que no constitu&iacute;an un procedimiento l&oacute;gico mediante el cual se encontraban vinculadas y relacionadas unas con otras (Bachman, 2005).</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b>El panorama de la validez a finales del siglo XX y comienzos del siglo XXI</b></font></p>          <p align="justify"><font face="verdana" size="2">Pese a las dificultades para materializar el modelo de Messick, la inclusi&oacute;n del significado social, los valores, la &eacute;tica y las consecuencias  de la evaluaci&oacute;n fomentaron la necesidad de incorporarlos dentro del dise&ntilde;o y validaci&oacute;n de ex&aacute;menes. Por estos motivos, a finales del siglo XX, debido a la falta de integraci&oacute;n e interrelaci&oacute;n entre los diversos conceptos de validez, el derrotero de la validez dentro del &aacute;mbito de la evaluaci&oacute;n comenz&oacute; a orientarse hacia la incorporaci&oacute;n de un argumento que fungiera como "paraguas", y que no s&oacute;lo describiera los componentes de validez, sino que adem&aacute;s los integrara e interrelacionara entre s&iacute;. De ah&iacute; que el modelo de argumentaci&oacute;n de Toulmin (1958) fuera retomado por los te&oacute;ricos que a lo largo de dos d&eacute;cadas hab&iacute;an incorporado dicho modelo con el fin de concebir la validez de forma m&aacute;s global que fragmentaria. Por lo anterior, antes de describir los enfoques m&aacute;s influyentes en la validez de ex&aacute;menes de alto impacto, ser&aacute; necesario describir el modelo de argumentaci&oacute;n de Toulmin.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>        <p align="justify"><font face="verdana" size="2"><b>El modelo de argumentaci&oacute;n de Toulmin</b> <b>(1958)</b> <b>Y Toulmin, Janik y Rieke </b> <b>(1979; 1984)</b></font></p>          ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">El modelo de argumentaci&oacute;n propuesto por Toulmin (1958), revisado y ampliado por Toulmin <i>et al.</i> (1979; 1984), ha tenido aplicaciones en diversos &aacute;mbitos como el derecho,</font> <font face="verdana" size="2">las ciencias duras, la medicina y la est&eacute;tica; no obstante, no fue sino hasta la d&eacute;cada de los noventa del siglo pasado cuando comenz&oacute; a contemplarse su adecuaci&oacute;n dentro del proceso de validaci&oacute;n de ex&aacute;menes (Kane, 1992).</font></p>     <p align="justify"><font face="verdana" size="2">Toulmin (1958) considera como punto de partida en el proceso de argumentaci&oacute;n dos componentes: una aserci&oacute;n <i>(claim)</i> y los hechos o datos <i>(data)</i> que fungen como base o fundamento para validar dicha aserci&oacute;n (<a href="#f1">Fig. 1</a>). Sin embargo, el verdadero reto, afirma el autor, no se encuentra representado por la aserci&oacute;n que se establece, sino por el procedimiento que se lleva a cabo para llegar a ella. Partiendo de esta premisa, el autor menciona que lo importante no es fortalecer nuestros datos, sino las proposiciones que de ellos podamos derivar: reglas, principios o inferencias. A este tipo de inferencias las denomina garant&iacute;as <i>(warrants);</i> las cuales, aunque puedan parecen obviedades, en realidad no lo son.</font></p>          <p align="center"><a name="f1"></a></p>     <p align="center"><img src="/img/revistas/peredu/v37n149/a10f1.jpg"></p>           <p align="justify"><font face="verdana" size="2">El problema de las garant&iacute;as, afirma Toulmin (1958), es que en ocasiones existen varias formas de argumentar en distintas direcciones, cada una con sus respectivas premisas y evidencias. Ante estas circunstancias, se deben sopesar los distintos argumentos en conflicto, de tal suerte que se pueda elegir aquella l&iacute;nea de argumentaci&oacute;n que conlleve mayor peso. Ahora bien, las garant&iacute;as son presuposiciones que no se validan <i>per se,</i> sino mediante el respaldo <i>(backing)</i> que permita justificarlas. Este respaldo debe ser considerado cuidadosamente, puesto que su pertinencia se ubica precisamente en el campo o &aacute;mbito en el cual el argumento es enunciado. Los cuatro puntos mencionados anteriormente, agrega Toulmin, son indispensables para conferirle solidez al argumento.</font></p>         <p align="justify"><font face="verdana" size="2">Una vez que el argumento cuenta con solidez, el siguiente paso consiste en establecer la fuerza del mismo. Toulmin <i>et al.</i> (1984) sostienen que los cuatro pasos anteriores son s&oacute;lo el principio del argumento, puesto que las garant&iacute;as son de diversa naturaleza, y por ello pueden conferir diferentes grados de fuerza de conclusi&oacute;n. Es aqu&iacute; donde entra el segundo nivel de an&aacute;lisis, mismo que los autores denominan como "la fuerza" de un argumento, la cual se encuentra compuesta por los calificadores modales <i>(qualifiers),</i> la refutaci&oacute;n <i>(rebuttal)</i> y las excepciones <i>(exceptions).</i> Seg&uacute;n Toulmin (1958) y Toulmin <i>et al.</i> (1984), esta fuerza se expresa mediante adverbios que denotan una cualidad: <i>necesariamente, tentativamente, probablemente, aparentemente, quiz&aacute;s, muy probablemente, seguramente,</i> etc. Por ende, puede que no resulte suficiente especificar los datos, la aserci&oacute;n y la garant&iacute;a, y que sea necesario a&ntilde;adir un calificador modal. El calificador se encuentra determinado y complementado por las refutaciones y/o por las condiciones de excepci&oacute;n, y se localiza justo frente a la conclusi&oacute;n, pues determina las condiciones mediante las cuales se puede aseverar algo.</font></p>        <p align="justify"><font face="verdana" size="2">Por &uacute;ltimo, las refutaciones y excepciones ayudan a establecer los l&iacute;mites de la aserci&oacute;n mediante un calificador modal; asimismo, permiten afirmar o rechazar un argumento. Toulmin <i>et al.</i> (1984) clasifican las refutaciones en dos tipos: a) cuando los datos, las garant&iacute;as y el respaldo dan apoyo a la aserci&oacute;n solamente de forma parcial; y b) cuando existe soporte de los datos, garant&iacute;as y respaldo solamente en ciertas condiciones. En el primer caso, el argumento carecer&aacute; de toda su fuerza, mientras que en el segundo, el argumento adquiere validez en la ausencia de condiciones particularmente excepcionales.</font></p>       <p align="justify"><font face="verdana" size="2">Sin lugar a dudas, gracias a la adopci&oacute;n del modelo de argumentaci&oacute;n de Toulmin en la validaci&oacute;n de los ex&aacute;menes de alto impacto, se dio un cuantioso salto en la noci&oacute;n de validez y confiabilidad. Asimismo, otra de las ventajas del modelo de Toulmin se debe a que &eacute;ste no busca evidencia perfecta, sino m&aacute;s bien plausible.</font></p>           <blockquote>       <p align="justify"><font face="verdana" size="2"><i>If we always waited until absolutely rigorous arguments could be constructed before we acted with reasoned confidence, we would be overtaken by events before we had occasion to act. In practice, therefore, it is often reasonable to base our conclusions on something less than absolutely perfect evidence. We then put forward our claims, not as being formally irrefutable, but rather as being practically strong or reliable</i> (Toulmin <i>et al.,</i> 1984: 81).</font></p> </blockquote>           ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Esta noci&oacute;n de verosimilitud <i>versus</i> perfecci&oacute;n en la evidencia resulta indispensable en el constructo de un argumento de validaci&oacute;n, puesto que, como bien se sabe, la suma de los elementos de validez no necesariamente le confiere validez a un examen, sino m&aacute;s bien, la validez se vale de diversos mecanismos para ser plausible. Aunado a lo anterior, el argumento empleado puede irse modificando a lo largo del tiempo en caso de que nuevos hallazgos fundamenten la implementaci&oacute;n de cambios en el modelo previamente concebido.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b>Los enfoques de argumentaci&oacute;n aplicados a la evaluaci&oacute;n de ex&aacute;menes</b></font></p>        <p align="justify"><font face="verdana" size="2">A continuaci&oacute;n se presentan los enfoques de argumentaci&oacute;n dentro del proceso de validaci&oacute;n que mayor influencia han tenido en la evaluaci&oacute;n de alto impacto. A lo largo de dos d&eacute;cadas, estos enfoques se han ido desarrollando y retroalimentando entre s&iacute;; sin embargo, no fue sino hasta comienzos del siglo XXI que comenzaron a adquirir mayor fuerza y consistencia; por esta raz&oacute;n, hace apenas una d&eacute;cada que comenzaron a ser adoptados dentro del proceso de validaci&oacute;n por las grandes instituciones internacionales que dise&ntilde;an y administran ex&aacute;menes de alto impacto. El orden en el cual se presentan corresponde meramente a un criterio alfab&eacute;tico; posteriormente se discutir&aacute;n las aportaciones de cada uno de ellos al campo de la evaluaci&oacute;n de alto impacto.</font></p>           <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b><i>El enfoque basado en el argumento de validaci&oacute;n de Bachman</i></b></font></p>       <p align="justify"><font face="verdana" size="2">Lyle Bachman representa un pilar fundamental dentro del dise&ntilde;o y evaluaci&oacute;n de ex&aacute;menes de lengua. Si bien es cierto que su &aacute;rea de especializaci&oacute;n es la evaluaci&oacute;n en el &aacute;rea de la ling&uuml;&iacute;stica aplicada, su discurso sobre las consecuencias ben&eacute;ficas de la evaluaci&oacute;n en programas y mejoras educativas ha contribuido considerablemente a la construcci&oacute;n de los enfoques te&oacute;ricos basados en la l&oacute;gica argumentativa y destinada al dise&ntilde;o y evaluaci&oacute;n de ex&aacute;menes de alto impacto. Bachman (2005) reconoce la importancia que juega la validez en relaci&oacute;n con las consecuencias del uso de ex&aacute;menes y enfatiza la necesidad de contar con un enfoque argumentativo que permita llegar a conclusiones o afirmaciones respecto de una forma de evaluaci&oacute;n espec&iacute;fica, un grupo de examinandos espec&iacute;fico y un contexto espec&iacute;fico.</font></p>          <p align="justify"><font face="verdana" size="2">A poco m&aacute;s de dos d&eacute;cadas de la publicaci&oacute;n de Bachman: <i>Fundamental Considerations in Language Testing</i> en 1990, la discusi&oacute;n en torno a la problem&aacute;tica de la evaluaci&oacute;n contin&uacute;a vigente. Despu&eacute;s de una d&eacute;cada de discusi&oacute;n respecto al tema, Bachman (2005) retoma dos preguntas fundamentales formuladas por Spolsky (1981) en las primeras discusiones en materia de evaluaci&oacute;n de lenguas que se llevaban a cabo a principios de la d&eacute;cada de los ochenta: <i>"How sure are you of your decision?",</i> y "How <i>sure are you of the evidence that you're using to make that decision?"</i> (Spolsky, 1981, cit. en Bachman, 2005: 5).</font></p>      <p align="justify"><font face="verdana" size="2">Indudablemente, ambas preguntas denotaban ya la importancia que representaba la toma de decisiones justas y equitativas. Bachman (2005: 5) retoma ambas preguntas y las reformula de la siguiente manera: "<i>How convincing is the argument for using the assessment in this way?";</i> y la segunda: <i>"How credible is the evidence that supports this argument?</i>". Para Bachman, un aspecto fundamental en su trabajo de validaci&oacute;n se refiere precisamente al uso que se le dar&aacute; a los ex&aacute;menes.</font></p>       <p align="justify"><font face="verdana" size="2">Su enfoque (2005) retoma la estructura de argumento de validaci&oacute;n elaborada por Mislevy <i>et al.</i> (2003), la cual se sustenta en el modelo de argumentaci&oacute;n de Toulmin. Al enfocar de manera pr&aacute;ctica el modelo de Toulmin, y al relacionarlo con la evaluaci&oacute;n de la adquisici&oacute;n de nuevas lenguas, Bachman (2005: 9&#45;10) describe sus partes de la siguiente manera:</font></p>           ]]></body>
<body><![CDATA[<blockquote>       <p align="justify"><font face="verdana" size="2">&#8226; Aserci&oacute;n: se refiere directamente a la interpretaci&oacute;n que queremos establecer. Es una conclusi&oacute;n sobre lo que el examinando conoce y puede hacer.</font></p>       <p align="justify"><font face="verdana" size="2">&#8226; Datos: es la informaci&oacute;n en la cual se sustenta la aserci&oacute;n; es decir, las respuestas del examinando.</font></p>       <p align="justify"><font face="verdana" size="2">&#8226; Garant&iacute;a: son las proposiciones que empleamos para justificar las inferencias.</font></p>       <p align="justify"><font face="verdana" size="2">&#8226; Respaldo: en la evaluaci&oacute;n, &eacute;sta proviene de la teor&iacute;a, experiencia previa o evidencia del proceso de validaci&oacute;n, as&iacute; como del an&aacute;lisis de necesidades de la tarea del dominio al cual se encuentra circunscrito el examen.</font></p>       <p align="justify"><font face="verdana" size="2">&#8226; Refutaci&oacute;n: corresponde a las posibles fuentes de invalidaci&oacute;n.</font></p>       <p align="justify"><font face="verdana" size="2">&#8226; Evidencia de refutaci&oacute;n: consiste en la evidencia que apoye, debilite o rechace una explicaci&oacute;n alternativa.</font></p> </blockquote>           <p align="justify"><font face="verdana" size="2">Bachman y Palmer (2010) retoman nuevamente las premisas b&aacute;sicas del enfoque argumentativo de Bachman (2005), pero parten de la equidad en el uso de ex&aacute;menes; es decir, de las consecuencias del uso de la evaluaci&oacute;n por las partes interesadas, que generalmente son las que toman decisiones respecto del desempe&ntilde;o de un candidato. Consecuentemente, la responsabilidad en la toma de decisiones resulta un punto crucial en la validez y la equidad en los ex&aacute;menes, de tal suerte que quienes dise&ntilde;an ex&aacute;menes requieren de herramientas que les permitan rendir cuentas, a las partes interesadas, acerca de las bases en las que se sostienen sus conclusiones respecto del desempe&ntilde;o de un candidato. Una decisi&oacute;n err&oacute;nea, tanto en perjuicio como en beneficio de un examinando, no solamente afectar&aacute; la noci&oacute;n de equidad, sino que adem&aacute;s mermar&aacute; la confianza por parte de los examinandos y de las instituciones. Por tal motivo, una cuesti&oacute;n fundamental ser&aacute; la de proporcionar informaci&oacute;n suficiente para que quienes toman decisiones, lo hagan a favor de las consecuencias ben&eacute;ficas de las partes interesadas: examinandos, administradores escolares, autoridades, agencias educativas y quienes dise&ntilde;an los ex&aacute;menes. Lo anterior se logra mediante el argumento de uso de la evaluaci&oacute;n, definido por Bachman (2005) y retomado por Bachman y Palmer (2010) como <i>assessment use argument (AUA).</i></font></p>          <p align="justify"><font face="verdana" size="2">Dicho argumento proporciona un marco conceptual que vincula el desempe&ntilde;o de un sustentante en un examen con la toma de decisiones y sus consecuencias, por una parte, mientras que por otra, de manera inversa, provee el fundamento y las bases para justificar las decisiones que se toman para el dise&ntilde;o y desarrollo de ex&aacute;menes. Por consiguiente, el enfoque de Bachman y Palmer (2010), al igual que el de Mislevy <i>et al.</i> (2003), cumple dos prop&oacute;sitos: servir como argumento de interpretaci&oacute;n y uso, y tambi&eacute;n como esquema para el dise&ntilde;o y desarrollo de ex&aacute;menes.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b><i>El enfoque basado en el argumento de validaci&oacute;n de Kane</i></b></font></p>         <p align="justify"><font face="verdana" size="2">Michael Kane es especialista en validez educativa y actualmente ocupa el cargo directivo de validez de ex&aacute;menes en el Educational Testing Service (ETS), mismo que asumi&oacute; en 2009. Dicha instituci&oacute;n es la mayor organizaci&oacute;n a nivel mundial dedicada a la investigaci&oacute;n y evaluaci&oacute;n educativa. Kane (1992) fue el primero en considerar la validaci&oacute;n de ex&aacute;menes como un proceso basado en la argumentaci&oacute;n, siguiendo el modelo de argumentaci&oacute;n de Toulmin. Esto debido a dos razones: en primer lugar, porque los est&aacute;ndares para la evaluaci&oacute;n educativa (AERA, APA y NCME, 1985; 1999) no ofrec&iacute;an realmente una gu&iacute;a apropiada para establecer el v&iacute;nculo entre los resultados de los ex&aacute;menes y la interpretaci&oacute;n para hacer uso de ellos eficazmente y de manera imparcial; y en segundo lugar, debido a que el marco de validez ofrecido por Messick (1989) resultaba abstracto y dif&iacute;cil de aplicar. En consecuencia, Kane desarroll&oacute; el enfoque basado en la argumentaci&oacute;n concebido como "un marco sustentado en la interpretaci&oacute;n para recolectar y presentar evidencia v&aacute;lida y expl&iacute;cita asociada con la plausibilidad de varias suposiciones e inferencias involucradas en la interpretaci&oacute;n" (Kane, 1992: 2). El enfoque, desde sus inicios, se concibi&oacute; compuesto por dos tipos de argumentos: el interpretativo y el de validez. El primero conten&iacute;a el razonamiento que part&iacute;a de los resultados de un examen hacia las afirmaciones y decisiones que se efectuaban con base en &eacute;stos; mientras que el segundo presentaba el caso de plausibilidad, d&eacute;bil o fuerte, del primero.</font></p>       <p align="justify"><font face="verdana" size="2">A lo largo de m&aacute;s de dos d&eacute;cadas, Kane (1992; 2002; 2006; 2013) ha modificado y adaptado su enfoque de argumentaci&oacute;n para la validaci&oacute;n <i>&#45;argument&#45;based approach to validity&#45;</i> de acuerdo a las necesidades que surgen en materia de evaluaci&oacute;n. El autor postula que es necesario un argumento mediante el cual se sustente la relaci&oacute;n subyacente entre el resultado de un examen y la interpretaci&oacute;n que de &eacute;ste se deriva. "Validar la interpretaci&oacute;n del puntaje de un examen es sustentar la plausibilidad del argumento de interpretaci&oacute;n correspondiente con su apropiada evidencia" (Kane, 1992: 527).</font></p>       <p align="justify"><font face="verdana" size="2">Dentro del argumento de validez, el autor enfatiza la necesidad de contar con varios tipos de evidencia organizados de manera coherente y convincente, adem&aacute;s de su posible refutaci&oacute;n. El proceso de argumentaci&oacute;n puede ser debilitado mediante la evidencia, pero enmendado en sus fallas y deficiencias; sin embargo, agrega Kane (2013), el mayor problema en la evaluaci&oacute;n se debe a suposiciones "ocultas"; es decir, aqu&eacute;llas que se han omitido dentro del proceso de interpretaci&oacute;n. Evidentemente, cualquier falla dentro del argumento de validez podr&iacute;a ser corregida o planteada de distinta forma, pero &iquest;qu&eacute; suceder&iacute;a si se omitieran suposiciones importantes no por negligencia, sino por desconocimiento de su existencia? Por ello, Kane (2013) afirma que es importante que constantemente se eval&uacute;en los argumentos que se postulan, con el fin de que se cerciore la pertinencia de cada uno de ellos.</font></p>          <p align="justify"><font face="verdana" size="2">Desde su concepci&oacute;n inicial, Kane (1992) y Kane <i>et al.</i> (1999) ya conceb&iacute;an, dentro del argumento interpretativo, la concatenaci&oacute;n de una serie de inferencias que incluyen: generalizaciones, extrapolaciones, predicciones, explicaciones, inferencias basadas en la teor&iacute;a y decisiones basadas en los puntajes obtenidos en una prueba. Sin embargo, si bien es cierto que a lo largo de dos d&eacute;cadas el enfoque de Kane hab&iacute;a girado exclusivamente en torno al argumento de interpretaci&oacute;n de los resultados, recientemente este autor introdujo el argumento de uso de un examen propuesto por Bachman (2005) y retomado por Bachman y Palmer (2010), dentro de su enfoque de validaci&oacute;n. De ah&iacute; que Kane ahora reconozca que "la validez no es una propiedad del examen, sino m&aacute;s bien es una propiedad de las interpretaciones y usos que se proponen de los resultados de un examen" (Kane, 2013: 3). De esta manera, el procedimiento para validar un examen bajo el enfoque basado en la argumentaci&oacute;n, consiste en desarrollar argumentos de interpretaci&oacute;n y de uso del examen <i>(interpretation/use argument)</i> y, posteriormente, validar dichos argumentos.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b><i>El argumento de interpretaci&oacute;n y de uso</i></b></font></p>       <p align="justify"><font face="verdana" size="2">De manera muy general, el enfoque actual de Kane (2013) se divide en dos tipos de inferencias: sem&aacute;nticas y pol&iacute;ticas. Las primeras incluyen la inferencia de los resultados observados, de generalizaci&oacute;n y de extrapolaci&oacute;n; en tanto que las segundas exclusivamente engloban la toma de decisiones.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b>Inferencia de los resultados observados</b></font></p>        ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">De acuerdo con Kane (1992; 2002; 2006; 2013), el primer paso necesario para el proceso de argumentaci&oacute;n de la evaluaci&oacute;n es contar con las evidencias producidas por el alumno: es decir, con las que se obtienen del examen que el candidato ha resuelto. Una vez que se tiene esa muestra, se la eval&uacute;a y se lleva a cabo la primera inferencia, la cual consiste en afirmar que el puntaje observado es reflejo del comportamiento observado. En otras palabras, se busca demostrar que los mecanismos de evaluaci&oacute;n fueron los apropiados y que &eacute;stos fueron aplicados de la manera correcta. Esta inferencia nos lleva al puntaje observado en el desempe&ntilde;o de quien resolvi&oacute; el examen.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b>Inferencia de generalizaci&oacute;n</b></font></p>         <p align="justify"><font face="verdana" size="2">El segundo tipo de inferencia se refiere a la confiabilidad. En el caso de las pruebas de respuesta seleccionada, se espera que los &iacute;tems sean representativos homog&eacute;neamente en cuanto al grado de dificultad del universo de conocimientos que se desea evaluar; mientras que en relaci&oacute;n con las pruebas de respuesta construida, se espera que las r&uacute;bricas est&eacute;n bien elaboradas, que los correctores sepan emplearlas efectivamente y que, por lo tanto, su evaluaci&oacute;n sea consistente. En realidad, la importancia del puntaje se debe a que con base en &eacute;l se toman decisiones y se busca establecer o afirmar lo que el candidato ser&aacute; capaz de llevar a cabo en contextos m&aacute;s amplios. Kane (2013) destaca que en un examen solamente se puede evaluar una peque&ntilde;a muestra de desempe&ntilde;o, y no toda una amplia gama de posibilidades existentes en el universo de dominio para el cual es dise&ntilde;ado un examen.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b>Inferencia de extrapolaci&oacute;n</b></font></p>        <p align="justify"><font face="verdana" size="2">El tercer tipo de inferencia involucra la extrapolaci&oacute;n de los resultados obtenidos en la prueba hacia un contexto circunscrito en el "mundo real"; en este caso, por ejemplo, el educativo. Este tipo de inferencia es crucial, y es una de las m&aacute;s dif&iacute;ciles de considerar, pues implica extrapolar el desempe&ntilde;o de un candidato, de un examen a las situaciones reales. La extrapolaci&oacute;n es sumamente compleja e incluye ciertos procesos que van m&aacute;s all&aacute; de los an&aacute;lisis estad&iacute;sticos. En este caso, se busca elaborar aserciones que contemplen situaciones de uso dentro del "mundo real". A este respecto, cabe se&ntilde;alar que Kane (2013) menciona que el argumento que mayor atenci&oacute;n amerita es aqu&eacute;l que resulta m&aacute;s d&eacute;bil. En el caso de los ex&aacute;menes de alto impacto, el argumento m&aacute;s endeble es, justamente, el de la extrapolaci&oacute;n.</font></p>       <p align="justify"><font face="verdana" size="2">Kane (2006) menciona dos tipos de evidencia que pueden emplearse para evaluar la inferencia de extrapolaci&oacute;n: anal&iacute;tica y emp&iacute;rica. La evidencia anal&iacute;tica se emplea generalmente durante el dise&ntilde;o y constructo del examen, mientras que la emp&iacute;rica busca relacionar los puntajes observados en un examen con otros tipos de muestras o de puntajes asociados con el dominio. Recordemos que el fin &uacute;ltimo de los ex&aacute;menes es tomar decisiones, por lo cual la inferencia de extrapolaci&oacute;n resulta indispensable dentro del argumento de interpretaci&oacute;n.</font></p>        <p align="justify"><font face="verdana" size="2">El mayor problema, como se describi&oacute; anteriormente, radica en qu&eacute; tan estandarizado se encuentre el examen, pues nuestra confianza en la inferencia de extrapolaci&oacute;n depender&aacute; de la relaci&oacute;n entre el examen y el dominio meta; de tal suerte que aquellos ex&aacute;menes que cubran un amplio espectro del dominio en cuesti&oacute;n podr&aacute;n considerarse plausibles y, por ende, la inferencia de extrapolaci&oacute;n no requerir&aacute; de demasiado soporte emp&iacute;rico. Sin embargo, en caso contrario, cuando las tareas de un examen difieran sustancialmente del dominio meta, el respaldo de la extrapolaci&oacute;n ser&aacute; imprescindible. Si el argumento que se establece a partir de las inferencias de interpretaci&oacute;n y de uso es validado mediante los mecanismos descritos anteriormente, poseer&aacute; una fuerte presuposici&oacute;n en favor de &eacute;ste, con lo que se podr&aacute; justificar el uso de los puntajes obtenidos en un examen.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b>Inferencia de toma de decisiones</b></font></p>          <p align="justify"><font face="verdana" size="2">La cuarta y &uacute;ltima inferencia implica la toma de decisiones. &Eacute;sta es la &uacute;nica inferencia que Kane (2013) considera de tipo pol&iacute;tico, dado que involucra ciertas normas previamente establecidas por la autoridad en cuesti&oacute;n (universidades, empresas, gobierno, entre otras), respecto de qu&eacute; sustentante es apto para hacer uso de las habilidades/competencias demostradas en diferentes contextos: acad&eacute;micos, profesionales o con fines migratorios. Kane (2013) retoma la postura de Bachman y Palmer (2010) y afirma que en la toma de decisiones deber&aacute; establecerse un balance de las consecuencias positivas y negativas de las mismas, optando por aqu&eacute;llas en donde las positivas sobrepasen a las negativas.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b><i>El modelo de validaci&oacute;n de Mislevy</i></b></font></p>     <p align="justify"><font face="verdana" size="2"> Robert Mislevy es especialista en estad&iacute;stica y medici&oacute;n educativa. Al igual que Kane, forma parte del ETS, en donde dirige el &aacute;rea de estad&iacute;stica y medici&oacute;n desde 2010. Retomando la noci&oacute;n de argumentaci&oacute;n de Toulmin (1958), Mislevy <i>et al.</i> (2003) desarrollaron el modelo de evaluaci&oacute;n conocido como <i>evidence&#45;centered design</i> para explicar el papel central que juega el razonamiento probatorio a trav&eacute;s de la evidencia. Dicho modelo parti&oacute; de la necesidad de establecer un argumento que permitiera relacionar lo que los estudiantes dicen o hacen en un examen con lo que hacen en contextos m&aacute;s amplios.</font></p>           <p align="justify"><font face="verdana" size="2">Seg&uacute;n Mislevy <i>et al.</i> (2003), los pasos para el dise&ntilde;o de ex&aacute;menes son equivalentes a los que se deben seguir en el proceso de validaci&oacute;n de los mismos. Los autores incluyen cuatro pasos fundamentales, cada uno de los cuales est&aacute; compuesto, a su vez, por diversos componentes: el an&aacute;lisis del dominio, el modelado del dominio, el marco conceptual de evaluaci&oacute;n y la arquitectura de la prueba, la cual engloba la aplicaci&oacute;n y puntuaci&oacute;n de la tarea (Mislevy, 2006; 2009; Mislevy <i>et al.,</i> 2003).</font></p>      <p align="justify"><font face="verdana" size="2">De manera sucinta se describe cada uno de los componentes del dise&ntilde;o centrado en la evidencia <i>(evidence&#45;centered design):</i> en primer lugar, es importante hacer un an&aacute;lisis del dominio, en otras palabras, de aquellas situaciones de la "vida real" en las cuales deseamos realizar la evaluaci&oacute;n. En segundo t&eacute;rmino, los autores describen el modelado del dominio, el cual se conforma de las tareas y de todos los instrumentos que se requerir&aacute;n para evaluarlas; por ejemplo, las r&uacute;bricas. En tercer lugar est&aacute; el marco conceptual de evaluaci&oacute;n, en donde se encuentran todos los procesos necesarios para determinar la confiabilidad de una prueba, ll&aacute;mense especificaciones, requerimientos operativos, modelos estad&iacute;sticos o detalles de r&uacute;bricas, entre otros. Generalmente, aunque no siempre, dentro de este marco se encuentran todos los an&aacute;lisis estad&iacute;sticos que se requieren y que son indispensables para determinar si los instrumentos que han sido dise&ntilde;ados, as&iacute; como los mecanismos para medirlos, cumplen con la funci&oacute;n para la cual fueron creados. Finalmente, la cuarta secci&oacute;n es la arquitectura del examen, misma que incluye la evaluaci&oacute;n operativa; en &eacute;sta se considera el resultado de los ex&aacute;menes y las partes involucradas: examinadores, administradores, examinandos, as&iacute; como aquellos que toman las decisiones.</font></p>          <p align="justify"><font face="verdana" size="2">El modelo de Mislevy es bastante complejo y a trav&eacute;s de los a&ntilde;os ha sido reelaborado por el autor (2006; 2009); no obstante, los puntos descritos anteriormente constituyen su base fundamental. En la actualidad, dicho modelo es conocido como <i>model&#45;based reasoning,</i> o modelo basado en el razonamiento, con sustento en una perspectiva sociocognitiva (Mislevy, 2009). Para Mislevy, un elemento esencial de la validez de una prueba resulta si al emplear un modelo subyace una base s&oacute;lida para la organizaci&oacute;n de las observaciones y para la gu&iacute;a de las acciones que deber&aacute;n considerarse en las situaciones para las cuales el examen fue destinado.</font></p>        <p align="justify"><font face="verdana" size="2">Mislevy concibe su modelo en tres planos (<a href="#f2">Fig. 2</a>); en la parte inferior se muestran diversas manifestaciones del mundo real. De acuerdo con este autor (2006; 2009), el sustento te&oacute;rico y emp&iacute;rico es imprescindible para poder dise&ntilde;ar las tareas mediante las cuales se evaluar&aacute; a un estudiante; de ah&iacute; la importancia del constructo dentro de la l&iacute;nea de validez de argumentaci&oacute;n. Ahora bien, para acceder del plano inferior al intermedio se deben considerar previamente los fundamentos te&oacute;ricos y emp&iacute;ricos de los procedimientos necesarios para evaluar las tareas.</font></p>     <p align="center"><a name="f2"></a></p>     ]]></body>
<body><![CDATA[<p align="center"><img src="/img/revistas/peredu/v37n149/a10f2.jpg"></p>     <p align="justify"><font face="verdana" size="2">En el plano intermedio, denominado por Mislevy como "plano sem&aacute;ntico", se muestran las entidades, relaciones y propiedades del modelo; es decir, la serie de argumentos que tendr&iacute;an que llevarse a cabo &#45;a manera de filtro&#45; para hacer inferencias y tomar decisiones respecto de las habilidades de un estudiante. Se trata, entonces, de un modelo basado en la teor&iacute;a y la experiencia &#45;el constructo de la prueba&#45; que le da sustento cient&iacute;fico a esta capa del modelo. Seg&uacute;n Mislevy (2009) este plano intermedio, conformado por modelos te&oacute;ricos, funge como intermediario entre el complejo "mundo real" (plano inferior) y el abstracto y r&iacute;gido "mundo estad&iacute;stico" que se emplea para validar ex&aacute;menes (plano superior).</font></p>     <p align="justify"><font face="verdana" size="2">En el plano superior figuran los sistemas de medici&oacute;n educativos que dar&aacute;n soporte al razonamiento y argumento previamente definidos. Mislevy lo esquematiza a manera de f&oacute;rmulas y ecuaciones que representan el proceso estad&iacute;stico que debe efectuarse para validar un examen y, as&iacute;, a partir de sus resultados, poder tomar decisiones. El analista, a trav&eacute;s del modelo de razonamiento, conecta nuevamente el sistema cient&iacute;fico de validez de la prueba con el "mundo real", lo cual implicar&iacute;a la toma de decisiones. Consecuentemente, se parte de un examen concebido dentro del mundo real y el objetivo final es, justamente, la inferencia de lo que un sustentante ser&aacute; capaz de realizar en un contexto determinado para el cual est&aacute; siendo examinado.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b>Discusi&oacute;n sobre los enfoques de argumentaci&oacute;n para ex&aacute;menes</b></font></p>         <p align="justify"><font face="verdana" size="2">Los tres enfoques descritos anteriormente han aportado cuantiosamente al proceso de validaci&oacute;n de ex&aacute;menes. El modelo de argumentaci&oacute;n de Mislevy es por dem&aacute;s complejo y hace gran &eacute;nfasis en los modelos matem&aacute;ticos que deber&aacute;n utilizarse para lograr la confiabilidad de la prueba, lo cual dificulta su aplicaci&oacute;n y deja de lado inferencias importantes que deben ser tomadas en cuenta al momento de validar un examen. Otra de las desventajas que el mismo Mislevy reconoce (2006) respecto de los modelos es que &eacute;stos no son perfectos y resulta dif&iacute;cil adaptarlos, ya que no siempre es claro definir cu&aacute;les podr&iacute;an ser los criterios para flexibilizarlo al momento de emplearlo.</font></p>        <p align="justify"><font face="verdana" size="2">La mayor aportaci&oacute;n de Bachman (2005) y Bachman y Palmer (2010) se debe, desde luego, al denotado &eacute;nfasis en las consecuencias de los ex&aacute;menes; de hecho, el argumento de validaci&oacute;n busca como fin &uacute;ltimo el uso que se har&aacute; de los ex&aacute;menes. La cr&iacute;tica de Bachman y Palmer (2010) hacia las propuestas de Kane y Mislevy reside fundamentalmente en que estos autores no incorporan el concepto de uso (Kane, 2006) o lo hacen de manera tangencial (Mislevy, 2006). Por ello, Kane (2013) incorpora dentro de su discurso el argumento de interpretaci&oacute;n y uso de los ex&aacute;menes. No obstante, a diferencia del peso mayoritario que le confieren Bachman (2005) y Bachman y Palmer (2010), Kane afirma que ambos argumentos &#45;de interpretaci&oacute;n y de uso&#45; son igual de importantes. Pese a lo anterior, la l&iacute;nea discursiva de Bachman (2005) y Bachman y Palmer (2010) hace referencia profusa a las consecuencias y el uso de los ex&aacute;menes, tomando en cuenta las nociones de equidad y de &eacute;tica, pero dejando de lado la importancia de las otras inferencias que son fundamentales para crear un argumento s&oacute;lido en cada uno de los estadios que se requiere para llegar de los datos a la aserci&oacute;n.</font></p>        <p align="justify"><font face="verdana" size="2">El enfoque de Kane, por otra parte, es el que mayor desarrollo, profusi&oacute;n y aplicaciones ha tenido desde la d&eacute;cada de los noventa, cuando incorpor&oacute; por vez primera el argumento por el cual Cronbach (1988) y Messick (1989) abogaban por concebir la validez de forma unitaria. Su enfoque, adem&aacute;s, incorpor&oacute; desde sus inicios el modelo argumentativo de Toulmin (1958) para la validaci&oacute;n de ex&aacute;menes. Como bien se&ntilde;ala Kane (2013), una de las mayores ventajas de su enfoque se debe a que es flexible y moldeable a la situaci&oacute;n para la cual se pretenda validar un examen. Las inferencias que el autor propone no resultan a discreci&oacute;n del experto en evaluaci&oacute;n, sino m&aacute;s bien se definen de acuerdo con las necesidades para las cuales se pretende evaluar. Por ello, el autor describe detalladamente en qu&eacute; casos ser&aacute; conveniente incluir cada una de las inferencias que &eacute;l propone, as&iacute; como la evidencia que ser&iacute;a necesaria para fundamentarlas.</font></p>      <p align="justify"><font face="verdana" size="2">Otra de las ventajas del enfoque de Kane se debe precisamente a que, al igual que Toulmin, su marco se encuentra sujeto a ser refutado mediante la contraevidencia. Sin lugar a dudas esto representa una de las grandes aportaciones del enfoque, pues precisamente el objetivo de la validez no es aceptar y aprobar un modelo de elaboraci&oacute;n/evaluaci&oacute;n de ex&aacute;menes, sino encontrar fallas y huecos que permitan su perfeccionamiento, desarrollo y evoluci&oacute;n. Por esta raz&oacute;n, el enfoque de Kane se ha adaptado a las condiciones que imperan en materia de evaluaci&oacute;n, as&iacute; como de validez de los ex&aacute;menes.</font></p>       <p align="justify"><font face="verdana" size="2">Finalmente, el reconocimiento de Kane (2013) respecto del uso y las consecuencias de los ex&aacute;menes, adem&aacute;s de la interpretaci&oacute;n de sus resultados, le confiere a su enfoque la solidez que se requiere cuando se trata de ex&aacute;menes de alto impacto, mismos que conllevan importantes implicaciones en la vida de los examinandos. Asimismo, implica un reconocimiento de la importancia que actualmente juegan la &eacute;tica y la equidad en la toma de decisiones y, por lo tanto, la flexibilidad, as&iacute; como la capacidad de adaptaci&oacute;n y evoluci&oacute;n de su enfoque.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b>Aplicaci&oacute;n del argumento de validaci&oacute;n a los ex&aacute;menes de alto impacto</b></font></p>        <p align="justify"><font face="verdana" size="2">Los alumnos no hispanohablantes que desean ingresar al posgrado de la UNAM deben aprobar un examen de posesi&oacute;n de la lengua espa&ntilde;ola que es administrado por el Centro de Ense&ntilde;anza para Extranjeros (CEPE). El examen actual consta de cuatro pruebas objetivas: comprensi&oacute;n auditiva, comprensi&oacute;n de lectura y vocabulario, y estructuras; y una prueba objetiva: expresi&oacute;n oral. Sin embargo, no se eval&uacute;a la expresi&oacute;n escrita, habilidad imprescindible en el &aacute;mbito acad&eacute;mico. Por ello, el CEPE se dio a la tarea de dise&ntilde;ar un examen destinado espec&iacute;ficamente a aquellos aspirantes no hispanohablantes que pretenden cursar estudios de grado o de posgrado en la UNAM. El examen a&uacute;n se encuentra en fase de pilotaje, pero se espera que pronto pueda emplearse como nuevo criterio que avale los conocimientos ling&uuml;&iacute;sticos de los aspirantes no hispanohablantes, e incluso de los propios aspirantes nativo&#45;hablantes a cursar estudios universitarios. Sin embargo, debido a la dificultad que subyace a la implementaci&oacute;n y validaci&oacute;n de pruebas de respuesta construida, como la escrita, Weigle (2002) enfatiza las m&uacute;ltiples consideraciones que deber&aacute;n tomarse en cuenta para el dise&ntilde;o de &eacute;stas.</font></p>      <p align="justify"><font face="verdana" size="2">Por ello, siguiendo la l&oacute;gica argumentativa propuesta por Toulmin (1958) y su aplicaci&oacute;n al enfoque para validar ex&aacute;menes propuesto por Kane (2006), se presenta un ejemplo para validar la prueba escrita del examen de espa&ntilde;ol con fines acad&eacute;micos (EXELEAA) que dise&ntilde;&oacute; el CEPE de la UNAM (<a href="#f3">Fig. 3</a>).</font></p>     <p align="center"><a name="f3"></a></p>     <p align="center"><img src="/img/revistas/peredu/v37n149/a10f3.jpg"></p>     <p align="justify"><font face="verdana" size="2">De &eacute;ste, se desprende la siguiente aserci&oacute;n:</font></p>           <blockquote>       <p align="justify"><font face="verdana" size="2">La prueba escrita del examen de espa&ntilde;ol acad&eacute;mico (EXELEAA) mide eficazmente la habilidad del examinando para utilizar el lenguaje escrito requerido a nivel posgrado. Asimismo, la puntuaci&oacute;n es &uacute;til y clara para que quienes se encargan de tomar decisiones lo hagan de manera justa y equitativa.</font></p> </blockquote>           <p align="justify"><font face="verdana" size="2">Para poder validar esa aserci&oacute;n, se plantean &#45;de acuerdo con el enfoque de Kane&#45; cuatro inferencias que deber&aacute;n sustentarse en evidencia para poder llevar a cabo una interpretaci&oacute;n. Estas cuatro inferencias son: evaluaci&oacute;n, generalizaci&oacute;n, extrapolaci&oacute;n y utilizaci&oacute;n. Sin embargo, el autor sugiere que cuando se trata de ex&aacute;menes de alto impacto en donde la toma de decisiones podr&iacute;a afectar decisivamente la vida de los examinandos se incluyan dos inferencias m&aacute;s: la descripci&oacute;n del dominio y la explicaci&oacute;n de los resultados</font> <font face="verdana" size="2">(Kane, 2006). A continuaci&oacute;n se describen estas inferencias adaptadas a la prueba del examen de espa&ntilde;ol para el &aacute;mbito acad&eacute;mico.<sup><a href="#nota">3</a></sup></font></p>           ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>    <p align="justify"><font face="verdana" size="2"><b><i>Primera inferencia: el argumento de la descripci&oacute;n del dominio</i></b></font></p>        <p align="justify"><font face="verdana" size="2">De acuerdo con Kane (2006), resulta imprescindible describir cuidadosamente el &aacute;mbito en el cual se pretende evaluar; en &aacute;mbitos tan amplios como el acad&eacute;mico, es importante que las tareas que han sido dise&ntilde;adas sean representativas del universo para el cual se pretende evaluar. La prueba escrita fue dise&ntilde;ada partiendo de los requerimientos de escritura de los estudiantes universitarios; no obstante, los mecanismos de evaluaci&oacute;n var&iacute;an considerablemente de una disciplina a otra y tambi&eacute;n de un grado a otro, es decir, ser&aacute; necesario investigar en un estudio exploratorio cu&aacute;les son los mecanismos de evaluaci&oacute;n de los diversos posgrados de la UNAM.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b><i>Segunda inferencia: el argumento de la evaluaci&oacute;n</i></b></font></p>       <p align="justify"><font face="verdana" size="2">Una vez que se administra el examen, se recaban los datos con el fin de medirlos. Este proceso es conocido como evaluaci&oacute;n. En el caso aqu&iacute; ejemplificado, el procedimiento consiste en obtener las muestras de la prueba escrita y corregirlas para obtener un puntaje. Dentro de este proceso, resulta fundamental contar con un instrumento que mida lo que se pretende medir. Estos instrumentos com&uacute;nmente son denominados "r&uacute;bricas", o "escalas de medici&oacute;n". En el presente caso se trata de una r&uacute;brica anal&iacute;tica que da cuenta detallada de los diversos aspectos que se desean evaluar en los escritos. Ahora bien, existen diversos mecanismos para garantizar la eficiencia de las r&uacute;bricas. En este caso se emplear&aacute;n dos mecanismos complementarios: en primer lugar, se identificar&aacute; cada uno de los puntos que se miden en la r&uacute;brica y se correlacionar&aacute;n con las habilidades de escritura acad&eacute;mica que son necesarias para ser competente  acad&eacute;micamente en el posgrado (Rosenfeld <i>et al.,</i> 2004). Una vez que se identifiquen los alcances y limitaciones de la r&uacute;brica, se llevar&aacute; a cabo un proceso estad&iacute;stico, tras la evaluaci&oacute;n de la prueba, con los resultados obtenidos en cada uno de los rubros previamente definidos en la r&uacute;brica. El fin de este estudio estad&iacute;stico ser&aacute; distinguir los componentes de la r&uacute;brica que funcionan adecuadamente, de los que no lo hacen.</font></p>     <p align="justify"><font face="verdana" size="2">En caso de ser necesario, se llevar&aacute;n a cabo las modificaciones necesarias para afinar la r&uacute;brica y se podr&aacute;n incorporar nuevas tareas que permitan incluir otras habilidades de escritura necesarias en el posgrado. Finalmente, si determinadas habilidades no pudieran ser medidas ni incluidas en la prueba escrita, se sugerir&aacute;n medios alternos que les permitan a las diversas facultades garantizar que el candidato a estudios de posgrado cuenta con dichas habilidades.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b><i>Tercera inferencia: el argumento de generalizaci&oacute;n</i></b></font></p>          <p align="justify"><font face="verdana" size="2">La inferencia de generalizaci&oacute;n permite demostrar que los resultados obtenidos en una muestra son consistentes y, por lo tanto, generalizables y confiables. Esto quiere decir que si un candidato presentara varias veces diversas modalidades de la prueba escrita, pero en condiciones similares de aplicaci&oacute;n y sin variaciones en su conocimiento a evaluar, su resultado ser&iacute;a el mismo o muy similar. Lo anterior querr&iacute;a decir que las diferentes versiones de la misma prueba son equiparables entre s&iacute;, y que el puntaje otorgado por el mismo corrector, y entre correctores, es consistente. En el caso de las pruebas de respuesta construida, &eacute;stas generalmente son evaluadas por dos correctores, y cuando existe discrepancia de m&aacute;s de 10 por ciento en el resultado final, se revisa por un tercer corrector experimentado. En caso de no haber consistencia en las evaluaciones, se tendr&aacute;n que llevar a cabo talleres de capacitaci&oacute;n y retroalimentaci&oacute;n para los evaluadores.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b><i>Cuarta inferencia: el argumento de explicaci&oacute;n</i></b></font></p>      <p align="justify"><font face="verdana" size="2"> Kane (2006) afirma que el argumento de validez puede prescindir de la explicaci&oacute;n, pero sugiere que en los casos en los cuales uno de los componentes de inferencia sea la interpretaci&oacute;n de resultados, como es el caso de la evaluaci&oacute;n de alto impacto, deber&iacute;a existir una inferencia fundamentada en la explicaci&oacute;n. En este caso, los descriptores del nivel de actuaci&oacute;n de los examinandos deber&aacute;n estar sustentados de manera s&oacute;lida en la teor&iacute;a ling&uuml;&iacute;stica que respalda al examen. Asimismo, los puntos de corte de los diferentes niveles de desempe&ntilde;o deber&aacute;n encontrarse claramente definidos y deber&aacute;n correlacionar positivamente con el puntaje demostrado por los candidatos.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b><i>Quinta inferencia: el argumento de extrapolaci&oacute;n</i></b></font></p>         <p align="justify"><font face="verdana" size="2">En el caso de los ex&aacute;menes de alto impacto, una de las mayores dificultades que se ha identificado radica justamente en lo dif&iacute;cil que resulta extrapolar los resultados del examen al "mundo real". Lo anterior se debe a que normalmente el universo para el cual se eval&uacute;a es demasiado amplio, como es el caso de la escritura acad&eacute;mica. Sin embargo, Kane (2013) menciona que el mayor &eacute;nfasis en la validaci&oacute;n de la argumentaci&oacute;n deber&aacute; encontrarse justamente en el argumento m&aacute;s endeble.</font></p>        <p align="justify"><font face="verdana" size="2">Dado que la prueba escrita se encuentra a&uacute;n en fase de pilotaje, se opt&oacute; por trabajar con estudiantes de posgrado no hispanohablantes ya inscritos en la UNAM. Para poder llevar a cabo la extrapolaci&oacute;n, se dise&ntilde;&oacute; un estudio cualitativo basado en entrevistas semiestructuradas que permitieran dar cuenta de las percepciones y dificultades que encaran los estudiantes al momento de escribir textos acad&eacute;micos o ex&aacute;menes escritos en el posgrado. Aunado a lo anterior, se adapt&oacute; el cuestionario dise&ntilde;ado por Rosenfeld <i>et al.</i> (2004), en aras de dar cuenta del dominio que deben poseer los estudiantes para escribir dentro del &aacute;mbito acad&eacute;mico. La triangulaci&oacute;n de estos dos instrumentos con el puntaje observado en la prueba permitir&aacute; determinar si, efectivamente, existe una correlaci&oacute;n positiva entre obtener un buen puntaje en la prueba escrita y ser acad&eacute;micamente competente al momento de escribir en el contexto universitario.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b><i>Sexta inferencia: el argumento de toma de decisiones</i></b></font></p>         <p align="justify"><font face="verdana" size="2">La inferencia respecto de la toma de decisiones es responsabilidad de quienes utilizan el examen; por ello, es menester que los encargados de dise&ntilde;ar ex&aacute;menes de alto impacto elaboren documentos que garanticen que los resultados de los ex&aacute;menes puedan ser interpretados correctamente por las partes interesadas. En el caso aqu&iacute; planteado, debido a que no se cuenta actualmente con una gu&iacute;a que contenga los descriptores del nivel de actuaci&oacute;n del candidato, ni de ejemplos de actuaci&oacute;n en cada uno de los descriptores, se elaborar&aacute; dicho documento y tambi&eacute;n se dise&ntilde;ar&aacute; un cuestionario que permita dar cuenta de su utilidad para las partes interesadas. Esto les permitir&aacute; a las facultades de la UNAM tomar la mejor decisi&oacute;n de acuerdo con los requerimientos de escritura que se requieren en cada uno de sus posgrados.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b>Conclusiones</b></font></p>         <p align="justify"><font face="verdana" size="2">A partir de la segunda mitad del siglo XX, la evaluaci&oacute;n adquiri&oacute; un car&aacute;cter cient&iacute;fico y la validez de constructo constituy&oacute; el eje rector para garantizar la fiabilidad de los ex&aacute;menes. No obstante, debido a las dificultades que se presentaron a finales del siglo XX relacionadas con la materializaci&oacute;n de los modelos de validez en la evaluaci&oacute;n, incorporada de manera fragmentada y desarticulada, desde inicios del siglo XXI se ha adoptado la argumentaci&oacute;n en la validez vista de manera integradora a trav&eacute;s de la l&oacute;gica argumentativa de Toulmin. As&iacute; pues, el establecimiento de una aserci&oacute;n respecto del desempe&ntilde;o de un candidato requiere de una serie de inferencias y su respectiva evidencia, con el fin de garantizar la confiabilidad y validez de un examen. Los tres enfoques descritos demuestran el considerable esfuerzo que se ha llevado a cabo durante la &uacute;ltima d&eacute;cada con miras a garantizar una evaluaci&oacute;n justa y equitativa de los ex&aacute;menes, particularmente en aqu&eacute;llos de alto impacto, puesto que conllevan importantes implicaciones en la vida de los examinandos. Dentro de estos enfoques destaca el de Kane, mismo que, gracias a su flexibilidad, ha ido evolucionando a lo largo de casi dos d&eacute;cadas desde su concepci&oacute;n inicial, y se ha ido adaptando a las nuevas exigencias e interrogantes que surgen en materia de evaluaci&oacute;n. Finalmente, el proceso de validaci&oacute;n de la prueba de expresi&oacute;n escrita del CEPE da cuenta de la aplicabilidad del enfoque te&oacute;rico de la validaci&oacute;n a trav&eacute;s de la argumentaci&oacute;n. Sin lugar a dudas, la concepci&oacute;n de la evaluaci&oacute;n vista desde la &oacute;ptica de la l&oacute;gica argumentativa resulta una herramienta &uacute;til para todos a aqu&eacute;llos que dise&ntilde;an y elaboran ex&aacute;menes de alto impacto.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>           <p align="justify"><font face="verdana" size="2"><b>Referencias</b></font></p>          <!-- ref --><p align="justify"><font face="verdana" size="2">American Educational Research Association/American psychological Association/National Council on Measurement in Education (1985), <i>Standards for Educational and Psychological Testing,</i> Washington, D.C., American Educational Research Association.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920380&pid=S0185-2698201500030001000001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>           <!-- ref --><p align="justify"><font face="verdana" size="2">American Educational Research Association/American psychological Association/National Council on Measurement in Education (1999), <i>Standards for Educational and Psychological testing,</i> Washington, D.C., American Educational Research Association.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920382&pid=S0185-2698201500030001000002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>      <!-- ref --><p align="justify"><font face="verdana" size="2">Bachman, Lyle (2005), "Building and Supporting a Case for Test Use", <i>Language Assessment Quarterly,</i> vol. 2, n&uacute;m. 1, pp. 1&#45;34.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920384&pid=S0185-2698201500030001000003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>       <!-- ref --><p align="justify"><font face="verdana" size="2">Bachman, Lyle y Adrian Palmer (2010), <i>Language Assessment in Practice: Developing language assessments and justifying their use in the real world,</i> Oxford, Oxford University Press.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920386&pid=S0185-2698201500030001000004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>       <!-- ref --><p align="justify"><font face="verdana" size="2">Cronbach, Lee (1988), "Five Perspectives on Validity Argument", en Howard Wainer y Henry Braun (eds.), <i>Test Validity,</i> Hillsdale, NJ, Lawrence Erlbaum, pp. 3&#45;17.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920388&pid=S0185-2698201500030001000005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>        <!-- ref --><p align="justify"><font face="verdana" size="2">Cronbach, Lee y Paul Meehl (1955), "Construct Validity in Psychological Tests", <i>Psychological Bulletin,</i> vol. 52, n&uacute;m. 4, pp. 281&#45;302.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920390&pid=S0185-2698201500030001000006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>         <!-- ref --><p align="justify"><font face="verdana" size="2">Kane, Michael (1992), "An Argument&#45;Based Approach to Validation", <i>Psychological Bulletin,</i> vol. 112, n&uacute;m 3, pp. 527&#45;535.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920392&pid=S0185-2698201500030001000007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>       <!-- ref --><p align="justify"><font face="verdana" size="2">Kane, Michael (2002), "Validating High&#45;Stakes Testing Programs", <i>Educational Measurement: Issues and Practice,</i> vol. 21, n&uacute;m. 1, pp. 31&#45;41.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920394&pid=S0185-2698201500030001000008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>         <!-- ref --><p align="justify"><font face="verdana" size="2">Kane, Michael (2006), "Validation", en Robert Brennan (ed.), <i>Educational Measurement,</i> West&#45;port, American Council on Education/Praeger, pp. 17&#45;64.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920396&pid=S0185-2698201500030001000009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>     <!-- ref --><p align="justify"><font face="verdana" size="2">Kane, Michael (2013), "Validating the Interpretations and Uses of Test Scores", <i>Journal of Educational Measurement,</i> vol. 50, n&uacute;m.1, pp. 1&#45;73.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920398&pid=S0185-2698201500030001000010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>          <!-- ref --><p align="justify"><font face="verdana" size="2">Kane, Michael, Terence Crooks y Allan Cohen (1999), "Validating Measures of Performance", <i>Educational Measurement: Issues and Practice,</i> vol. 18, n&uacute;m. 2, pp. 5&#45;17.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920400&pid=S0185-2698201500030001000011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>           <!-- ref --><p align="justify"><font face="verdana" size="2">Messick, Samuel (1989), "Validity", en Robert Linn (ed.), <i>Educational Measurement,</i> Nueva York, American Council on Education/Macmillan, pp. 13&#45;103.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920402&pid=S0185-2698201500030001000012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>       <!-- ref --><p align="justify"><font face="verdana" size="2">Messick, Samuel (1995), "Validity of Psychological Assessment", <i>American Psychologist,</i> vol. 50, n&uacute;m. 9, pp. 741&#45;749.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920404&pid=S0185-2698201500030001000013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>       <!-- ref --><p align="justify"><font face="verdana" size="2">Mislevy, Robert (2006), "Cognitive Psychology and Educational Assessment", en Robert Brennan (ed.), <i>Educational Measurement,</i> Westport, American Council on Education/Praeger, pp. 257&#45;305.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920406&pid=S0185-2698201500030001000014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>        <!-- ref --><p align="justify"><font face="verdana" size="2">Mislevy, Robert (2009),"Validity from the Perspective of Model&#45;based Reasoning", <i>Cresst Report,</i> n&uacute;m. 752, National Center for Research on Evaluation, Standards, and Student Testing, Los Angeles, pp. 1&#45;28.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920408&pid=S0185-2698201500030001000015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>        <!-- ref --><p align="justify"><font face="verdana" size="2">Mislevy, Robert, Linda Steinberg y Rusell Almond (2003), "On the Structure of Educational Assessments", <i>CSE Technical Report 597,</i> Los Angeles, pp. 1&#45;67.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920410&pid=S0185-2698201500030001000016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>        <!-- ref --><p align="justify"><font face="verdana" size="2">Rosenfeld, Michael, Rosaela Courtney y Mary Fowles (2004), "Identifying the Writing Tasks Important for Academic Success at the Undergraduate and Graduate Levels", <i>Educational Testing Service Research,</i> Report 42, Princeton, Educational Testing Service.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920412&pid=S0185-2698201500030001000017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>         <!-- ref --><p align="justify"><font face="verdana" size="2">Toulmin, Stephen (1958), <i>The Uses of Argument,</i> Cambridge, Cambridge University Press.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920414&pid=S0185-2698201500030001000018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>          <!-- ref --><p align="justify"><font face="verdana" size="2">Toulmin, Stephen, Richard Rieke y Allan Janik (1979), <i>An Introduction to Reasoning,</i> Nueva York, Macmillan.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920416&pid=S0185-2698201500030001000019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>        <!-- ref --><p align="justify"><font face="verdana" size="2">Toulmin, Stephen, Richard Rieke y Allan Janik (1984), <i>An Introduction to Reasoning,</i> Nueva York/Londres, Macmillan Publishing, Co. Inc./Collier Macmillan Publisher.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920418&pid=S0185-2698201500030001000020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>        <!-- ref --><p align="justify"><font face="verdana" size="2">Weigle, Sarah (2002), <i>Assessing Writing,</i> Cambridge (UK), Cambridge University Press.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=5920420&pid=S0185-2698201500030001000021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>         <p align="justify"><font size="2" face="verdana"><a name="nota"></a><b>Notas</b></font></p>       <p align="justify"><font face="verdana" size="2">1&nbsp;Un examen de alto impacto es aquel cuyo resultado es empleado para tomar decisiones importantes que conllevan consecuencias positivas o negativas en quienes los sustentan. A diferencia de los ex&aacute;menes a gran escala, los de alto impacto pueden o no ser administrados a grandes poblaciones. Por ejemplo, en el contexto educativo, los resultados de los ex&aacute;menes de aptitud, certificaci&oacute;n y dominio son frecuentemente empleados por las partes interesadas como criterios de egreso/ingreso tanto en la educaci&oacute;n media superior como superior.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">2&nbsp;APA: American Psychological Association; AERA: American Educational Research Association; NCME: National Council on Measurement in Education.</font></p>     <p align="justify"><font face="verdana" size="2">3 El proceso de validaci&oacute;n de la prueba se encuentra a&uacute;n en proceso.</font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="book">
<collab>American Educational Research Association/American psychological Association/National Council on Measurement in Education</collab>
<source><![CDATA[Standards for Educational and Psychological Testing]]></source>
<year>1985</year>
<publisher-loc><![CDATA[Washington^eD.C. D.C.]]></publisher-loc>
<publisher-name><![CDATA[American Educational Research Association]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="book">
<collab>American Educational Research Association/American psychological Association/National Council on Measurement in Education</collab>
<source><![CDATA[Standards for Educational and Psychological testing]]></source>
<year>1999</year>
<publisher-loc><![CDATA[Washington^eD.C. D.C.]]></publisher-loc>
<publisher-name><![CDATA[American Educational Research Association]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bachman]]></surname>
<given-names><![CDATA[Lyle]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Building and Supporting a Case for Test Use]]></article-title>
<source><![CDATA[Language Assessment Quarterly]]></source>
<year>2005</year>
<volume>2</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>1-34</page-range></nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bachman]]></surname>
<given-names><![CDATA[Lyle]]></given-names>
</name>
<name>
<surname><![CDATA[Palmer]]></surname>
<given-names><![CDATA[Adrian]]></given-names>
</name>
</person-group>
<source><![CDATA[Language Assessment in Practice: Developing language assessments and justifying their use in the real world]]></source>
<year>2010</year>
<publisher-loc><![CDATA[Oxford ]]></publisher-loc>
<publisher-name><![CDATA[Oxford University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cronbach]]></surname>
<given-names><![CDATA[Lee]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Five Perspectives on Validity Argument]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Wainer]]></surname>
<given-names><![CDATA[Howard]]></given-names>
</name>
<name>
<surname><![CDATA[Braun]]></surname>
<given-names><![CDATA[Henry]]></given-names>
</name>
</person-group>
<source><![CDATA[Test Validity]]></source>
<year>1988</year>
<page-range>3-17</page-range><publisher-loc><![CDATA[Hillsdale^eNJ NJ]]></publisher-loc>
<publisher-name><![CDATA[Lawrence Erlbaum]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cronbach]]></surname>
<given-names><![CDATA[Lee]]></given-names>
</name>
<name>
<surname><![CDATA[Meehl]]></surname>
<given-names><![CDATA[Paul]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Construct Validity in Psychological Tests]]></article-title>
<source><![CDATA[Psychological Bulletin]]></source>
<year>1955</year>
<volume>52</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>281-302</page-range></nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kane]]></surname>
<given-names><![CDATA[Michael]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An Argument-Based Approach to Validation]]></article-title>
<source><![CDATA[Psychological Bulletin]]></source>
<year>1992</year>
<volume>112</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>527-535</page-range></nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kane]]></surname>
<given-names><![CDATA[Michael]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Validating High-Stakes Testing Programs]]></article-title>
<source><![CDATA[Educational Measurement: Issues and Practice]]></source>
<year>2002</year>
<volume>21</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>31-41</page-range></nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kane]]></surname>
<given-names><![CDATA[Michael]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Validation]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Brennan]]></surname>
<given-names><![CDATA[Robert]]></given-names>
</name>
</person-group>
<source><![CDATA[Educational Measurement]]></source>
<year>2006</year>
<page-range>17-64</page-range><publisher-name><![CDATA[West-port, American Council on EducationPraeger]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kane]]></surname>
<given-names><![CDATA[Michael]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Validating the Interpretations and Uses of Test Scores]]></article-title>
<source><![CDATA[Journal of Educational Measurement]]></source>
<year>2013</year>
<volume>50</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>1-73</page-range></nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kane]]></surname>
<given-names><![CDATA[Michael]]></given-names>
</name>
<name>
<surname><![CDATA[Crooks]]></surname>
<given-names><![CDATA[Terence]]></given-names>
</name>
<name>
<surname><![CDATA[Cohen]]></surname>
<given-names><![CDATA[Allan]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Validating Measures of Performance]]></article-title>
<source><![CDATA[Educational Measurement: Issues and Practice]]></source>
<year>1999</year>
<volume>18</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>5-17</page-range></nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Messick]]></surname>
<given-names><![CDATA[Samuel]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Validity]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Linn]]></surname>
<given-names><![CDATA[Robert]]></given-names>
</name>
</person-group>
<source><![CDATA[Educational Measurement]]></source>
<year>1989</year>
<page-range>13-103</page-range><publisher-loc><![CDATA[Nueva York ]]></publisher-loc>
<publisher-name><![CDATA[American Council on EducationMacmillan]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Messick]]></surname>
<given-names><![CDATA[Samuel]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Validity of Psychological Assessment]]></article-title>
<source><![CDATA[American Psychologist]]></source>
<year>1995</year>
<volume>50</volume>
<numero>9</numero>
<issue>9</issue>
<page-range>741-749</page-range></nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mislevy]]></surname>
<given-names><![CDATA[Robert]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Cognitive Psychology and Educational Assessment]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Brennan]]></surname>
<given-names><![CDATA[Robert]]></given-names>
</name>
</person-group>
<source><![CDATA[Educational Measurement]]></source>
<year>2006</year>
<page-range>257-305</page-range><publisher-loc><![CDATA[Westport ]]></publisher-loc>
<publisher-name><![CDATA[American Council on EducationPraeger]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mislevy]]></surname>
<given-names><![CDATA[Robert]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Validity from the Perspective of Model-based Reasoning]]></article-title>
<source><![CDATA[Cresst Report]]></source>
<year>2009</year>
<numero>752</numero>
<issue>752</issue>
<page-range>1-28</page-range><publisher-loc><![CDATA[Los Angeles ]]></publisher-loc>
<publisher-name><![CDATA[National Center for Research on Evaluation, StandardsStudent Testing]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mislevy]]></surname>
<given-names><![CDATA[Robert]]></given-names>
</name>
<name>
<surname><![CDATA[Steinberg]]></surname>
<given-names><![CDATA[Linda]]></given-names>
</name>
<name>
<surname><![CDATA[Almond]]></surname>
<given-names><![CDATA[Rusell]]></given-names>
</name>
</person-group>
<source><![CDATA[On the Structure of Educational Assessments]]></source>
<year>2003</year>
<publisher-loc><![CDATA[Los Angeles ]]></publisher-loc>
<publisher-name><![CDATA[1-67]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rosenfeld]]></surname>
<given-names><![CDATA[Michael]]></given-names>
</name>
<name>
<surname><![CDATA[Courtney]]></surname>
<given-names><![CDATA[Rosaela]]></given-names>
</name>
<name>
<surname><![CDATA[Fowles]]></surname>
<given-names><![CDATA[Mary]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Identifying the Writing Tasks Important for Academic Success at the Undergraduate and Graduate Levels]]></article-title>
<source><![CDATA[Educational Testing Service Research]]></source>
<year>2004</year>
<publisher-loc><![CDATA[Princeton ]]></publisher-loc>
<publisher-name><![CDATA[Educational Testing Service]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Toulmin]]></surname>
<given-names><![CDATA[Stephen]]></given-names>
</name>
</person-group>
<source><![CDATA[The Uses of Argument]]></source>
<year>1958</year>
<publisher-loc><![CDATA[Cambridge ]]></publisher-loc>
<publisher-name><![CDATA[Cambridge University Press]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Toulmin]]></surname>
<given-names><![CDATA[Stephen]]></given-names>
</name>
<name>
<surname><![CDATA[Rieke]]></surname>
<given-names><![CDATA[Richard]]></given-names>
</name>
<name>
<surname><![CDATA[Janik]]></surname>
<given-names><![CDATA[Allan]]></given-names>
</name>
</person-group>
<source><![CDATA[An Introduction to Reasoning]]></source>
<year>1979</year>
<publisher-loc><![CDATA[Nueva York ]]></publisher-loc>
<publisher-name><![CDATA[Macmillan]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Toulmin]]></surname>
<given-names><![CDATA[Stephen]]></given-names>
</name>
<name>
<surname><![CDATA[Rieke]]></surname>
<given-names><![CDATA[Richard]]></given-names>
</name>
<name>
<surname><![CDATA[Janik]]></surname>
<given-names><![CDATA[Allan]]></given-names>
</name>
</person-group>
<source><![CDATA[An Introduction to Reasoning]]></source>
<year>1984</year>
<publisher-loc><![CDATA[Nueva YorkLondres ]]></publisher-loc>
<publisher-name><![CDATA[Macmillan Publishing, Co. Inc.Collier Macmillan Publisher]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Weigle]]></surname>
<given-names><![CDATA[Sarah]]></given-names>
</name>
</person-group>
<source><![CDATA[Assessing Writing]]></source>
<year>2002</year>
<publisher-loc><![CDATA[Cambridge^eUK UK]]></publisher-loc>
<publisher-name><![CDATA[Cambridge University Press]]></publisher-name>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
