<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>0185-2760</journal-id>
<journal-title><![CDATA[Revista de la educación superior]]></journal-title>
<abbrev-journal-title><![CDATA[Rev. educ. sup]]></abbrev-journal-title>
<issn>0185-2760</issn>
<publisher>
<publisher-name><![CDATA[Asociación Nacional de Universidades e Instituciones de Educación Superior de la República Mexicana A.C.]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S0185-27602008000300003</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[La evaluación del conocimiento en medicina]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Rodríguez Carranza]]></surname>
<given-names><![CDATA[Rodolfo]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Nacional Autónoma de México (UNAM) Facultad de Medicina Departamento de Farmacología]]></institution>
<addr-line><![CDATA[ ]]></addr-line>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>09</month>
<year>2008</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>09</month>
<year>2008</year>
</pub-date>
<volume>37</volume>
<numero>147</numero>
<fpage>31</fpage>
<lpage>42</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_arttext&amp;pid=S0185-27602008000300003&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&amp;pid=S0185-27602008000300003&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_pdf&amp;pid=S0185-27602008000300003&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Se destaca la importancia de la evaluación en medicina y la variedad de formatos que se utilizan para evaluar el aprendizaje de los alumnos y las competencias clínicas de los egresados. Se especifica que el examen de opción múltiple es el formato más frecuentemente utilizado, y se analizan sus características, alcances y limitaciones. Se reconoce que las computadoras y la evolución de los programas de cómputo son dos factores que han renovado el interés en los reactivos de opción múltiple e impulsado el desarrollo de exámenes computarizados, los cuales ahora se aplican regularmente en muchas escuelas de medicina.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[This article first discusses some general issues on complexity and relevance of medicine assessment, and describes the wide variety of examination formats that have been developed to evaluate students' achievements and competence of practicing physicians. Then gives an overview of the multiple-choice test, the most commonly used type of test item, with its major advantages and disadvantages. This article also refers to computer-based testing, which has recently gained popularity as testing modality in most medical schools.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[educación médica]]></kwd>
<kwd lng="es"><![CDATA[evaluación]]></kwd>
<kwd lng="es"><![CDATA[competencias]]></kwd>
<kwd lng="en"><![CDATA[medical education]]></kwd>
<kwd lng="en"><![CDATA[evaluation]]></kwd>
<kwd lng="en"><![CDATA[competencies]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[ <p align="justify"><font face="verdana" size="4">Estudios e investigaciones</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="center"><font face="verdana" size="4"><b>La evaluaci&oacute;n del conocimiento en medicina</b></font></p>     <p align="center"><font face="verdana" size="2">&nbsp;</font></p>     <p align="center"><font face="verdana" size="2"><b>Rodolfo Rodr&iacute;guez Carranza*</b></font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><i>* Departamento de Farmacolog&iacute;a, Facultad de Medicina, UNAM.</i> Correo e: <a href="mailto:rodcar@servidor.unam.mx">rodcar@servidor.unam.mx</a> </font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2">Ingreso: 17/01/08     <br> Aprobaci&oacute;n: 12/05/08</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Resumen</b></font></p>     <p align="justify"><font face="verdana" size="2">Se destaca la importancia de la evaluaci&oacute;n en medicina y la variedad de formatos que se utilizan para evaluar el aprendizaje de los alumnos y las competencias cl&iacute;nicas de los egresados. Se especifica que el examen de opci&oacute;n m&uacute;ltiple es el formato m&aacute;s frecuentemente utilizado, y se analizan sus caracter&iacute;sticas, alcances y limitaciones. Se reconoce que las computadoras y la evoluci&oacute;n de los programas de c&oacute;mputo son dos  factores que han renovado el inter&eacute;s en los reactivos de opci&oacute;n m&uacute;ltiple e impulsado el desarrollo de ex&aacute;menes computarizados, los cuales ahora se aplican regularmente en muchas escuelas de medicina.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Palabras clave:</b> educaci&oacute;n m&eacute;dica, evaluaci&oacute;n, competencias.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Abstract</b></font></p>     <p align="justify"><font face="verdana" size="2">This article first discusses some general issues on complexity and relevance of medicine assessment, and describes the wide variety of examination formats that have been developed to evaluate students' achievements and competence of practicing physicians. Then gives an overview of the multiple&#150;choice test, the most commonly used type of test item, with its major advantages and disadvantages. This article also refers to computer&#150;based testing, which has recently gained popularity as testing modality in most medical schools.</font></p>     <p align="justify"><font face="verdana" size="2"><b>Key words:</b> medical education, evaluation, competencies.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Introducci&oacute;n</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Se reconoce que la medicina es una ciencia muy extensa y compleja, cuya ense&ntilde;anza y aprendizaje representa un reto formidable para los educadores, para los evaluadores y para los estudiantes de medicina. En el campo educativo, seg&uacute;n los objetivos que se&ntilde;alan los diversos planes de estudio, el alumno est&aacute; obligado a adquirir, adem&aacute;s de un volumen impresionante de informaci&oacute;n biom&eacute;dica y m&eacute;dica, las habilidades y valores establecidos para el ejercicio de la medicina, y los atributos esenciales de la buena instrucci&oacute;n universitaria, como son inter&eacute;s continuo en la superaci&oacute;n acad&eacute;mica y en el aprendizaje independiente, adaptabilidad para el cambio, y habilidad para pensar de manera cr&iacute;tica, para educar, y para comunicarse claramente. Todo ello con sentido humanista y social. Si se consideran esos objetivos educacionales, el m&eacute;dico debe ser educado y evaluado como cl&iacute;nico, como cient&iacute;fico, como humanista, y como docente (Reddy y Vijayakumar, 2000).</font></p>     <p align="justify"><font face="verdana" size="2">Como puede apreciarse, la evaluaci&oacute;n en medicina no es un tema menor y cumple funciones personales, institucionales, curriculares y sociales (Epstein y Hundert, 2002). Por ejemplo, sus resultados generan informaci&oacute;n &uacute;til a los estudiantes para sustentar la toma de decisiones, como reforzar o cambiar sus m&eacute;todos y h&aacute;bitos de estudio, orientar su estudio independiente y, si es necesario, programar medidas de recuperaci&oacute;n; por lo cual, la evaluaci&oacute;n, particularmente la de car&aacute;cter formativo, es un instrumento muy valioso que impulsa el inter&eacute;s en el desarrollo personal. Las instituciones, a trav&eacute;s de la evaluaci&oacute;n, determinan el grado de avance del aprendizaje, el dominio de una disciplina y el logro de las competencias establecidas en el plan de estudios; informaci&oacute;n que les permite validar la pertinencia de una promoci&oacute;n, la obtenci&oacute;n de un grado y la autorizaci&oacute;n para el ejercicio de la medicina (evaluaci&oacute;n sumativa); asimismo, informaci&oacute;n que es, o debe ser, fundamento de cambios curriculares.</font></p>     <p align="justify"><font face="verdana" size="2">Al final de los estudios, los ex&aacute;menes de egreso constituyen la principal garant&iacute;a a la sociedad de la competencia profesional de los m&eacute;dicos generales y de los especialistas.</font></p>     <p align="justify"><font face="verdana" size="2">Por todas esas razones, y porque la evaluaci&oacute;n es parte integral de la educaci&oacute;n m&eacute;dica (Schuwirth y Van der Vleuten, 2004), los procedimientos de evaluaci&oacute;n en medicina han sido motivo de diversos estudios y de un gran n&uacute;mero de cuestionamientos y, actualmente, el desarrollo de nuevos y mejores m&eacute;todos y esquemas de evaluaci&oacute;n es tema de numerosas investigaciones, particularmente de las escuelas de medicina que verdaderamente buscan la excelencia acad&eacute;mica de sus egresados.</font></p>     <p align="justify"><font face="verdana" size="2">En este art&iacute;culo se describen algunos de los procedimientos desarrollados para evaluar el conocimiento en medicina, se analizan las caracter&iacute;sticas, ventajas y desventajas de los ex&aacute;menes constituidos por reactivos de opci&oacute;n m&uacute;ltiple, que es el formato de examen m&aacute;s frecuentemente utilizado, y su empleo en los ex&aacute;menes sustentados en la tecnolog&iacute;a inform&aacute;tica (computarizados).</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>La evaluaci&oacute;n en medicina</b></font></p>     <p align="justify"><font face="verdana" size="2">En nuestro campo, el t&eacute;rmino competencia refiere los conocimientos, habilidades (psicomotoras y cognitivas) y valores que debe tener un estudiante de medicina, y el t&eacute;rmino desempe&ntilde;o hace referencia a la pericia del m&eacute;dico en la pr&aacute;ctica cl&iacute;nica real. En la literatura m&eacute;dica se pueden encontrar varias definiciones de competencia. Destaca la propuesta de Southgate (1999), quien se&ntilde;ala que la competencia en medicina "est&aacute; compuesta por conocimientos, habilidades interpersonales y atributos morales y personales; que es en parte la habilidad y en parte el deseo para seleccionar y efectuar tareas cl&iacute;nicas relevantes en el contexto de un ambiente social con el fin de resolver problemas de salud de los individuos de manera eficiente, econ&oacute;micamente efectiva, y con sentido humanista", y la de Epstein y Hundert (2002), quienes se&ntilde;alan que la competencia cl&iacute;nica es "el uso habitual y juicioso de la comunicaci&oacute;n, conocimiento, habilidades t&eacute;cnicas, razonamiento cl&iacute;nico, emociones, valores y reflexi&oacute;n en la pr&aacute;ctica diaria para beneficio de un individuo y de la comunidad a la cual se sirve". Definici&oacute;n que parece referirse m&aacute;s al desempe&ntilde;o profesional que a las competencias, pero que deja claras las dificultades inherentes a su evaluaci&oacute;n.</font></p>     <p align="justify"><font face="verdana" size="2">Para evaluar el conocimiento en medicina se han desarrollado diversos procedimientos (Collins y Gamble, 1996; Epstein y Hundert, 2002; Van der Vleuten y Schuwirth, 2005); entre los m&aacute;s frecuentemente utilizados se pueden mencionar: a) examen con reactivos de opci&oacute;n m&uacute;ltiple (Norcini <i>et al, </i>1985; Collins, 2006); examen con respuesta estructurada por el estudiante (Schafer <i>et al, </i>2005); c) examen ante pacientes reales, hospitalizados y externos, con o sin escala de medici&oacute;n (Reddy y Vijayakumar, 2000); d) examen ante pacientes estandarizados (Reddy y Vijayakumar, 2000; Tamblyn <i>et al, </i>1991; Pololi, 1995); e) examen cl&iacute;nico objetivo y estructurado (Harden y Gleeson, 1979; Petrusa <i>et al, </i>1987; Sloan <i>et al, </i>1995); f) examen oral, estructurado y no&#150;estructurado (Kelley <i>et al., </i>1971; Williams <i>et al, </i>1987); g) manejo del problema principal de un paciente (Van der Vleuten y Newble, 1995); y h) portafolio (Friedman Ben&#150;David <i>et al, </i>2001). Todos estos procedimientos tienen ventajas y desventajas. La selecci&oacute;n de alguno de ellos depende, precisamente, de un an&aacute;lisis cuidadoso.</font></p>     <p align="justify"><font face="verdana" size="2">Algunos de los criterios a considerar para su selecci&oacute;n se derivan de sus propiedades psicom&eacute;tricas, en particular validez y confiabilidad. Por definici&oacute;n, el t&eacute;rmino validez indica la medida en que el examen mide la competencia que se propone evaluar, y espec&iacute;ficamente hace referencia: a) al contenido (validez de contenido), que se&ntilde;ala el grado de relaci&oacute;n entre lo que se pregunta y los objetivos educacionales del plan y/o del programa de estudios; b) a la construcci&oacute;n (validez de construcci&oacute;n), que hace referencia al grado en que leg&iacute;timamente se pueden hacer inferencias del contenido del reactivo al concepto que se desea medir; y c) a la predicci&oacute;n (validez de predicci&oacute;n), que refiere la capacidad de predecir el desempe&ntilde;o acad&eacute;mico o profesional futuro. Mientras que el t&eacute;rmino confiabilidad indica la medida en que el puntaje del examen es consistente y puede ser generalizado (Schuwirth y Van der Vleuten, 2004). Como es bien sabido, los reactivos incluidos en un examen s&oacute;lo suelen representar una muestra peque&ntilde;a del conjunto de posibles preguntas relevantes que pueden ser incorporadas; por ello es importante que el puntaje en una prueba sea indicativo del valor que el mismo estudiante puede sacar en otro grupo de preguntas relevantes.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">En la selecci&oacute;n del procedimiento de evaluaci&oacute;n tambi&eacute;n deben considerarse otros aspectos: a) aceptabilidad, que se refiere a la opini&oacute;n que alumnos y profesores tienen sobre el tipo de examen y a su disposici&oacute;n para aceptarlo y, en el caso de los profesores, para elaborar los reactivos correspondientes; b) capacidad discriminatoria, que hace referencia a la capacidad del examen para diferenciar un nivel de conocimientos de otro; y c) costos, que considera los recursos econ&oacute;micos y tiempo necesarios para la elaboraci&oacute;n, aplicaci&oacute;n y calificaci&oacute;n de ex&aacute;menes (Schuwirth y Van der Vleuten, 2004). Los costos en tiempo y recursos var&iacute;an considerablemente de un tipo de examen a otro.</font></p>     <p align="justify"><font face="verdana" size="2">En general, ninguno de los formatos de examen arriba descritos es superior a otro y, de manera aislada, no eval&uacute;an satisfactoriamente todas las competencias de una ciencia tan compleja como la medicina (Wass <i>et al, </i>2001a). Por ello, la mayor&iacute;a de los autores concluyen que se requieren varios formatos de evaluaci&oacute;n para establecer con certeza el grado de aprendizaje de los estudiantes y la competencia cl&iacute;nica global de los egresados (Schwartz <i>et al, </i>1992; Schuwartz <i>et al, </i>1994; Hull <i>et al, </i>1995; Collins y Gamble, 1996; Schuwirth y Van der Vleuten, 2004; Carr, 2004; Van der Vleuten y Schuwirth, 2005). Asimismo, para una evaluaci&oacute;n &uacute;til y certera, es muy importante que los planes y programas de estudio describan claramente lo que los estudiantes deben aprender, ya que ello define qu&eacute; y c&oacute;mo evaluar y, en consecuencia, la combinaci&oacute;n de procedimientos id&oacute;neos a los objetivos educacionales de cada nivel educativo (Wass <i>et al, </i>2001b).</font></p>     <p align="justify"><font face="verdana" size="2">En general, el dominio de los conocimientos de ciencias b&aacute;sicas puede ser m&aacute;s f&aacute;cilmente evaluado con ex&aacute;menes de opci&oacute;n m&uacute;ltiple, ex&aacute;menes orales y ensayos, pero se requieren procedimientos m&aacute;s sofisticados para evaluar las diferentes facetas de la competencia cl&iacute;nica; entre ellos se encuentran los formatos que utilizan pacientes estandarizados, reales (hospitalizados y externos), y el denominado examen cl&iacute;nico objetivo y estructurado (ECOE).</font></p>     <p align="justify"><font face="verdana" size="2">En el ECOE, formato que se utiliza cada vez con mayor frecuencia, los estudiantes pasan a trav&eacute;s de una serie de estaciones (8 a m&aacute;s de 20) dise&ntilde;adas para evaluar habilidades cl&iacute;nicas predeterminadas (historia cl&iacute;nica, exploraci&oacute;n, interpretaci&oacute;n de resultados de laboratorio, diagn&oacute;stico diferencial, manejo integral del paciente, comunicaci&oacute;n, etc.) en un tiempo tambi&eacute;n predeterminado (5 a 30 min). A una se&ntilde;al, el examinando pasa a la siguiente estaci&oacute;n y as&iacute; contin&uacute;a hasta que se termina el n&uacute;mero de estaciones programadas (Harden y Gleeson, 1979; Smee, 2003). En este formato se utilizan pacientes estandarizados; es decir, personas que han sido entrenadas para simular problemas de salud de una manera consistente, confiable y relativamente realista. El ECOE (OSCE, por sus siglas en ingl&eacute;s) ha ganado muchos adeptos, pero se trata de un procedimiento costoso en tiempo y recursos (Barman, 2005).</font></p>     <p align="justify"><font face="verdana" size="2">En la literatura m&eacute;dica se aprecia cierta tendencia a la combinaci&oacute;n de por lo menos tres de los formatos de examen arriba descritos; entre ellos: a) de opci&oacute;n m&uacute;ltiple, incluido en la totalidad de las propuestas; b) cl&iacute;nico objetivo y estructurado, que ha cobrado fuerza durante los &uacute;ltimos a&ntilde;os; c) con pacientes reales, que representa la situaci&oacute;n m&aacute;s cercana al ejercicio real de la medicina; y d) oral, que contin&uacute;a siendo uno de los m&aacute;s favorecidos. Cabe mencionar que en algunas instituciones, a lo largo de la educaci&oacute;n m&eacute;dica se utiliza una combinaci&oacute;n de seis diferentes tipos de examen (Davis, 2003).</font></p>     <p align="justify"><font face="verdana" size="2">Por ser los m&aacute;s frecuentemente utilizados y por su relaci&oacute;n con los ex&aacute;menes computarizados, los cuales han estado desplazando a los ex&aacute;menes escritos, en este trabajo s&oacute;lo se analizan con detalle las caracter&iacute;sticas principales de los ex&aacute;menes de opci&oacute;n m&uacute;ltiple.</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Ex&aacute;menes de opci&oacute;n m&uacute;ltiple</b></font></p>     <p align="justify"><font face="verdana" size="2">Como ya se mencion&oacute;, los ex&aacute;menes constituidos por reactivos de opci&oacute;n m&uacute;ltiple (ROM) han sido y son los instrumentos m&aacute;s frecuentemente utilizados a lo largo de la educaci&oacute;n m&eacute;dica para evaluar formalmente el aprendizaje y el progreso acad&eacute;mico de los alumnos de licenciatura y de posgrado; tambi&eacute;n se les utiliza en los ex&aacute;menes profesionales, de ingreso a las residencias m&eacute;dicas, y de certificaci&oacute;n (Norcini <i>et al, </i>1985; Reddy y Vijayakumar, 2000; Collins, 2006). La gran aceptaci&oacute;n de los ROM para la evaluaci&oacute;n del conocimiento m&eacute;dico depende de la posibilidad de usar un n&uacute;mero alto de reactivos, lo que permite incluir reactivos sobre los temas representados por los contenidos y objetivos m&aacute;s importantes de una disciplina, de un ciclo escolar o de un plan de estudios. Su aceptaci&oacute;n tambi&eacute;n depende de que se pueden aplicar en un tiempo relativamente corto y de que pueden ser analizados por la computadora (Epstein, 2007). Estas caracter&iacute;sticas determinan que los ex&aacute;menes de opci&oacute;n m&uacute;ltiple se puedan aplicar simult&aacute;neamente a un n&uacute;mero alto de estudiantes.</font></p>     <p align="justify"><font face="verdana" size="2">Los ex&aacute;menes de opci&oacute;n m&uacute;ltiple surgieron por primera vez en el campo educativo como parte de un esfuerzo para ordenar la ense&ntilde;anza formal (elemental y media) y como auxiliares importantes de la evaluaci&oacute;n del aprovechamiento escolar, en especial para contender con una poblaci&oacute;n estudiantil cada vez m&aacute;s numerosa (Viniegra, 1979). Por su eficiencia y caracter&iacute;sticas psicom&eacute;tricas (confiabilidad y validez), su uso se extendi&oacute; r&aacute;pidamente a todas las &aacute;reas de educaci&oacute;n formal, incluida la medicina.</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">En general, este tipo de reactivos est&aacute; constituido por dos partes, el enunciado (cuerpo o base del reactivo) que expresa una proposici&oacute;n (imperativa, incompleta, interrogativa) y varias alternativas (tres o m&aacute;s opciones) de respuesta (Garcia <i>et al, </i>2006); las cuales son posibles respuestas o soluciones. Las opciones incluyen la(s) respuesta(s) correcta(s) y una serie de respuestas incompletas o incorrectas, denominadas distractores. A este tipo de reactivos se les clasifica por la forma de respuesta, por su estructura (formato), y por el tipo de aprendizaje que pueden medir. Los formatos de reactivos de opci&oacute;n m&uacute;ltiple m&aacute;s frecuentemente utilizados son los denominados de formato simple. En este caso el enunciado tiene una sola opci&oacute;n de respuesta correcta (&uacute;nica verdadera) y el resto son distractores veros&iacute;miles; se trata del formato de examen m&aacute;s vers&aacute;til y el que regularmente se utiliza en las asignaturas precl&iacute;nicas.</font></p>     <p align="justify"><font face="verdana" size="2">Otros formatos conocidos, cuyo uso es m&aacute;s frecuente para evaluar el conocimiento cl&iacute;nico, son los de la mejor respuesta, de apareamiento, de omisi&oacute;n, de falso&#150;verdadero, de &iacute;tem interpretativo, de falso&#150;verdadero m&uacute;ltiple, y de formato dependiente de contexto (Norcini <i>et al, </i>1985; Schuwirth y Van der Vleuten, 2004; Carr, 2004; Garc&iacute;a <i>et al</i>, 2006).</font></p>     <p align="justify"><font face="verdana" size="2">Tambi&eacute;n se debe mencionar el formato de apareamiento extendido, el cual se utiliza frecuentemente en los ex&aacute;menes profesionales, de ingreso a las residencias m&eacute;dicas y de certificaci&oacute;n, ya que requiere la aplicaci&oacute;n del conocimiento m&eacute;dico sobre casos cl&iacute;nicos espec&iacute;ficos (reales) y permite que un mayor n&uacute;mero de preguntas se resuelva en corto de tiempo, lo que aumenta su confiabilidad y validez. Este formato est&aacute; constituido por un tema o problema, una lista de opciones o respuestas posibles (siete a 26), una conducci&oacute;n de entrada, y la base del enunciado que refiere un caso cl&iacute;nico (Beullens <i>et al</i>, 2002) </font></p>     <p align="justify"><font face="verdana" size="2">La mayor&iacute;a de los autores acepta que los ex&aacute;menes de opci&oacute;n m&uacute;ltiple, al reducir al m&iacute;nimo la intervenci&oacute;n humana, eliminan la subjetividad de la evaluaci&oacute;n y la inconsistencia de las puntuaciones que se observa en los ensayos, en el examen oral y en el examen ante pacientes; asimismo, el riesgo de sesgo (raza, g&eacute;nero) en ese tipo de ex&aacute;menes. Tambi&eacute;n se acepta ampliamente que cuando los reactivos que los conforman son pertinentes, est&aacute;n claramente escritos y bien construidos, son &uacute;tiles para medir procesos cognitivos superiores, como interpretaci&oacute;n, s&iacute;ntesis y aplicaci&oacute;n del conocimiento (capacidad para resolver problemas), y que estos ex&aacute;menes son v&aacute;lidos, discriminatorios, econ&oacute;micos y confiables (Anderson, 1979; Norcini <i>et al, </i>1985; McCoubrie, 2004; Anderson, 2004; Collins, 2006). De hecho, la confiabilidad es la cualidad principal, y m&aacute;s ampliamente aceptada, de los ex&aacute;menes de opci&oacute;n m&uacute;ltiple</font></p>     <p align="justify"><font face="verdana" size="2">Diversos autores han cuestionado la validez de los ex&aacute;menes de opci&oacute;n m&uacute;ltiple para evaluar el aprendizaje en medicina, particularmente la cl&iacute;nica (Newble <i>et al, </i>1979; Viniegra, 1979; Darling&#150;Hammond y Lieberman, 1992). Entre otras cr&iacute;ticas, destacan: a) que miden esencialmente niveles cognitivos de orden bajo (memoria), como recordar hechos aislados y/o triviales y que, por lo tanto, no son ideales para evaluar habilidades cognitivas de nivel alto, como razonamiento, s&iacute;ntesis y evaluaci&oacute;n; b) que tienen escasa relaci&oacute;n con la acci&oacute;n que se requiere en la pr&aacute;ctica cl&iacute;nica; c) que no revelan la actitud del estudiante ni su capacidad para integrar conocimientos, para resolver problemas o para comunicarse, y que su aprobaci&oacute;n no es garant&iacute;a de competencia profesional; y d) que eval&uacute;an el reconocimiento de la respuesta correcta, no la capacidad de generar espont&aacute;neamente una respuesta correcta.</font></p>     <p align="justify"><font face="verdana" size="2">No hay duda de que los reactivos de opci&oacute;n m&uacute;ltiple pobremente construidos inducen en los estudiantes la estrategia err&oacute;nea de aprender hechos aislados, pero es claro que cuando los reactivos de opci&oacute;n m&uacute;ltiple se preparan cuidadosamente tambi&eacute;n exploran, como ya se mencion&oacute;, habilidades cognitivas complejas (Glaser, 1984; Maguire <i>et al, </i>1992; Skakun <i>et al, </i>1994; Van der Vleuten y Newble, 1995; Coderre <i>et al</i>, 2004). Adem&aacute;s, algunas variantes del examen de opci&oacute;n m&uacute;ltiple han sido desarrolladas con el fin espec&iacute;fico de evaluar mejor el razonamiento cl&iacute;nico y la aplicaci&oacute;n del conocimiento m&eacute;dico (Aeschlimann <i>et al, </i>2001; Beullens <i>et al, </i>2002; Beullens <i>et al, </i>2005). Y cabe destacar que la construcci&oacute;n de la base del reactivo determina la calidad y el nivel cognitivo de un examen, no el formato o el n&uacute;mero de alternativas (Coderre <i>et al, </i>2004); asimismo, la escasa importancia que algunos cr&iacute;ticos de los reactivos de opci&oacute;n m&uacute;ltiple otorgan a la memoria, componente fundamental del pensamiento y del razonamiento.</font></p>     <p align="justify"><font face="verdana" size="2">En este trabajo se considera que el examen de opci&oacute;n m&uacute;ltiple es mucho m&aacute;s que un procedimiento confiable para medir la capacidad de recordar y reconocer el conocimiento establecido, y se acepta que los ex&aacute;menes de opci&oacute;n m&uacute;ltiple bien construidos pueden medir habilidades cognitivas superiores, adem&aacute;s de que estimulan el aprendizaje de los alumnos. Tampoco se trata, desde luego, de un procedimiento ideal ni completo para la evaluaci&oacute;n del conocimiento cl&iacute;nico. Se les acepta como uno de los componentes m&aacute;s &uacute;tiles de los sistemas de evaluaci&oacute;n del conocimiento en medicina, sistemas que deben incluir otros formatos, como arriba se indica.</font></p>     <p align="justify"><font face="verdana" size="2">Conviene agregar que el dise&ntilde;o de reactivos de opci&oacute;n m&uacute;ltiple requiere dominio de la disciplina motivo de la evaluaci&oacute;n, as&iacute; como de la t&eacute;cnica para elaborar un reactivo &uacute;til y relevante (Collins, 2006; Garcia <i>et al, </i>2006). De hecho, la creaci&oacute;n de un banco de reactivos de opci&oacute;n m&uacute;ltiple bien balanceado, no es un ejercicio trivial. Su desarrollo requiere de mucho tiempo, ya que es necesario asegurar la precisi&oacute;n, relevancia e importancia del contenido, adem&aacute;s de que la estructura de cada reactivo debe ser aceptable en t&eacute;rminos de un enunciado apropiado y estar libre de errores y ambig&uuml;edades. Tambi&eacute;n se requiere que, antes de ser utilizados, cada uno de ellos sea revisado y aprobado por los profesores encargados de los cursos y por los comit&eacute;s de evaluaci&oacute;n (Palmer y Devitt, 2006).</font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Aplicaci&oacute;n de ex&aacute;menes computarizados</b></font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">La introducci&oacute;n y evoluci&oacute;n de las computadoras y de la tecnolog&iacute;a son dos factores que han impactado de manera determinante en el proceso educativo en todas las &aacute;reas del conocimiento. Adem&aacute;s del apoyo invaluable al proceso ense&ntilde;anza&#150;aprendizaje (Greenhalgh, 2006), los avances tecnol&oacute;gicos en ese campo han orientado, en gran medida, la forma en que se eval&uacute;an los conocimientos, se aplican y se cuantifican los ex&aacute;menes, y se reportan los resultados. Estos cambios son particularmente evidentes en los ex&aacute;menes sustentados en la tecnolog&iacute;a inform&aacute;tica, que aqu&iacute; denominamos ex&aacute;menes computarizados, donde dichos avances han determinado el desarrollo de un gran n&uacute;mero de variantes de examen (Zenisky y Sireci, 2002). A la fecha, se pueden distinguir dos tipos b&aacute;sicos de ex&aacute;menes computarizados. En el primero, se pide a los examinandos marcar la respuesta correcta, al igual que en los ex&aacute;menes escritos, marcas que reconoce la computadora. En el segundo, la computadora genera una interfase, los examinandos ingresan su respuesta, y son retroalimentados v&iacute;a la computadora.</font></p>     <p align="justify"><font face="verdana" size="2">La evaluaci&oacute;n computarizada es un procedimiento que se utiliza desde hace m&aacute;s de 40 a&ntilde;os (Swets y Feurzeig, 1965) y que paulatinamente ha estado desplazando, o complementa, la evaluaci&oacute;n escrita en medicina (Doull y Walaszek, 1978; Money <i>et al, </i>1998; Cantillon, <i>et al, </i>2004). El inter&eacute;s inicial en los ex&aacute;menes computarizados y su aceptaci&oacute;n creciente se puede atribuir a su mayor eficiencia (Wise y Kingsbury, 2000), ya que algunos de ellos pueden reducir de manera significativa los tiempos de examen, manteniendo as&iacute; la calidad de los ex&aacute;menes escritos. Sus ventajas generales se pueden resumir de la siguiente manera: a) rapidez; b) no afectan las puntuaciones; c) no requieren programaci&oacute;n especial; d) ensamblado autom&aacute;tico de ex&aacute;menes; e) empleo de im&aacute;genes de alta calidad; f) mayor aceptaci&oacute;n por parte de los estudiantes; g) retroalimentaci&oacute;n inmediata a los examinandos; h) almacenamiento autom&aacute;tico de los datos y la opci&oacute;n de an&aacute;lisis estad&iacute;stico; e i) opci&oacute;n para que los estudiantes determinen por s&iacute; mismos (autoevaluaci&oacute;n) sus niveles de aprendizaje y progreso acad&eacute;mico (Cantillon <i>et al, </i>2004; Vrabel, 2004; <i>Lim et al, </i>2006).</font></p>     <p align="justify"><font face="verdana" size="2">Por todo lo anterior, la evaluaci&oacute;n computarizada ahora se aplica de manera sistem&aacute;tica en las escuelas de medicina y se le utiliza en evaluaciones de tipo formativo, sumativo, diagn&oacute;stico, y para autoevaluaci&oacute;n. Su validez para ex&aacute;menes con un n&uacute;mero alto de reactivos est&aacute; ampliamente documentada (Russell y Haney, 1997; Wolfson <i>et al, </i>2001). Sus principales desventajas se refieren a la alteraci&oacute;n emocional (ansiedad) que genera este tipo de ex&aacute;menes en los alumnos no familiarizados con el manejo de la computadora (Olea <i>et al, </i>2000), y a los costos de operaci&oacute;n (Booth, 1998). Tambi&eacute;n es importante tener en cuenta que la implementaci&oacute;n de las evaluaciones computarizadas es dif&iacute;cil y prolongada (Cantillon <i>et al, </i>2004); asimismo, que se requieren medidas especiales de vigilancia y seguridad. Entre ellas, cuando el mismo examen se aplica a varios estudiantes, el uso de pantallas opacas o distribuci&oacute;n al azar del orden de los reactivos. Si la evaluaci&oacute;n es en l&iacute;nea (Internet), el examen debe efectuarse en un ambiente donde el acceso a las fuentes de informaci&oacute;n y al correo electr&oacute;nico est&eacute; controlado.</font></p>     <p align="justify"><font face="verdana" size="2">Para los ex&aacute;menes computarizados se utilizan los formatos de reactivos de opci&oacute;n m&uacute;ltiple previamente descritos; adem&aacute;s, los avances tecnol&oacute;gicos han impulsado el desarrollo de otros formatos m&aacute;s sofisticados, muchos de ellos interactivos, con los cuales se pretende mejorar la calidad de la evaluaci&oacute;n y aumentar la eficiencia de los procedimientos tradicionales. Huff y Sireci (2001) y Zemsky y Sireci (2002), refieren un total de 21 formatos diferentes, entre los que destacan los de selecci&oacute;n y colocaci&oacute;n, de an&aacute;lisis de casos breves, y los de soluci&oacute;n secuencial de problemas. Tambi&eacute;n se han descrito formatos para evaluar el desempe&ntilde;o t&eacute;cnico, como habilidades quir&uacute;rgicas b&aacute;sicas (Datta <i>et al, </i>2002).</font></p>     <p align="justify"><font face="verdana" size="2">Por sus caracter&iacute;sticas, conviene destacar los ex&aacute;menes computarizados adaptativos (CATs, por sus siglas en ingl&eacute;s), tambi&eacute;n denominados tests adaptativos informatizados (TAIs). Se trata de una forma especial de examen "a la medida" (Kreiter <i>et al, </i>1999; Ponsoda, 2000; Roex y Degryse, 2004; Gershon, 2005), cuyo objetivo b&aacute;sico es seleccionar el grupo de reactivos que mejor informa sobre el nivel de preparaci&oacute;n de cada examinando (examen personalizado). El CAT se deriva de las pruebas adaptativas desarrolladas en 1905 por Bidet y Simon (citado por Weiss, 2004) y sus m&eacute;todos est&aacute;n basados en la Teor&iacute;a de Respuesta al Item (TRI); teor&iacute;a estad&iacute;stica que genera en una serie modelos matem&aacute;ticos que permiten estimar la probabilidad de una respuesta particular, en una escala de &iacute;tems, como funci&oacute;n de los atributos del examinando y ciertas caracter&iacute;sticas (par&aacute;metros) del &iacute;tem (Lord y Novick, 1968; Green <i>et al, </i>1984; Wise y Kingsbury, 2000). Ello implica que la probabilidad de que un examinando responda correctamente ante un &iacute;tem dado depende b&aacute;sicamente de los conocimientos y habilidades del examinando. Adem&aacute;s, el principio invariable de la TRI facilita la generaci&oacute;n de diferentes grupos de reactivos para diferentes examinandos y la estimaci&oacute;n de su nivel de preparaci&oacute;n en la misma escala de medici&oacute;n, lo cual permite comparar los puntajes de estudiantes que presentaron examen con diferentes juegos de reactivos obtenidos del mismo banco (Chang y Reeve, 2005). Los elementos b&aacute;sicos del CAT son dos: a) un banco robusto (2000 para una licenciatura) de reactivos calibrados; y b) los algoritmos interactivos necesarios para presentar un reactivo, estimar el nivel de aprovechamiento del examinando bas&aacute;ndose en la respuesta al &iacute;tem previo, seleccionar del banco el siguiente mejor &iacute;tem, y as&iacute; sucesivamente hasta que se alcance una condici&oacute;n predeterminada para el examen (error est&aacute;ndar m&iacute;nimo, contenido, m&aacute;ximo de &iacute;tems) y para determinar cu&aacute;ndo se debe terminar la prueba de cada examinando (Wise y Kingsbury, 2000; Chang y Reeve, 2005).</font></p>     <p align="justify"><font face="verdana" size="2">De manera pr&aacute;ctica, se puede se&ntilde;alar que el CAT opera y utiliza el principio de que los reactivos demasiado f&aacute;ciles o demasiado dif&iacute;ciles para un estudiante contribuyen muy poco para conocer el nivel acad&eacute;mico real de ese estudiante (Green <i>et al, </i>1984). As&iacute;, una vez que el examinando ingresa al CAT, el sistema revisa los antecedentes del estudiante (haber tomado previamente el examen, nivel de estudios) y, con base en ello, selecciona el primer reactivo; si no hay antecedentes, el sistema selecciona el primer reactivo en funci&oacute;n de un nivel preestablecido (medio). Una vez que se emite la primera respuesta, y en conjunci&oacute;n con las especificaciones iniciales del examen, un algoritmo selecciona el mejor reactivo disponible para continuar el examen de ese estudiante. En cada ocasi&oacute;n que se emite una respuesta, &eacute;sta es calificada inmediatamente y el programa decide el grado de dificultad y discriminaci&oacute;n del siguiente reactivo. Si el estudiante responde correctamente, los reactivos subsecuentes son m&aacute;s dif&iacute;ciles, mientras que las respuestas incorrectas conducen a reactivos cada vez m&aacute;s f&aacute;ciles. De esta manera, los reactivos que est&aacute;n m&aacute;s all&aacute; del nivel de conocimientos del estudiante (demasiado f&aacute;ciles o dif&iacute;ciles) son evitados; lo que personaliza el examen.</font></p>     <p align="justify"><font face="verdana" size="2">Con este procedimiento, el n&uacute;mero de reactivos (y tiempo) necesario para evaluar el nivel de aprovechamiento del estudiante es considerablemente menor que el requerido en ex&aacute;menes escritos (Krieter <i>et al, </i>1999). Esta ventaja es particularmente atractiva para ex&aacute;menes muy extensos, ya que en este caso el problema principal que enfrenta el examinando es la fatiga (por ejemplo, examen de ingreso a las residencias m&eacute;dicas, constituido habitualmente por 700 reactivos). Adem&aacute;s, este tipo de ex&aacute;menes parece reducir la angustia y frustraci&oacute;n de los examinandos (Olea <i>et al, </i>2000). En todo caso, la calidad de este tipo de ex&aacute;menes depende de la disponibilidad de un banco de reactivos bien construidos, pertinentes (v&aacute;lidos), y calibrados. M&aacute;s que una colecci&oacute;n de reactivos, los bancos para CATs deben contener &iacute;tems que desarrollen, definan y cuantifiquen un tema com&uacute;n, con ello se proporciona una definici&oacute;n operativa de sus caracter&iacute;sticas (Green <i>et al, </i>1984).</font></p>     <p align="justify"><font face="verdana" size="2">Por otra parte, este sistema de evaluaci&oacute;n no est&aacute; libre de problemas y riesgos. Por ejemplo, el empleo de criterios estad&iacute;sticos para la selecci&oacute;n de los reactivos no asegura una prueba con contenidos totalmente v&aacute;lidos (Hambleton <i>et al, </i>1991). Asimismo, y por las caracter&iacute;sticas del sistema, algunos reactivos se utilizan de manera repetitiva (alta exposici&oacute;n), mientras que otros son ocasionalmente seleccionados o nunca tocados por el algoritmo correspondiente; ello altera el nivel de discriminaci&oacute;n (Chang y Van der Linden, 2003). Tambi&eacute;n debe tomarse en cuenta que este sistema es muy vulnerable cuando est&aacute; en l&iacute;nea (Internet) y que requiere de medidas adicionales de vigilancia y seguridad (Wise y Kingsbury, 2000). Los reactivos pueden ser extra&iacute;dos por el sustentante del examen y compartidos con futuros examinandos. Asimismo, las medidas de seguridad del banco de reactivos pueden ser vulneradas por personas u organizaciones <i>(hackers) </i>ilegalmente interesadas en el banco. La seguridad de la informaci&oacute;n en el Internet es siempre cuestionable; ello debilita seriamente el valor del sistema en l&iacute;nea para la toma de decisiones importantes (Butcher <i>et al, </i>2004).</font></p>     <p align="justify"><font face="verdana" size="2">Se puede concluir que los programas computarizados adaptables ofrecen una alternativa de evaluaci&oacute;n muy interesante, que merece atenci&oacute;n y estudios especiales. Aun cuando ya se les utiliza en ex&aacute;menes de grado y de certificaci&oacute;n (Roex y Degryse, 2004; Bergstrom y Lunz, 1999), su verdadera utilidad en las evaluaciones formales del conocimiento m&eacute;dico est&aacute; por determinarse.</font></p>     <p align="justify"><font face="verdana" size="2">Finalmente, se puede agregar que los resultados de nuestra b&uacute;squeda bibliogr&aacute;fica revelan que los ex&aacute;menes computarizados no se utilizan&nbsp;formalmente en nuestras escuelas de medicina. Asimismo, que se ha puesto en marcha un que permite la selecci&oacute;n al azar de los reactivos proyecto piloto (experimental) que pretende establecer, en nuestro medio, las ventajas y desventajas del uso de las computadoras en la&nbsp;evaluaci&oacute;n del aprendizaje de los alumnos de medicina. Su desarrollo est&aacute; planeado en varias etapas. La primera de ellas, ya terminada, y la m&aacute;s&nbsp;costosa en tiempo, se refiere a la elaboraci&oacute;n de un banco de reactivos &uacute;tiles (clasificados y calificados) y al dise&ntilde;o de un programa de c&oacute;mputo que permite la selecci&oacute;n al azar de los reactivos del banco y la elaboraci&oacute;n y aplicaci&oacute;n simult&aacute;nea de ex&aacute;menes diferentes. En su segunda etapa (en&nbsp;proceso), este proyecto s&oacute;lo contempla una de las asignaturas b&aacute;sicas en la tercera fase, el estudio se extender&aacute;, tambi&eacute;n de manera experimental,&nbsp;a otras asignaturas precl&iacute;nicas y a las asignaturas&nbsp;cl&iacute;nicas. Si los resultados de este proyecto son satisfactorios, se puede considerar la pertinencia de los ex&aacute;menes computarizados en otro tipo de evaluaciones (ex&aacute;menes profesionales, de ingreso a las residencias m&eacute;dicas, de certificaci&oacute;n).</font></p>     ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&nbsp;</font></p>     <p align="justify"><font face="verdana" size="2"><b>Referencias</b></font></p>     <!-- ref --><p align="justify"><font face="verdana" size="2">Aeschlimann, A. <i>et al. </i>(2001). "Multiple choice question quiz: a valid test for needs assessment in CME in rheumatology and for self assessment", <i>en Ann Rheumatol Dis, </i>60.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819559&pid=S0185-2760200800030000300001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Anderson, J. (1979). "For multiple choice questions", en <i>Med Teach, </i>1.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819560&pid=S0185-2760200800030000300002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Anderson,J. (2004). "Multiple&#150;choice questions revisited", <i>en Med Teach, </i>26.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819561&pid=S0185-2760200800030000300003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Barman, A. (2005). "Critiques on the Objective Structured Clinical Examination", en <i>Ann Acad Med, </i>Singapore, 34.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819562&pid=S0185-2760200800030000300004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Bergstrom, B. A. &amp; M. E. Lunz (1999). "CAT for certification and licensure", en F. Drasgow &amp; J. B. Olson&#150;Buchanan (Eds.), <i>Innovations in Computarized Assessment. </i>Hillsdate, N.J., Lawrence Erlbaum.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819563&pid=S0185-2760200800030000300005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Beullens J, <i>et al. </i>(2002). "Are extended&#150;matching multiple&#150;choice items appropriate for a final test in medical education?", en <i>Med Teach, </i>24.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819564&pid=S0185-2760200800030000300006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Beullens, J. <i>et al. </i>(2005). "Do extended matching multiple&#150;choice questions measure clinical reasoning?", en <i>Med Educ, </i>39.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819565&pid=S0185-2760200800030000300007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Booth, J. F. (1998). "Guest Editorial: Uses of PC technology in selection and assessment", en <i>Int J Selec Assess, </i>6.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819566&pid=S0185-2760200800030000300008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Butcher, J. N. <i>et al. </i>(2004). "Computers in clinical assessment: historical developments, present status, and future challenges", en J <i>Clin Psychol, </i>60.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819567&pid=S0185-2760200800030000300009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Cantillon, P. <i>et al. </i>(2004). "Using computers for assessment in medicine", en <i>Brit Med J, </i>329.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819568&pid=S0185-2760200800030000300010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Carr, S. J. (2004). "Assessing clinical competency in medical senior house officers: how and why should we do it?", en <i>Postgrad Med J, </i>80.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819569&pid=S0185-2760200800030000300011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Coderre, S. P. <i>et al. </i>(2004). "The impact of two&#150;choice formats on the problem solving strategies used by novices and experts", en <i>BMC Med Educ, </i>4.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819570&pid=S0185-2760200800030000300012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Collins, J. P. &amp; G. D. Gamble (1996). "A multi&#150;format interdisciplinary final examination", en <i>Med Educ, </i>30.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819571&pid=S0185-2760200800030000300013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Collins, J. P. (2006). "Educational techniques for lifelong learning: writing multiple&#150;choice questions for continuing medical education activities and self&#150;assessment modules", en <i>Radiographics, </i>26.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819572&pid=S0185-2760200800030000300014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Chang, H. H. &amp; W. J. van der Linden (2003). "Optimal stratification of Item pools in alpha&#150;stratified computerized adaptive testing", en <i>Appl Psychol Meas, </i>27.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819573&pid=S0185-2760200800030000300015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Chang, C.H. &amp; B.B. Reeve (2005). "Item response theory and its application to patient&#150;reported outcomes measurement", en <i>Eval Health Prof, </i>28.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819574&pid=S0185-2760200800030000300016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Darling&#150;Hammond, L. &amp; A. Lieberman (1992). "The shortcomings of standardized tests", en <i>Chron Higher Educ, </i>29.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819575&pid=S0185-2760200800030000300017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Datta, Y <i>et al </i>(2002). "The relationship between motion analysis and surgical technical assessments", en <i>Am J Surg, </i>184.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819576&pid=S0185-2760200800030000300018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Davis, M. H. (2003) "OSCE: the Dundee experience", en <i>Med Teach, </i>25.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819577&pid=S0185-2760200800030000300019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Doull,J. &amp; E. J. Walaszek (1978). "The use of computer&#150;assisted teaching systems (CATS) in pharmacology", en E. C. DeLand (Ed.), <i>Information Technology in Health Science Education (CATS), </i>New York, Plenum Pub Corp.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819578&pid=S0185-2760200800030000300020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Epstein, R. M. &amp; E. M. Hundert (2002). "Defining and assessing professional competence", en <i>J Am Med Assoc, </i>287.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819579&pid=S0185-2760200800030000300021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Epstein, R. M. (2007). "Assessment in medical education", en <i>New Engl J Med, </i>356.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819580&pid=S0185-2760200800030000300022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Friedman Ben&#150;David, M. <i>et al. </i>(2001). "AMEE medical education guide No. 24: portfolios as a method of student assessment", en <i>Med Teach, </i>23.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819581&pid=S0185-2760200800030000300023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Garcia, R. <i>et al. </i>(2006). "Elaboraci&oacute;n de &iacute;tems objetivos" en Casta&ntilde;eda S. (Coord.). <i>Evaluaci&oacute;n de aprendizaje universitario. Elaboraci&oacute;n de ex&aacute;menes y reactivos, </i>M&eacute;xico, Universidad Nacional Aut&oacute;noma de M&eacute;xico.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819582&pid=S0185-2760200800030000300024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Gershon, R. C. (2005). "Understanding rasch measurement: computer adaptive testing", en <i>J Appl Meas, </i>6.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819583&pid=S0185-2760200800030000300025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Glaser, R. (1984). "Education and thinking: the role of knowledge", en <i>Amer Psychol, </i>19.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819584&pid=S0185-2760200800030000300026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Green, B. F. <i>et al. </i>(1984). "Technical guidelines for assessing computerized adaptive tests", en J <i>Educ Meas, </i>21.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819585&pid=S0185-2760200800030000300027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Greenhalgh, T. (2006). "Computer assisted learning in undergraduate medical education", <i>Brit Med J, </i>322.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819586&pid=S0185-2760200800030000300028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Hambleton, R.K. <i>et al. </i>(1991). <i>Fundamentals of item response theory, </i>Newbury Park, CA, Sage.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819587&pid=S0185-2760200800030000300029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Harden, R. M. &amp; F. A. Gleeson (1979). "Assessment of clinical competence using an objective structured clinical examination (OSCE)", en <i>Med Educ, </i>13.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819588&pid=S0185-2760200800030000300030&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Huff, K. L. &amp; S. G. Sireci (2001). "Validity issues in computer&#150;based testing", en <i>Educ Meas: Issues and Practice, </i>20.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819589&pid=S0185-2760200800030000300031&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Hull, A. L. <i>et al </i>(1995). "Validity of three clinical performance assessments of internal medicine clerks", <i>Acad Med, </i>70.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819590&pid=S0185-2760200800030000300032&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Kelley, R R. Jr, <i>et al. </i>(1971). "Analysis of the oral examination of the American Board of Anesthesiology", <i>en J Med Educ, </i>46.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819591&pid=S0185-2760200800030000300033&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Kreiter, C. D. <i>et al. </i>(1999). "Evaluating the usefulness of computerized adaptive testing for medical in&#150;course assessment", en <i>Acad Med, </i>74.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819592&pid=S0185-2760200800030000300034&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Lim, E. C. H. <i>et al (2006). </i>"Computer&#150;based versus pen&#150;and&#150;pencil testing: students' perception", en <i>Ann Acad Med, Singapore, </i>35.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819593&pid=S0185-2760200800030000300035&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Lord, F. M. &amp; M. R. Novick (1968). <i>Statistical theory of mental test scores, </i>Reading, MA, Adisson&#150;Wesley.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819594&pid=S0185-2760200800030000300036&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Maguire, T. <i>et al. </i>(1992). "Setting standards for multiple choice items in clinical reasoning", en <i>Eval Health Prof, </i>15.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819595&pid=S0185-2760200800030000300037&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">McCoubrie, P. (2004). "Improving the fairness of multiple&#150;choice questions: a literature review", en <i>Med Teach, </i>26.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819596&pid=S0185-2760200800030000300038&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Mooney, G. A. <i>et al. </i>(1998). "Some techniques for computer&#150;based assessment in medical education", en <i>Med Teach, </i>20.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819597&pid=S0185-2760200800030000300039&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Newble, D. <i>et al. </i>(1979). "A comparison of multiple&#150;choice questions and free&#150;response tests in examination of clinical competence", en <i>Med Educ, </i>13.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819598&pid=S0185-2760200800030000300040&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Norcini, J. J. <i>et al. </i>(1985). "Reliability, validity and efficiency of m&uacute;ltiple choice questions and patient management problem items formats in assessment of clinical competence", <i>en Med Educ, </i>19.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819599&pid=S0185-2760200800030000300041&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Olea, J. <i>et al. </i>(2000). "Psychometric and psychological effects of review on computerized fixed and adaptive tests", en <i>Psicol&oacute;gica, </i>21.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819600&pid=S0185-2760200800030000300042&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Palmer, E. &amp; R Devitt (2006). "Constructing multiple choice questions as a method for learning", en <i>Ann Acad Med, </i>Singapore, 35.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819601&pid=S0185-2760200800030000300043&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Petrusa, E. R. <i>et al. </i>(1987). "An objective measure of clinical performance", en <i>Am J Med, </i>83.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819602&pid=S0185-2760200800030000300044&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Pololi, L. H. (1995). "Standardised patients: as we evaluate, so shall we reap", en <i>Lancet, </i>25.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819603&pid=S0185-2760200800030000300045&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Ponsoda, <i>V. </i>(2000). "Overview of the computerized adaptive testing special section", en <i>Psicol&oacute;gica, </i>21.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819604&pid=S0185-2760200800030000300046&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Reddy, S. &amp; S. Vijayakumar (2000). "Evaluating clinical skills of radiation oncology residents: parts I and II", en <i>Int J Cancer, </i>90.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819605&pid=S0185-2760200800030000300047&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Roex, A. &amp; J. Degryse (2004). "A computerized adaptive knowledge test as an assessment tool in general practice", en <i>Med Teach, </i>26.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819606&pid=S0185-2760200800030000300048&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Russell, M. &amp; W. Haney (1997). "Testing writing on computers: an experiment comparing student performance on tests conducted via computer and via paper&#150;and pencil", en <i>Educ Pol Anal Arch, </i>5.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819607&pid=S0185-2760200800030000300049&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Schafer, W. D. <i>et al. </i>(2005). "Resistance to confounding style and content in scoring constructed&#150;response items", en <i>Educ Meas: Issues and Practice, </i>24.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819608&pid=S0185-2760200800030000300050&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Schwartz, R. W. <i>et al. </i>(1992). "Undergraduate surgical education for the twenty&#150;first century", en <i>Ann Surg, </i>216.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819609&pid=S0185-2760200800030000300051&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Schwartz, R. W. <i>et al. </i>(1994). "Assessing senior residents' knowledge and performance: an integrated evaluation program", en <i>Surgery, </i>116.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819610&pid=S0185-2760200800030000300052&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Schuwirth, L.W.T. &amp; C. R M. van der Vleuten (2004). "Different written assessment methods: what can be said about their strengths and weakness?", en <i>Med Educ, </i>38.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819611&pid=S0185-2760200800030000300053&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Skakun, E. <i>et al. </i>(1994). "Strategy choices in multiple&#150;choice items", en Acad Med, Supl 10.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819612&pid=S0185-2760200800030000300054&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Sloan, D. A. <i>et al. </i>(1995). "The Objective Structured Clinical Examination. The new gold standard for evaluating postgraduate clinical performance", en <i>Ann Surg, </i>222.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819613&pid=S0185-2760200800030000300055&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Smee, S. (2003). "ABC of learning and teaching in medicine: skill based assessment", en <i>Brit Med J, </i>29.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819614&pid=S0185-2760200800030000300056&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Southgate, L. (1999). "Professional competence in medicine", en <i>Hosp Med, </i>60.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819615&pid=S0185-2760200800030000300057&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Swets, J. A. &amp; W. Feurzeig (1965). "Computer&#150;aided instruction", en <i>Science, </i>15.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819616&pid=S0185-2760200800030000300058&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Tamblyn, R. M. <i>et al. </i>(1991). "The accuracy of standardized patient presentations", <i>en Med Educ, </i>25.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819617&pid=S0185-2760200800030000300059&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Van der Vleuten, C. P. M. &amp; D. I. Newble (1995) "How can we test clinical reasoning?", en <i>Lancet, </i>345.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819618&pid=S0185-2760200800030000300060&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Van der Vleuten, C. R M. &amp; L. W. T. Schuwirth (2005). "Assessing professional competence: from methods to programmes", en <i>Med Educ, </i>39.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819619&pid=S0185-2760200800030000300061&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Viniegra, L. (1979). "Ex&aacute;menes de opci&oacute;n m&uacute;ltiple", en <i>Gac Med Mex, </i>115.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819620&pid=S0185-2760200800030000300062&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Vrabel, M. (2004). "Computarized versus paper&#150;and&#150;pencil testing methods for a nursing certification examination: a review of the literature", en <i>Comput Inform Nurs, </i>22.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819621&pid=S0185-2760200800030000300063&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Wass, V. <i>et al. </i>(2001a). "Assessment of clinical competence", en <i>Lancet, </i>357.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819622&pid=S0185-2760200800030000300064&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Wass, V. <i>et al. </i>(2001b). "Composite undergraduate clinical examinations: how should the components be combined to maximize reliability?", en <i>Med Educ, </i>35.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819623&pid=S0185-2760200800030000300065&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Weiss, D. J. (2004). "Computarized adaptive testing for effective and efficient measurement in counseling and education", en <i>Meas Eval Counsel Dev, </i>37.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819624&pid=S0185-2760200800030000300066&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Williams, R. G. <i>et al. </i>(1987). "Direct, standardized assessment of clinical competence", en <i>Med Educ, </i>21.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819625&pid=S0185-2760200800030000300067&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Wise, S. L. &amp; G. G. Kingsbury (2000). "Practical issues in developing and maintaining a computerized adaptive testing program", en <i>Psicol&oacute;gica, </i>21.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819626&pid=S0185-2760200800030000300068&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Wolfson, R J. <i>et al. </i>(2001). "Administration of open&#150;ended test questions by computer in a clerkship final examination", en <i>Acad Med, </i>76.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819627&pid=S0185-2760200800030000300069&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --><!-- ref --><p align="justify"><font face="verdana" size="2">Zenisky, A. L. &amp; S. G. Sireci (2002). "Technological innovations in large&#150;scale assessment", en <i>Appl Meas Educ, </i>15.</font>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=6819628&pid=S0185-2760200800030000300070&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --> ]]></body><back>
<ref-list>
<ref id="B1">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Aeschlimann]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Multiple choice question quiz: a valid test for needs assessment in CME in rheumatology and for self assessment]]></article-title>
<source><![CDATA[Ann Rheumatol Dis]]></source>
<year>2001</year>
<volume>60</volume>
</nlm-citation>
</ref>
<ref id="B2">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Anderson]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[For multiple choice questions]]></article-title>
<source><![CDATA[Med Teach]]></source>
<year>1979</year>
<volume>1</volume>
</nlm-citation>
</ref>
<ref id="B3">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Anderson]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Multiple-choice questions revisited]]></article-title>
<source><![CDATA[Med Teach]]></source>
<year>2004</year>
<volume>26</volume>
</nlm-citation>
</ref>
<ref id="B4">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Barman]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Critiques on the Objective Structured Clinical Examination]]></article-title>
<source><![CDATA[Ann Acad Med]]></source>
<year>2005</year>
<volume>34</volume>
<publisher-loc><![CDATA[Singapore ]]></publisher-loc>
</nlm-citation>
</ref>
<ref id="B5">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bergstrom]]></surname>
<given-names><![CDATA[B. A.]]></given-names>
</name>
<name>
<surname><![CDATA[Lunz]]></surname>
<given-names><![CDATA[M. E.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[CAT for certification and licensure]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Drasgow]]></surname>
<given-names><![CDATA[F.]]></given-names>
</name>
<name>
<surname><![CDATA[Olson-Buchanan]]></surname>
<given-names><![CDATA[J. B.]]></given-names>
</name>
</person-group>
<source><![CDATA[Innovations in Computarized Assessment]]></source>
<year>1999</year>
<publisher-loc><![CDATA[^eN.J. N.J.]]></publisher-loc>
<publisher-name><![CDATA[Lawrence Erlbaum]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Beullens]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Are extended-matching multiple-choice items appropriate for a final test in medical education?]]></article-title>
<source><![CDATA[Med Teach]]></source>
<year>2002</year>
<volume>24</volume>
</nlm-citation>
</ref>
<ref id="B7">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Beullens]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Do extended matching multiple-choice questions measure clinical reasoning?]]></article-title>
<source><![CDATA[Med Educ]]></source>
<year>2005</year>
<volume>39</volume>
</nlm-citation>
</ref>
<ref id="B8">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Booth]]></surname>
<given-names><![CDATA[J. F.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Guest Editorial: Uses of PC technology in selection and assessment]]></article-title>
<source><![CDATA[Int J Selec Assess]]></source>
<year>1998</year>
<volume>6</volume>
</nlm-citation>
</ref>
<ref id="B9">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Butcher]]></surname>
<given-names><![CDATA[J. N.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Computers in clinical assessment: historical developments, present status, and future challenges]]></article-title>
<source><![CDATA[J Clin Psychol]]></source>
<year>2004</year>
<volume>60</volume>
</nlm-citation>
</ref>
<ref id="B10">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cantillon]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Using computers for assessment in medicine]]></article-title>
<source><![CDATA[Brit Med J]]></source>
<year>2004</year>
<volume>329</volume>
</nlm-citation>
</ref>
<ref id="B11">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Carr]]></surname>
<given-names><![CDATA[S. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Assessing clinical competency in medical senior house officers: how and why should we do it?]]></article-title>
<source><![CDATA[Postgrad Med J]]></source>
<year>2004</year>
<volume>80</volume>
</nlm-citation>
</ref>
<ref id="B12">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Coderre]]></surname>
<given-names><![CDATA[S. P.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The impact of two-choice formats on the problem solving strategies used by novices and experts]]></article-title>
<source><![CDATA[BMC Med Educ]]></source>
<year>2004</year>
<volume>4</volume>
</nlm-citation>
</ref>
<ref id="B13">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Collins]]></surname>
<given-names><![CDATA[J. P.]]></given-names>
</name>
<name>
<surname><![CDATA[Gamble]]></surname>
<given-names><![CDATA[G. D.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A multi-format interdisciplinary final examination]]></article-title>
<source><![CDATA[Med Educ]]></source>
<year>1996</year>
<volume>30</volume>
</nlm-citation>
</ref>
<ref id="B14">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Collins]]></surname>
<given-names><![CDATA[J. P.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Educational techniques for lifelong learning: writing multiple-choice questions for continuing medical education activities and self-assessment modules]]></article-title>
<source><![CDATA[Radiographics]]></source>
<year>2006</year>
<volume>26</volume>
</nlm-citation>
</ref>
<ref id="B15">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chang]]></surname>
<given-names><![CDATA[H. H.]]></given-names>
</name>
<name>
<surname><![CDATA[van der Linden]]></surname>
<given-names><![CDATA[W. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Optimal stratification of Item pools in alpha-stratified computerized adaptive testing]]></article-title>
<source><![CDATA[Appl Psychol Meas]]></source>
<year>2003</year>
<volume>27</volume>
</nlm-citation>
</ref>
<ref id="B16">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Chang]]></surname>
<given-names><![CDATA[C.H.]]></given-names>
</name>
<name>
<surname><![CDATA[Reeve]]></surname>
<given-names><![CDATA[B.B.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Item response theory and its application to patient-reported outcomes measurement]]></article-title>
<source><![CDATA[Eval Health Prof]]></source>
<year>2005</year>
<volume>28</volume>
</nlm-citation>
</ref>
<ref id="B17">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Darling-Hammond]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
<name>
<surname><![CDATA[Lieberman]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The shortcomings of standardized tests]]></article-title>
<source><![CDATA[Chron Higher Educ]]></source>
<year>1992</year>
<volume>29</volume>
</nlm-citation>
</ref>
<ref id="B18">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Datta]]></surname>
<given-names><![CDATA[Y]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The relationship between motion analysis and surgical technical assessments]]></article-title>
<source><![CDATA[Am J Surg]]></source>
<year>2002</year>
<volume>184</volume>
</nlm-citation>
</ref>
<ref id="B19">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Davis]]></surname>
<given-names><![CDATA[M. H.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[OSCE: the Dundee experience]]></article-title>
<source><![CDATA[Med Teach]]></source>
<year>2003</year>
<volume>25</volume>
</nlm-citation>
</ref>
<ref id="B20">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Doull]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
<name>
<surname><![CDATA[Walaszek]]></surname>
<given-names><![CDATA[E. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The use of computer-assisted teaching systems (CATS) in pharmacology]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[DeLand]]></surname>
<given-names><![CDATA[E. C.]]></given-names>
</name>
</person-group>
<source><![CDATA[Information Technology in Health Science Education (CATS)]]></source>
<year>1978</year>
<publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[Plenum Pub Corp]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B21">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Epstein]]></surname>
<given-names><![CDATA[R. M.]]></given-names>
</name>
<name>
<surname><![CDATA[Hundert]]></surname>
<given-names><![CDATA[E. M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Defining and assessing professional competence]]></article-title>
<source><![CDATA[J Am Med Assoc]]></source>
<year>2002</year>
<volume>287</volume>
</nlm-citation>
</ref>
<ref id="B22">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Epstein]]></surname>
<given-names><![CDATA[R. M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Assessment in medical education]]></article-title>
<source><![CDATA[New Engl J Med]]></source>
<year>2007</year>
<volume>356</volume>
</nlm-citation>
</ref>
<ref id="B23">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Friedman]]></surname>
<given-names><![CDATA[Ben-David, M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[AMEE medical education guide No. 24: portfolios as a method of student assessment]]></article-title>
<source><![CDATA[Med Teach]]></source>
<year>2001</year>
<volume>23</volume>
</nlm-citation>
</ref>
<ref id="B24">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Garcia]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Elaboración de ítems objetivos]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Castañeda]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<source><![CDATA[Evaluación de aprendizaje universitario: Elaboración de exámenes y reactivos]]></source>
<year>2006</year>
<publisher-name><![CDATA[Universidad Nacional Autónoma de México]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B25">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Gershon]]></surname>
<given-names><![CDATA[R. C.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Understanding rasch measurement: computer adaptive testing]]></article-title>
<source><![CDATA[J Appl Meas]]></source>
<year>2005</year>
<volume>6</volume>
</nlm-citation>
</ref>
<ref id="B26">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Glaser]]></surname>
<given-names><![CDATA[R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Education and thinking: the role of knowledge]]></article-title>
<source><![CDATA[Amer Psychol]]></source>
<year>1984</year>
<volume>19</volume>
</nlm-citation>
</ref>
<ref id="B27">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Green]]></surname>
<given-names><![CDATA[B. F.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Technical guidelines for assessing computerized adaptive tests]]></article-title>
<source><![CDATA[J Educ Meas]]></source>
<year>1984</year>
<volume>21</volume>
</nlm-citation>
</ref>
<ref id="B28">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Greenhalgh]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Computer assisted learning in undergraduate medical education]]></article-title>
<source><![CDATA[Brit Med J]]></source>
<year>2006</year>
<volume>322</volume>
</nlm-citation>
</ref>
<ref id="B29">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hambleton]]></surname>
<given-names><![CDATA[R.K.]]></given-names>
</name>
</person-group>
<source><![CDATA[Fundamentals of item response theory]]></source>
<year>1991</year>
<publisher-loc><![CDATA[^eCA CA]]></publisher-loc>
<publisher-name><![CDATA[Sage]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B30">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Harden]]></surname>
<given-names><![CDATA[R. M.]]></given-names>
</name>
<name>
<surname><![CDATA[Gleeson]]></surname>
<given-names><![CDATA[F. A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Assessment of clinical competence using an objective structured clinical examination (OSCE)]]></article-title>
<source><![CDATA[Med Educ]]></source>
<year>1979</year>
<volume>13</volume>
</nlm-citation>
</ref>
<ref id="B31">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Huff]]></surname>
<given-names><![CDATA[K. L.]]></given-names>
</name>
<name>
<surname><![CDATA[Sireci]]></surname>
<given-names><![CDATA[S. G.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Validity issues in computer-based testing]]></article-title>
<source><![CDATA[Educ Meas: Issues and Practice]]></source>
<year>2001</year>
<volume>20</volume>
</nlm-citation>
</ref>
<ref id="B32">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Hull]]></surname>
<given-names><![CDATA[A. L.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Validity of three clinical performance assessments of internal medicine clerks]]></article-title>
<source><![CDATA[Acad Med]]></source>
<year>1995</year>
<volume>70</volume>
</nlm-citation>
</ref>
<ref id="B33">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kelley]]></surname>
<given-names><![CDATA[R R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Analysis of the oral examination of the American Board of Anesthesiology]]></article-title>
<source><![CDATA[J Med Educ]]></source>
<year>1971</year>
<volume>46</volume>
</nlm-citation>
</ref>
<ref id="B34">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Kreiter]]></surname>
<given-names><![CDATA[C. D.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Evaluating the usefulness of computerized adaptive testing for medical in-course assessment]]></article-title>
<source><![CDATA[Acad Med]]></source>
<year>1999</year>
<volume>74</volume>
</nlm-citation>
</ref>
<ref id="B35">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lim]]></surname>
<given-names><![CDATA[E. C. H.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Computer-based versus pen-and-pencil testing: students' perception]]></article-title>
<source><![CDATA[Ann Acad Med]]></source>
<year>2006</year>
</nlm-citation>
</ref>
<ref id="B36">
<nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Lord]]></surname>
<given-names><![CDATA[F. M.]]></given-names>
</name>
<name>
<surname><![CDATA[Novick]]></surname>
<given-names><![CDATA[M. R.]]></given-names>
</name>
</person-group>
<source><![CDATA[Statistical theory of mental test scores]]></source>
<year>1968</year>
<publisher-loc><![CDATA[MA ]]></publisher-loc>
<publisher-name><![CDATA[Adisson-Wesley]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B37">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Maguire]]></surname>
<given-names><![CDATA[T.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Setting standards for multiple choice items in clinical reasoning]]></article-title>
<source><![CDATA[Eval Health Prof]]></source>
<year>1992</year>
<volume>15</volume>
</nlm-citation>
</ref>
<ref id="B38">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McCoubrie]]></surname>
<given-names><![CDATA[P.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Improving the fairness of multiple-choice questions: a literature review]]></article-title>
<source><![CDATA[Med Teach]]></source>
<year>2004</year>
<volume>26</volume>
</nlm-citation>
</ref>
<ref id="B39">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Mooney]]></surname>
<given-names><![CDATA[G. A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Some techniques for computer-based assessment in medical education]]></article-title>
<source><![CDATA[Med Teach]]></source>
<year>1998</year>
<volume>20</volume>
</nlm-citation>
</ref>
<ref id="B40">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Newble]]></surname>
<given-names><![CDATA[D.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A comparison of multiple-choice questions and free-response tests in examination of clinical competence]]></article-title>
<source><![CDATA[Med Educ]]></source>
<year>1979</year>
<volume>13</volume>
</nlm-citation>
</ref>
<ref id="B41">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Norcini]]></surname>
<given-names><![CDATA[J. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Reliability, validity and efficiency of múltiple choice questions and patient management problem items formats in assessment of clinical competence]]></article-title>
<source><![CDATA[Med Educ]]></source>
<year>1985</year>
<volume>19</volume>
</nlm-citation>
</ref>
<ref id="B42">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Olea]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Psychometric and psychological effects of review on computerized fixed and adaptive tests]]></article-title>
<source><![CDATA[Psicológica]]></source>
<year>2000</year>
<volume>21</volume>
</nlm-citation>
</ref>
<ref id="B43">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Palmer]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
<name>
<surname><![CDATA[Devitt]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Constructing multiple choice questions as a method for learning]]></article-title>
<source><![CDATA[Ann Acad Med]]></source>
<year>2006</year>
<volume>35</volume>
</nlm-citation>
</ref>
<ref id="B44">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Petrusa]]></surname>
<given-names><![CDATA[E. R.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An objective measure of clinical performance]]></article-title>
<source><![CDATA[Am J Med]]></source>
<year>1987</year>
<volume>83</volume>
</nlm-citation>
</ref>
<ref id="B45">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Pololi]]></surname>
<given-names><![CDATA[L. H.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Standardised patients: as we evaluate, so shall we reap]]></article-title>
<source><![CDATA[Lancet]]></source>
<year>1995</year>
<volume>25</volume>
</nlm-citation>
</ref>
<ref id="B46">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Ponsoda]]></surname>
<given-names><![CDATA[V.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Overview of the computerized adaptive testing special section]]></article-title>
<source><![CDATA[Psicológica]]></source>
<year>2000</year>
<volume>21</volume>
</nlm-citation>
</ref>
<ref id="B47">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Reddy]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
<name>
<surname><![CDATA[Vijayakumar]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Evaluating clinical skills of radiation oncology residents: parts I and II]]></article-title>
<source><![CDATA[Int J Cancer]]></source>
<year>2000</year>
<volume>90</volume>
</nlm-citation>
</ref>
<ref id="B48">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Roex]]></surname>
<given-names><![CDATA[A.]]></given-names>
</name>
<name>
<surname><![CDATA[Degryse]]></surname>
<given-names><![CDATA[J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A computerized adaptive knowledge test as an assessment tool in general practice]]></article-title>
<source><![CDATA[Med Teach]]></source>
<year>2004</year>
<volume>26</volume>
</nlm-citation>
</ref>
<ref id="B49">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Russell]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
<name>
<surname><![CDATA[Haney]]></surname>
<given-names><![CDATA[W.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Testing writing on computers: an experiment comparing student performance on tests conducted via computer and via paper-and pencil]]></article-title>
<source><![CDATA[Educ Pol Anal Arch]]></source>
<year>1997</year>
<volume>5</volume>
</nlm-citation>
</ref>
<ref id="B50">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Schafer]]></surname>
<given-names><![CDATA[W. D.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Resistance to confounding style and content in scoring constructed-response items]]></article-title>
<source><![CDATA[Educ Meas: Issues and Practice]]></source>
<year>2005</year>
<volume>24</volume>
</nlm-citation>
</ref>
<ref id="B51">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Schwartz]]></surname>
<given-names><![CDATA[R. W.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Undergraduate surgical education for the twenty-first century]]></article-title>
<source><![CDATA[Ann Surg]]></source>
<year>1992</year>
<volume>216</volume>
</nlm-citation>
</ref>
<ref id="B52">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Schwartz]]></surname>
<given-names><![CDATA[R. W.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Assessing senior residents' knowledge and performance: an integrated evaluation program]]></article-title>
<source><![CDATA[Surgery]]></source>
<year>1994</year>
<volume>116</volume>
</nlm-citation>
</ref>
<ref id="B53">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Schuwirth]]></surname>
<given-names><![CDATA[L.W.T.]]></given-names>
</name>
<name>
<surname><![CDATA[van der Vleuten]]></surname>
<given-names><![CDATA[C. R M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Different written assessment methods: what can be said about their strengths and weakness?]]></article-title>
<source><![CDATA[Med Educ]]></source>
<year>2004</year>
<volume>38</volume>
</nlm-citation>
</ref>
<ref id="B54">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Skakun]]></surname>
<given-names><![CDATA[E.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Strategy choices in multiple-choice items]]></article-title>
<source><![CDATA[Acad Med]]></source>
<year>1994</year>
<numero>^s10</numero>
<issue>^s10</issue>
<supplement>10</supplement>
</nlm-citation>
</ref>
<ref id="B55">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sloan]]></surname>
<given-names><![CDATA[D. A.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The Objective Structured Clinical Examination: The new gold standard for evaluating postgraduate clinical performance]]></article-title>
<source><![CDATA[Ann Surg]]></source>
<year>1995</year>
<volume>222</volume>
</nlm-citation>
</ref>
<ref id="B56">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Smee]]></surname>
<given-names><![CDATA[S.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[ABC of learning and teaching in medicine: skill based assessment]]></article-title>
<source><![CDATA[Brit Med J]]></source>
<year>2003</year>
<volume>29</volume>
</nlm-citation>
</ref>
<ref id="B57">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Southgate]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Professional competence in medicine]]></article-title>
<source><![CDATA[Hosp Med]]></source>
<year>1999</year>
<volume>60</volume>
</nlm-citation>
</ref>
<ref id="B58">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Swets]]></surname>
<given-names><![CDATA[J. A.]]></given-names>
</name>
<name>
<surname><![CDATA[Feurzeig]]></surname>
<given-names><![CDATA[W.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Computer-aided instruction]]></article-title>
<source><![CDATA[Science]]></source>
<year>1965</year>
<volume>15</volume>
</nlm-citation>
</ref>
<ref id="B59">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tamblyn]]></surname>
<given-names><![CDATA[R. M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The accuracy of standardized patient presentations]]></article-title>
<source><![CDATA[Med Educ]]></source>
<year>1991</year>
<volume>25</volume>
</nlm-citation>
</ref>
<ref id="B60">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Van der Vleuten]]></surname>
<given-names><![CDATA[C. P. M.]]></given-names>
</name>
<name>
<surname><![CDATA[Newble]]></surname>
<given-names><![CDATA[D. I.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[How can we test clinical reasoning?]]></article-title>
<source><![CDATA[Lancet]]></source>
<year>1995</year>
<volume>345</volume>
</nlm-citation>
</ref>
<ref id="B61">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Van der Vleuten]]></surname>
<given-names><![CDATA[C. R M.]]></given-names>
</name>
<name>
<surname><![CDATA[Schuwirth]]></surname>
<given-names><![CDATA[L. W. T.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Assessing professional competence: from methods to programmes]]></article-title>
<source><![CDATA[Med Educ]]></source>
<year>2005</year>
<volume>39</volume>
</nlm-citation>
</ref>
<ref id="B62">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Viniegra]]></surname>
<given-names><![CDATA[L.]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Exámenes de opción múltiple]]></article-title>
<source><![CDATA[Gac Med Mex]]></source>
<year>1979</year>
<volume>115</volume>
</nlm-citation>
</ref>
<ref id="B63">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Vrabel]]></surname>
<given-names><![CDATA[M.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Computarized versus paper-and-pencil testing methods for a nursing certification examination: a review of the literature]]></article-title>
<source><![CDATA[Comput Inform Nurs]]></source>
<year>2004</year>
<volume>22</volume>
</nlm-citation>
</ref>
<ref id="B64">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wass]]></surname>
<given-names><![CDATA[V.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Assessment of clinical competence]]></article-title>
<source><![CDATA[Lancet]]></source>
<year>2001</year>
<volume>357</volume>
</nlm-citation>
</ref>
<ref id="B65">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wass]]></surname>
<given-names><![CDATA[V.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Composite undergraduate clinical examinations: how should the components be combined to maximize reliability?]]></article-title>
<source><![CDATA[Med Educ]]></source>
<year>2001</year>
<volume>35</volume>
</nlm-citation>
</ref>
<ref id="B66">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Weiss]]></surname>
<given-names><![CDATA[D. J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Computarized adaptive testing for effective and efficient measurement in counseling and education]]></article-title>
<source><![CDATA[Meas Eval Counsel Dev]]></source>
<year>2004</year>
<volume>37</volume>
</nlm-citation>
</ref>
<ref id="B67">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Williams]]></surname>
<given-names><![CDATA[R. G.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Direct, standardized assessment of clinical competence]]></article-title>
<source><![CDATA[Med Educ]]></source>
<year>1987</year>
<volume>21</volume>
</nlm-citation>
</ref>
<ref id="B68">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wise]]></surname>
<given-names><![CDATA[S. L.]]></given-names>
</name>
<name>
<surname><![CDATA[Kingsbury]]></surname>
<given-names><![CDATA[G. G.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Practical issues in developing and maintaining a computerized adaptive testing program]]></article-title>
<source><![CDATA[Psicológica]]></source>
<year>2000</year>
<volume>21</volume>
</nlm-citation>
</ref>
<ref id="B69">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Wolfson]]></surname>
<given-names><![CDATA[R J.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Administration of open-ended test questions by computer in a clerkship final examination]]></article-title>
<source><![CDATA[Acad Med]]></source>
<year>2001</year>
<volume>76</volume>
</nlm-citation>
</ref>
<ref id="B70">
<nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Zenisky]]></surname>
<given-names><![CDATA[A. L.]]></given-names>
</name>
<name>
<surname><![CDATA[Sireci]]></surname>
<given-names><![CDATA[S. G.]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Technological innovations in large-scale assessment]]></article-title>
<source><![CDATA[Appl Meas Educ]]></source>
<year>2002</year>
<volume>15</volume>
</nlm-citation>
</ref>
</ref-list>
</back>
</article>
