<?xml version="1.0" encoding="ISO-8859-1"?><article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<front>
<journal-meta>
<journal-id>2007-5057</journal-id>
<journal-title><![CDATA[Investigación en educación médica]]></journal-title>
<abbrev-journal-title><![CDATA[Investigación educ. médica]]></abbrev-journal-title>
<issn>2007-5057</issn>
<publisher>
<publisher-name><![CDATA[Universidad Nacional Autónoma de México, Facultad de Medicina]]></publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id>S2007-50572013000400005</article-id>
<title-group>
<article-title xml:lang="es"><![CDATA[Distractores en preguntas de opción múltiple para estudiantes de medicina: ¿cuál es su comportamiento en un examen sumativo de altas consecuencias?]]></article-title>
<article-title xml:lang="en"><![CDATA[Distractors in multiple-choice questions for medical students: a descriptive analysis in a high-stakes summative exam]]></article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Jurado-Núñez]]></surname>
<given-names><![CDATA[Alma]]></given-names>
</name>
<xref ref-type="aff" rid="A01"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Flores-Hernández]]></surname>
<given-names><![CDATA[Fernando]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Delgado-Maldonado]]></surname>
<given-names><![CDATA[Laura]]></given-names>
</name>
<xref ref-type="aff" rid="A03"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Sommer-Cervantes]]></surname>
<given-names><![CDATA[Hermann]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Martínez-González]]></surname>
<given-names><![CDATA[Adrián]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
<xref ref-type="aff" rid="A04"/>
</contrib>
<contrib contrib-type="author">
<name>
<surname><![CDATA[Sánchez-Mendiola]]></surname>
<given-names><![CDATA[Melchor]]></given-names>
</name>
<xref ref-type="aff" rid="A02"/>
<xref ref-type="aff" rid="A05"/>
</contrib>
</contrib-group>
<aff id="A01">
<institution><![CDATA[,Universidad Nacional Autónoma de México Facultad de Medicina ]]></institution>
<addr-line><![CDATA[México D.F.]]></addr-line>
<country>México</country>
</aff>
<aff id="A02">
<institution><![CDATA[,Universidad Nacional Autónoma de México Facultad de Medicina Secretaría de Educación Médica]]></institution>
<addr-line><![CDATA[México D.F.]]></addr-line>
<country>México</country>
</aff>
<aff id="A03">
<institution><![CDATA[,Universidad Nacional de Educación a Distancia España Facultad de Psicología ]]></institution>
<addr-line><![CDATA[México D.F.]]></addr-line>
<country>México</country>
</aff>
<aff id="A04">
<institution><![CDATA[,Universidad Nacional Autónoma de México Facultad de Medicina Departamento de Salud Pública]]></institution>
<addr-line><![CDATA[México D.F.]]></addr-line>
<country>México</country>
</aff>
<aff id="A05">
<institution><![CDATA[,Universidad Nacional Autónoma de México Facultad de Medicina División de Estudios de Posgrado]]></institution>
<addr-line><![CDATA[México D.F.]]></addr-line>
<country>México</country>
</aff>
<pub-date pub-type="pub">
<day>00</day>
<month>12</month>
<year>2013</year>
</pub-date>
<pub-date pub-type="epub">
<day>00</day>
<month>12</month>
<year>2013</year>
</pub-date>
<volume>2</volume>
<numero>8</numero>
<fpage>202</fpage>
<lpage>210</lpage>
<copyright-statement/>
<copyright-year/>
<self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_arttext&amp;pid=S2007-50572013000400005&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_abstract&amp;pid=S2007-50572013000400005&amp;lng=en&amp;nrm=iso"></self-uri><self-uri xlink:href="http://www.scielo.org.mx/scielo.php?script=sci_pdf&amp;pid=S2007-50572013000400005&amp;lng=en&amp;nrm=iso"></self-uri><abstract abstract-type="short" xml:lang="es"><p><![CDATA[Introducción: Los exámenes de opción múltiple son la herramienta más utilizada en la evaluación del conocimiento en estudiantes de medicina. Se ha demostrado que tres opciones para cada ítem son suficientes, sin embargo, muchos exámenes en nuestro medio aún están compuestos por preguntas con cinco opciones. El estudio de los distractores no funcionales (DNF) es necesario para mejorar la calidad de los exámenes. Objetivo: Identificar los DNF y su comportamiento en una evaluación sumativa de altas consecuencias en estudiantes de medicina. Método: Se realizó análisis psicométrico del Examen Profesional Teórico de la Facultad de Medicina de la Universidad Nacional Autónoma de México (UNAM), en la versión de 2008. Se calcularon dificultad, discriminación y correlación punto-biserial de cada ítem y de sus cuatro distractores. Se obtuvo la frecuencia de preguntas con cero a cuatro DNF y se valoraron las diferencias de DNF por ítem y sus características psicométricas. Se contrastó el comportamiento psicométrico del examen completo, con una versión en la que se eliminaron los ítems con cuatro DNF. Resultados: El examen tuvo 420 reactivos de opción múltiple con cinco opciones de respuesta, fue contestado por 882 sustentantes. El instrumento tuvo un alfa de Cronbach de 0.93. De los 1 680 distractores evaluados, sólo 788 (46.9%) fueron funcionales. Más de dos tercios del total de ítems contaron con dos o más DNF. Se encontró un promedio de 2.12 ± 0.99 DNF por ítem, la mayoría de los cuales fueron elegidos por menos de 5% de los sustentantes. A mayor cantidad de DNF, mayor índice de dificultad y menor poder de discriminación de los ítems. Conclusiones: Los ítems con dos distractores funcionales comprenden la mayoría de los reactivos del examen. Dos distractores plausibles representan una alternativa asequible para elaborar los ítems, manteniendo o mejorando la confiabilidad y el perfil psicométrico de este tipo de evaluaciones.]]></p></abstract>
<abstract abstract-type="short" xml:lang="en"><p><![CDATA[Introduction: Multiple-choice question (MCQ) exams are the most frequently used tool for knowledge assessment of medical students. It has been shown that three options in each item are enough; however, many tests in our country still use questions with five options. The study of non-functional distractors (NFD) is needed in order to improve the quality of our assessment instruments. Objective: To identify NFD and their behavior in a high-stakes summative exam in medical students. Method: A psychometric analysis was performed of the Theoretical Professional Exam at UNAM Faculty of Medicine, the 2008 version. Difficulty, discrimination and point-biserial correlation were calculated for each item and its four distractors. The frequency of items with zero to four NFD was obtained, and the differences of NFD per item and their psychometric characteristics were assessed. The psychometric behavior of the whole exam was compared to a version where items with four NFD were removed. Results: The test had 420 MCQ items with five options, and was answered by 882 students. The instrument had a Cronbach's alpha of 0.93. Of the 1 680 distractors evaluated, only 788 (46.9%) were functional. More than two-thirds of the total of items had two or more NFD. There was an average of 2.12 ± 0.99 NFD per item, the majority of which were chosen by less than 5% of the test takers. With higher quantity of NFD, the items' difficulty index was higher and the discrimination index was lower. Conclusions: Items with two functional distractors were the majority in the exam. Two plausible distractors are a reasonable alternative for item development, maintaining or improving the reliability and psychometric profile of these types of tests.]]></p></abstract>
<kwd-group>
<kwd lng="es"><![CDATA[Evaluación del aprendizaje]]></kwd>
<kwd lng="es"><![CDATA[exámenes escritos]]></kwd>
<kwd lng="es"><![CDATA[preguntas de opción múltiple]]></kwd>
<kwd lng="es"><![CDATA[educación médica de pregrado]]></kwd>
<kwd lng="es"><![CDATA[México]]></kwd>
<kwd lng="en"><![CDATA[Learning assessment]]></kwd>
<kwd lng="en"><![CDATA[written tests]]></kwd>
<kwd lng="en"><![CDATA[multiple choice questions]]></kwd>
<kwd lng="en"><![CDATA[undergraduate medical education]]></kwd>
<kwd lng="en"><![CDATA[Mexico]]></kwd>
</kwd-group>
</article-meta>
</front><body><![CDATA[  	    <p align="justify"><font face="verdana" size="4">Art&iacute;culo original</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="4"><b>Distractores en preguntas de opci&oacute;n m&uacute;ltiple para estudiantes de medicina: &iquest;cu&aacute;l es su comportamiento en un examen sumativo de altas consecuencias?</b></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="3"><b>Distractors in multiple&#45;choice questions for medical students: a descriptive analysis in a high&#45;stakes summative exam</b></font></p>  	    <p align="center"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="center"><font face="verdana" size="2"><b>Alma Jurado&#45;N&uacute;&ntilde;ez,<sup>1</sup> Fernando Flores&#45;Hern&aacute;ndez,<sup>2</sup> Laura Delgado&#45;Maldonado,<sup>3</sup> Hermann Sommer&#45;Cervantes,<sup>2</sup> Adri&aacute;n Mart&iacute;nez&#45;Gonz&aacute;lez,<sup>2,4</sup> Melchor S&aacute;nchez&#45;Mendiola<sup>2,5</sup></b></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><i><sup>1</sup> Programa de Apoyo y Fomento a la Investigaci&oacute;n Estudiantil (AFINES), Facultad de Medicina, Universidad Nacional Aut&oacute;noma de M&eacute;xico, M&eacute;xico D.F., M&eacute;xico.</i></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><i><sup>2</sup> Secretar&iacute;a de Educaci&oacute;n M&eacute;dica, Facultad de Medicina, Universidad Nacional Aut&oacute;noma de M&eacute;xico, M&eacute;xico D.F., M&eacute;xico.</i></font></p>  	    <p align="justify"><font face="verdana" size="2"><i><sup>3</sup>Facultad de Psicolog&iacute;a, Universidad Nacional de Educaci&oacute;n a Distancia Espa&ntilde;a, M&eacute;xico D.F., M&eacute;xico.</i></font></p>  	    <p align="justify"><font face="verdana" size="2"><i><sup>4</sup> Departamento de Salud P&uacute;blica, Facultad de Medicina, Universidad Nacional Aut&oacute;noma de M&eacute;xico, M&eacute;xico D.F., M&eacute;xico.</i></font></p>  	    <p align="justify"><font face="verdana" size="2"><i><sup>5</sup> Divisi&oacute;n de Estudios de Posgrado, Facultad de Medicina, Universidad Nacional Aut&oacute;noma de M&eacute;xico, M&eacute;xico D.F., M&eacute;xico.</i></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Correspondencia:    <br> 	</b><i>Melchor S&aacute;nchez Mendiola.    <br> 	Secretar&iacute;a de Educaci&oacute;n M&eacute;dica. Av. Universidad N&deg; 3000,    <br> 	Edif. B, 3er piso, C.U., C.P. 04510, M&eacute;xico D.F., M&eacute;xico.    <br> 	</i></font><font face="verdana" size="2"><i> Tel&eacute;fono: (5255) 5623 2448.    ]]></body>
<body><![CDATA[<br>     Fax: (5255) 5616 2346.</i>    <br>     Correos electr&oacute;nicos: <a href="mailto:melchorsm@gmail.com">melchorsm@gmail.com</a>    <br>     <a href="mailto:melchors@liceaga.facmed.unam.mx">melchors@liceaga.facmed.unam.mx</a></font></p>     <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2">Recepci&oacute;n 26 de mayo de 2013    <br> 	Aceptaci&oacute;n 19 de agosto de 2013</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font>	</p>     <p align="justify"><font face="verdana" size="2"><b>Resumen</b></font></p>  	    <p align="justify"><font face="verdana" size="2"><i><b>Introducci&oacute;n:</b></i> Los ex&aacute;menes de opci&oacute;n m&uacute;ltiple son la herramienta m&aacute;s utilizada en la evaluaci&oacute;n del conocimiento en estudiantes de medicina. Se ha demostrado que tres opciones para cada &iacute;tem son suficientes, sin embargo, muchos ex&aacute;menes en nuestro medio a&uacute;n est&aacute;n compuestos por preguntas con cinco opciones. El estudio de los distractores no funcionales (DNF) es necesario para mejorar la calidad de los ex&aacute;menes.</font></p>  	    <p align="justify"><font face="verdana" size="2"><i><b>Objetivo:</b></i> Identificar los DNF y su comportamiento en una evaluaci&oacute;n sumativa de altas consecuencias en estudiantes de medicina.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><i><b>M&eacute;todo:</b></i> Se realiz&oacute; an&aacute;lisis psicom&eacute;trico del Examen Profesional Te&oacute;rico de la Facultad de Medicina de la Universidad Nacional Aut&oacute;noma de M&eacute;xico (UNAM), en la versi&oacute;n de 2008. Se calcularon dificultad, discriminaci&oacute;n y correlaci&oacute;n punto&#45;biserial de cada &iacute;tem y de sus cuatro distractores. Se obtuvo la frecuencia de preguntas con cero a cuatro DNF y se valoraron las diferencias de DNF por &iacute;tem y sus caracter&iacute;sticas psicom&eacute;tricas. Se contrast&oacute; el comportamiento psicom&eacute;trico del examen completo, con una versi&oacute;n en la que se eliminaron los &iacute;tems con cuatro DNF.</font></p>  	    <p align="justify"><font face="verdana" size="2"><i><b>Resultados:</b></i> El examen tuvo 420 reactivos de opci&oacute;n m&uacute;ltiple con cinco opciones de respuesta, fue contestado por 882 sustentantes. El instrumento tuvo un alfa de Cronbach de 0.93. De los 1 680 distractores evaluados, s&oacute;lo 788 (46.9%) fueron funcionales. M&aacute;s de dos tercios del total de &iacute;tems contaron con dos o m&aacute;s DNF. Se encontr&oacute; un promedio de 2.12 &plusmn; 0.99 DNF por &iacute;tem, la mayor&iacute;a de los cuales fueron elegidos por menos de 5% de los sustentantes. A mayor cantidad de DNF, mayor &iacute;ndice de dificultad y menor poder de discriminaci&oacute;n de los &iacute;tems. </font></p> 	    <p align="justify"><font face="verdana" size="2"><i><b>Conclusiones:</b></i> Los &iacute;tems con dos distractores funcionales comprenden la mayor&iacute;a de los reactivos del examen. Dos distractores plausibles representan una alternativa asequible para elaborar los &iacute;tems, manteniendo o mejorando la confiabilidad y el perfil psicom&eacute;trico de este tipo de evaluaciones.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Palabras clave:</b> Evaluaci&oacute;n del aprendizaje; ex&aacute;menes escritos; preguntas de opci&oacute;n m&uacute;ltiple; educaci&oacute;n m&eacute;dica de pregrado; M&eacute;xico.</font></p>     <p align="justify">&nbsp;</p>      <p align="justify"><font face="verdana" size="2"><b>Abstract</b></font></p>  	    <p align="justify"><font face="verdana" size="2"><i><b>Introduction:</b></i> Multiple&#45;choice question (MCQ) exams are the most frequently used tool for knowledge assessment of medical students. It has been shown that three options in each item are enough; however, many tests in our country still use questions with five options. The study of non&#45;functional distractors (NFD) is needed in order to improve the quality of our assessment instruments.</font></p>  	    <p align="justify"><font face="verdana" size="2"><i><b>Objective:</b></i> To identify NFD and their behavior in a high&#45;stakes summative exam in medical students.</font></p>  	    <p align="justify"><font face="verdana" size="2"><i><b>Method:</b></i> A psychometric analysis was performed of the Theoretical Professional Exam at UNAM Faculty of Medicine, the 2008 version. Difficulty, discrimination and point&#45;biserial correlation were calculated for each item and its four distractors. The frequency of items with zero to four NFD was obtained, and the differences of NFD per item and their psychometric characteristics were assessed. The psychometric behavior of the whole exam was compared to a version where items with four NFD were removed.</font></p>  	    <p align="justify"><font face="verdana" size="2"><i><b>Results:</b></i> The test had 420 MCQ items with five options, and was answered by 882 students. The instrument had a Cronbach's alpha of 0.93. Of the 1 680 distractors evaluated, only 788 (46.9%) were functional. More than two&#45;thirds of the total of items had two or more NFD. There was an average of 2.12 <b>&plusmn;</b> 0.99 NFD per item, the majority of which were chosen by less than 5% of the test takers. With higher quantity of NFD, the items' difficulty index was higher and the discrimination index was lower.</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><i><b>Conclusions:</b></i> Items with two functional distractors were the majority in the exam. Two plausible distractors are a reasonable alternative for item development, maintaining or improving the reliability and psychometric profile of these types of tests.</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Keywords:</b> Learning assessment; written tests; multiple choice questions; undergraduate medical education; Mexico.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Introducci&oacute;n</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Las ciencias de la salud, incluyendo la medicina, consisten en un conjunto complejo de disciplinas que avanzan continuamente en la generaci&oacute;n de conocimiento y tecnolog&iacute;a. Las instituciones de salud y de educaci&oacute;n superior enfrentan los m&uacute;ltiples retos que implican la ense&ntilde;anza, el aprendizaje y la evaluaci&oacute;n de dichos conocimientos y habilidades, en las diferentes poblaciones de estudiantes que son formados en las mismas.</font></p>  	    <p align="justify"><font face="verdana" size="2">La evaluaci&oacute;n del aprendizaje en educaci&oacute;n es un proceso continuo, sistem&aacute;tico y reflexivo a trav&eacute;s del cual se obtiene informaci&oacute;n cuantitativa y cualitativa pertinente, v&aacute;lida y fiable acerca de un objeto, lo cual permite identificar fortalezas y &aacute;reas de oportunidad para emitir un juicio de su val&iacute;a o m&eacute;rito y tomar decisiones fundamentadas orientadas a su perfeccionamiento.<sup>1,2</sup> Existe una gran variedad de </font><font face="verdana" size="2">instrumentos para evaluar los conocimientos, habilidades y actitudes, todos con sus ventajas y limitaciones. Algunos pueden resultar m&aacute;s &uacute;tiles o adecuados en determinada situaci&oacute;n, porque su eficacia var&iacute;a seg&uacute;n el contexto donde se apliquen, como en diferentes planes de estudios, con grupos o poblaciones de estudiantes de diferentes caracter&iacute;sticas, en diversas disciplinas a evaluar, entre otras.<sup>3,4</sup></font></p>     <p align="justify"><font face="verdana" size="2">Evaluar espec&iacute;ficamente el conocimiento adquirido por los estudiantes es una actividad de gran relevancia que permite determinar el logro de los objetivos educativos, as&iacute; como realimentar a los profesores, a los programas acad&eacute;micos, a la instituci&oacute;n y a los propios estudiantes. Para ello, se han utilizado diversos instrumentos de evaluaci&oacute;n como preguntas abiertas, ex&aacute;menes orales, preguntas de opci&oacute;n m&uacute;ltiple (POM), preguntas de verdadero o falso y relaci&oacute;n de columnas, entre otros.<sup>5</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">En la educaci&oacute;n m&eacute;dica de pregrado y posgrado los ex&aacute;menes que utilizan POM son los instrumentos m&aacute;s frecuentemente utilizados en las evaluaciones de conocimientos.<sup>3,5&#45;7</sup> El uso de este tipo de instrumentos en las pruebas se justifica por su alta aceptaci&oacute;n y bajo costo; adem&aacute;s, facilita la evaluaci&oacute;n de una gran cantidad de estudiantes en poco tiempo, obliga a la estandarizaci&oacute;n del conocimiento y brinda objetividad y efectividad.<sup>3,5,6</sup> El dise&ntilde;o de las POM permite la evaluaci&oacute;n de niveles cognitivos complejos como la aplicaci&oacute;n del conocimiento y la soluci&oacute;n de problemas. La elaboraci&oacute;n de reactivos de forma planeada y siguiendo los principios descritos para elaborar preguntas de calidad, propicia que la evaluaci&oacute;n del conocimiento arroje resultados con fuerte evidencia de validez y elevada confiabilidad.<sup>6,8,9</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">La visi&oacute;n moderna de validez en evaluaci&oacute;n educativa la considera como un concepto hol&iacute;stico, en el que toda la validez es validez de constructo, la cual se nutre de cinco diferentes fuentes de evidencia: contenido, proceso de respuesta, estructura interna, relaci&oacute;n con otras variables y consecuencias.<sup>8,10</sup> De acuerdo a este modelo, la fuente de evidencia de validez denominada "estructura interna" de la prueba, se refiere a las caracter&iacute;sticas estad&iacute;sticas o psicom&eacute;tricas del instrumento, de los reactivos que lo conforman, y de las opciones de respuesta.<sup>6,8</sup> En las &uacute;ltimas d&eacute;cadas, diversos investigadores se han dado a la tarea de determinar los elementos clave en la realizaci&oacute;n de POM y analizar sus caracter&iacute;sticas psicom&eacute;tricas, como los &iacute;ndices de dificultad, de discriminaci&oacute;n, la correlaci&oacute;n punto&#45;biserial, la frecuencia de respuesta de cada una de las opciones, incluyendo a los distractores.<sup>5,6,9,11</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">El uso apropiado de distractores u opciones incorrectas es una importante faceta de la elaboraci&oacute;n y an&aacute;lisis de los reactivos de opci&oacute;n m&uacute;ltiple, ya que requieren un importante esfuerzo por los elaboradores de &iacute;tems, son determinantes de la calidad de las preguntas y tienen una funci&oacute;n educativa importante para los sustentantes en el proceso de evaluaci&oacute;n.<sup>5,6</sup> La importancia de identificar los distractores y su comportamiento es trascendental para mejorar los est&aacute;ndares de los ex&aacute;menes, especialmente en aquellos de altas consecuencias; reducir el tiempo para responderlos o ampliar los contenidos a evaluar; igualmente, es relevante para cuestiones administrativas como el tiempo de construcci&oacute;n, y los recursos materiales y humanos implicados en su elaboraci&oacute;n. Relativamente pocos trabajos se han publicado sobre el comportamiento de los distractores en los ex&aacute;menes con POM en ciencias de la salud, que eval&uacute;en su calidad, funcionalidad, y an&aacute;lisis psicom&eacute;trico, lo que hace necesario explorar esta informaci&oacute;n en instituciones educativas de pa&iacute;ses como el nuestro.<sup>12&#45;16</sup></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">En la Facultad de Medicina de la Universidad Nacional Aut&oacute;noma de M&eacute;xico (UNAM), se forma a los estudiantes durante la licenciatura para que adquieran los conocimientos, habilidades, actitudes y valores necesarios para desempe&ntilde;arse como m&eacute;dicos generales. Para ello, se cuenta con el Plan de Estudios de la Carrera de M&eacute;dico Cirujano conformado por programas acad&eacute;micos de las &aacute;reas biom&eacute;dica, socio&#45;m&eacute;dica y cl&iacute;nica, estableciendo claramente el perfil del egresado.<sup>17</sup> El Examen Profesional de la Facultad de Medicina de la UNAM es la evaluaci&oacute;n sumativa de altas consecuencias aplicada al final de la licenciatura de M&eacute;dico Cirujano, que tiene como objetivo valorar en conjunto los conocimientos generales del sustentante en su carrera, que &eacute;ste demuestre su capacidad para aplicar los conocimientos adquiridos y que posee criterio profesional. El examen tiene dos fases, una te&oacute;rica y otra pr&aacute;ctica, la te&oacute;rica se compone de un examen escrito con reactivos de opci&oacute;n m&uacute;ltiple.<sup>18</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">El prop&oacute;sito del presente trabajo es evaluar el comportamiento de los distractores en las POM en una aplicaci&oacute;n del Examen Profesional Te&oacute;rico de la Facultad de Medicina de la UNAM, para obtener informaci&oacute;n concreta sobre esta tem&aacute;tica.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>M&eacute;todo</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Los datos empleados en el presente estudio corresponden a la informaci&oacute;n obtenida de los resultados de la Fase Te&oacute;rica del Examen Profesional de la Facultad de Medicina de la UNAM, aplicado en enero de 2008. En esa ocasi&oacute;n el instrumento se aplic&oacute; a la poblaci&oacute;n de estudiantes que acreditaron el quinto a&ntilde;o de la carrera de medicina. El instrumento estuvo compuesto por 420 reactivos en formato de opci&oacute;n m&uacute;ltiple, con cinco opciones de respuesta (una correcta y cuatro incorrectas o distractores). La prueba explor&oacute; seis &aacute;reas de conocimiento: Medicina Interna, Pediatr&iacute;a, Gineco&#45;obstetricia, Urgencias, Cirug&iacute;a y Medicina familiar. El examen se aplic&oacute; en condiciones estandarizadas en instalaciones de la Facultad, las respuestas se registraron en hojas de lector &oacute;ptico.</font></p>  	    <p align="justify"><font face="verdana" size="2">La base de datos se analiz&oacute; mediante la Teor&iacute;a Cl&aacute;sica de los Test (TCT) a trav&eacute;s del programa ITEMAN 3.5 (Assessment Systems Corporation<sup>&reg;</sup>, Minnesota, EUA <a href="http://www.assess.com" target="_blank">www.assess.com</a>), con el que se obtuvieron los datos psicom&eacute;tricos de manera global, de cada &iacute;tem y de cada distractor, calculando los &iacute;ndices de dificultad, de discriminaci&oacute;n y la correlaci&oacute;n punto&#45;biserial, como se report&oacute; previamente.<sup>18</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">Los resultados obtenidos se sometieron a un an&aacute;lisis de frecuencia para las opciones de respuesta, identificando qu&eacute; porcentaje de sustentantes respondi&oacute; cada una de las opciones. Se defini&oacute; operacionalmente a los distractores como no funcionales (DNF), tomando en cuenta su desempe&ntilde;o psicom&eacute;trico, a partir de su asignaci&oacute;n a cualquiera de las siguientes categor&iacute;as: frecuencia menor o igual a 1%, frecuencia menor a 5%, discriminaci&oacute;n positiva y no discriminaci&oacute;n. Un distractor que es elegido por muy pocos sustentantes es un distractor que no cumple su funci&oacute;n evaluativa (puede ser que no sea plausible o que tiene alguna falla en el dise&ntilde;o que hace que los estudiantes lo descarten como opci&oacute;n), y un distractor que no discrimina a los estudiantes o que tiene una discriminaci&oacute;n positiva (es decir, es elegido por los mejores estudiantes con mayor frecuencia que por los estudiantes con desempe&ntilde;o m&aacute;s bajo) tambi&eacute;n es una bandera roja de que ese distractor debe ser revisado por los elaboradores del examen y expertos en contenido.</font></p>  	    <p align="justify"><font face="verdana" size="2">Se obtuvo el porcentaje de preguntas que conten&iacute;an de cero a cuatro DNF para cada &aacute;rea de conocimiento y para el examen en general. Se calcul&oacute; el &iacute;ndice de dificultad y discriminaci&oacute;n media para cada grupo de preguntas con n&uacute;mero determinado de DNF, para el examen en conjunto y para cada una de las &aacute;reas de conocimiento que integran el examen. Se realiz&oacute; un ANOVA con una prueba <i>post&#45;hoc</i> de Tukey HSD, en que se consider&oacute; como factor el n&uacute;mero de DNF y como variables dependientes la dificultad, el &iacute;ndice de discriminaci&oacute;n y correlaci&oacute;n punto&#45;biserial de los &iacute;tems; lo anterior con el fin de encontrar diferencias significativas entre grupos y dentro de los mismos. Posteriormente se eliminaron los &iacute;tems que presentaron cuatro DNF, y se realiz&oacute; nuevamente el an&aacute;lisis psicom&eacute;trico para comparar el desempe&ntilde;o psicom&eacute;trico de esta versi&oacute;n acortada del examen con el examen completo.</font></p>  	    <p align="justify"><font face="verdana" size="2">La obtenci&oacute;n de datos y an&aacute;lisis de los resultados se llev&oacute; a cabo como parte de la evaluaci&oacute;n del Plan de Estudios, y sus procesos de control de calidad. Los resultados se manejaron de manera an&oacute;nima, y se reportan los agregados del an&aacute;lisis, por lo que el trabajo no implica riesgos para los estudiantes evaluados.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2"><b>Resultados</b></font></p>  	    <p align="justify"><font face="verdana" size="2">El Examen Profesional Te&oacute;rico de la Facultad de Medicina de la UNAM analizado, tuvo lugar en las instalaciones de la instituci&oacute;n el mes de enero de 2008, y el n&uacute;mero de sustentantes que contest&oacute; el examen fue de 882. Respecto al conjunto global de la prueba, se encontr&oacute; que el promedio de dificultad cl&aacute;sica fue de 54.95% de aciertos, su confiabilidad medida con el coeficiente de Cronbach tuvo un &#945;=0.93 y el error est&aacute;ndar de medici&oacute;n (EEM) de 8.67.</font></p>  	    <p align="justify"><font face="verdana" size="2">El n&uacute;mero total de opciones del examen fue de 2 100, compuesto de 420 respuestas correctas y 1 680 distractores u opciones incorrectas. El 53.1% (892) de los distractores evaluados se clasific&oacute; como no funcional (DNF). Solamente 18 &iacute;tems (4.3%) tuvieron los cuatro distractores funcionales. Treinta y cuatro &iacute;tems (8.1%) no tuvieron ning&uacute;n distractor funcional. El n&uacute;mero de DNF por &iacute;tem fue de 2.12 &plusmn; 0.99 (media &plusmn; desviaci&oacute;n est&aacute;ndar). Los resultados de frecuencia se presentan en la <a href="#a5t1">Tabla 1</a>.</font></p>  	    <p align="center"><font face="verdana" size="2"><a name="a5t1"></a></font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/iem/v2n8/a5t1.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">Al clasificar a los DNF, se encontr&oacute; que 74% de ellos fueron elegidos por menos del 5% de los sustentantes, 36.4% fue respondido por 1% o menos de la poblaci&oacute;n, 20% tuvo un &iacute;ndice de discriminaci&oacute;n positiva y 6.1% no discrimin&oacute;. Cinco &aacute;reas del examen conten&iacute;an, por lo menos, tres &iacute;tems con ning&uacute;n DNF y uno con cuatro DNF. El &aacute;rea de Cirug&iacute;a, en contraste, tuvo el mayor n&uacute;mero de &iacute;tems con cuatro DNF y ninguno con todos los distractores funcionales. El comportamiento de DNF en cada &aacute;rea de conocimiento se muestra en la <a href="/img/revistas/iem/v2n8/a5t2.jpg" target="_blank">Tabla 2</a>.</font></p>  	    <p align="justify"><font face="verdana" size="2">El promedio de &iacute;ndice de dificultad y de discriminaci&oacute;n en los &iacute;tems con ning&uacute;n DNF fue de 0.48 &plusmn; 0.14 y 0.30 &plusmn; 0.09, respectivamente (media &plusmn; desviaci&oacute;n est&aacute;ndar). En contraste, estos par&aacute;metros psicom&eacute;tricos en los &iacute;tems con cuatro DNF fueron 0.84 &plusmn; 0.17 y 0.05 &plusmn; 0.08, con 40% mayor &iacute;ndice de dificultad (es decir, 40% m&aacute;s f&aacute;cil) y 25% menor discriminaci&oacute;n (<a href="#f1">Figura 1</a> ). Para &iacute;tems con 2 DNF, los &iacute;ndices de dificultad y discriminaci&oacute;n medios fueron 0.52 y 0.20, respectivamente (<a href="#f1">Figura 1</a>).</font></p> 	    <p align="center"><a name="f1"></a></p> 	    <p align="center"><img src="/img/revistas/iem/v2n8/a5f1.jpg"></p>      <p align="justify"><font face="verdana" size="2">El ANOVA mostr&oacute; diferencias estad&iacute;sticamente significativas (p&lt;0.001) en los indicadores psicom&eacute;tricos (&iacute;ndices de dificultad y discriminaci&oacute;n, correlaci&oacute;n de punto&#45;biserial), entre los grupos de &iacute;tems con diferente n&uacute;mero de DNF (<a href="/img/revistas/iem/v2n8/a5t3.jpg" target="_blank">Tabla 3</a>). La prueba <i>post&#45;hoc</i> de Tukey mostr&oacute; diferencias significativas (p&lt;0.001) en &iacute;ndice de dificultad y de discriminaci&oacute;n entre &iacute;tems con cuatro DNF y los dem&aacute;s &iacute;tems con cero a tres DNF. Se encontr&oacute; diferencia significativa en la correlaci&oacute;n punto&#45;biserial entre los &iacute;tems con cuatro DNF y el grupo con ning&uacute;n DNF (<a href="/img/revistas/iem/v2n8/a5t4.jpg" target="_blank">Tabla 4</a>).</font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Al eliminar los 34 &iacute;tems con cuatro DNF y analizar de nuevo el examen con la Teor&iacute;a Cl&aacute;sica de los Test, se mantuvo la confiabilidad y mejor&oacute; ligeramente el perfil psicom&eacute;trico del examen. La <a href="#a5t5">Tabla 5</a> muestra un peque&ntilde;o aumento del coeficiente punto&#45;biserial medio, una reducci&oacute;n del error est&aacute;ndar de medici&oacute;n y del &iacute;ndice de dificultad en el examen depurado.</font></p>  	    <p align="center"><font face="verdana" size="2"><a name="a5t5"></a></font></p>  	    <p align="center"><font face="verdana" size="2"><img src="/img/revistas/iem/v2n8/a5t5.jpg"></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Discusi&oacute;n</b></font></p>  	    <p align="justify"><font face="verdana" size="2">El presente trabajo describe una evaluaci&oacute;n del comportamiento de todos los distractores utilizados en una aplicaci&oacute;n del Examen Profesional Te&oacute;rico de la Facultad de Medicina de la UNAM, la prueba sumativa de altas consecuencias que se aplica al final de la carrera de m&eacute;dico cirujano en nuestra Instituci&oacute;n. Hasta donde pudieron identificar los autores, se trata de uno de los pocos reportes en la literatura disponible, publicada en Latinoam&eacute;rica, sobre los distractores de POM en ex&aacute;menes sumativos en escuelas de medicina.</font></p>  	    <p align="justify"><font face="verdana" size="2">La evaluaci&oacute;n en medicina representa un gran reto, especialmente aquella de altas consecuencias; los instrumentos deben ser construidos para evaluar no s&oacute;lo el conocimiento puntual o memor&iacute;stico sino niveles cognitivos superiores como la aplicaci&oacute;n del conocimiento y la soluci&oacute;n de problemas. La redacci&oacute;n de &iacute;tems para evaluaciones sumativas con POM es una labor compleja, intensiva, que requiere entrenamiento y pr&aacute;ctica y que, en cierto sentido, constituye un arte para los elaboradores de reactivos; las reglas y recomendaciones metodol&oacute;gicas que nutren la elaboraci&oacute;n de &iacute;tems permanece en continuo desarrollo.<sup>5,6,9,11</sup> El proceso de analizar el desempe&ntilde;o del examen a partir de sus distractores y las caracter&iacute;sticas psicom&eacute;tricas de los mismos, es una necesidad imperativa en la mejora continua de la calidad de la evaluaci&oacute;n del aprendizaje.</font></p>  	    <p align="justify"><font face="verdana" size="2">Los distractores deben considerarse una parte importante de los reactivos en los ex&aacute;menes de opci&oacute;n m&uacute;ltiple, que tienen implicaciones para los evaluadores, los sustentantes y en general todos los usuarios de la informaci&oacute;n obtenida al aplicar una prueba. M&aacute;s de medio siglo de investigaci&oacute;n en el tema ha identificado una relaci&oacute;n s&oacute;lida entre la elecci&oacute;n de los distractores y la puntuaci&oacute;n global en los ex&aacute;menes, por lo que uno de los expertos mundiales en el &aacute;rea, el Dr. Thomas Haladyna, ha propuesto las siguientes cinco razones para estudiar el desempe&ntilde;o de los distractores en los ex&aacute;menes de opci&oacute;n m&uacute;ltiple:<sup>19</sup></font></p>  	    <blockquote> 		    <p align="justify"><font face="verdana" size="2">&bull;&nbsp;Adelgazar los &iacute;tems "obesos".</font></p>  		    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&bull;&nbsp;Mejorar la calidad de los &iacute;tems de los ex&aacute;menes.</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull;&nbsp;Detectar las razones que expliquen los problemas de desempe&ntilde;o en los &iacute;tems.</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull;&nbsp;Incrementar los estudios de los procesos cognitivos en el aprendizaje.</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull;&nbsp;Analizar el funcionamiento diferencial de los distractores.</font></p> 	</blockquote>  	    <p align="justify"><font face="verdana" size="2">Estas razones no son s&oacute;lo convincentes, sino que sugieren que todo el esfuerzo que se aplique en el estudio, an&aacute;lisis y mejora de los distractores, constituir&aacute; un componente importante de los argumentos de evidencia </font><font face="verdana" size="2">de validez para todo el proceso de planeaci&oacute;n, dise&ntilde;o, implementaci&oacute;n, aplicaci&oacute;n y an&aacute;lisis de resultados de los ex&aacute;menes. En nuestro estudio menos de la mitad de los distractores totales del Examen Profesional Te&oacute;rico (46.9%) fue funcional, y menos de 5% de los &iacute;tems contaron con los cuatro distractores funcionales. Esto sugiere que aunque el examen fue construido con cinco opciones de respuesta (la correcta y cuatro distractores), al aplicar el examen los sustentantes trabajaron generalmente con tres opciones (la correcta y dos distractores). Estos impactantes datos son similares a lo encontrado en otros trabajos, en los que la cantidad de DNF es similar, y la mayor&iacute;a de los &iacute;tems presentan, al menos, un DNF.<sup>12&#45;16,20</sup></font></p>     <p align="justify"><font face="verdana" size="2">El gran n&uacute;mero de &iacute;tems con dos DNF coincide con lo mencionado por m&uacute;ltiples autores: tres opciones pueden constituir un probable l&iacute;mite natural y representar la m&aacute;xima eficiencia en este tipo de reactivos.<sup>12&#45;16,20,21</sup> El uso de cinco o cuatro opciones es a&uacute;n predominante en evaluaciones en el &aacute;mbito m&eacute;dico, a pesar de la gran cantidad de trabajos de investigaci&oacute;n publicada sobre el tema y las recomendaciones de los expertos internacionales, por varias razones probablemente relacionadas con los "usos y costumbres" y la tendencia de algunos profesores e instituciones a no conocer o no tomar en cuenta los trabajos de investigaci&oacute;n original publicados en las revistas especializadas en educaci&oacute;n y medici&oacute;n educativa, en el momento de tomar decisiones sobre c&oacute;mo ense&ntilde;ar y evaluar.<sup>22</sup> El presente trabajo es un refuerzo m&aacute;s a la necesidad de replantear los est&aacute;ndares que rigen la construcci&oacute;n de nuestros instrumentos, aportando informaci&oacute;n cuantitativa que puede contribuir a informar las decisiones sobre evaluaci&oacute;n que toman los profesores y los gremios institucionales.</font></p>  	    <p align="justify"><font face="verdana" size="2">Los distractores con frecuencia de selecci&oacute;n menor a 5% no son funcionales porque generalmente no son plausibles, resultan il&oacute;gicos, carecen de consistencia interna o tienen alguna falla en su redacci&oacute;n que ofrece pistas a los sustentantes.<sup>19,20</sup> La diferencia en el &iacute;ndice de dificultad entre preguntas con 5 y 4 opciones, as&iacute; como entre 5 y 3 opciones con respecto al ideal (aproximadamente 60%) es de 0.03 y 0.07 respectivamente, por lo que el esfuerzo que implica el desarrollo de distractores extra puede no estar justificado. Las directrices de los principales expertos internaciones para la construcci&oacute;n de &iacute;tems recomiendan la creaci&oacute;n de tantos distractores como sea posible y factible, pero adem&aacute;s recomiendan establecer tres opciones como objetivo y permitir reactivos con m&aacute;s opciones si se logra su desarrollo con calidad y se confirma su calidad psicom&eacute;trica.<sup>9,11</sup> En cuanto a la preferencia de los sustentantes, Owen y Froman en 1987 encuestaron a 114 examinados sobre su preferencia entre &iacute;tems de tres o cinco opciones; 111 de ellos votaron por tres opciones, tres no externaron preferencia y ninguno vot&oacute; por cinco opciones.<sup>23</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">Los DNF se detectan al ser seleccionados por menos de 5% de los sustentantes, por ser gr&aacute;ficamente similares a la respuesta correcta (es decir, discriminar positivamente) o haber sido contestados igualmente por la poblaci&oacute;n correspondiente a cada percentil de resultados.<sup>20</sup> Algunos estudios que han empleado m&aacute;s de dos distractores, han identificado falta de funcionalidad por lo menos en uno de los excedentes.<sup>12,13,15,20,24</sup> Pr&aacute;cticamente en todos los estudios publicados, incluido el presente trabajo, se ha documentado de manera contundente un porcentaje elevado de DNF en el total de la prueba, lo que es consistente con la hip&oacute;tesis de que una gran cantidad de distractores en los &iacute;tems de ex&aacute;menes de opci&oacute;n m&uacute;ltiple son desechados con facilidad por los sustentantes, probablemente por ser demasiado obvios, no ser plausibles, o tener pistas que orientan al estudiante a descartarlo, sin necesidad de tener el conocimiento relevante espec&iacute;fico supuestamente explorado por el distractor. Es de llamar la atenci&oacute;n que todos los estudios publicados que analizan el tema de los distractores, utilizan ex&aacute;menes sumativos de consecuencias altas o moderadas, en los que se supone se han tomado medidas para cuidar la calidad de los &iacute;tems y sus diferentes fuentes de validez durante todo el proceso de elaboraci&oacute;n y aplicaci&oacute;n de los mismos, y a pesar de ello, el porcentaje de DNF es elevado. Es probable que este fen&oacute;meno sea a&uacute;n m&aacute;s frecuente en ex&aacute;menes formativos, diagn&oacute;sticos o de bajas consecuencias, en los que no se tenga tanta atenci&oacute;n al detalle durante su integraci&oacute;n.</font></p>  	    <p align="justify"><font face="verdana" size="2">Un argumento utilizado con frecuencia para mantener el exceso de distractores en los &iacute;tems es porque as&iacute; se puede disminuir la probabilidad de respuesta al azar, sin tener que recurrir a f&oacute;rmulas de correcci&oacute;n.<sup>25&#45;27</sup> Varios autores han demostrado que pocas veces existe m&aacute;s de un distractor funcional por pregunta, lo que puede producir disminuci&oacute;n del &iacute;ndice de dificultad y por lo tanto, resultar perjudicial para la discriminaci&oacute;n del &iacute;tem y para la confiabilidad del examen.<sup>12,13,20</sup> Es importante resaltar que, en la mayor&iacute;a de los casos, la probabilidad de adivinaci&oacute;n se entiende err&oacute;neamente o se sobrestima. La probabilidad de adivinar a ciegas o totalmente al azar es la que t&iacute;picamente se intenta corregir o se considera en el proceso de responder un reactivo del que se desconoce totalmente el contenido; no obstante, se trata de un suceso inveros&iacute;mil y poco frecuente en sustentantes y estudiantes que, en la vida real, contestan ex&aacute;menes, especialmente evaluaciones sumativas de altas consecuencias.</font></p>  	    <p align="justify"><font face="verdana" size="2">El conocimiento parcial, las habilidades para resolver ex&aacute;menes <i>("testwiseness"</i> en ingl&eacute;s) y la capacidad para discriminar distractores no plausibles <i>("educated guessing"</i> en ingl&eacute;s), son pr&aacute;cticas mucho m&aacute;s frecuentes. <sup>25,28,29</sup> Adem&aacute;s, al seguir las directrices para realizar un buen &iacute;tem, y con ello lograr un instrumento de evaluaci&oacute;n adecuado, se asume que cada pregunta es independiente y cada distractor es funcional, por lo que la probabilidad de acertar ciegamente a una de ellas es 0.33 en &iacute;tems de tres opciones, de obtener dos respuestas correctas es 0.11 y as&iacute; sucesivamente hasta ser extremadamente baja en un examen de m&aacute;s de 100 preguntas, como el evaluado en este trabajo.<sup>29</sup></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">La cantidad de preguntas con cuatro DNF es de gran relevancia, ya que pueden amenazar la confiabilidad y validez del examen; especialmente al considerar que se trata de una evaluaci&oacute;n de car&aacute;cter profesional y de altas consecuencias. Estas preguntas tiene una discriminaci&oacute;n baja (media = 0.06) y tienen un alto &iacute;ndice de dificultad &#45;es decir, son m&aacute;s f&aacute;ciles&#45; (media = 0.86), por lo que si se incluyen muchos reactivos con estas caracter&iacute;sticas, sustentantes en el l&iacute;mite de aprobaci&oacute;n pueden lograr acreditar el examen a expensas de las habilidades referidas para contestar ex&aacute;menes que no tienen que ver con el conocimiento del constructo explorado <i>("testwise</i></font><font face="verdana" size="2"><i>ness").</i> Como se document&oacute; en este estudio, el eliminar los reactivos con cuatro DNF no afecta la confiabilidad del instrumento, y pudiera mejorar un poco algunos de sus par&aacute;metros psicom&eacute;tricos.</font></p>     <p align="justify"><font face="verdana" size="2">Algunas de las limitaciones del presente estudio es que solamente se analiz&oacute; un Examen Profesional Te&oacute;rico de una instituci&oacute;n, lo que tiene implicaciones para la validez externa y generalizabilidad ecol&oacute;gica de los resultados. Aunque las interpretaciones de los par&aacute;metros psicom&eacute;tricos son aseveraciones informadas, existe la posibilidad de que resulten imprecisas por la naturaleza multifactorial de los resultados. El an&aacute;lisis psicom&eacute;trico del presente trabajo se bas&oacute; en la Teor&iacute;a Cl&aacute;sica de los </font><font face="verdana" size="2">Test, la cual tiene algunas desventajas, como son el hecho de que la dificultad de los &iacute;tems est&aacute; confundida con la habilidad de los estudiantes, su dependencia del tama&ntilde;o de la muestra y del n&uacute;mero de &iacute;tems, sus limitaciones para evaluar la aptitud de los sustentantes, entre otras. Una alternativa podr&iacute;a ser utilizar la Teor&iacute;a de Respuesta al &Iacute;tem, ya que ofrece otra perspectiva de an&aacute;lisis psicom&eacute;trico y considera las limitaciones de la TCT mencionadas.<sup>18</sup> Por otra parte, el estudio s&oacute;lo evalu&oacute; el an&aacute;lisis psicom&eacute;trico del instrumento y el an&aacute;lisis estad&iacute;stico de los distractores que lo conforman, sin evaluar cualitativamente los elementos propios de los mismos (formato, coherencia, longitud, claridad en la redacci&oacute;n, elecci&oacute;n de vocabulario), tampoco se realiz&oacute; una evaluaci&oacute;n de los distractores <i>a posteriori</i> con expertos en contenido, para identificar las oportunidades educativas de mejora de DNF. Esto ser&aacute; materia de otros trabajos de investigaci&oacute;n.</font></p>     <p align="justify"><font face="verdana" size="2">El t&oacute;pico de la evaluaci&oacute;n de los distractores en POM ha recibido relativamente poca atenci&oacute;n en el pasado, comparado con otros aspectos de los ex&aacute;menes. En la actualidad est&aacute; claro que la b&uacute;squeda de evidencia de validez de los instrumentos de evaluaci&oacute;n en ciencias de la salud debe tener necesariamente el apartado de "estructura interna", que incluye el an&aacute;lisis psicom&eacute;trico de los ex&aacute;menes y el estudio concienzudo del comportamiento num&eacute;rico y gr&aacute;fico de todos y cada uno de los distractores que componen los reactivos.<sup>8,19</sup> El uso apropiado de esta informaci&oacute;n por los elaboradores de ex&aacute;menes y los usuarios de los resultados puede tener un impacto significativo en la profesionalizaci&oacute;n del proceso educativo y de evaluaci&oacute;n. Algunos de los efectos positivos del an&aacute;lisis de los distractores en este tipo de ex&aacute;menes son:</font></p>  	    <blockquote> 		    <p align="justify"><font face="verdana" size="2">&bull;&nbsp;El tener una imagen m&aacute;s realista del instrumento, y no sobreestimar su valor s&oacute;lo porque tiene muchos reactivos con muchas opciones.</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull;&nbsp;El disminuir la cantidad de opciones se puede traducir en menor inversi&oacute;n de tiempo en la construcci&oacute;n del examen, tanto de los elaboradores de reactivos como de los responsables del ensamble, aplicaci&oacute;n y an&aacute;lisis de la prueba. A los escritores de reactivos les cuesta trabajo generar m&aacute;s de tres o cuatro distractores realmente funcionales, y pueden usar un tiempo excesivo en dise&ntilde;ar una quinta opci&oacute;n que a fin de cuentas tenga defectos y sea f&aacute;cilmente eliminada por los estudiantes.</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull;&nbsp;Al disminuir el n&uacute;mero de opciones de cada &iacute;tem en un examen, el tiempo de resoluci&oacute;n del mismo se usa de una manera m&aacute;s eficiente, ya que los sustentantes tardar&aacute;n menos tiempo en responder un igual n&uacute;mero de reactivos.</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull;&nbsp;Por otra parte, si se cuenta con el mismo tiempo de examinaci&oacute;n, se pueden incluir m&aacute;s reactivos. Esto incrementa la validez de contenido al explorar m&aacute;s temas de la tabla de especificaciones (o hacerlo con mayor profundidad).</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull;&nbsp;Al analizar estad&iacute;stica y gr&aacute;ficamente cada distractor, se encuentra un caudal de oportunidades de mejorar los &iacute;tems y en consecuencia, la calidad del instrumento en su conjunto.</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull;&nbsp;Se identifica el papel educativo de cada distractor, que debe visualizarse desde un punto de vista positivo como una oportunidad de detectar deficiencias en el sistema educativo y en el proceso de ense&ntilde;anza&#45;aprendizaje, errores de conceptos en los estudiantes, entre otros.</font></p>  		    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">&bull;&nbsp;El distractor es un elemento esencial de los &iacute;tems, y por lo tanto debe ser &uacute;til para el proceso. Su rol en la exploraci&oacute;n de procesos cognitivos de alto nivel es fundamental. Si un distractor no es &uacute;til, debe ser eliminado o revisado con minuciosidad.</font></p>  		    <p align="justify"><font face="verdana" size="2">&bull;&nbsp;Esta informaci&oacute;n constituye una oportunidad dorada de formaci&oacute;n docente para incrementar la conciencia del profesorado sobre lo dif&iacute;cil que es dise&ntilde;ar instrumentos de alta calidad, los elementos para desarrollar distractores funcionales, y la profesionalizaci&oacute;n gradual de la comunidad de educadores en ciencias de la salud sobre el tema.</font></p> 	</blockquote>  	    <p align="justify"><font face="verdana" size="2">El an&aacute;lisis descriptivo reportado en este trabajo arroja informaci&oacute;n interesante y &uacute;til para la comunidad de educadores en ciencias de la salud, que puede contribuir a la mejor&iacute;a de calidad de los instrumentos e incremento de la validez de las interpretaciones de los resultados. Por otra parte, la informaci&oacute;n obtenida con este estudio contribuy&oacute; a la decisi&oacute;n de utilizar reactivos con menos n&uacute;mero de opciones en el examen profesional a partir de 2008, y a seleccionar los reactivos con mejores caracter&iacute;sticas psicom&eacute;tricas, manteniendo una confiabilidad adecuada.</font></p>  	    <p align="justify"><font face="verdana" size="2">Es importante profesionalizar la evaluaci&oacute;n del aprendizaje en las escuelas de medicina y dem&aacute;s ciencias de la salud, as&iacute; como construir reactivos de opci&oacute;n m&uacute;ltiple que sean pertinentes, con distractores educativamente relevantes y s&oacute;lidos. Cada escuela de medicina, departamento acad&eacute;mico y grupo de profesores debe realizar de manera colegiada y lo m&aacute;s profesional posible, el an&aacute;lisis psicom&eacute;trico de los instrumentos de evaluaci&oacute;n que utiliza. La formaci&oacute;n de profesores adecuada llevar&aacute; a mejor redacci&oacute;n de reactivos, mejor dise&ntilde;o de ex&aacute;menes, mejor medici&oacute;n del aprovechamiento y del nivel de habilidades de los estudiantes, as&iacute; como a una interpretaci&oacute;n m&aacute;s apropiada de los resultados, de los logros y una toma de decisiones m&aacute;s v&aacute;lida para beneficio de los estudiantes, de los educadores y de la sociedad.<sup>4,5</sup></font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Contribuci&oacute;n de los autores</b></font></p>  	    <p align="justify"><font face="verdana" size="2">AJN, FFH, LDM, HSC, AMG y MSM participaron en la concepci&oacute;n y el dise&ntilde;o del estudio, colecci&oacute;n de datos, b&uacute;squeda bibliogr&aacute;fica y redacci&oacute;n del documento.    <br> 	AJN, FFH y LDM realizaron el an&aacute;lisis psicom&eacute;trico de los datos.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Financiamiento</b></font></p>  	    ]]></body>
<body><![CDATA[<p align="justify"><font face="verdana" size="2">Ninguno.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Conflicto de intereses</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Los autores declaran no tener ning&uacute;n conflicto de intereses.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Presentaciones previas</b></font></p>  	    <p align="justify"><font face="verdana" size="2">Trabajo oral en las Jornadas de Educaci&oacute;n M&eacute;dica 2013, Facultad de Medicina de la UNAM.</font></p>  	    <p align="justify"><font face="verdana" size="2">&nbsp;</font></p>  	    <p align="justify"><font face="verdana" size="2"><b>Referencias</b></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">1.&nbsp;Downing SM, Yudkowsky R. Introduction to Assessment in the Health Professions. En: Downing SM, Yudkowsky (Eds). Assessment in Health Professions Education. New York, NY: Routledge; 2009. p. 1&#45;21.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589798&pid=S2007-5057201300040000500001&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">2.&nbsp;Mart&iacute;nez GA, Lifshitz GA, Ponce RR, et al. Evaluaci&oacute;n del desempe&ntilde;o docente en cursos de especializaci&oacute;n m&eacute;dica. Validaci&oacute;n de un cuestionario. Rev Med Inst Mex Seguro Soc 2008;46(4):375&#45;382.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589800&pid=S2007-5057201300040000500002&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">3.&nbsp;Linn RL, Gronlund NE. Measurement and assessment in teaching. 8th ed. USA: Prentice&#45;Hall. 2000. Cap. 2:29&#45;49.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589802&pid=S2007-5057201300040000500003&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">4.&nbsp;Miller GE. The assessment of clinical skills/competence/performance. Acad Med 1990;65(Suppl):S63&#45;S67.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589804&pid=S2007-5057201300040000500004&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">5.&nbsp;Downing SM. Assessment of knowledge with written test forms. In: Norman GR, Van der Vleuten C, Newble DI (eds). International Handbook of Research in Medical Education. Volume II. Dorcrecht: Kluwer Academic Publishers; 2002. p. 647&#45;672.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589806&pid=S2007-5057201300040000500005&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">6.&nbsp;Haladyna TM. Developing and Validating Multiple&#45;Choice Test Items. 3rd Ed. Mahwah, NJ: Lawrence Erlbaum Associates, Inc. Publishers. 2004; Chapter 1:3&#45;18.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589808&pid=S2007-5057201300040000500006&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">7.&nbsp;McCoubrie P. Improving the fairness of multiple&#45;choice questions: a literature review. Med Teach 2004; 26(8):709&#45;712.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589810&pid=S2007-5057201300040000500007&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">8.&nbsp;Downing SM. Validity: on the meaningful interpretation of assessment data. Med Educ 2003; 37:830&#45;837.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589812&pid=S2007-5057201300040000500008&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">9.&nbsp;Haladyna TM, Downing SM, Rodriguez MC. A review of multiple choice item&#45;writing guidelines for classroom assessment. Appl Meas Educ 2002;15(3):309&#45;334.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589814&pid=S2007-5057201300040000500009&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">10.&nbsp;Messick S. Validity. In: Linn RL (ed). Educational Measurement. 3rd ed. New York: American Council on Education and Macmillan; 1989. p. 13&#45;104.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589816&pid=S2007-5057201300040000500010&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">11.&nbsp;Moreno R, Mart&iacute;nez RJ, Mu&ntilde;iz J. Directrices para la construcci&oacute;n de &iacute;tems de elecci&oacute;n m&uacute;ltiple. Psicothema 2006;16(3):490&#45;497.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589818&pid=S2007-5057201300040000500011&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">12.&nbsp;Tarrant M, Ware J, Mohammed AM. An assessment of functioning and non&#45;functioning distractors in multiple&#45;choice questions: a descriptive analysis. BMC Medical Education 2009; 9:40.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589820&pid=S2007-5057201300040000500012&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">13.&nbsp;Rogausch A, Hofer R, Krebs R. Rarely selected distractors in high stakes medical multiple&#45;choice examinations and their recognition by item authors: a simulation and survey. BMC Medical Education 2010;10:85.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589822&pid=S2007-5057201300040000500013&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">14.&nbsp;Galli A, Roiter H, de Molleinet D, et al. Evaluaci&oacute;n de la calidad de las preguntas de selecci&oacute;n m&uacute;ltiple utilizadas en los ex&aacute;menes de Certificaci&oacute;n y Recertificaci&oacute;n en Cardiolog&iacute;a en el a&ntilde;o 2009. Revista Argentina de Cardiolog&iacute;a 2011;79(5):419&#45;422.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589824&pid=S2007-5057201300040000500014&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">15.&nbsp;Cizek GJ, O'Day DM. Further investigation of nonfunctioning options in multiple&#45;choice test items. Educ Psychol Meas 1994;54:861&#45;887.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589826&pid=S2007-5057201300040000500015&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">16.&nbsp;Abad FJ, Olea J, Ponsoda V. Analysis of the optimum number alternatives from the Item Response Theory. Psicothema 2001;13(1):152&#45;158.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589828&pid=S2007-5057201300040000500016&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">17.&nbsp;S&aacute;nchez&#45;Mendiola M, Durante&#45;Montiel I, Morales&#45;L&oacute;pez S, et al. Plan de Estudios 2010 de la Facultad de Medicina de la Universidad Nacional Aut&oacute;noma de M&eacute;xico. Gac M&eacute;d M&eacute;x 2011;147(2):152&#45;158.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589830&pid=S2007-5057201300040000500017&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">18.&nbsp;Delgado&#45;Maldonado L, S&aacute;nchez&#45;Mendiola M. An&aacute;lisis del examen profesional de la Facultad de Medicina de la UNAM: Una experiencia de evaluaci&oacute;n objetiva del aprendizaje con la Teor&iacute;a de Respuesta al &Iacute;tem. Inv Ed Med 2012;1(3):130&#45;139.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589832&pid=S2007-5057201300040000500018&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">19.&nbsp;Haladyna TM. Validity evidence coming from statistical study of item responses. In: Haladyna TM (ed). Developing and Validating Multiple&#45;Choice Test Items. 3rd Ed. Chapter 9. Mahwah, NJ: Lawrence Erlbaum Associates, Inc. Publishers; 2004. p. 202&#45;229.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589834&pid=S2007-5057201300040000500019&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">20.&nbsp;Haladyna TM, Downing SM. How many options is enough for a multiple&#45;choice test item? Educ Psychol Meas 1993;53(4):999&#45;1010.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589836&pid=S2007-5057201300040000500020&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">21.&nbsp;Rodr&iacute;guez MC. Three options are optimal for multiple&#45;choice items: A meta&#45;analysis of 80 years of research. Educ Meas Issues Pract 2005;24(2):3&#45;13.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589838&pid=S2007-5057201300040000500021&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">22.&nbsp;S&aacute;nchez&#45;Mendiola M. Educaci&oacute;n m&eacute;dica basada en evidencias: &iquest;ser o no ser? Inv Ed Med 2012; 1(2):82&#45;89.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589840&pid=S2007-5057201300040000500022&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">23.&nbsp;Owen SV, Froman RD. What's wrong with three&#45;option multiple choice items? Educ Psychol Meas 1987;47:513&#45;522.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589842&pid=S2007-5057201300040000500023&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">24.&nbsp;Cizek GJ, Robinson L, O'Day DM. Nonfunctioning options: A closer look. Educ Psychol Meas 1998;58(4):605&#45;611.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589844&pid=S2007-5057201300040000500024&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">25.&nbsp;Rogers WT, Harley D. An empirical comparison of three&#45; and four&#45;choice items and tests: susceptibility to testwiseness and internal consistency reliability. Educ Psychol Meas 1999;59:234&#45;247.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589846&pid=S2007-5057201300040000500025&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">26.&nbsp;Bruno JE, Dirkzwager A. Determining the optimal number of alternatives to a multiple&#45;choice test. Educ Psychol Meas 1995;55(6):959&#45;966.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589848&pid=S2007-5057201300040000500026&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">27.&nbsp;Burton RF. Multiple choice and true/false tests: reliability measures and some implications of negative marking. Assessment &amp; Evaluation in Higher Education 2004;29(5):585&#45;595.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589850&pid=S2007-5057201300040000500027&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">28.&nbsp;Burton RF. Multiple&#45;choice and true/false tests: myths and misapprehensions. Assessment &amp; Evaluation in Higher Education 2005;30(1):65&#45;72.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589852&pid=S2007-5057201300040000500028&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>  	    <!-- ref --><p align="justify"><font face="verdana" size="2">29.&nbsp;Downing SM. Guessing on selected&#45;response examinations. Med Educ 2003;37:670&#45;671.    &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;[&#160;<a href="javascript:void(0);" onclick="javascript: window.open('/scielo.php?script=sci_nlinks&ref=4589854&pid=S2007-5057201300040000500029&lng=','','width=640,height=500,resizable=yes,scrollbars=1,menubar=yes,');">Links</a>&#160;]<!-- end-ref --></font></p>      ]]></body><back>
<ref-list>
<ref id="B1">
<label>1</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Downing]]></surname>
<given-names><![CDATA[SM]]></given-names>
</name>
<name>
<surname><![CDATA[Yudkowsky]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Introduction to Assessment in the Health Professions]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Downing]]></surname>
<given-names><![CDATA[SM]]></given-names>
</name>
<name>
<surname><![CDATA[Yudkowsky]]></surname>
</name>
</person-group>
<source><![CDATA[Assessment in Health Professions Education]]></source>
<year>2009</year>
<page-range>1-21</page-range><publisher-loc><![CDATA[New York^eNY NY]]></publisher-loc>
<publisher-name><![CDATA[Routledge]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B2">
<label>2</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Martínez]]></surname>
<given-names><![CDATA[GA]]></given-names>
</name>
<name>
<surname><![CDATA[Lifshitz]]></surname>
<given-names><![CDATA[GA]]></given-names>
</name>
<name>
<surname><![CDATA[Ponce]]></surname>
<given-names><![CDATA[RR]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Evaluación del desempeño docente en cursos de especialización médica: Validación de un cuestionario]]></article-title>
<source><![CDATA[Rev Med Inst Mex Seguro Soc]]></source>
<year>2008</year>
<volume>46</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>375-382</page-range></nlm-citation>
</ref>
<ref id="B3">
<label>3</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Linn]]></surname>
<given-names><![CDATA[RL]]></given-names>
</name>
<name>
<surname><![CDATA[Gronlund]]></surname>
<given-names><![CDATA[NE]]></given-names>
</name>
</person-group>
<source><![CDATA[Measurement and assessment in teaching]]></source>
<year>2000</year>
<edition>8</edition>
<page-range>29-49</page-range><publisher-name><![CDATA[Prentice-Hall]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B4">
<label>4</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Miller]]></surname>
<given-names><![CDATA[GE]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[The assessment of clinical skills/competence/performance]]></article-title>
<source><![CDATA[Acad Med]]></source>
<year>1990</year>
<volume>65</volume>
<numero>^sSuppl</numero>
<issue>^sSuppl</issue>
<supplement>Suppl</supplement>
<page-range>S63-S67</page-range></nlm-citation>
</ref>
<ref id="B5">
<label>5</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Downing]]></surname>
<given-names><![CDATA[SM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Assessment of knowledge with written test forms]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Norman]]></surname>
<given-names><![CDATA[GR]]></given-names>
</name>
<name>
<surname><![CDATA[Van der Vleuten]]></surname>
<given-names><![CDATA[C]]></given-names>
</name>
<name>
<surname><![CDATA[Newble]]></surname>
<given-names><![CDATA[DI]]></given-names>
</name>
</person-group>
<source><![CDATA[International Handbook of Research in Medical Education. Volume II]]></source>
<year>2002</year>
<page-range>647-672</page-range><publisher-loc><![CDATA[Dorcrecht ]]></publisher-loc>
<publisher-name><![CDATA[Kluwer Academic Publishers]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B6">
<label>6</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Haladyna]]></surname>
<given-names><![CDATA[TM]]></given-names>
</name>
</person-group>
<source><![CDATA[Developing and Validating Multiple-Choice Test Items]]></source>
<year>2004</year>
<edition>3</edition>
<page-range>3-18</page-range><publisher-loc><![CDATA[^eNJ NJ]]></publisher-loc>
<publisher-name><![CDATA[Lawrence Erlbaum AssociatesInc. Publishers]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B7">
<label>7</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[McCoubrie]]></surname>
<given-names><![CDATA[P]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Improving the fairness of multiple-choice questions: a literature review]]></article-title>
<source><![CDATA[Med Teach]]></source>
<year>2004</year>
<volume>26</volume>
<numero>8</numero>
<issue>8</issue>
<page-range>709-712</page-range></nlm-citation>
</ref>
<ref id="B8">
<label>8</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Downing]]></surname>
<given-names><![CDATA[SM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Validity: on the meaningful interpretation of assessment data]]></article-title>
<source><![CDATA[Med Educ]]></source>
<year>2003</year>
<volume>37</volume>
<page-range>830-837</page-range></nlm-citation>
</ref>
<ref id="B9">
<label>9</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Haladyna]]></surname>
<given-names><![CDATA[TM]]></given-names>
</name>
<name>
<surname><![CDATA[Downing]]></surname>
<given-names><![CDATA[SM]]></given-names>
</name>
<name>
<surname><![CDATA[Rodriguez]]></surname>
<given-names><![CDATA[MC]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[A review of multiple choice item-writing guidelines for classroom assessment]]></article-title>
<source><![CDATA[Appl Meas Educ]]></source>
<year>2002</year>
<volume>15</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>309-334</page-range></nlm-citation>
</ref>
<ref id="B10">
<label>10</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Messick]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Validity]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Linn]]></surname>
<given-names><![CDATA[RL]]></given-names>
</name>
</person-group>
<source><![CDATA[Educational Measurement]]></source>
<year>1989</year>
<edition>3</edition>
<page-range>13-104</page-range><publisher-loc><![CDATA[New York ]]></publisher-loc>
<publisher-name><![CDATA[American Council on Education and Macmillan]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B11">
<label>11</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Moreno]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Martínez]]></surname>
<given-names><![CDATA[RJ]]></given-names>
</name>
<name>
<surname><![CDATA[Muñiz]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Directrices para la construcción de ítems de elección múltiple]]></article-title>
<source><![CDATA[Psicothema]]></source>
<year>2006</year>
<volume>16</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>490-497</page-range></nlm-citation>
</ref>
<ref id="B12">
<label>12</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Tarrant]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Ware]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Mohammed]]></surname>
<given-names><![CDATA[AM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An assessment of functioning and non-functioning distractors in multiple-choice questions: a descriptive analysis]]></article-title>
<source><![CDATA[BMC Medical Education]]></source>
<year>2009</year>
<volume>9</volume>
<page-range>40</page-range></nlm-citation>
</ref>
<ref id="B13">
<label>13</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rogausch]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Hofer]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
<name>
<surname><![CDATA[Krebs]]></surname>
<given-names><![CDATA[R]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Rarely selected distractors in high stakes medical multiple-choice examinations and their recognition by item authors: a simulation and survey]]></article-title>
<source><![CDATA[BMC Medical Education]]></source>
<year>2010</year>
<volume>10</volume>
<page-range>85</page-range></nlm-citation>
</ref>
<ref id="B14">
<label>14</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Galli]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
<name>
<surname><![CDATA[Roiter]]></surname>
<given-names><![CDATA[H]]></given-names>
</name>
<name>
<surname><![CDATA[de Molleinet]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Evaluación de la calidad de las preguntas de selección múltiple utilizadas en los exámenes de Certificación y Recertificación en Cardiología en el año 2009]]></article-title>
<source><![CDATA[Revista Argentina de Cardiología]]></source>
<year>2011</year>
<volume>79</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>419-422</page-range></nlm-citation>
</ref>
<ref id="B15">
<label>15</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cizek]]></surname>
<given-names><![CDATA[GJ]]></given-names>
</name>
<name>
<surname><![CDATA[O'Day]]></surname>
<given-names><![CDATA[DM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Further investigation of nonfunctioning options in multiple-choice test items]]></article-title>
<source><![CDATA[Educ Psychol Meas]]></source>
<year>1994</year>
<volume>54</volume>
<page-range>861-887</page-range></nlm-citation>
</ref>
<ref id="B16">
<label>16</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Abad]]></surname>
<given-names><![CDATA[FJ]]></given-names>
</name>
<name>
<surname><![CDATA[Olea]]></surname>
<given-names><![CDATA[J]]></given-names>
</name>
<name>
<surname><![CDATA[Ponsoda]]></surname>
<given-names><![CDATA[V]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Analysis of the optimum number alternatives from the Item Response Theory]]></article-title>
<source><![CDATA[Psicothema]]></source>
<year>2001</year>
<volume>13</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>152-158</page-range></nlm-citation>
</ref>
<ref id="B17">
<label>17</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sánchez-Mendiola]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
<name>
<surname><![CDATA[Durante-Montiel]]></surname>
<given-names><![CDATA[I]]></given-names>
</name>
<name>
<surname><![CDATA[Morales-López]]></surname>
<given-names><![CDATA[S]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Plan de Estudios 2010 de la Facultad de Medicina de la Universidad Nacional Autónoma de México]]></article-title>
<source><![CDATA[Gac Méd Méx]]></source>
<year>2011</year>
<volume>147</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>152-158</page-range></nlm-citation>
</ref>
<ref id="B18">
<label>18</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Delgado-Maldonado]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[Sánchez-Mendiola]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Análisis del examen profesional de la Facultad de Medicina de la UNAM: Una experiencia de evaluación objetiva del aprendizaje con la Teoría de Respuesta al Ítem]]></article-title>
<source><![CDATA[Inv Ed Med]]></source>
<year>2012</year>
<volume>1</volume>
<numero>3</numero>
<issue>3</issue>
<page-range>130-139</page-range></nlm-citation>
</ref>
<ref id="B19">
<label>19</label><nlm-citation citation-type="book">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Haladyna]]></surname>
<given-names><![CDATA[TM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Validity evidence coming from statistical study of item responses]]></article-title>
<person-group person-group-type="editor">
<name>
<surname><![CDATA[Haladyna]]></surname>
<given-names><![CDATA[TM]]></given-names>
</name>
</person-group>
<source><![CDATA[Developing and Validating Multiple-Choice Test Items]]></source>
<year>2004</year>
<edition>3</edition>
<page-range>202-229</page-range><publisher-loc><![CDATA[^eNJ NJ]]></publisher-loc>
<publisher-name><![CDATA[Lawrence Erlbaum AssociatesInc. Publishers]]></publisher-name>
</nlm-citation>
</ref>
<ref id="B20">
<label>20</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Haladyna]]></surname>
<given-names><![CDATA[TM]]></given-names>
</name>
<name>
<surname><![CDATA[Downing]]></surname>
<given-names><![CDATA[SM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[How many options is enough for a multiple-choice test item]]></article-title>
<source><![CDATA[Educ Psychol Meas]]></source>
<year>1993</year>
<volume>53</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>999-1010</page-range></nlm-citation>
</ref>
<ref id="B21">
<label>21</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rodríguez]]></surname>
<given-names><![CDATA[MC]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Three options are optimal for multiple-choice items: A meta-analysis of 80 years of research]]></article-title>
<source><![CDATA[Educ Meas Issues Pract]]></source>
<year>2005</year>
<volume>24</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>3-13</page-range></nlm-citation>
</ref>
<ref id="B22">
<label>22</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Sánchez-Mendiola]]></surname>
<given-names><![CDATA[M]]></given-names>
</name>
</person-group>
<article-title xml:lang="es"><![CDATA[Educación médica basada en evidencias: ¿ser o no ser?]]></article-title>
<source><![CDATA[Inv Ed Med]]></source>
<year>2012</year>
<volume>1</volume>
<numero>2</numero>
<issue>2</issue>
<page-range>82-89</page-range></nlm-citation>
</ref>
<ref id="B23">
<label>23</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Owen]]></surname>
<given-names><![CDATA[SV]]></given-names>
</name>
<name>
<surname><![CDATA[Froman]]></surname>
<given-names><![CDATA[RD]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[What's wrong with three-option multiple choice items]]></article-title>
<source><![CDATA[Educ Psychol Meas]]></source>
<year>1987</year>
<volume>47</volume>
<page-range>513-522</page-range></nlm-citation>
</ref>
<ref id="B24">
<label>24</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Cizek]]></surname>
<given-names><![CDATA[GJ]]></given-names>
</name>
<name>
<surname><![CDATA[Robinson]]></surname>
<given-names><![CDATA[L]]></given-names>
</name>
<name>
<surname><![CDATA[O'Day]]></surname>
<given-names><![CDATA[DM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Nonfunctioning options: A closer look]]></article-title>
<source><![CDATA[Educ Psychol Meas]]></source>
<year>1998</year>
<volume>58</volume>
<numero>4</numero>
<issue>4</issue>
<page-range>605-611</page-range></nlm-citation>
</ref>
<ref id="B25">
<label>25</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Rogers]]></surname>
<given-names><![CDATA[WT]]></given-names>
</name>
<name>
<surname><![CDATA[Harley]]></surname>
<given-names><![CDATA[D]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[An empirical comparison of three- and four-choice items and tests: susceptibility to testwiseness and internal consistency reliability]]></article-title>
<source><![CDATA[Educ Psychol Meas]]></source>
<year>1999</year>
<volume>59</volume>
<page-range>234-247</page-range></nlm-citation>
</ref>
<ref id="B26">
<label>26</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Bruno]]></surname>
<given-names><![CDATA[JE]]></given-names>
</name>
<name>
<surname><![CDATA[Dirkzwager]]></surname>
<given-names><![CDATA[A]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Determining the optimal number of alternatives to a multiple-choice test]]></article-title>
<source><![CDATA[Educ Psychol Meas]]></source>
<year>1995</year>
<volume>55</volume>
<numero>6</numero>
<issue>6</issue>
<page-range>959-966</page-range></nlm-citation>
</ref>
<ref id="B27">
<label>27</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Burton]]></surname>
<given-names><![CDATA[RF]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Multiple choice and true/false tests: reliability measures and some implications of negative marking]]></article-title>
<source><![CDATA[Assessment & Evaluation in Higher Education]]></source>
<year>2004</year>
<volume>29</volume>
<numero>5</numero>
<issue>5</issue>
<page-range>585-595</page-range></nlm-citation>
</ref>
<ref id="B28">
<label>28</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Burton]]></surname>
<given-names><![CDATA[RF]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Multiple-choice and true/false tests: myths and misapprehensions]]></article-title>
<source><![CDATA[Assessment & Evaluation in Higher Education]]></source>
<year>2005</year>
<volume>30</volume>
<numero>1</numero>
<issue>1</issue>
<page-range>65-72</page-range></nlm-citation>
</ref>
<ref id="B29">
<label>29</label><nlm-citation citation-type="journal">
<person-group person-group-type="author">
<name>
<surname><![CDATA[Downing]]></surname>
<given-names><![CDATA[SM]]></given-names>
</name>
</person-group>
<article-title xml:lang="en"><![CDATA[Guessing on selected-response examinations]]></article-title>
<source><![CDATA[Med Educ]]></source>
<year>2003</year>
<volume>37</volume>
<page-range>670-671</page-range></nlm-citation>
</ref>
</ref-list>
</back>
</article>
