Reglas de asociación como estrategia de selección de ítems en exámenes adaptativos computarizados

Pacheco Ortiz, Josué; Rodríguez Mazahua, Lisbeth; Alor Hernández, Giner; Pacheco Ortiz, Josué; Rodríguez Mazahua, Lisbeth; Alor Hernández, Giner

doi:10.30878/ces.v30n2a10

Servicios Personalizados

Revista

Articulo

Indicadores

Citado por SciELO
Accesos

Links relacionados

Similares en SciELO

Otros
Otros

Permalink

Ciencia ergo sum

versión On-line ISSN 2395-8782versión impresa ISSN 1405-0269

Cienc. ergo-sum vol.30 no.2 Toluca jul. 2023 Epub 02-Dic-2024

https://doi.org/10.30878/ces.v30n2a10

Espacio del Divulgador

Reglas de asociación como estrategia de selección de ítems en exámenes adaptativos computarizados

Association rules as a item selection strategy in computerized adaptive testing

Josué Pacheco Ortiz¹iscjpo@gmail.com
http://orcid.org/0000-0002-2694-2827

Lisbeth Rodríguez Mazahua²lrodriguezm@ito-depi.edu.mx
http://orcid.org/0000-0002-9861-3993

Giner Alor Hernández³giner.ah@orizaba.tecnm.mx
http://orcid.org/0000-0003-3296-0981

^¹Tecnológico Nacional de México, México

^²Tecnológico Nacional de México, México

^³Tecnológico Nacional de México, México

Resumen

Se propone un método de selección de ítems en los CAT (Computerized Adaptive Testing) basado en reglas de asociación. De acuerdo con la respuesta correcta (1) o incorrecta (0) del evaluado a cada pregunta, se buscan reglas de asociación que tengan como antecedente la pregunta contestada y su resultado (1 o 0) y, como consecuente, ítems con mayor o menor nivel de complejidad que el ítem respondido, respectivamente. La elección del ítem se realiza considerando las reglas con la mayor confianza y soporte. Para finalizar, se incluye un ejemplo para demostrar la eficacia del método propuesto.

Palabras clave exámenes adaptativos computarizados; minería de datos; reglas de asociación

Abstract

An item selection method in CAT (Computerized Adaptive Testing) based on association rules is proposed. According to the correct (1) or incorrect (0) answer to each item, association rules are sought with the answered item and its result (1 or 0) as antecedent, and as consequent, items with higher or lower complexity level than the answered item respectively. The election of the item is performed considering rules with the highest confidence and support. Finally, we include an example to demonstrate the effectiveness of the proposed method.

Keywords computerized adaptive testing; data mining; association rules

Introducción

Los CAT (Computerized Adaptive Testing) son una forma de evaluación cuya característica principal es la de adaptar las preguntas siguientes de acuerdo con las respuestas que otorga el evaluado en las preguntas previas.

El algoritmo de selección de ítems dentro del proceso de los CAT inicia con la selección de la primera pregunta de dificultad media y, dependiendo de la respuesta que otorgue la persona evaluada, adaptará la dificultad de la siguiente. Maximizar la precisión del examen es el objetivo principal de los CAT. Una de la sus ventajas fundamentales es que ocupan menos preguntas y toman menos tiempo que los exámenes tradicionales en lápiz y papel, pero conservan o mejoran el nivel de precisión (^{López-Cuadrado et
al., 2010}).

Así también, entre sus componentes principales está el criterio de selección de ítems. En la actualidad, la información máxima de Fisher (^{Albano et al., 2019}) es uno de los métodos más empleados, pero presenta diversas desventajas, entre las cuales se encuentran a) sesgo en la elección de ítems, b) error en la estimación de habilidad y c) duplicidad de ítems presentados (^{Sheng et
al., 2018}; ^{Lin y Chang, 2019}; ^{Yigit et al., 2019}). Algunos trabajos se han enfocado en tratar de resolver los problemas presentados utilizando otras herramientas en la etapa de selección como algoritmo voraz (^{Bengs et al.,
2018}) y Kullback-Leibler Information (^{Tokusada y Hirose, 2016}); sin embargo, a pesar de que han tenido resultados favorables, estos sólo han sido en estudios de simulación y no en aplicación con grupos reales de evaluados.

En este artículo se presenta un método de evaluación adaptativa computarizada que utiliza la minería de reglas de asociación como estrategia de selección de ítems, por medio de la cual se busca aprovechar las ventajas potenciales de las reglas de asociación para encontrar relaciones entre las preguntas contestadas correcta o incorrectamente y las preguntas contestadas correctamente y presentar las preguntas más adecuadas (con mayor probabilidad de contestar correctamente) en los exámenes de acuerdo con las respuestas del evaluado, y donde se considere las mejores reglas (guardadas en la base de datos de alumnos que contestaron el mismo examen previamente) con mayor soporte y confianza. Es importante mencionar que estas dos características son en las que está basado el algoritmo para hacer una correcta elección de la regla para la selección de la pregunta.

En la figura 1 se muestra el proceso seguido por los CAT (^{Oppl et
al., 2017}), el cual comienza con la estimación inicial de conocimientos de la persona evaluada. Posteriormente, el primer ítem es seleccionado y presentado a la persona evaluada. Una vez que la respuesta se obtiene, una nueva estimación de conocimientos se lleva a cabo. La siguiente etapa consiste en verificar si el criterio de parada se cumple. Si esto no sucede, el siguiente ítem es seleccionado y el ciclo comienza de nuevo: se repite hasta que se cumple el criterio de parada. Cuando esto ocurre, se lleva a cabo una estimación final de conocimiento y termina el proceso.

Fuente: elaboración propia.

Figura 1 Proceso CAT

A lo largo del tiempo, diversos métodos, herramientas y estrategias han sido empleados en las distintas fases del CAT, por ejemplo el modelo logístico de tres parámetros (3PL) para la calibración de ítems, la estimación de máxima verosimilitud (MLE) para la estimación de habilidad del evaluado y las diferencias cuadráticas medias como criterio de evaluación.

1. Reglas de asociación

La minería de reglas de asociación tiene como finalidad encontrar relaciones entre los elementos u objetos de una base de datos, es decir, permite descubrir patrones comunes en los elementos. Su uso se puede encontrar en diversas áreas como de salud (^{Zhang et
al., 2020}) y aprendizaje en línea (^{Paladines Rodríguez et al.,
2021}); en cada uno de los casos ofrece resultados positivos.

Existen diversos algoritmos para la minería de reglas de asociación, entre los cuales destacan Apriori (^{Agrawal
et al., 1993}), FPGrowth (^{Han et al., 2016}), PredictiveApriori (^{Scheffer,
2001}) y Tertius (^{Flach & Lachiche, 2001}). Además, para el análisis comparativo de los algoritmos de reglas de asociación, se utilizan diversos criterios:

a) Confianza: evalúa el grado de certeza de la asociación detectada.

b) Soporte: representa el porcentaje de transacciones de la base de datos que satisface la regla dada.

c) Tiempo: número de milisegundos que toma la construcción de un modelo.

d) Reglas: representa el número de reglas interesantes obtenidas.

e) Sustentación: indica la relación entre el soporte observado de un conjunto de elementos y el soporte teórico de ese conjunto dada la suposición de independencia.

2. Proceso CAT con reglas de asociación

La figura 2 ilustra el método de evaluación adaptativa computarizada propuesto que integra a la minería de reglas de asociación como estrategia de selección de ítems en el proceso de los CAT. A continuación se muestra su empleo:

a) Basándose en que cada pregunta o ítem tiene un nivel de complejidad (1 a 100), el sistema elige la pregunta inicial de acuerdo con el criterio de arranque seleccionado, el cual es la elección de una pregunta de nivel medio.

b) Para la elección de la siguiente pregunta:

• Si la respuesta de la pregunta inmediata anterior fue correcta (pX = 1), el sistema elige una de mayor complejidad (pY) tomando en cuenta las reglas de asociación almacenadas en la base de datos (de alumnos que presentaron la misma prueba previamente), con mayor soporte y confianza. Las reglas de asociación se generan de la siguiente forma:

pX = 1=> pY = 1 (1)

• Si la respuesta de la pregunta inmediata anterior fue errónea (pX = 0), el sistema elige una de menor nivel de complejidad (pZ) tomando en cuenta las reglas de asociación almacenadas en la base de datos (de alumnos que presentaron la misma prueba previamente), con mayor soporte y confianza.

pX = 0 => pZ = 1 (2)

Fuente: elaboración propia.

Figura 2 Proceso CAT con reglas de asociación

c) El proceso del paso 2 se repite con cada una de las preguntas siguientes.

d) Después de finalizar el número de preguntas establecidas por el profesor, el sistema termina el examen, guarda toda la información generada en su base de datos y proporciona la calificación al alumno.

e) El alumno cierra sesión o regresa a la página inicial para presentar otro examen.

Finalmente, el sistema origina reglas de asociación a través de la aplicación inmediata del algoritmo Apriori (^{Agrawal et al., 1993}) a la información guardada con la finalidad de encontrar relaciones entre las preguntas contestadas y que sirvan como base para la próxima vez que un alumno presente el mismo examen.

3. Selección de ítems con reglas de asociación

La figura 3 muestra el proceso completo de la fase de selección de ítems aplicando reglas de asociación. A continuación se describe:

Fuente: elaboración propia.

Figura 3 Etapa de selección de ítems con reglas de asociación

El proceso de la fase de selección de ítems comienza cuando el algoritmo verifica si la respuesta a la pregunta anterior fue correcta o incorrecta. En caso de ser correcta:

a) Se seleccionan todos los ítems con mayor nivel de dificultad que el ítem presentado y se descartan los ya mostrados. A este conjunto de ítems se les denomina “ítems disponibles”.

b) Se verifica si existen reglas de asociación almacenadas en la base de datos para el ítem presentado. En caso de existir, se obtienen. A este conjunto se le denomina “reglas encontradas”. Si no existen reglas, se procede al paso 5.

c) El siguiente paso consiste en revisar cada una de las reglas encontradas: primero se revisa si la pregunta consecuente de la regla ya fue presentada al alumno; en caso de ser afirmativo, se descarta la regla. Si no lo ha sido, entonces ahora se verifica si la pregunta consecuente tiene mayor nivel de complejidad que la pregunta previa; en caso de ser negativo, se descarta la regla. Si la regla ha pasado los dos filtros previos, se guarda de manera temporal en un grupo llamado “reglas guardadas”.

d) El paso 3 se repite para cada una de las reglas encontradas. Cuando ya no hay más, entonces se comprueba si el conjunto de reglas guardadas es igual a 0. Si es afirmativo, se procede al paso 5 y si es negativo, se seleccionan reglas con mayor confianza y soporte y se procede a verificar si existe más de una regla con la misma confianza y soporte. Si es negativo, se procede al paso 6 y si es positivo, se selecciona la regla cuyo consecuente tenga el mayor nivel de dificultad y se continúa con el paso 6.

e) Se verifica si la pregunta recién presentada es la de máxima dificultad en la lista general de ítems. En caso de ser afirmativo, se elige una pregunta con menor dificultad y con mayor dificultad del grupo de ítems disponibles y se procede al paso 6; de ser negativo, se selecciona la pregunta con mayor dificultad del grupo de ítems disponibles y se sigue con el paso 6.

f) Se presenta la pregunta y termina la etapa de selección de ítems.

Si la respuesta a la pregunta anterior es incorrecta, prácticamente se sigue el mismo proceso con las siguientes diferencias:

a) En el paso 1 se seleccionan ítems con menor nivel de dificultad que el ítem presentado.

b) En el paso 3 se verifica si la pregunta consecuente de la regla tiene menor nivel de complejidad.

c) En el paso 5 se revisa si la pregunta reciente presentada es la de mínima dificultad en la lista general de ítems. En caso de ser afirmativo, se selecciona la pregunta con mayor nivel de dificultad del grupo de ítems disponibles; en caso de ser negativo, sería una pregunta con menor dificultad del ítem presentado y mayor dificultad del grupo de ítems disponibles. En ambos casos igual se procede al paso 6.

3. 1. Ejemplo

Suponiendo que se toma el mismo nivel de estimación inicial de habilidad para todos los alumnos de un grupo (pregunta con dificultad media) y se tienen 10 preguntas identificadas como Pregunta1 a Pregunta10, ordenadas de acuerdo con su nivel de dificultad de menor a mayor respectivamente, la última pregunta presentada fue la Pregunta7 y la respuesta del alumno fue correcta, entonces:

a) El algoritmo selecciona todas las preguntas con mayor nivel de dificultad que la pregunta presentada; descarta las preguntas ya presentadas: Pregunta8, Pregunta9 y Pregunta10 (paso 1).

b) Se verifica si existen reglas para la Pregunta7. Al respecto, se tienen dos:

• Pregunta7(1) => Pregunta8(1) Confianza = 1, Soporte 0.90

• Pregunta7(1) => Pregunta10(1) Confianza = 1, Soporte 0.90

Lo anterior significa que si se contesta bien la Pregunta7, entonces implica mayor probabilidad de responder correctamente la Pregunta8 y la Pregunta10. Este conjunto se reglas reciben el nombre de “reglas encontradas” (paso 2).

c) El algoritmo comprueba si la pregunta consecuente (Pregunta8) de la primera regla encontrada ya fue presentada. Si no ha sido presentada, entonces se tiene que verificar si la pregunta tiene mayor nivel de dificultad. En este caso sí presenta mayor nivel de dificultad; por lo tanto, procede a almacenarla de manera temporal en “reglas guardadas”. Se repite el proceso con la pregunta consecuente (Pregunta10) de la segunda regla, siendo el mismo resultado, y también la almacena (paso 3).

d) El siguiente paso en el algoritmo consiste en verificar si existe más de una regla en “reglas guardadas” que tenga el mismo nivel de confianza y soporte; para este ejemplo ambas reglas cuentan con los mismos niveles. Por lo tanto, el algoritmo selecciona la regla cuya pregunta consecuente posea el mayor nivel de dificultad; para este caso, la segunda regla dispone de la Pregunta10 que, de acuerdo con las bases del ejemplo, es la que tiene mayor nivel de dificultad (paso 4).

e) Por último, la Pregunta10 es presentada al alumno (paso 6).

Prospectiva

La contribución principal de este artículo es proponer un método de evaluación adaptativa computarizada que integra a la minería de reglas de asociación como estrategia de selección de ítems. La principal ventaja de este método es que la selección se basa en los datos recolectados de otros estudiantes que han realizado el mismo examen con el objetivo de presentar al evaluado las preguntas con mayor probabilidad de responder correctamente. En el futuro, se desarrollará una aplicación web que implemente el método propuesto y se aplicará en un curso de bases de datos en nivel maestría para evaluar su desempeño.

Conclusiones

Evaluar es una parte fundamental dentro del proceso enseñanza-aprendizaje, ya que no solamente le da una nota o calificación al alumno, sino que, además, le brinda información al profesor acerca de las ventajas y desventajas que tiene cada evaluado, lo cual puede ser utilizado para mejorar la calidad del proceso. A lo largo del tiempo, las pruebas o exámenes han sido la forma más de común de medir el nivel de conocimientos de las personas.

Mientras que en el sistema tradicional suele aplicarse el mismo examen para todas las personas que forman parte de un grupo físico, en el sistema e-Learning las pruebas son de manera digital y, de la misma forma que en el sistema tradicional de enseñanza, también puede aplicarse el mismo examen para todos los alumnos que forman parte de un grupo virtual. Sin embargo, con el surgimiento de los CAT, las pruebas pueden adaptarse al nivel de conocimiento de los evaluados.

El proceso de los CAT contempla varias etapas: una de las principales es la selección de ítems, donde la información máxima de Fisher es uno de los criterios más empleados, aunque plantea ciertas desventajas, tales como repetición de ítems presentados, sesgo en la elección, entre otras. Para tratar de resolver estos errores, este artículo muestra la aplicación de la minería de reglas de asociación como una estrategia de selección de ítems, donde, basándose en el conocimiento generado en información de exámenes previamente contestados por alumnos, el algoritmo de selección puede elegir los ítems que mejor se adapten al alumno de acuerdo con su nivel de conocimiento.

El proceso de selección de ítems presentado se empleará en la implementación de un sistema de evaluación CAT, cuya característica principal es la de utilizar reglas de asociación en la etapa de selección; por el momento, el sistema de evaluación se encuentra en la etapa de desarrollo. Al finalizar, se llevarán a cabo pruebas de simulación que permitirán verificar su eficacia.

Agradecimientos

Agradecemos al Consejo Nacional de Ciencia y Tecnología (Conacyt) por la beca de doctorado otorgada a Josué Pacheco Ortiz y al Tecnológico Nacional de México (TecNM) por apoyar el desarrollo de este trabajo. Asimismo, a los árbitros de la revista por sus aportes que permitieron mejorar el contenido.

Referencias

Agrawal, R., Imielinski, T., & Swam, A. (1993). Mining association rules between sets of items in large databases. Proceedings of the ACM SIGMOD International Conference on Management of Data, 22(2), 207-216. [ Links ]

Albano, A., Cai, L., Lease, E., & McConnell, S. (2019). Computerized adaptive testing in early education: exploring the impact of item position effects on ability estimation. Journal of Educational Measurement, 56(2), 437-451. https://doi.org/10.1111/jedm.12215 [ Links ]

Bengs, D., Brefeld, U., & Kröhne, U. (2018). Adaptive item selection under matroid constraints. Journal of Computerized Adaptive Testing, 6(2), 15-36. https://doi.org/10.7333/1808-0602015 [ Links ]

Flach, P., & Lachiche, N. (2001). Confirmation-guided discovery of first-order rules with tertius. Machine Learning, 42(1-2), 61-95. [ Links ]

Han, J., Kamber, M., & Pei, J. (2016). Data mining: Concepts and techniques (3th ed.). Morgan Kaufmann. [ Links ]

Lin, C.-J., & Chang, H.-H. (2019). Item selection criteria with practical constraints in cognitive diagnostic computerized adaptive testing. Educational and Psychological, 79(2), 1-23. https://doi.org/10.1177/0013164418790634 [ Links ]

López-Cuadrado, J., Pérez, T., Vadillo, J., & Gutiérrez, J. (2010). Calibration of an item bank for the assessment of Basque language knowledge. Computers & Education, 55, 1044-1055. [ Links ]

Oppl, S., Reisinger, F., Eckmaier, A., & Helm, C. (2017). A flexible online platform for computerized adaptive testing. International Journal of Educational Technology in Higher Education, 14(2), 2-21. https://doi.org/10.1186/s41239-017-0039-0 [ Links ]

Paladines Rodríguez, J., Carreño Arce, C., & Parrales Loor, A. (2021). Incidencia en la deserción de los cursos de primer nivel de la carrera de desarrollo de software del instituto superior tecnológico Guayaquil. Serie Científica de la Universidad de las Ciencias Informáticas, 14(6), 43-58. [ Links ]

Scheffer, T. (2001). Finding association rules that trade support optimally against confidence. Principles of Data Mining and Knowledge Discovery, 9(4), 224-235. [ Links ]

Sheng, C., Bingwei, B., & Jiecheng, Z. (2018). An Adaptive Online Learning Testing System. ICIET ‘18 Proceedings of the 6th International Conference on Information and Education Technology, 55(1), 18-24. https://doi.org/10.1145/3178158.3178187 [ Links ]

Tokusada, Y., & Hirose, H. (2016). Evaluation of Abilities by Grouping for Small IRT Testing Systems. 5th IIAI International Congress on Advanced Applied Informatics, 445-449. https://doi.org/10.1109/IIAI-AAI.2016.50 [ Links ]

Yigit, H., Sorrel, M., & De la Torre, J. (2019). Computerized adaptive testing for cognitively based multiple-choice data. Applied Psychological Measurement, 43(5), 1-14. [ Links ]

Zhang, D., Jintao, L., Zhang, B., Zhang, X., Jiang, H., & Lin, Z. (2020). The characteristics and regularities of cardiac adverse drug reactions induced by Chinese materia medica: A bibliometric research and association rules analysis. Journal of Ethnopharmacology, 252, 1-12. [ Links ]

Recibido: 16 de Noviembre de 2021; Aprobado: 16 de Marzo de 2022

lrodriguezm@ito-depi.edu.mx

Atribución — Usted debe dar crédito de manera adecuada, brindar un enlace a la licencia, e indicar si se han realizado cambios. Puede hacerlo en cualquier forma razonable, pero no de forma tal que sugiera que usted o su uso tienen el apoyo de la licenciante. NoComercial — Usted no puede hacer uso del material con propósitos comerciales. SinDerivadas — Si remezcla, transforma o crea a partir del material, no podrá distribuir el material modificado. No hay restricciones adicionales — No puede aplicar términos legales ni medidas tecnológicas que restrinjan legalmente a otras a hacer cualquier uso permitido por la licencia.

Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-SinDerivar 4.0 Internacional.

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

Compartir

Ciencia ergo sum

versión On-line ISSN 2395-8782versión impresa ISSN 1405-0269

Cienc. ergo-sum vol.30 no.2 Toluca jul. 2023 Epub 02-Dic-2024

https://doi.org/10.30878/ces.v30n2a10