Evaluación de la Calidad de los Agentes Conversacionales para la Creación de Instrumentos de Evaluación en Medición de Señales Bioeléctricas

Pérez-Sanpablo, Alberto Isaac; Rodriguez-Urrea, Marcela D.; Arquer-Ruíz, María del Carmen; Ramirez-Morales, Adrian Octavio; Meneses-Peñaloza, Alicia

doi:10.17488/rmib.44.4.11

Serviços Personalizados

Journal

Artigo

Indicadores

Citado por SciELO
Acessos

Links relacionados

Similares em SciELO

Permalink

Revista mexicana de ingeniería biomédica

versão On-line ISSN 2395-9126versão impressa ISSN 0188-9532

Resumo

PEREZ-SANPABLO, Alberto Isaac et al. Evaluación de la Calidad de los Agentes Conversacionales para la Creación de Instrumentos de Evaluación en Medición de Señales Bioeléctricas. Rev. mex. ing. bioméd [online]. 2023, vol.44, n.spe1, pp.152-164. Epub 21-Jun-2024. ISSN 2395-9126. https://doi.org/10.17488/rmib.44.4.11.

El objetivo de esta investigación es evaluar la calidad de agentes conversacionales basados en Modelos de Lenguaje Grandes, para la evaluación de aplicación de conocimiento en Ingeniería Biomédica. Se desarrolló un instrumento de evaluación sobre seis temas de medición de señales bioeléctricas elaborado por un agente humano y los agentes conversacionales Chat-GPT y Bard. Se evaluó la calidad del instrumento en términos de nivel de pensamiento, validez, relevancia, claridad, dificultad y capacidad de discriminación, mediante índice kappa (k) del acuerdo de dos expertos y análisis Rasch de resultados de treinta y ocho estudiantes. Tras eliminar siete preguntas de los agentes conversacionales por problemas de validez y originalidad se integró un instrumento de seis preguntas. Las preguntas fueron válidas y relevantes, claras (>0.95, k=1.0), con dificultad baja a alta (0.61-0.87, k=0.83), índice de discriminación adecuado (0.11-0.47), a nivel de pensamiento de análisis (k=0.22). El promedio de los estudiantes fue de 7.24±2.40. Este es el primer análisis crítico de la calidad de los agentes conversacionales a un nivel de pensamiento superior al de comprensión. Los agentes conversacionales presentaron limitaciones en términos de validez, originalidad, dificultad y discriminación en comparación con el experto humano lo que resalta la necesidad aún de su supervisión.

Palavras-chave : Bard; Chat-GPT; evaluación educativa; ingeniería biomédica; inteligencia artificial.

· resumo em Inglês · texto em Espanhol · Espanhol (

pdf )