INTRODUCCIÓN
La simulación clínica permite que el estudiante interactúe con situaciones similares a la realidad1-5, que aprenda del error, experimente emociones, genere seguridad y desarrolle sus habilidades clínicas5,6. La inserción curricular de la simulación debe considerar un nivel de complejidad creciente1,2,5,7,8, por esto, en los primeros años de la formación de pregrado de enfermería, se utiliza, principalmente, la simulación de baja fidelidad para el desarrollo de habilidades motoras básicas o técnicas1,4,5, que se basa en una baja interacción con aspectos de la realidad, asimismo, se sustenta en propósitos claros, práctica repetitiva, supervisada y con retroalimentación dirigida, y posteriormente, en razón del progreso curricular, se añaden situaciones de mayor complejidad y fidelidad1,5,6.
Es habitual la entrega de material instruccional al estudiante antes de una clase de simulación2,4, el cual contiene los objetivos que se desean alcanzar, contenido teórico y un instrumento de evaluación que oriente al estudiante al logro de un desempeño específico9. En este contexto, los contenidos virtuales han ganado terreno9, y es frecuente la entrega de material teórico escrito, audio, video, lecturas adicionales y otros4, con el propósito que los estudiantes se enfrenten a las clases con mayores herramientas y conocimiento. Partiendo del supuesto de que los jóvenes son considerados “nativos digitales”10, entregar contenido digital permitiría mayor interacción con los mismos, mayor independencia en el aprendizaje y acceso a mayor cantidad de información, basándose en el hecho de que los estudiantes universitarios utilizan tecnologías como el teléfono móvil, tanto para la comunicación y redes sociales10,11, como para descargar material de estudio, hacer tareas y grabar clases, entre otras actividades académicas11,12.
A partir de esto, se han creado herramientas tecnológicas de uso frecuente en educación, y es innovador incluir elementos interactivos y multimedia para el aprendizaje9. Sin embargo, estos elementos pueden representar un aumento de la carga mental, la cual se relaciona con la teoría de la carga cognitiva y corresponde a la cantidad de recursos mentales que una persona debe utilizar en una tarea específica8. Esta teoría se basa en la capacidad limitada de la memoria de trabajo para procesar información y ejecutar tareas simultáneas3,13-20, y en la intensidad que tienen las actividades cognitivas complejas que el individuo debe ejecutar durante una situación de trabajo o aprendizaje21-24. En el proceso cognitivo la memoria de trabajo interpreta y procesa la información, para luego fijarla en la memoria de largo plazo y generar el aprendizaje13. En este sentido, en una misma unidad de tiempo, una sobrecarga de actividades e información genera menor conocimiento almacenado en la memoria de largo plazo, lo que puede afectar el aprendizaje8,16. Por lo anterior, es importante que el material de estudio se construya con un nivel de complejidad óptimo y se evalúe la carga mental con el fin de no superar la capacidad de la memoria de trabajo. Así también, la cantidad de carga puede ser un predictor del proceso de aprendizaje3.
Existen estudios que demuestran que las calificaciones obtenidas en cursos dictados en modalidades virtuales tienen mejores resultados en la evaluación sumativa que los cursos dictados en modalidad presencial25, lo que lleva a inferir que el material digital podría ser un elemento que aporte en la mejora del proceso formativo6. Es por ello que se hace necesario evaluar la carga mental que genera el contenido digital y valorar su aporte como material instruccional previo a las simulaciones de baja fidelidad.
OBJETIVO
Este trabajo tuvo como propósito evaluar la carga mental en simulaciones de baja fidelidad en estudiantes de enfermería, con y sin el uso de material instruccional interactivo en una universidad privada de Santiago de Chile.
MÉTODO
Estudio cuantitativo, experimental, diseño de caso y control. La población correspondió a estudiantes de enfermería que cursaban la asignatura Práctica Integrada II, del segundo año de la carrera, durante el año 2022. La muestra fue de tipo censal, con asignación aleatoria al grupo control y caso, y correspondió a 105 estudiantes: 54 en el grupo control y 51 en el grupo caso. Para el grupo caso la edad promedio fue 21.53 ± 2.98 (rango 19-29 años) y para el grupo control fue de 20.83 ± 2.01 (rango 19-34 años) (p > 0.05).
Al grupo control se le asignó la lectura de una guía de aprendizaje previo a una simulación de baja fidelidad de aspiración de secreciones; la guía de aprendizaje consistía en contenido teórico sobre la aspiración de secreciones y que describía la ejecución paso a paso de la técnica, y contenía aproximadamente 1200 palabras; al grupo caso se le asignó la lectura de esta misma guía de aprendizaje, más la revisión de un video de la técnica de aspiración ejecutada por un docente sobre un simulador, con opciones interactivas, con una duración aproximada de 90 segundos. Este material instruccional, tanto la lectura como el video, le fue entregado a ambos grupos una semana antes de la simulación, la cual trataba sobre el mismo contenido de la lectura y el video.
A su vez, la simulación fue estructurada de modo tal que se dividió en tres componentes: inicio, práctica de la técnica de aspiración de secreciones y retroalimentación2,18; se desarrolló en forma estandarizada para ambos grupos y se consideró el mismo tiempo, número de repeticiones, insumos clínicos, simuladores y condiciones de infraestructura. Inmediatamente15,17,26, transcurridos menos de diez minutos desde el final de la retroalimentación, se midió la carga mental con el instrumento NASATask Load Index (NASA-TLX), tanto para el grupo control y caso.
Instrumento
Se utilizó el instrumento NASA-TLX que mide la carga mental, en forma indirecta y subjetiva15-17,20,27-29, en seis escalas: demanda mental, demanda física, demanda temporal, esfuerzo, nivel de frustración y rendimiento global15-17,28-35. En cada escala el participante gradúa entre 1 (“muy poco”) y 10 (“demasiado”) su percepción sobre lo que le demanda una actividad, basándose en la descripción de cada escala:
La demanda mental, se refiere a actividad mental y perceptiva que requiere la tarea (pensar, decidir, calcular, recordar, etc.)31,34,35.
La demanda física, hace referencia a la cantidad de actividad física necesaria para la tarea31,34,35.
La demanda temporal, está relacionada con la presión de tiempo percibida, la razón entre el tiempo requerido y el disponible31,34,35.
El esfuerzo, está en relación con el esfuerzo mental y físico que tiene que realizar el sujeto para obtener su nivel de rendimiento31,34,35.
Nivel de frustración, hace alusión a si el sujeto se siente inseguro, estresado, irritado, descontento durante la ejecución de la tarea31,34,35.
Rendimiento, se refiere al nivel de satisfacción con el rendimiento percibido sobre el logro de la tarea31,34,35.
Para la interpretación de las escalas se analizaron cada una por separado y en combinaciones. Se interpretó por separado las escalas demanda mental, demanda temporal, esfuerzo, nivel de frustración, considerando que a mayor puntaje (con límite máximo 10) se estima mayor carga.
Respecto a la escala rendimiento, en este caso, un mayor puntaje (con límite máximo 10) se considera mejor percepción de rendimiento. Las escalas combinadas se trataron de la siguiente forma: demanda mental, demanda física y demanda temporal, que hacen alusión a las características de la tarea impuesta a la persona32,34,36; y las escalas esfuerzo y nivel de frustración, que se relacionan con cómo la persona enfrenta la tarea32,34,35.
El instrumento ha sido utilizado en distintas investigaciones que incluyen ambientes laborales26,28,31,33,34,37, e incluso, más allá de su aplicación original, que era la aviación26,32, debido a su facilidad de uso31, y también en situaciones de aprendizaje en educación15,26,35, siendo validado en estos contextos, tanto en inglés15,16,26,28,32,33, como en español29,36, ya sea en la versión de cuatro escalas (TLX-4), que excluye rendimiento y frustración, y la que ha sido utilizada en este estudio que incluye las seis escalas (TLX-6)33.
El instrumento fue entregado a los estudiantes en formato impreso con las instrucciones de llenado para cada escala y sus definiciones.
Análisis de datos
Para el análisis de datos se obvió la fase de ponderación y se tomaron los puntajes brutos, siguiendo lo realizado por otros autores32,34-36. El análisis se hizo con base en las escalas de puntaje de 1 a 10 puntos. Para ambos grupos (control y caso) se calculó la media aritmética y la desviación estándar por cada escala; para establecer al valor de p se utilizó la prueba T-Student, con un nivel de significancia <0.05. La correlación entre las escalas fue medida a través del coeficiente de correlación producto-momento de Pearson, estableciendo un nivel de significancia <0.05. La confiabilidad se estableció a través del coeficiente omega de McDonald (ω), debido a la naturaleza discreta (1 a 10 puntos) de las escalas de NASA-TLX; para el grupo control, el coeficiente ω fue de 0.58 y para el grupo caso fue de 0.74. El análisis de los datos se realizó con el software Microsoft® Excel para Mac versión 17.78.3 y con el software jamovi® para Mac, versión 2.4.8.0.
Consideraciones éticas
La participación en el estudio fue voluntaria. A los participantes que accedieron se les aplicaron consentimientos informados. El llenado de las respuestas se realizó en condiciones anónimas. No se observan riesgos para las personas ni para el medio ambiente derivados del estudio.
RESULTADOS
En el grupo control participaron 44 (81.50%) estudiantes que se identificaron como sexo femenino y 10 (18.50%) estudiantes que se identificaron como sexo masculino. En el grupo caso participaron 46 (90.20%) estudiantes que se identificaron como sexo femenino y 5 (9.80%) estudiantes que se identificaron como sexo masculino.
Las medias de las escalas del NASA-TLX, por separado y en combinaciones, para los grupos control y caso se muestran en la Tabla 1.
Tabla 1 Medias de las escalas NASA-TLX
| Escala | Grupo control | Grupo caso | Valor p |
| Escalas por separado | |||
| Demanda mental | 5.69 ± 1.93 | 6.24 ± 2.17 | 0.09 |
| Demanda física | 3.22 ± 1.91 | 3.47 ± 2.13 | 0.27 |
| Demanda temporal | 4.89 ± 2.32 | 5.49 ± 2.71 | 0.11 |
| Esfuerzo | 6.98 ± 1.78 | 7.61 ± 1.83 | 0.03* |
| Nivel de frustración | 4.81 ± 2.50 | 6.02 ± 2.83 | 0.01* |
| Rendimiento global | 7.91 ± 1.49 | 7.71 ± 1.45 | 0.24 |
| Combinaciones | |||
| Tarea impuesta a la persona (demanda mental, demanda física, demanda temporal) | 4.60 ± 2.29 | 5.07 ± 2.61 | 0.04* |
| Enfrentamiento de la persona a la tarea (esfuerzo, nivel de frustración) | 5.90 ± 2.42 | 6.81 ± 2.50 | 0.004* |
Media ± desviación estándar; grupo control N = 54; grupo caso N = 51; *diferencia significativa.
La distribución de frecuencias se observa en la Tabla 2 para los grupos control y caso.
Tabla 2 Matriz de correlaciones grupo control
| Escala | Demanda
mental |
Demanda
física |
Demanda
temporal |
Esfuerzo | Nivel de
frustración |
Rendimiento
global |
| Demanda física | 0.47 (<0.05) | - | - | - | - | - |
| Demanda temporal | 0.40 (<0.05) | 0.33 (<0.05) | - | - | - | - |
| Esfuerzo | 0.39 (<0.05) | 0.45 (<0.05) | 0.41 (<0.05) | - | - | - |
| Nivel frustración | 0.01 (>0.05) | -0.01 (>0.05) | 0.41 (<0.05) | 0.00 (0>0.05) | - | - |
| Rendimiento | 0.02 (>0.05) | -0.04 (>0.05) | -0.23 (>0.05) | 0.18 (>0.05) | -0.59 (<0.05) | - |
Coeficiente de correlación de Pearson (valor de p); N = 54.
Se calcularon las correlaciones entre las escalas y la edad para ambos grupos (Tablas 2 y 3).
Tabla 3 Matriz de correlaciones grupo caso
| Escala | Demanda
mental |
Demanda
física |
Demanda
temporal |
Esfuerzo | Nivel de
frustración |
Rendimiento
global |
| Demanda física | 0.37 (<0.05) | - | - | - | - | - |
| Demanda temporal | 0.39 (<0.05) | 0.44 (<0.05) | - | - | - | - |
| Esfuerzo | 0.41 (<0.05) | 0.48 (<0.05) | 0.70 (<0.05) | - | - | - |
| Nivel frustración | 0.00 (>0.05) | 0.23 (>0.05) | 0.57 (<0.05) | 0.33 (<0.05) | - | - |
| Rendimiento | 0.20 (>0.05) | 0.23 (>0.05) | 0.12 (>0.05) | 0.20 (>0.05) | -0.25 (>0.05) | - |
Coeficiente de correlación de Pearson (valor de p); N = 51.
La confiabilidad se observa en la Tabla 4.
Tabla 4 Confiabilidad de NASA-TLX si se descartan escalas
| Escala | Grupo control | Grupo caso |
| Sin escala demanda mental | 0.48 | 0.73 |
| Sin escala demanda física | 0.51 | 0.71 |
| Sin escala demanda temporal | 0.46 | 0.63 |
| Sin escala esfuerzo | 0.46 | 0.65 |
| Sin escala nivel de frustración | 0.66 | 0.75 |
| Sin escala rendimiento | 0.69 | 0.78 |
Coeficiente omega de McDonald (ω).
DISCUSIÓN
Las escalas esfuerzo y nivel de frustración mostraron diferencias significativas entre ambos grupos, siendo las medias de ambas escalas superiores en el grupo caso (Tabla 1). Al respecto, es de esperarse que, al incorporar un elemento interactivo, los estudiantes lo perciban como un esfuerzo adicional, el cual requiere revisión, análisis y repetición, las veces necesarias hasta su comprensión y asimilación. Por tanto, todo material, por didáctico y eficiente que sea, genera impacto en la carga mental. Llama la atención el mayor puntaje en la escala nivel de frustración en el grupo caso, dado que se hubiera esperado un menor puntaje en este grupo, basándose en el hecho de que un video puede modelar el procedimiento que el estudiante va a realizar durante la simulación; ahora bien, esto podría explicarse de la siguiente forma: el estudiante al observar un procedimiento bien realizado, con cierto nivel de producción y edición y en contraste realice la técnica en condiciones simuladas, esto marque un diferencial con lo observado de forma previa en el video (materiales, cantidad de luz, condiciones de brazo simulado). Asimismo, esto puede concordar con lo encontrado en una revisión sistemática sobre el uso de modelado con video, donde su uso aumentó la carga de tipo intrínseca y pertinente15,38.
Cuando se examina en específico la escala esfuerzo en el grupo control, se observa una correlación positiva débil con la demanda física y la demanda temporal. Para el grupo caso muestra una correlación positiva débil con la demanda mental y física, y correlación moderada con la demanda temporal; esto está en concordancia con la descripción de la escala esfuerzo: “esfuerzo mental y físico que tiene que realizar el sujeto para obtener su nivel de rendimiento”. Ahora, al analizar las frecuencias, se obtiene que para el grupo control los niveles de carga igual o superior a 7 son alcanzados por el 61.1% de los participantes, mientras que es mayor para el grupo caso, donde los niveles de carga igual o superior a 7 son alcanzados por el 70.6% de los participantes (Tabla 5). Lo anterior puede confirmar que mientras más elementos se tengan que procesar cognitivamente, mayor será la carga mental. Así también, se puede estar frente a un “efecto de redundancia”, que ocurre al utilizar simultáneamente varias fuentes de información que deben ser comprendidas por separado39; para el grupo caso, se contó con un video y una guía de aprendizaje, la guía de aprendizaje consistía en contenido teórico sobre la aspiración de secreciones y el video mostraba la ejecución de esta técnica en un simulador.
Tabla 5 Distribución de frecuencias para rangos de carga
| Escala | Cantidad de carga | |||||
| Rango 1-2 | Rango 3-4 | Rango 5-6 | Rango 7-8 | Rango 9-10 | Total | |
| Demanda mental (control) | 5 (9.3%) | 6 (11.1%) | 24 (44.4%) | 17 (31.5%) | 2 (3.7%) | 54 (100%) |
| Demanda mental (caso) | 1 (2.0%) | 11 (21.6%) | 15 (29.4%) | 16 (31.4%) | 8 (15.7%) | 51 (100%) |
| Demanda física (control) | 23 (42.6%) | 16 (29.6%) | 14 (25.9%) | 0 (0%) | 1 (1.9%) | 54 (100%) |
| Demanda física (caso) | 20 (39.2%) | 17 (33.3%) | 8 (15.7%) | 5 (9.8%) | 1 (2.0%) | 51 (100%) |
| Demanda temporal (control) | 11 (20.4%) | 11 (20.4%) | 22 (40.7) | 5 (9.3%) | 5 (9.3%) | 54 (100%) |
| Demanda temporal (caso) | 10 (19.6%) | 9 (17.6%) | 12 (23.5%) | 14 (27.5%) | 6 (11.8%) | 51 (100%) |
| Esfuerzo (control) | 1 (1.9%) | 2 (3.7%) | 18 (33.3%) | 19 (35.2%) | 14 (25.9%) | 54 (100%) |
| Esfuerzo (caso) | 0 (0.0%) | 3 (5.9%) | 12 (23.5%) | 18 (35.3%) | 18 (35.3%) | 51 (100%) |
| Nivel de frustración (control) | 11 (20.4%) | 13 (24.1%) | 18 (33.3%) | 7 (13.0%) | 5 (9.3%) | 54 (100%) |
| Nivel de frustración (caso) | 8 (15.7%) | 7 (13.7%) | 14 (27.5%) | 8 (15.7%) | 14 (27.5%) | 51 (100%) |
| Rendimiento global (control) | 0 (0.0%) | 0 (0.0%) | 9 (16.7%) | 23 (42.6%) | 22 (40.7%) | 54 (100%) |
| Rendimiento global (caso) | 0 (0.0%) | 0 (0.0%) | 10 (19.6%) | 24 (47.1%) | 17 (33.3%) | 51 (100%) |
Frecuencia (%); grupo control N = 54; grupo caso N = 51.
A su vez, la escala nivel de frustración, hace alusión a si el sujeto se siente inseguro, estresado, irritado, descontento, durante la ejecución de la tarea, que fue significativamente menor en el grupo control y se correlaciona, en este grupo, de forma negativamoderada con el rendimiento, y para el grupo caso se correlaciona de forma positiva-moderada con la demanda temporal. Al analizar las frecuencias, se obtiene que para el grupo control los niveles de carga igual o superior a 7 son alcanzados por el 22.3% de los participantes, mientras que para el grupo caso son alcanzados por el 43.2% de los participantes (Tabla 5). Lo anterior podría estar explicado, como se comentó, en el diferencial expectativa-realidad que se produce al comparar lo ejecutado de manera experta en un video, versus la ejecución propia del procedimiento por parte del estudiante durante la simulación.
Si bien no se evidenciaron diferencias significativas en las escalas demanda mental, demanda física, demanda temporal y rendimiento global, sí se consignaron puntajes mayores en el grupo caso versus el grupo control. La demanda mental, concebida como la cantidad de actividad mental y perceptiva necesaria para una tarea, esto es “pensar”, “decidir”, “calcular” fue superior en el grupo caso. Para ambos grupos la demanda mental tuvo correlación positiva débil con la demanda física, la demanda temporal y el esfuerzo. Al analizar las frecuencias en los niveles de carga igual o superior a 7 se observa que 35.20% de los participantes alcanza este rango para el grupo control; para el grupo caso este valor llega a 47.10% (Tabla 5).
Respecto a la escala demanda física, el puntaje fue superior en el grupo caso. Para ambos grupos se encontró correlación positiva débil con la demanda mental, temporal y el esfuerzo. Al analizar las frecuencias en niveles de carga igual o superior a 7 se observa que 1.90% de los participantes alcanza este rango para el grupo control, y para el grupo caso este valor llega al 11.80% (Tabla 5).
La demanda temporal fue también superior en el grupo caso. Se observa correlación con la demanda mental, demanda física, esfuerzo y nivel de frustración, para el grupo control. Cuando se examina el grupo caso se observa correlación moderada-significativa con el esfuerzo y el nivel de frustración. Al analizar la escala rendimiento, se obtiene que los puntajes fueron superiores en el grupo control. Para el grupo control se correlaciona de forma negativa con el nivel de frustración, para el grupo caso no se encontraron correlaciones significativas. Sin embargo, debido a que el instrumento mide el rendimiento en relación con la percepción que el estudiante tiene sobre él mismo, no es posible concluir que en el grupo caso exista un rendimiento menor objetivo, lo cual debe ser medido de forma más precisa a través de evaluación auténtica del aprendizaje. A pesar de lo anterior, es posible inferir, y así también lo señalan otros autores, que el aumento de la carga mental implica disminución del rendimiento en tareas específicas20,27.
El mayor puntaje en las escalas demanda mental, demanda física, demanda temporal, esfuerzo y frustración en el grupo caso, podría derivar del hecho de incorporar el video, dado que el participante tiene que procesar más información, lo cual se condice con la teoría de la carga mental. En general la suma de elementos a procesar cognitivamente da como resultado una mayor carga mental, lo que podría dejar pocas opciones para procesar otras actividades, y podría disminuir la precisión para realizar las tareas40. Sin bien la propia simulación implica carga mental8,15,38 debido a la interacción con simuladores, el ambiente, los insumos clínicos, la ejecución de la técnica, entre otros aspectos, es destacable la carga añadida que experimentó el grupo caso y que se atribuye al material instruccional extra que fue el video, ya que ambos grupos tuvieron las mismas condiciones.
Como implicaciones prácticas para la formación de enfermería, es importante consignar que se deben realizar mediciones de la carga mental en las actividades de aprendizaje y determinar su impacto, tanto en la interacción del estudiante con una tarea, en el diseño del material instruccional y en el diseño de los ambientes de aprendizaje y establecer la relación con otras variables como edad, nivel de avance curricular, tipo de metodología, y en la incorporación de estrategias innovadoras para conocer su verdadero efecto. Asimismo, es necesario tener en cuenta el contexto donde se realizan las mediciones, porque los resultados pueden variar dependiendo de ello, por lo tanto, se requiere más investigaciones en esta área.
Como limitantes del estudio se tiene que los estudiantes perciben un rendimiento inferior en el grupo caso, sin embargo, el estudio no pudo profundizar en una evaluación auténtica del rendimiento mediante instrumentos como pauta de evaluación u otros, para determinar si es efectivo que la percepción de rendimiento menor se asocia con un aprendizaje más menguado. El estudio tampoco permite estimar cuál es el nivel de carga preciso donde ocurre o no ocurre el aprendizaje y asimismo cuál de los factores (demanda mental, demanda física, etc.) tiene mayor correlación con el aprendizaje, dado que se estima que niveles elevados de carga e incluso niveles muy bajos pueden afectar el aprendizaje26, lo que se denomina “relación parabólica”15,17. Otras limitantes tienen relación con la escasez de trabajos publicados sobre la interpretación de los datos de las escalas34-35 y que la mayoría de los estudios están realizados sobre desempeño en tareas laborales. También es importante mencionar como limitación la confiabilidad del instrumento obtenida en este estudio, que puede estar asociada con la forma de medición de la escala rendimiento, que va en un sentido diferente al resto de las escalas, dado que un mayor puntaje en rendimiento implica una interpretación positiva de la actuación del sujeto, versus el resto de las escalas, donde mayor puntaje implica mayor cantidad de carga, lo que se demuestra en la mediciones de confiabilidad retirando cada escala (Tabla 4); valores de confiabilidad cercanos a los de este estudio han sido reportado por otros autores, sin embargo fueron medidos con el coeficiente alpha de Cronbach29,33; otro reporte ha comunicado valores más altos, y en este caso se utilizó la fase de ponderación de NASA-TLX36. Finalmente, otra limitante radica en que se realizó solo una medición de carga mental; sería interesante explorar cómo evoluciona la carga en más interacciones ya sea con elementos instruccionales o con el entrenamiento, debido a que exposición repetida a estos factores puede disminuir la carga mental y aumentar el rendimiento3,15.
CONCLUSIONES
Se encontraron diferencias significativas en las escalas esfuerzo y nivel de frustración, obteniendo mayores niveles de carga el grupo caso. En las escalas demanda mental, física y temporal los puntajes en el grupo caso fueron mayores, pero sin diferencias significativas. El rendimiento autopercibido fue menor en el grupo caso. Es necesario evidenciar el impacto en el rendimiento real a través de evaluación auténtica del aprendizaje.















