INTRODUCCIÓN
Desde la década de los 80 a la actualidad el uso de software específico para análisis estadístico se ha ido generalizando en la enseñanza universitaria. Los motivos de esta generalización han sido diversos. Por el lado de los estudiantes, distintos estudios han generado una línea que lleva desde la satisfacción y preferencias de los estudiantes por el uso de software estadístico (SE), pasando por la mejora de actitudes hacia la estadística, la reducción de la denominada “ansiedad estadística”, el desarrollo de habilidades prácticas, y culmina en una mejora en el rendimiento académico de los estudiantes que utilizan este tipo de software (Estrada, 2002; Batanero, 2002). Además, la satisfacción de los estudiantes en relación a su interacción con el SE parece básica a la hora de intentar cimentar un cambio de actitudes hacia el aprendizaje de la estadística. Pero no sólo los estudiantes han obtenido ventajas al aplicar SE en su aprendizaje. También los profesores han logrado liberar un espacio temporal dedicado a complejas explicaciones que ahora pueden utilizar en demostraciones más productivas.
La investigación sobre el estudio de estos software es amplia, pero el estudio de su relación utilizando nociones didácticas y psicológicas pueden presentar resultados interesantes para ver relaciones entre dimensiones de ambos campos. El objetivo de esta investigación es analizar la usabilidad y la ansiedad producidos en el proceso de enseñanza del contraste de hipótesis mediante dos softwares habituales en el aula de la Universidad.
MARCO TEÓRICO
En este trabajo se analizarán recursos didácticos tecnológicos que se manejan en niveles universitarios que incluyen el estudio de contrastes de hipótesis. Para ello se utilizan nociones teóricas relacionadas con el Enfoque Ontosemiótico (EOS) desarrollado por Godino y su equipo de colaboradores (Godino, 2002; Godino, Batanero y Font, 2007 y otras publicaciones). Más concretamente, el trabajo se centra en las prácticas matemáticas involucradas en el contraste de hipótesis y softwares usuales R y SPSS.
También utilizamos la idea de conflicto semiótico de este marco teórico como complemento del análisis de la enseñanza. En las prácticas matemáticas se requiere un uso continuo del lenguaje matemático, pues los objetos matemáticos son inmateriales; por ello a cada expresión matemática (objeto inicial, o signo) le corresponde un contenido (objeto final, esto es, lo representado; generalmente mediante un criterio o regla de correspondencia). El carácter relacional de la actividad matemática puede explicar algunas dificultades y errores de los estudiantes. Godino, Batanero y Font (2007) denominan conflicto semiótico a las interpretaciones de expresiones matemáticas por parte de los estudiantes que no concuerdan con las que el profesor trata de transmitir. Dichos conflictos semióticos producen equivocaciones en los estudiantes que no son debidos a falta de conocimiento, sino a una interpretación incorrecta de expresiones matemáticas.
Entre los elementos elaborados en este marco teórico, utilizaremos también la noción de idoneidad didáctica, la cual está dividida en 6 componentes (Figura 1). Esta idea será utilizada en el apartado de discusión, para analizar la enseñanza realizada y los resultados de la evaluación de la misma.
INVESTIGACIONES PREVIAS
Schenker (2007) demostró que los estudiantes se muestran más satisfechos y prefieren las clases que incorporan tecnología en la instrucción. En la misma línea Johnson y Dasgupta (2005) refieren que los estudiantes de estadística prefieren las clases que siguen una metodología de enseñanza no tradicional a las clases tradicionales. Mitra y Steffensmeier (2000) profundizan un poco más en este tipo de análisis, y no sólo afirman que los estudiantes se sienten más cómodos con los ordenadores, sino que además indican que sufren menos aprensión a la hora de enfrentarse a la materia y piensan que los ordenadores les hacen el proceso de aprendizaje más sencillo. Esta tendencia a preferir aprender estadística mediante la asistencia de un ordenador parece acentuarse especialmente entre los estudiantes más jóvenes (Malby, 2001).
Kulik y Kulik (1987) realizaron un meta-análisis en el que encontraron que la instrucción matemática basada en el uso del ordenador tenía un tamaño del efecto de 0.28 para la actitud hacia la instrucción y de 0.33 para la actitud hacia los ordenadores cuando era comparada con la instrucción tradicional. Sin embargo, la importancia de valorar el efecto de factores no cognitivos en el aprendizaje de la estadística no toma fuerza hasta la década de los 90 (Gal y Ginsburg, 1994). Ma y Kishor (1997) mostraron en un meta-análisis que existía una relación entre la actitud hacia las matemáticas y el rendimiento en matemáticas. Posteriormente, Potthast (1999) afirma que existe una relación similar en la enseñanza y el aprendizaje de la estadística. Incluso más recientemente se han encontrado correlaciones positivas entre la actitud hacia la estadística y la absorción cognitiva que produce en el estudiante la interacción con el SE (Jardina, 2011).
Quizá el fenómeno más difícil de tratar de cara a mejorar las actitudes de los estudiantes hacia el aprendizaje de la estadística sea la denominada “ansiedad estadística”. Forte (1995) sugiere que el temor a los cursos de estadística puede ser mitigado incorporando aproximaciones aplicadas o experimentales y el uso de la tecnología en la instrucción de estadística puede ayudar a reducir la ansiedad en los estudiantes.
Por otra parte, desde una perspectiva aplicada, el SE también parece mejorar el desarrollo de habilidades. Incorporar al aula proyectos estadísticos aplicados puede incrementar la apreciación del estudiante del valor de las habilidades desarrolladas en los cursos de estadística (Wells, 2006). Pero la mejora de habilidades en estadística no sólo se queda en la apreciación subjetiva por parte del estudiante. Ben-Zvi (2000) sugiere que la instrucción en estadística utilizando herramientas tecnológicas puede ayudar a los estudiantes a realizar las tareas a tiempo, hacerlo rápidamente, con mayor exactitud y con menos errores.
Lesser (1998) presentó que los estudiantes instruidos en estadística en un entorno tecnológico respondían mejor a preguntas que implicaban razonamiento crítico. Asimismo, los estudiantes instruidos en clases multimedia obtienen mejores notas en los exámenes finales de estadística que los instruidos en clases tradicionales (Erwin y Rieppi, 1999). De hecho, Christmann y Badgett (1999) encontraron, respecto al rendimiento académico, un tamaño del efecto de 0.256 a favor de varios paquetes de SE frente a la instrucción tradicional.
Pero además aparecen repercusiones para los profesores. Según Moore (1997), al utilizar SE en la enseñanza de la estadística, los profesores pueden dedicar menos tiempo a tópicos que podrían automatizarse (como cálculos), y más tiempo a la interpretación de gráficos, estrategias efectivas de exploración de datos, y manejo conceptual de términos estadísticos. Por otra parte, un paquete estadístico también ofrece a los profesores la oportunidad de proveer de ejemplos adicionales pudiendo confeccionar cursos para audiencias específicas, introduciendo datos procedentes de las distintas disciplinas de los estudiantes (Velleman y Moore, 1996). En todo caso, y con la finalidad de optimizar los resultados, para evitar una sobrecarga mental debida al aprendizaje conjunto de la utilización del SE y de los conceptos estadísticos, autores como Clarke, Ayres y Sweller (2005) recomiendan una secuenciación del aprendizaje, comenzando por el software para, una vez asentadas las habilidades con el mismo, introducir los conocimientos estadísticos.
En este apartado hemos revisado artículos que exponen cómo el uso del SE en la enseñanza de la estadística aumenta las posibilidades didácticas de los docentes y mejora la competencia estadística de los estudiantes en actitudes, habilidades y conocimientos. A principios de los 90 una revisión llevada a cabo por Khamis (1991) indicaba que el 70% de los cursos introductorios de estadística usaban software informático. Hoy día se ha extendido el uso de SE a la mayoría de los cursos de estadística y la cuestión que queda por resolver es qué software específico debe ser integrado en el proceso de enseñanza y aprendizaje (Fernandez y Liu, 1999).
EXPERIMENTACIÓN DEL MATERIAL
La experiencia de enseñanza se llevó a cabo en las asignaturas de “Técnicas de Análisis en la Investigación Psicológica” y “Fundamentos de Metodología en Logopedia”. Ambas asignaturas se imparten en el segundo cuatrimestre del primer curso, la primera en el Grado de Psicología, y la segunda en el Grado de Logopedia. Estas asignaturas son de carácter obligatorio, con una carga docente de 6 créditos ECTS cada una. Los resultados fueron homogéneos en ambas asignaturas, por lo que en adelante se realiza el estudio sin distinción de los mismos.
El tiempo dedicado a la enseñanza fue de 7 sesiones de 1 hora de duración. Todas ellas se llevaron a cabo en el laboratorio de informática en grupos medianos (unos 25 estudiantes por grupo). En cada sesión se presentaba primero la temática a tratar con ayuda de las diapositivas de PowerPoint preparadas al efecto. Los estudiantes disponían previamente del material en una versión extendida a través de la plataforma Moodle. A continuación, los estudiantes trabajaban independientemente con el ordenador, realizando los ejercicios propuestos. Para la resolución de dichos ejercicios requerían utilizar los programas estadísticos R o SPSS. Las clases de los grupos que trabajaban con estos programas fueron impartidas por el profesor responsable de la asignatura.
La validez de la recogida de datos se garantizó mediante la observación de las sesiones por miembros del equipo de investigación y otros profesores que impartían también la asignatura en otros grupos. Estos observadores anotaban las principales incidencias y dudas planteadas por los estudiantes.
MÉTODO
La muestra estuvo formada por 168 estudiantes de primer año de la Universidad de Granada, que cursaban una asignatura de formación estadística. Los datos se tomaron después del estudio formal de un tema específico de los contrastes de hipótesis, con el fin de detectar posibles dificultades y concepciones incorrectas, fruto del diseño de la enseñanza con los paquetes de ordenador ya mencionados.
El cuestionario de evaluación que se usó estuvo formado por 6 ítems de tres alternativas, con una única respuesta correcta. Se utilizó un contexto relacionado con el campo de los estudiantes como incentivo de la resolución del cuestionario. El contenido estadístico se planteó con 4 ítems correspondientes a la realización de ANOVA, 3 ítems de un contraste de muestras independientes, y 3 ítems de un contraste de muestras relacionadas.
Los cuestionarios utilizados como complemento evaluaban la ansiedad y el de uso de programa, los cuales se utilizaron en otras investigaciones mencionadas en los antecedentes. El primer test está constituido por un total de 24 ítems, en el cual se miden 3 dimensiones: ansiedad ante los exámenes, ansiedad al solicitar ayuda y ansiedad al interpretar. El segundo test lo forman un total de 30 ítems, en donde aparecen la dimensión de utilidad del programa, facilidad de uso, facilidad de aprendizaje y satisfacción.
RESULTADOS Y DISCUSIÓN
Una vez recogidos los cuestionarios, se realizó un análisis comparativo entre los dos programas utilizados en clase (R y SPSS) y en la evaluación. Se clasificaron los análisis en dos bloques, cada uno correspondiente a uno de los test.
CONFLICTOS SEMIÓTICOS
En este trabajo utilizamos el método de análisis semiótico propuesto en nuestro marco teórico para analizar las respuestas de los estudiantes en la solución de los problemas planteados. Este análisis consiste en la identificación de las prácticas matemáticas al tratar de resolver el problema y de los objetos y procesos matemáticos implicados. Como resultado se identifican algunos conflictos semióticos que explican los errores de los estudiantes.
Al analizar las posibles dificultades de los estudiantes en el uso de estos recursos, observamos que una posible complejidad radica en la falta de claridad del programa R, ya que este programa exige el uso de nociones de programación que los estudiantes no tienen que saber. Ello puede inducir una serie de errores en los estudiantes a la hora de utilizar el programa, pero las programaciones fueron entregadas para solventar esta dificultad y obtener la solución que se quiere interpretar. Por otro lado, el SPSS no requiere de programación, pero la realización de un análisis puede dar más variedad de respuestas donde hay que ir seleccionando las necesarias para nuestro problema. Por ejemplo, en la respuesta de la realización de un contraste inicialmente se observa la significación de la comparación de varianzas y, según como sean, se estudian las medias de una forma u otra. En nuestro estudio aparecen los siguientes conflictos:
Conflictos semióticos relacionados con los conceptos
Los estudiantes pueden confundir el estadístico y el parámetro, error descrito, entre otros, por Schuyten (1991). Mientras que la distribución de probabilidad de una variable depende de algunos parámetros (normalmente desconocidos y constantes), los estadísticos se calculan a partir de los datos de la muestra y son variables aleatorias, aunque el valor para la muestra particular es fijo y conocido (Batanero, 2000). Por ello no tiene mucho sentido establecer las hipótesis en términos de los estadísticos (ya que su valor es conocido en la muestra particular). Además, en esta respuesta los estudiantes no recuerdan que el valor p es una probabilidad y por lo tanto su valor no puede ser superior a 1.
Se puede encontrar una cierta confusión entre el p-valor y el nivel de significación, dos conceptos que de acuerdo con Morrison y Henkel (1970), Menon (1993), Vallecillos (1994) y Williams (1997) son particularmente mal entendidos. El nivel de significación se define como la probabilidad de falso rechazo de una hipótesis nula y es un valor constante que se establece a priori (antes de recopilar los datos) por el investigador. El valor p se define como la probabilidad de observar el valor empírico del estadístico o un valor más extremo, dado que la hipótesis nula es verdadera y varía de una muestra a otra.
Otro posible conflicto que aparece es confundir muestras independientes y relacionadas. El estudiante no extrapola los datos de forma correcta a su contexto para decidir el tipo de muestras que maneja. En la investigación de Cañadas et al. (2012) se comenta cómo los estudiantes no realizan las interpretaciones en el contexto del problema.
Conflictos semióticos relacionados con procedimientos de cálculo
Aparece un conflicto cuando los estudiantes toman una decisión incorrecta, rechazando la hipótesis nula y causando el error tipo I, existiendo una confusión en los criterios de aceptación y rechazo, error también señalado en otras investigaciones (Vallecillos, 1994 y Haller y Kraus, 2002).
Por otro lado, los estudiantes pueden tomar una decisión incorrecta, aceptando la hipótesis nula, existiendo una confusión en los criterios de aceptación y rechazo, error también señalado en otras investigaciones (Vallecillos, 1994 y Haller y Kraus, 2002).
Otros conflictos aparecen en el procedimiento de los programas, como sería no cambiar el valor de alfa, causando esto que el programa siempre considere el que tiene inicialmente.
Conflictos semióticos relacionados con procedimientos interpretativos de los resultados del programa
Confundir la significación de la diferencia de medias con la significación obtenida de la prueba de Brown-Forsythe (BF).
Confundir la significación de la diferencia de medias con la significación obtenida de la prueba de homogeneidad.
Confundir la significación de la diferencia de medias con la significación obtenida de la prueba de Levene.
COMPARACIÓN DE LA USABILIDAD DEL PROGRAMA
Este test, está compuesto por cuatro dimensiones: “utilidad del programa”, “facilidad de uso”, “facilidad de aprendizaje” y “satisfacción”. Estas dimensiones confeccionan una forma efectiva de valorar estos programas en lo que se refiere a su uso práctico. Al comparar los valores medios teóricos y reales (Tabla 1), observamos como los valores medios reales para ambos programas están por encima de la media teórica, lo que implica que ambos programas son válidos para su uso en clase. Por otro lado, al comparar los valores de las medias de ambos programas, nos damos cuenta que las medias del SPSS están siempre por encima de las medias del programa R.
Software usado | Media Teórica | Media | Desviación típ. | |
Utilidad | R | 20 | 32,88 | 9443 |
SPSS | 20 | 35,17 | 7739 | |
Facilidad Uso | R | 27,5 | 46,44 | 11835 |
SPSS | 27,5 | 49,57 | 9905 | |
Facilidad Aprendizaje | R | 10 | 15,44 | 5459 |
SPSS | 10 | 16,84 | 3957 | |
Satisfacción | R | 17,5 | 25,45 | 8231 |
SPSS | 17,5 | 31,95 | 7257 |
Hemos realizado contrastes de comparación de medias para detectar qué medias son estadísticamente significativas mediante la prueba T de muestras independientes (Tabla 2). En la dimensión de “Satisfacción” es donde existen diferencias, siendo mayor para los estudiantes que utilizan el programa SPSS.
ESTUDIO DE LAS COMPONENTES PSICOLÓGICAS CONSIDERADAS
Este test está compuesto por cuatro dimensiones: “utilidad del programa”, “facilidad de uso”, “facilidad de aprendizaje” y “satisfacción”. Al comparar los valores medios teóricos y reales (Tabla 3), observamos como los valores medios reales para ambos programas están por debajo de la media teórica en dos de las dimensiones (ansiedad para pedir ayuda y ansiedad para interpretar), lo que implica que en el proceso de hacer el examen con ambos programas se detecta un alto grado de ansiedad. Por otro lado, al comparar los valores de las medias de ambos programas, nos damos cuenta que las medias del SPSS están por debajo de las medias del programa R en dos de las dimensiones (ansiedad durante el examen y ansiedad para pedir ayuda), únicamente se encuentra más ansiedad en el programa SPSS para interpretar los resultados de los problemas del contraste de hipótesis.
Software usado | Media Teórica | Media | Desviación típ. | |
Ansiedad examen | R | 28 | 33,06 | 4868 |
SPSS | 28 | 31,27 | 5964 | |
Ansiedad ayuda | R | 28 | 19,4 | 7525 |
SPSS | 28 | 16,4 | 7388 | |
Ansiedad interpretar | R | 28 | 18,69 | 5625 |
SPSS | 28 | 20,64 | 5826 |
A continuación, realizamos contrastes de comparación de medias para detectar qué medias son estadísticamente significativas mediante la prueba T de muestras independientes (Tabla 4). Se han encontrado diferencias entre los dos programas para dos dimensiones: “ansiedad para pedir ayuda” y “ansiedad para interpretar”. Para el primer caso existe mayor valor para el programa R, en cambio, para el segundo hay mayor ansiedad en el uso del SPSS.
DISCUSIÓN
La formación estadística es un pilar importante en la formación. Ridgway, Nicholson y McCusker (2008) analizan la importancia de la cultura estadística debida, entre otros hechos, al esfuerzo de instituciones como la Unión Europea o la Organización de Naciones Unidas de hacer accesible a los ciudadanos sus estadísticas. Estas estadísticas que quieren acercar a los ciudadanos, con frecuencia manejan representaciones gráficas o datos complejos que se ponen a disposición del público en Internet. Consecuentemente, el interés de que los ciudadanos adquieran un conocimiento estadístico básico es una necesidad prioritaria (Carrión y Espinel, 2006). A raíz de esta necesidad, la enseñanza de la estadística se ha incorporado de forma generalizada, desde hace unas décadas, en todos los niveles educativos. Ello es debido al carácter instrumental de la estadística y el valor del desarrollo del razonamiento estadístico en la sociedad de la información (Batanero, 2002). Además, la Estadística está presente en el currículo de multitud de carreras universitarias, ya que se aplica a muchos campos de conocimiento, siendo uno de ellos el de la Psicología.
Las investigaciones didácticas sobre el contraste de hipótesis plantean una amplia gama de dificultades, las cuales nos obliga a su incorporación al estudio de las tecnologías del tema. Por ejemplo, en Cañadas et al. (2012), en su estudio sobre los pasos que realizan los estudiantes para solucionar un problema planteado de contraste de hipótesis, obtiene que el 79,3% planteaban hipótesis correctas o parcialmente correctas, 64,1% determinaban correctamente el estadístico y valor p (único punto facilitado por el software “Excel”), 51,9% tomaban la decisión correcta y 43,5% interpretaban correctamente los resultados en contexto, recorriendo así todos los pasos del proceso de modelización (Henry, 1997): planteamiento de hipótesis, definición y trabajo con un modelo matemático, e interpretación de resultados.
En Vera, Díaz y Batanero (2011) no se ha presentado la confusión entre hipótesis nula y alternativa que Vallecillos (1994) sí encontró en un 13% aproximadamente. Sin embargo, sí encontraron estudiantes que plantean hipótesis alternativas puntuales o hipótesis que en su conjunto no cubren el espacio paramétrico, de modo que existe coincidencia con Vallecillos (1994) en que los estudiantes confunden algunas propiedades de las hipótesis nula y alternativa.
En este trabajo hemos analizado dos recursos que pueden ayudar a entender los contrastes de hipótesis, presentando un breve resumen de los materiales y resultados. Para finalizar analizamos el proceso de enseñanza mediante las condiciones de idoneidad didáctica, definida por Godino, Wilhelmi y Bencomo (2005) como la articulación de las seis componentes:
Idoneidad epistémica: definido como la representatividad de los significados institucionales implementados (o intención) respecto al significado de referencia previamente definido. El material descrito anteriormente puede ser adecuado para estudiar los contrastes de hipótesis, sus propiedades, conceptos asociados, así como dificultades mostradas en otras investigaciones didácticas (Vallecillos y Batanero, 1997; Vera, Díaz y Batanero, 2011; Cañadas, Batanero, Díaz y Roa, 2012).
Idoneidad cognitiva: que expresa el grado en que los significados pretendidos o implementados están en la zona de desarrollo potencial de los alumnos y su proximidad con el significado personal logrado. Los recursos analizados son adecuados para la formación de estudiantes de ciencias sociales, puesto de manifiesto por el alto porcentaje de estudiantes con calificaciones altas (aproximadamente el 70% obtuvieron una calificación de sobresaliente).
Idoneidad interaccional: medida en que las configuraciones didácticas y las trayectorias permiten identificar y resolver los conflictos semióticos que podrían ocurrir durante el proceso de instrucción. Dicha adecuación depende de cómo el profesor organiza su trabajo en el aula. Los estudiantes deberán trabajar en grupos con el fin de fomentar el conflicto y verbalizarlo. Esto también requiere la organización de una discusión conjunta de soluciones en un intento por lograr que los estudiantes ayuden a sus colegas a detectar problemas.
Idoneidad mediacional: marcado por la disponibilidad y adecuación de los recursos materiales y temporales necesarios para desarrollar el proceso de enseñanza y aprendizaje. No se necesitan muchos recursos, ya que en la actualidad, cualquier universidad dispone de aulas con ordenadores para todos los estudiantes.
Idoneidad emocional: que atañe a la participación de los estudiantes (intereses, motivación...) en el proceso de estudio. Creemos que los recursos informáticos son interesantes para los estudiantes. Además, se ha aumentado este interés al contextualizar los ejemplos en áreas próximas al interés del estudiante.
Idoneidad ecológica: grado en que el proceso que se estudia se ajusta al entorno. En este sentido, los cuestionarios empleados no contravinieron ningún aspecto contemplado en el proyecto del centro ni del contexto social del alumnado.
CONCLUSIONES
Las tecnologías en el aula plantean gran variedad de recursos ricos que requieren estudio y reflexión antes de su utilización. Los softwares planteados en esta investigación han resultado eficaces y con buenos resultados en los test utilizados para su evaluación, al realizar las comparaciones oportunas con las medias teóricas. El programa R, por su fácil acceso al ser un software libre, está cogiendo peso en los últimos años, aunque sigue siendo el SPSS el que nos ha mostrado mejores actitudes en todos los campos salvo uno.
Aunque los materiales se han relevado de interés al usarlos con estudiantes universitarios, un recurso didáctico por sí sólo no resuelve todos los problemas. Se plantea así el reto de continuar este trabajo con nuevas investigaciones sobre la enseñanza y aprendizaje de las tecnologías en las aulas.