## Articulo

• Similares en SciELO

## versión On-line ISSN 2448-8089versión impresa ISSN 0187-8298

### Educ. mat. vol.30 no.1 Ciudad de México abr. 2018  Epub 07-Ene-2022

#### https://doi.org/10.24844/em3001.02

Artículos de investigación

Niveles de razonamiento sobre variación estadística de estudiantes de nivel medio superior al resolver problemas en un contexto de riesgo

Reasoning Levels about Statistical Variation of High School Students Solving Problems in Risk Context

1Escuela Nacional para Maestras de Jardines de Niños. jaortaa@gmail.com

2 Departamento de Matemática Educativa. Cinvestav, Instituto Politécnico Nacional esanchez@cinvestav.mx

Resumen:

Palabras clave: Variación estadística; contexto de riesgo; razonamiento; nivel medio superior

Abstract:

In this research, the following question was raised: What aspects of students’ reasoning on the variability emerge through their activity in the resolution of problems in a risk context? To answer it, a questionnaire was designed based on two problems about comparing groups in risk context, one about a hypothetical game and another on medical treatments. The problems were answered by 59 high school students (16 to 17 years old) who had not yet taken a Statistics and probability course. Based on the solo taxonomy and in the participant’ answers, a hierarchy was proposed to define the main reasoning levels present in the answers. It is shown that the development of reasoning in its lowest levels only considers one value of each group, and at their highest levels articulates several data of each group and integrates considerations about the variability, interpreted like risk. The analysis of the answers shows the importance that students consider the arithmetic mean.

Keywords: Statistical variation; risk context; reasoning; high school students

INTRODUCCIÓN

La variabilidad es una realidad observable que está presente en todas partes y afecta todos los aspectos de la vida (Wild y Pfannkuch, 1999). Un objetivo central de la estadística es describir, medir y explicar la variabilidad no determinística en sus diversas manifestaciones, por ejemplo en los datos, las muestras o en las distribuciones (Shaughnessy, 2007). Los términos variabilidad y variación suelen utilizarse como sinónimos, no obstante, conviene utilizar la palabra variación para referirse a la descripción o medida de la entidad observable llamada variabilidad (Reading y Shaughnessy, 2004).

En consecuencia, la investigación didáctica sobre la variabilidad es relativamente reciente. En los años 90 algunos autores como Green (1991) y Shaughnessy (1997) hicieron un llamado, cada uno por su parte, sobre la necesidad de investigar cómo razonan los estudiantes en problemas donde la variabilidad estadística está presente, y cómo pueden mejorar su razonamiento. Desde entonces se han buscado contextos en los cuales plantear tareas que propicien, durante el proceso de su solución, el desarrollo de ideas relevantes sobre la variabilidad. Se ha encontrado que situaciones de muestreo repetido, de juegos de azar, de datos acerca del clima y de mediciones repetidas de magnitudes físicas permiten formular problemas para motivar la reflexión de los alumnos sobre la variabilidad.

Un contexto que aún no se ha explorado suficientemente es el de riesgo; es decir, de situaciones de incertidumbre en las que hay resultados que pueden causar pérdidas o daños. No obstante, las pocas experiencias que se han realizado utilizando problemas en este contexto sugieren que es apropiado para comprometer a los estudiantes en su solución (Kahneman y Tversky, 2000). ¿Qué aspectos del razonamiento de los alumnos sobre la variabilidad emergen mediante su actividad en la resolución de problemas ubicados en un contexto simple de riesgo? El objetivo del este estudio es explorar los niveles de razonamiento que muestran los participantes en su respuestas a tareas en las que intervienen la variabilidad y el riesgo.

ANTECEDENTES

El tema de la variabilidad estadística en la investigación didáctica de los niveles básicos es relativamente reciente. Durante la primera década de este siglo, una serie de estudios fueron configurando un programa de investigación acerca del razonamiento de los alumnos de niveles básicos y preuniversitarios sobre la variación estadística. Entre los rasgos de este programa cabe destacar el tipo de tareas que se utilizan para explorar el razonamiento de los estudiantes y los contextos en los que se inscriben.

Varios estudios han explorado el razonamiento sobre la variabilidad en problemas de muestreo repetido con estudiantes tanto de primaria como de secundaria: Shaughnessy et al. (1999), Torok y Watson (2000), Kelly y Watson (2002) han analizado el razonamiento con el Problema de los Dulces; se trata de preguntas sobre la variabilidad del número de dulces rojos en una muestra de tamaño 10 de una urna que contiene dulces de diferentes colores, con 50% de dulces rojos. En sus respuestas a tales problemas los jóvenes muestran ideas en diferentes niveles sobre centro y dispersión. Watson, Kelly, Callingham y Shaughnessy (2003) utilizaron datos de 746 estudiantes de grados 3, 5, 7 y 9 para sugerir un modelo de comprensión de la variabilidad consistente en 4 niveles. Usaron tareas en diferentes contextos para explorar el razonamiento de los estudiantes, por ejemplo, predecir las frecuencias de ocurrencia de cada cara en 60 lanzamientos de un dado; predecir la frecuencia en la que se detienen 10 (o 50) giros de una ruleta, y otras en contextos escolares. El modelo resultante describe niveles de comprensión de la variabilidad: 1. Prerrequisitos 2. Reconocimiento parcial, 3. Aplicaciones, 4. Aspectos críticos.

En los estudios mencionados los sujetos participantes, en su mayoría, son de nivel primaria y secundaria; además, los problemas no se refieren a cálculos de ninguna medida de dispersión, sino al análisis de los datos para comprender un fenómeno o tomar una decisión. Un rasgo notable de los estudios mencionados es que, a pesar de que las tareas utilizadas se relacionan con la incertidumbre y el azar, no emergen de los estudiantes razonamientos de probabilidad; en los estudios de los autores mencionados, estos se enfocaron más en el análisis de datos que en el azar. Es probable que no buscaran que emergieran ideas de probabilidad, por considerar que sus sujetos no tenían aún la madurez suficiente para hacerlo. En problemas de toma de decisiones en contextos de riesgo es evidente el papel de la probabilidad; de hecho, las situaciones paradigmáticas de riesgo las incluyen explícitamente.

En efecto, en uno de los estudios de Kahneman y Tversky (1984), los investigadores proponen a los participantes elegir entre las dos opciones siguientes:

1. Ganar \$1000 con probabilidad de 85% o perder todo con probabilidad de 15%

2. Ganar \$800 con certeza, es decir, con probabilidad 1.

En la teoría clásica de la toma de decisiones se resuelven estas tareas mediante el principio de maximización de la utilidad (Chernoff y Moses, 1959), consistente en comparar la utilidad de cada opción y elegir aquella que ofrezca mejores utilidades. Si la función utilidad se identifica con la ganancia esperada (como se hace en muchas situaciones), entonces la opción A debería ser elegida porque ofrece una ganancia de \$850, mientras que la B de solo \$800. Sin embargo, no siempre es conveniente identificar la función utilidad con la ganancia, pues la gente muchas veces racionalmente prefiere B, renunciado a obtener la máxima ganancia (esperada), pero evitando el riesgo que implica optar por A; esta respuesta contraria a la norma es un rasgo psicológico que se conoce como aversión al riesgo. En la presente investigación se buscaron problemas para relacionar de manera más evidente la variabilidad en los datos con la incertidumbre, y encontramos en las situaciones de riesgo de los estudios de Kahneman y Tversky una pista para formular problemas que permitieran hacer dicha conexión.

MARCO CONCEPTUAL

El marco conceptual expone brevemente los principales conceptos que permitan entender el sentido de la investigación. En primer lugar, se precisan algunos conceptos relacionados con el contenido estadístico en juego, en especial la variación, el riesgo y la probabilidad. En segundo lugar, se expone la idea de razonamiento como el aspecto de la actividad cognitiva del alumno que interesa estudiar. Finalmente, se mencionan algunos aspectos del modelo solo utilizado para organizar los datos y construir una jerarquía de razonamiento.

En esta investigación se pone atención al razonamiento que exhiben los estudiantes frente a tareas que implican aspectos del concepto de variación o dispersión de un conjunto de datos. En particular, el estudio se relaciona con dos medidas de variación, el rango y la desviación media. Dado un conjunto de datos numéricos, el rango es simplemente el máximo menos el mínimo de los datos, mientras que la desviación media es la media aritmética de las desviaciones absolutas de cada valor respecto a la media aritmética de los datos. Hemos subrayado el concepto de media aritmética para hacer notar que se utiliza dos veces en la definición del concepto de desviación media (lo mismo ocurre en la definición de desviación estándar). Esto pone de manifiesto que el estudio de las medidas de variación, como la desviación media y la desviación estándar, presuponen el concepto de media aritmética, la cual se define como la suma de todos los datos, dividida entre el número de estos. Conviene notar que una de las medidas de dispersión más utilizadas en estadística es la desviación estándar, no obstante, su construcción es mucho más compleja y, cómo veremos, está más alejada de la posibilidad de que los estudiantes de los niveles preuniversitarios la entiendan como una medida de variación; en todo caso, entender e interpretar el rango y la desviación media como medidas de variación puede ser un antecedente importante para la comprensión de la desviación estándar.

RIESGO

Las situaciones en las que es aplicable el enfoque frecuencial de probabilidad son experiencias aleatorias que pueden ser repetidas bajo condiciones similares; además, se debe satisfacer la condición de regularidad de las frecuencias, es decir, que para cada evento sus frecuencias relativas converjan a un valor fijo cuando el número de repeticiones de la experiencia se repite indefinidamente. Para aplicar el enfoque bayesiano “es suficiente que dispongamos de una proposición y que desconozcamos su veracidad” (Carranza y Fuentealba, 2010: 59), pues esto permite asignar una medida que refleje la creencia del sujeto acerca de la veracidad de la proposición. Veremos que, en el caso presente, los estudiantes eligen entre tres opciones con base en una estimación subjetiva acerca de las opciones que perciben.

RAZONAMIENTO

El razonamiento surge de diversas maneras, en especial cuando: a) Se busca y apoya la solución de un problema, b) Se analizan las posibilidades para tomar una decisión, o c) Se justifica la verdad de una proposición. Aunque el razonamiento es un proceso mental, las pautas principales que lo constituyen pueden expresarse oralmente o por escrito; esta característica permite estudiarlo, pues las expresiones pueden ser registradas, analizadas, discutidas y compartidas. Cuando los alumnos explican o justifican por escrito (u oralmente) la respuesta a una tarea, o la toma de una decisión, exhiben ciertos rasgos característicos de su razonamiento. En la presente investigación se les pide que tomen una decisión y ofrezcan los argumentos que la motivan. Una buena decisión en cada una de las tareas planteadas en este estudio depende de la apreciación y tratamiento de la variabilidad en los datos, pero ésta es compleja y depende de diversos componentes. Se analizan entonces sus razonamientos sobre la variabilidad en función de las componentes pertinentes que incorporan en sus justificaciones. Un método que puede aplicarse al análisis de los componentes que constituyen un razonamiento sobre la solución de una tarea ha sido desarrollado por Biggs y Collis (1982 y 1991), dando lugar al Modelo solo, que se introduce en la siguiente sección.

Las concepciones, sesgos y creencias sobre conceptos presentes en las situaciones o problemas que resuelven los estudiantes tienen una fuerte influencia en su razonamiento. En particular, con relación al riesgo han sido identificadas actitudes de los sujetos que influyen en sus respuestas y no necesariamente coinciden con el razonamiento normativo. Kahneman y Tversky (2000) señalan que el ejemplo paradigmático de la decisión con riesgo es la participación en un juego cuyos resultados generan posibles ganancias o pérdidas económicas de acuerdo con ciertas probabilidades específicas. En estas situaciones han encontrado la aversión al riesgo y la propensión al riesgo. La primera consiste en evitar, en la medida de lo posible, situaciones desfavorables, aunque esto presuponga renunciar a una ganancia que podría compensar el riesgo. Su contraparte es la propensión al riesgo, consistente en preferir una situación en función de resultados favorables, a pesar de que implique mayor riesgo.

MODELO SOLO

La Taxonomía solo propone las bases para discriminar entre las diferentes respuestas de los estudiantes, en función de la calidad del aprendizaje que los sujetos muestran acerca de un determinado contenido. Se proponen 5 niveles en los cuales se pueden clasificar las respuestas: Prestructural, Uniestructural, Multiestructural, Relacional y Abstracto Extendido. Los niveles centrales son definidos en función de si las respuestas contienen los aspectos relevantes a la solución de la tarea. Una solución es una estructura formada por diferentes componentes adecuadamente relacionadas; si una respuesta solo incluye una componente, entonces es Uniestructural; si incluye dos o más componentes pero no las relaciona de manera adecuada es Multiestructural, y si incluye varias componentes de manera integrada es Relacional. Cuando una pregunta no contiene ninguna componente pertinente a la tarea es Prestructural. El nivel Abstracto Extendido se define cuando una respuesta Relacional se generaliza hacia otras tareas; generalmente, para detectar respuestas en este nivel es necesario ampliar las tareas. Por otro lado, conviene indicar que en este estudio las respuestas que se analizan consisten en las justificaciones que ofrecen los alumnos a una elección entre dos situaciones; en consecuencia, se analiza su razonamiento, por lo cual lo que se construye es una Jerarquía solo de razonamiento.

MÉTODO

Esta investigación se enfoca en el razonamiento de los estudiantes frente a enunciados que se refieren a situaciones de riesgo. En general, en la investigación sobre los procesos de enseñanza-aprendizaje escolares se estudian los comportamientos, razonamiento, creencias o dificultades de los sujetos frente a diferentes tipos de tareas formuladas en el discurso, combinando lenguaje matemático y lenguaje coloquial; muchas de las tareas se enriquecen ubicándolas en contextos extramatemáticos. Hay dos propósitos o funciones del uso de los contextos extramatemáticos en situaciones de enseñanza, a saber: 1) El contexto extramatemático ofrece una oportunidad para ampliar el sentido de los conceptos matemáticos, 2) Los conceptos matemáticos ofrecen una oportunidad para mejorar la comprensión de situaciones extramatemáticas (Niss, Blum, Galbraith, 2007). En el primer caso, las situaciones extramatemáticas son un referente que ayuda a darle sentido a las ideas matemáticas; en el segundo, se muestra la potencia de la matemática para entender el mundo real. En la presente investigación, la intención es la primera, utilizar un contexto de riesgo para darle sentido a la consideración de la variabilidad en los datos.

Como se quiere explorar el razonamiento de los estudiantes sobre la variabilidad en contexto de riesgo, es importante: 1) Determinar el nivel de los alumnos que se van a examinar, y 2) Utilizar tareas que propicien que externen sus ideas sobre la variabilidad.

PARTICIPANTES

Los participantes fueron 59 estudiantes de nivel medio superior (16 a 17 años de edad) de una escuela pública de la Ciudad de México, quienes aún no habían tomado el curso de Estadística y probabilidad, en ese grado. No obstante, en el nivel educativo anterior (secundaria) debieron haber abordado los temas de medidas de tendencia central y dispersión (SEP, 2011), por lo cual se puede suponer que saben calcular la media aritmética, la mediana y la moda.

INSTRUMENTOS

Para explorar los razonamientos de los participantes, los autores diseñaron dos problemas en situaciones de riesgo que implican comparaciones de conjuntos de datos. Para hacer las comparaciones conviene calcular las medias aritméticas de los conjuntos y compararlas. Los datos del Problema 1 se han elegido de manera que tengan la misma media aritmética y diferente dispersión. En consecuencia, los conjuntos a comparar en el Problema 1 son equivalentes en términos del beneficio obtenido, pero son diferentes en términos del riesgo que implican. En el Problema 1 (ver Figura 1) se presenta una situación en la que se ofrecen dos muestras de resultados de las ganancias de dos juegos; a partir de los datos, los estudiantes deben decidir en qué juego les conviene jugar.

Debe notarse que en ambos juegos hay diferentes valores, los negativos representan pérdidas y los positivos ganancias; también que no se da información sobre el mecanismo del juego ni de la distribución de probabilidad y de las ganancias correspondientes.

En consecuencia, no se dan las condiciones necesarias para hacer estimaciones de probabilidad con base en un enfoque frecuencial, por ejemplo, no se puede determinar el espacio de todos los posibles resultados (ganancias) de un juego y sus probabilidades. No obstante, en la medida en que es una situación de incertidumbre, se requiere considerar probabilidades desde un enfoque bayesiano. En efecto, los sujetos pueden considerar los eventos “El juego A es mejor que el juego B”, “El juego A es equivalente al juego B” y “El juego A no es mejor que el juego B” (donde “Es mejor” quiere decir “se gana más”) y buscar argumentos en la información dada para favorecer la probabilidad de alguno de tales eventos. En el análisis de las respuestas de los estudiantes podremos determinar cuáles son los argumentos que ellos consideran para tomar su decisión, lo cual revelará sus estimaciones cualitativas acerca de la probabilidad de los eventos mencionados.

A continuación hacemos un análisis de una solución al problema que aporta argumentos para apoyar una decisión utilizando herramientas estadísticas. Como en muchos problemas estadísticos, no se puede afirmar que es una solución determinista correcta, sino solo que es una solución racional que busca incorporar toda la información. En primer lugar, se puede aplicar el principio de razón insuficiente, formulado por Laplace. Como no tenemos más que la información de 10 resultados del juego y no hay ninguna razón para inclinarse a pensar que alguno es más probable que el otro, asignamos a cada valor presente de la variable “ganancia” la misma probabilidad (véanse Tabla 1 y Tabla 2):

Tabla 1 Distribución de la ganancia del Juego 1.

 Ganancia o pérdida -25 -21 -4 -2 11 13 15 16 50 Total Probabilidad 1/10 1/10 2/10 1/10 1/10 1/10 1/10 1/10 1/10 1

Tabla 2 Distribución de la ganancia del Juego 2.

 Ganancia o pérdida -132 -120 -81 -24 -21 18 60 96 120 133 Total Probabilidad 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1/10 1

Dos valores destacados de las distribuciones son el centro y la dispersión, el primero puede representarse con la media y el segundo con el rango o la desviación media (no consideramos la desviación estándar por ser más compleja e innecesaria en este caso). Otros dos valores importantes son el mínimo y el máximo, pues informan sobre el rango de las ganancias en cada juego. En la Tabla 3 se enlistan los 5 valores mencionados de cada distribución:

Tabla 3 Valores importantes de la distribución.

 Juego 1 Juego 2 Valor máximo 50 133 Valor mínimo -25 -132 Media aritmética 4.9 4.9 Rango 75 265 Desviación media 16.1 80.5

Los valores de la Tabla 3 y sus interpretaciones se utilizan para apoyar algunos de los enunciados que permiten la toma de una decisión. Por ejemplo, un argumento es el siguiente: como la media aritmética de las ganancias de cada juego es 4.9, y asumiendo una hipotética interpretación frecuencial del juego, si se jugara un gran número de juegos, a la larga la ganancia que se obtendría con cada uno sería la misma. Pero, como se ha dicho, no hay indicios suficientes en el problema para asumir el enfoque frecuencial, de modo que conviene pensar que se va a jugar solo una vez. En estas circunstancias se impone llevar a cabo un razonamiento bayesiano. ¿Qué otros argumentos se pueden derivar de los datos para identificar la mejor decisión? El argumento basado solamente en la comparación de los máximos (Elegir el Juego 2 porque se gana hasta 132, mientras que en el juego 1 solo 50) es sesgado, pues únicamente tiene en cuenta los extremos máximos e ignora los demás datos. Un sesgo similar es el simétrico, que solo observa los mínimos (las pérdidas), llevando a tomar la decisión de elegir el Juego 1 “porque se pierde menos”. En cambio, la consideración simultánea de máximo y mínimo lleva a ponderar el riesgo. En este caso, la elección de uno u otro juego va a depender de las preferencias de los sujetos acerca del riesgo; los adversos al riesgo preferirán el Juego 1, mientras quienes sean propensos al riesgo preferirán el Juego 2.

En la Figura 2 se presenta el Problema 2; los datos se refieren a tiempo de vida en años después de seguir un tratamiento u otro; se agregan además las gráficas de las distribuciones.

Bajo supuestos similares a los planteados en el problema anterior, se pueden determinar las distribuciones de probabilidad de cada tratamiento (véanse Tablas 4 y 5):

Tabla 4 Distribución del tiempo de vida después de seguir el Tratamiento 1.

 Tiempo de vida 2 3 4 5 6 7 8 9 10 Total Probabilidad 1/27 1/27 2/27 3/27 4/27 5/27 6/27 4/27 1/27 1

Tabla 5 Distribución del tiempo de vida después de seguir el Tratamiento 2.

 Tiempo de vida 4 5 6 7 8 Total Probabilidad 2/21 5/21 7/21 5/21 2/21 1

En la Tabla 6 se han organizado los 5 valores de la distribución que permiten formular argumentos para la toma de una decisión.

Tabla 6 Valores importantes de la distribución.

 Tratamiento 1 Tratamiento 2 Valor máximo 10 8 Valor mínimo 2 4 Media aritmética 6.7 6.0 Rango 8 4 Desviación media 1.61 0.86

Comparando las medias aritméticas se puede argumentar que el Tratamiento 1 ofrece mayor probabilidad de vivir un poco más, por lo que, solo con este argumento, se puede preferir ese tratamiento. Sin embargo, tiene el inconveniente de que hay un caso en que el tiempo de vida es solamente de 2 años y otro en el que es de 3 años. Por otro lado, en el Tratamiento 1 hay un caso que vivió 9 años y otro que vivió 10; mientras en el Tratamiento 2 el que mayor tiempo ha vivido registra 8 años de vida. El Tratamiento 1 puede ser más prometedor, pero se corre más riesgo; en cambio, el Tratamiento 2 es conservador, con menos riesgo. Nuevamente, la decisión dependerá de las actitudes ante el riesgo de quien toma la decisión. Si es adverso al riesgo optará por el Tratamiento 2, si es propenso al riesgo optará por el Tratamiento 1.

El análisis consistió en identificar aquellas componentes pertinentes en las respuestas, en un ir y venir entre un análisis a priori de las soluciones esperadas, así como una comparación constante de las respuestas obtenidas para identificar las componentes que permitieran la construcción de una jerarquía solo. En este proceso se construyó la jerarquía solo de la Tabla 7.

Tabla 7 Jerarquía de razonamiento solo para los problemas.

Preestructural
Las respuestas clasificadas en este nivel tienen justificaciones circulares (por ejemplo, “porque se gana más” o “porque se vive más”), o en el argumento no se utiliza ninguna de las ideas estadísticas pertinentes al problema.
Uniestructural
Eligen un dato de cada conjunto y los comparan, por ejemplo: solo los máximos, solo los mínimos o solo las modas.
Multiestructural
Consideran los máximos y lo mínimos de cada conjunto y los comparan; esto se manifiesta con expresiones como “se gana más, pero se pierde menos”. Comparan las sumas de los datos de cada conjunto y notan que son iguales; esto los lleva a decir que es indiferente elegir cualquiera de los dos conjuntos.
Relacional
Consideran la media y la dispersión. Notan que las ganancias globales son iguales en ambos conjuntos, entonces consideran el riesgo. La elección depende de sus preferencias sobre éste: Los adversos al riesgo eligen el conjunto con menos variabilidad y los propensos al riesgo el de mayor variabilidad.

Lo que caracteriza el nivel de razonamiento reflejado en las respuestas de las tareas planteadas es la cantidad de información que el estudiante es capaz de extraer y utilizar de cada conjunto de datos para elaborar argumentos que apoyen una decisión: en el nivel más bajo de razonamiento no utilizan la información; en el más alto, logran hacer una síntesis adecuada de la información de cada conjunto. En la jerarquía de la Tabla 7 se describen las características de los niveles de manera precisa y, enseguida, se ofrecen ejemplos que muestran el tipo de respuestas que se clasifican en cada nivel.

PRESTRUCTURAL

En este nivel se agruparon las respuestas con argumentos circulares o no pertinentes. Los primeros consisten en elegir un conjunto de datos y justificar la elección diciendo que se “gana más” o “se vive más”. Este tipo de respuesta muestra que aunque notan algo en los conjuntos que los lleva a tomar una decisión, no pueden expresarlo con claridad; lo que se espera de un argumento es que den razones, que aclaren por qué se gana más o se vive más. Las respuestas que no contienen elementos pertinentes consistieron en buscar y comparar proporciones irrelevantes, o buscar patrones de la ocurrencia de pérdidas y ganancias, por ejemplo observar que hay 5 valores negativos y 5 positivos.

Un estudiante cuya respuesta al Problema 1 se encuentra en el nivel Prestructural, elige el Juego 1 y argumenta: Porque es en donde se presentan mayores oportunidades de ganar más premios. Una respuesta al Problema 2 que se clasifica en este nivel elige el Tratamiento 1 y comenta: mis años de vida se extienden.

Conviene destacar que los participantes entendieron bien el sentido de la pregunta, a diferencia de otros estudios en que las respuestas de nivel Prestructural se producen -en gran medida- porque no se entiende la pregunta, o el contexto es tan familiar que la respuesta se basa en experiencias personales sin relación con el problema, aquí ellos saben que la respuesta consiste en elegir el juego o el tratamiento más favorable. En las respuestas clasificadas en este nivel toman una decisión; no obstante, su elección tiene argumentos circulares o inapropiados.

UNIESTRUCTURAL

Un estudiante elige el Juego 2, y argumenta:

Si llegas a ganar, las ganancias son mucho más grandes que las del Juego 1 y el índice de ganadores es con un 50% de posibilidades, por lo cual pienso que valdría la pena el Juego 2.

Se puede deducir que compara los máximos de cada grupo y elige el Juego 2 porque en éste la ganancia es mayor (133) que en el 1 (50); menciona además un hecho irrelevante, pues en ambos juegos la mitad corresponde a pérdidas y la mitad a ganancias.

Con relación al problema de los tratamientos médicos, un alumno elige el Tratamiento 1, y argumenta:

La enfermedad es mortal, el punto cumbre del pensamiento es vivir más tiempo y en el [Tratamiento] 1 el máximo de tiempo que se puede conseguir es de 10 años.

Esta respuesta solo considera los valores máximos de cada conjunto, 10 y 8 años (aunque no se menciona explícitamente el 8) y considera que con el Tratamiento 1 se vive más por este hecho. Ignora que con el Tratamiento 1 también hay casos que solamente han vivido 2 años.

MULTIESTRUCTURAL

En el siguiente ejemplo, el participante elige el Juego 1 y argumenta:

Porque en caso de perder no perdería tanto, lo máximo que se han llevado en este juego es 50 y lo más que perdieron fue 25, por lo que podría decirse que hay más que ganar, sin perder tanto; en cambio, en el Juego 2 se gana 133 pero se pierde 132, es más arriesgado y, en caso de perder, no convendría.

Evalúa que el Juego 2 es más arriesgado que el Juego 1 mediante la consideración de los máximos y los mínimos, y su decisión refleja aversión al riesgo, pues evita el juego donde se puede perder más, sin importar el monto de lo que se podría ganar. Esta respuesta sería relacional si además del máximo y el mínimo se utilizaran, en la comparación, los centros de cada distribución.

En el problema de los tratamientos, el estudiante del siguiente ejemplo eligió el Tratamiento 1, argumentando:

Ya que me arriesgaría porque podría vivir 2 años pero también hasta 10 años, en cambio, con el otro tratamiento, sí podré tener un poco más de seguridad de vivir 4 años, mínimo, pero solo lo máximo son 8 años; así que por eso elegí el Tratamiento 1.

Al igual que el caso anterior, también considera los máximos y los mínimos del tiempo de vida después de cada tratamiento y nota que el 1 es el más arriesgado, pero también que ofrece posibilidades de vivir más. Al elegir el Tratamiento 1 muestra propensión al riesgo, como él mismo lo expresa cuando dice “… me arriesgaría”.

RELACIONAL

En el problema de los juegos un ejemplo de este nivel es la respuesta de un estudiante que eligió el Juego 2, argumentando:

Sumamos las ganancias (+105) y las pérdidas (-56) del Juego 1; y del Juego 2, 427 contra -378. Podemos ver que en ambos hay una diferencia de 49; yo prefiero el 2 ya que aunque en el 1 ganas poco, también pierdes poco; solo vas a jugar una vez, así que vale la pena ya que podrías ganar más.

En esta respuesta se considera indirectamente la media aritmética al percibir que la suma de los valores (ganancias - pérdidas) es 49 en ambos juegos; el participante también nota el riesgo al decir que “en el 1 ganas poco, también pierdes poco”. Es interesante notar que el estudiante hace explícito que “solo vas a jugar una vez”, con lo cual muestra que implícitamente su razonamiento es bayesiano. Como se decide por el Juego 2 y con la aclaración de que solo se va a jugar una vez y vale la pena [arriesgar], muestra que es propenso al riesgo.

Con respecto al Problema 2, hemos elegido el siguiente ejemplo en el que el alumno prefiere el Tratamiento 1, con el siguiente argumento:

Tiene mayor promedio de vida el Tratamiento 1 respecto al 2; aunque alguna gente vive menos en el primero, también puede vivir más (arriesgando todo). Promedio de años de vida en Tratamiento 1: 6.7 años Promedio de años de vida Tratamiento 2: 6 años.

Calcula la media aritmética de cada conjunto y detecta el riesgo. Muestra que es propenso al riesgo con el comentario “arriesgando todo”.

Conviene aclarar que la jerarquía es un esquema simplificado de los diferentes niveles de razonamiento de los estudiantes, pero las respuestas reales ofrecen variantes en las que se combinan razonamientos del esquema con otras dos características; una de ellas son las expresiones que reflejan que se percibe el riesgo, “es un juego muy arriesgado” o “con este tratamiento se corre más riesgo”; evaluamos que, en general, estas consideraciones mejoran la calidad de la respuesta. Es decir, una respuesta de un nivel puede ser clasificada en el nivel inmediato superior gracias a tales consideraciones. La otra característica de varias respuestas va en el sentido inverso y se presenta cuando hay expresiones incompletas o errores en los cálculos, si esto ocurre se evalúa inferior la calidad de la respuesta. Por ejemplo, una respuesta que considera dos o más datos y que, de acuerdo a la jerarquía, se clasificaría en Multiestructural, es clasificada en el nivel Uniestructural debido a las expresiones incompletas o errores en los cálculos. Teniendo en cuenta tales consideraciones, cada respuesta fue clasificada en alguno de los niveles solo, y las frecuencias de respuesta en cada nivel se presentan en las Tablas 8 y 9.

Tabla 8 Distribución de frecuencias de respuestas por nivel solo al Problema 1.

 Nivel Prestructural Uniestructural Multiestructural Relacional Total No. respuestas 20 16 20 3 59 Porcentaje 34% 27% 34% 5% 100%

Tabla 9 Distribución de frecuencias de respuestas por nivel solo al Problema 2.

 Nivel Prestructural Uniestructural Multiestructural Relacional Total No. respuestas 22 8 26 3 59 Porcentaje 37% 14% 44% 5% 100%

Se puede observar que en ambas preguntas poco más de la tercera parte de las respuestas cae en el nivel Prestructural. Esto significa que los estudiantes no saben argumentar su elección con base en la información que proporcionan los datos. Algunos probablemente ven en estos rasgos que les hacen creer que una opción les conviene sobre la otra, pero no lo expresan de manera adecuada, sino solo con respuestas circulares o expresiones vagas. Las frecuencias en el nivel Uniestructural indican que solamente tienen en cuenta un dato de cada conjunto, y la disminución de la frecuencia en el caso del Problema 2 muestra que hay menos probabilidad, en la situación de los tratamientos, de conformarse con un solo dato; esto mismo explica que aumente la frecuencia de respuestas en el nivel Multiestructural del Problema 2. Se puede conjeturar que los alumnos son más sensibles al riesgo en el caso de tiempo de vida que en el de ganancias monetarias. La tercera parte en el Problema 1 y poco menos de la mitad en el Problema 2 se clasifican en Multiestructural, es decir, no pocos estudiantes se esfuerzan por explorar en los datos. Únicamente 3 respuestas de cada pregunta contienen rasgos de los dos factores clave de los datos, a saber, la media y la dispersión, y llegan a estas consideraciones no mediante una aplicación mecánica de fórmulas preconcebidas, sino a través de un análisis de la situación. En este sentido es que se conjetura que los problemas ayudan al desarrollo del razonamiento acerca de los datos y su variabilidad.

CONCLUSIONES

La interpretación de la variación como indicadora de riesgo contribuye a valorarla y entender lo que Wild y Pfannkuch (1999: 235) llaman el segundo mensaje que conlleva: “[la variación] puede tener serias consecuencias prácticas”. En efecto, en muchas de sus respuestas los alumnos indican que perciben las diferencias en términos del riesgo presente en los juegos o en los tratamientos. Consideramos que esto muestra el potencial que tiene este tipo de problemas para ofrecer la oportunidad a los estudiantes de valorar la importancia de percibir y analizar la dispersión de los datos.

En el estudio se reveló el papel fundamental que juega la media aritmética, y reafirma que “es imposible considerar la variabilidad sin también considerar el centro ya que ambas ideas son necesarias para darle significado al análisis de datos” (Garfield y Ben-Zvi, 2008: 203). El objetivo inicial del presente trabajo se enfocaba fundamentalmente en la variación de los datos, sobre todo del rango y la desviación media; no obstante, en el análisis de las respuestas se notó que los participantes no utilizaron la media aritmética. La estrategia de sumar los datos de cada conjunto y compararlos fue la más cercana a la consideración de la media, pero omitía el análisis de la variación. Casi ningún estudiante usó en sus respuestas la media aritmética como representante de todo el grupo de datos y, por tanto, que se puede utilizar para hacer comparaciones entre grupos; esto sugiere que los problemas que hemos diseñado pueden complementarse con otros similares en los que la media aritmética no sea igual en ambos conjuntos; de esta manera, antes de entrar en el análisis de la variación se compararían las medias aritméticas.

REFERENCIAS

Batanero, C., Henry, M. y Parzysz, B. (2005). The Nature of Chance and Probability. In: G. A. Jones (ed.). Exploring Probability in School: Challenges for Teaching and Learning (pp. 15-37). New York: Springer. [ Links ]

Bakker, A. y Gravemeijer, K. P. E. (2004). Learning to Reason about Distribution. In: D. Ben-Zvi & J. Garfield (eds.). The Challenge of Developing Statistical Literacy, Reasoning, and Thinking (pp. 147-168). Dordrecht, The Netherlands: Kluwer Academic Publishers. [ Links ]

Ben-Zvi, D. (2004). Reasoning about Variability in Comparing Distributions. Statistics Education Research Journal, 3(2), 42-63. [ Links ]

Biggs, J. B. y Collis, K. (1982). Evaluating the Quality of Learning: The solo Taxonomy. New York, Academic Press. [ Links ]

Biggs, J. y Collis, K. (1991). Multimodal Learning and the Quality of Intelligent Behavior. En: H. Rowe (ed.). Intelligence, Reconceptualization and Measurement (pp.57-76). New Jersey: Laurence Erlbaum Assoc. [ Links ]

Chernoff, H. y Moses, L. (1959). Elementary Decision Theory. Dover: New York. [ Links ]

Fischhoff, B. y Kadvany, J. (2011). Risk, a Very Short Introduction. Oxford: United States, New York. [ Links ]

Garfield, J. y Ben-Zvi, D. (2008). Developing Students’ Statistical Reasoning: Connecting Research and Teaching Practice. New York: Springer. [ Links ]

Green, D. R. (1991). A Longitudinal Study of Pupil’s Probability Concepts. Technical Report ME90/91. Loughborough: University of Technology. [ Links ]

Hacking, I. (1975). The Emergence of Probability. Cambridge: Cambridge University Press. [ Links ]

Kahneman, D. y Tversky, A. (1984). Choices, Values, and Frames. American Psychologist, 39(4), 341-350. [ Links ]

Kahneman, D. y Tversky, A. (2000). Choices, Values, and Frames. Cambridge: Russell Sage Foundation. [ Links ]

Kelly, B. A. y Watson, J. M. (2002). Variation in a Chance Sampling Setting: The Lollies Task. En: B. Barton, K. C. Irwin, M. Pfannkuch & M. O. J. Thomas (eds.). Mathematics Education in the South Pacific (Proceedings of the 26th Annual Conference of the Mathematics Education Research Group of Australasia, Auckland, NZ, vol. 2 pp. 366-373). Sydney: merga. [ Links ]

Niss, M., Blum, W. y Galbraith, P. (2007). Introduction. In: W.Blum, P. L. Galbraith, H-W.Henn & M. Niss (eds.). Modelling and Applications in Mathematics Education. The 14th ICMI Study. New York: Springer. [ Links ]

Petrosino, A., Lehrer, R. y Schauble, L. (2003). Structuring Error and Experimental Variation as Distribution in the Fourth Grade. Mathematical Thinking and Learning, 5(2&3), 131-156. [ Links ]

Reading, C. (2004). Student Description of Variation While Working with Weather Data, Statistics Education Research Journal , 3(2), 84-105. [ Links ]

Reading, C. y Shaughnessy, M. (2004). Reasoning about Variation. In: D. Ben-Zvi and J. Garfield (eds.). The Challenge of Developing Statistical Literacy, Reasoning and Thinking (pp. 201-226). The Netherlands: Kluwer Academic Publishers. [ Links ]

SEP. (2011). Programas de Estudio 2011 Guía para el maestro. Educación Básica Secundaria. Matemáticas. México. Secretaría de Educación Pública. [ Links ]

Shaughnessy, J. M. (1997). Missed Opportunities in Research on the Teaching and Learning of Data and Chance. In: F. Bidulph & K.Carr (eds.). Proceedings of the Twentieth Annual Conference of the Mathematics Education Research Group of Australasia (pp. 6-22). Rotorua, N. Z.: University of Waikata. [ Links ]

Shaughnessy, J. M., Watson, J., Moritz, J. y Reading, C. (1999). School Mathematics Students’ Acknowledgement of Statistical Variation. En: C. Maher (Chair), There’s More to Life than Centers. Presession Research Symposium, 77th. Annual National Council of Teachers of Mathematics Conference, San Francisco, CA. [ Links ]

Shaughnessy, J. M. (2007). Research on Statistics Learning and Reasoning. In: F. K. LesterJr (ed.). Second Handbook of Research on Mathematics Teaching and Learning (pp. 957-1009). Reston: The National Council of Teachers of Mathematics. [ Links ]

Torok, R. y Watson, J. (2000). Development of the Concept of Statistical Variation: An Exploratory Study. Mathematics Education Research Journal, 12(2), 147-169. [ Links ]

Watson, J., Kelly, B. A., Callingham, R. A. y Shaughnessy, J. M. (2003). The Measurement of School Students’ Understanding of Statistical Variation. International Journal of Mathematical Education in Science and Technology, 34(1), 1-29. [ Links ]

Watson, J. M. y Kelly, B. A. (2004). Statistical Variation in a Chance Setting: A Two-year Study. Educational Studies in Mathematics, 57, 121-144. [ Links ]

Watson, J. M. y Kelly, B. A. (2005). The Winds are Variable: Students’ Intuitions about the Weather. School Science in Mathematics, 105(5), 252-259. [ Links ]

Wild, C. y Pfannkuch, M. (1999). Statistical Thinking in Empirical Enquiry. International Statistical Review, 67(3), 223-265. [ Links ]

Recibido: 06 de Marzo de 2017; Aprobado: 30 de Octubre de 2017

Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons