Bachillerato: Estadística y Probabilidad

Bachillerato: Estadística y Probabilidad

Interpretar Datos y Categóricos Cuantitativos HSS-ID.A.2

2. Utiliza la estadística que corresponda a la forma de la distribución de datos para comparar el centro (mediana, media) y la dispersión/distribución (rango intercuartil, desviación estándar) de dos o más conjuntos de datos diferentes.

Una de las principales razones por las cuales se recoge información es para poder compararla con otra información. Parece un sueño que se convierte en realidad, ¿no es cierto?

La comparación de datos nos permite hacer grandes afirmaciones. Después de todo, ¿cómo nos podemos asegurar de que al usar Shmoop subiremos los puntajes de los exámenes sino tenemos dos conjuntos de datos, antes y después de recurrir a Shmoop, para comparar?

En lugar de comparar conjuntos de datos completos, sin embargo, podemos resumir los datos y comparar estos resúmenes. De ese modo, en vez de comparar largas einterminables listas, podemos comparar dos factores muy básicos que nos dicen mucho acerca de los datos: el centro y la dispersión/distribución de los datos.

El centro de los datos es exactamente lo que parece: una representación del medio de los datos, o un valor típico. Nos da una buena estimación inicial de dónde se ubicarán los datos en la recta numérica. Los alumnos deben conocer los dos tipos de centros de datos: la media y la mediana. La media, o promedio, es la suma de todos los puntos de datos dividida por el número de puntos de datos, mientras que la mediana es el valor que divide los datos en dos intervalos.

Los alumnos deben saber que el centro de los datos puede darnos una buena noción del conjunto de datos en general. Por ejemplo, sabremos que las alturas de los edificios se representan mejor con un promedio de 100 pies que con un promedio de 100,000 pies. Aun así, el centro de los datos no nos dice todo. Supongamos que tenemos los dos conjuntos de datos siguientes:

Conjunto 1: 4, 5, 6, 4, 6, 5
Conjunto 2: 1, 9, 2, 8, 0, 10

Ambos conjuntos de datos tienen un promedio de 5, pero el primer conjunto solo tiene valores entre 4 y 6 y el segundo conjunto de datos tiene valores entre 0 y 10, un rango mucho más amplio. Esta “extensión” o “amplitud” de los datos se representa mediante la dispersión de datos y ése es el segundo aspecto que los estudiantes deben tener en cuenta cuando estén resumiendo datos.

Los estudiantes deben saber cómo usar el rango intercuartil y la desviación estándar para describir la dispersión de datos. El rango intercuartil (IQR) es el rango que abarca la mitad del cincuenta por ciento de los datos. Para poder determinar el IQR, se tienen que determinar el cuartil inferior (Q1) y el cuartil superior (Q3). Una vez que se hayan calculado, IQR = Q3 – Q1.

La desviación estándar, que se designa con σ, corresponde a la dispersión de los datos fuera de la media de un conjunto de datos. Si pudieras alejarte de la media simultáneamente en ambas direcciones, cuando hubieras viajado la distancia de la desviación estándar en ambas direcciones, entonces el 68% de los datos estarían entre tú y tu clon (en una distribución normal, en todo caso).

Los estudiantes deben saber que la media tiene la siguiente fórmula:

Y la desviación estándar tiene la siguiente fórmula:

A menudo, la media y la desviación estándar se emplean juntas y la mediana y el rango intercuartil se usan juntos. Los estudiantes deben saber que la media y la desviación estándar se usan más frecuentemente cuando la distribución de los datos se representa en una curva de campana [de Gaus] (distribución normal), como se muestra a continuación:

Los estudiantes deben entender que cuanto más grandes sean los valores del IQR o desviación estándar, más grande será la dispersión de los datos. Si a los estudiantes les cuesta entender por qué es así, demuéstraselos desde el punto de vista matemático, por medio de fórmulas (puesto que los cuartiles están alejados, o las diferencias entre los puntos de los datos y la media están alejados). Ahora, en lugar de comparar tablas de docenas o incluso cientos de números, solo necesitamos comparar dos.

A continuación ofrecemos un recurso que pueden usar los profesores para explicar la curva de distribución normal:

 

Recursos que se Conforman a los Estándares

    More standards from Bachillerato: Estadística y Probabilidad - Interpretar Datos y Categóricos Cuantitativos