Bachillerato: Estadística y Probabilidad

Bachillerato: Estadística y Probabilidad

Interpretar Datos y Categóricos Cuantitativos HSS-ID.C.9

9. Distingue entre correlación y causalidad.

Uno de los errores más comunes que se comete al analizar estadística es confundir la correlación con la causalidad, o más específicamente, dar por hecho que la correlación implica causalidad. ¿Qué sucede cuando damos algo por sentado? No sabemos, pero rara vez es bueno.

Los estudiantes ya deben saber que la correlación es una medida de la fuerza de la asociación de dos variables. En particular, deben saber que el coeficiente de correlación lineal r puede oscilar de -1 a 1, y que un valor de -1 sugiere una fuerte correlación negativa y un valor de 1 sugiere una fuerte correlación positiva. Al menos, deben saber que este coeficiente existe.

Independientemente de cuán fuerte sea el tipo r (y su cinturón negro dice todo), sigue siendo un coeficiente de correlación. Mientras que r puede probar que dos variables están correlacionadas fuertemente, no puede probar que una sea la causa de la otra.

Por ejemplo, supongamos que descubrimos que hay una correlación lineal positiva fuerte entre la edad de un árbol y la cantidad de manzanas que produce. De hecho, esta correlación es tan fuerte que r = 0.99. ¿Significa esto que la edad del árbol es la causa de que crezcan más manzanas?

Tal vez, ¿cierto? Después de todo, es lógico que cuanto más viejo sea el árbol, produzca más fruta, y eso explica por qué r tiene la fuerza del Hombre Increíble. Por lo tanto, podemos decir que la edad de un árbol hará que crezcan más manzanas, ¿verdad?

Incorrecto.

Si bien las dos variables están fuertemente correlacionadas, no podemos probar que una causa la otra porque hay otros chorrocientos factores que no hemos considerado. ¿Y la lluvia? ¿El agricultor utilizó fertilizante? ¿Podó los árboles? ¿Cuáles eran las temperaturas de verano e invierno? Cualquiera de estos factores puede haber influenciado el número de manzanas.

Básicamente, los estudiantes deberían tener grabado en la cabeza que se necesita mucho más que una correlación fuerte para probar la causalidad.

La clave aquí es que la correlación no implica causalidad. Lo repetimos, porque así es de importante: la correlación no implica causalidad. Es esencial que los estudiantes entiendan y recuerden esto. De hecho, se lo deberían tatuar en la frente para que no se les olvide. La correlación no implica causalidad. ¿Quedó claro?

Recursos que se Conforman a los Estándares

    More standards from Bachillerato: Estadística y Probabilidad - Interpretar Datos y Categóricos Cuantitativos