Lección 9

Relaciones causales

  • Estudiemos más a fondo las variables que se relacionan.

9.1: Relaciones de automóviles usados

En cada caso, describe la intensidad de la relación entre las variables y el signo que esperas que tenga la relación. Explica tu razonamiento.

  1. El precio de un automóvil usado y el precio de venta original de ese automóvil.
  2. El precio de un automóvil usado y el número de portavasos que tiene ese automóvil.
  3. El precio de un automóvil usado y el número de cambios de aceite que ha tenido ese automóvil.
  4. El precio de un automóvil usado y el número de millas recorridas por ese automóvil.

9.2: ¿Causa o efecto?

Cada uno de los diagramas de dispersión muestra una relación fuerte. Escribe una o dos oraciones que describan cómo piensas que se relacionan las variables.

  1. A scatterplot. Percentage with jackets. Precipitation in inches.

    Durante el mes de abril, Elena lleva un registro del número de pulgadas de lluvia que cae cada día y el porcentaje de personas que asisten a la escuela con chaquetas impermeables.

  2. A scatterplot. Number of pages. Time in hours.

    El club de lectura de una escuela le ofrece a sus miembros una lista de 100 libros. Llevan un registro del número de páginas de cada libro que alguien lee y de la cantidad de tiempo que le toma leer el libro.

  3. A scatterplot, Noise level in decibels. Number of tickets left.

    El número de boletos de la fiesta de vacaciones que no se vendieron y el nivel de ruido de la fiesta.

  4. A scatterplot. Vocabulary test score in percent. Height in inches.

    La estatura de un niño de 6 a 13 años y el puntaje que obtuvo en una prueba de vocabulario.

9.3: Encuentra tu causa

En cada caso, describe una pareja de variables que cumpla la condición. Explica tu razonamiento.

  1. Las variables tienen una relación causal.
  2. Las variables están fuertemente relacionadas, pero un tercer factor podría ser la causa de los cambios de las variables.
  3. Las variables solo se relacionan débilmente.


  1. Busca en noticias o en publicidad 2 o 3 afirmaciones de causalidad o correlación. Para cada una de las afirmaciones, lee o mira los artículos o la publicidad y responde estas preguntas.

    1. ¿Cuál es la afirmación?

    2. ¿Qué evidencia se presenta para sustentar esa afirmación?

    3. ¿Parece haber alguna evidencia de causalidad o de correlación? Explica cómo pensaste.

  2. Escoge la afirmación que tenga menos evidencia (incluso ninguna evidencia). Describe un experimento u otra forma en la que podrías recolectar datos para mostrar si hay correlación o causalidad.

Resumen

Los seres humanos están programados para buscar conexiones y luego usarlas para aprender sobre su entorno. Una forma de identificar conexiones es buscar una pareja de variables que tengan una relación. Para descubrir cómo están relacionadas, necesitamos controlar una de las variables y ver si hay cambios en la otra variable. Por ejemplo, si observamos que las personas que tienden a comer muchas más calorías también tienen un riesgo más alto de tener un ataque cardíaco, podríamos preguntarnos si reducir nuestro consumo de calorías mejoraría nuestra salud.

Un error común que las personas tienden a cometer al usar la estadística es pensar que todas las relaciones entre variables son causales. Los diagramas de dispersión pueden mostrar únicamente una relación entre las dos variables. Para determinar si el cambio de una variable realmente hace que la otra variable cambie, es decir, si hay una relación causal, se debe entender mejor el contexto y descartar otras opciones.

Por ejemplo, supondríamos que hay una relación positiva y fuerte entre el número de tablas de snowboard alquiladas y las ventas de chocolate caliente durante los meses de septiembre a enero. Esto no significa que un aumento en las tablas de snowboard alquiladas cause que las personas compren más chocolate caliente. Tampoco significa que el aumento en las ventas de chocolate caliente cause que las personas alquilen más tablas de snowboard. Lo más probable es que haya una tercera variable, como un clima más frío, que haga que ambas variables aumenten al mismo tiempo. 

Por otro lado, algunas veces sí hay una relación causal. Se podría establecer una relación positiva y fuerte entre las ventas de chocolate caliente y las ventas de malvaviscos, porque al comprar chocolate caliente es posible que se quiera agregar malvaviscos pequeños a la bebida. Por lo tanto, un aumento en las ventas de chocolate caliente realmente causa un aumento en las ventas de malvaviscos.

Encontrar relaciones con la ayuda del coeficiente de correlación es una muy buena forma de darse cuenta de que hay una conexión entre las variables. Para determinar si la relación es causal, el siguiente paso, por lo general, consiste en diseñar con cuidado un experimento que aísle y controle de manera precisa una de las variables para determinar cómo esta influye en la otra variable. 

Entradas del glosario

  • coeficiente de correlación

    Un número entre -1 y 1 que describe la intensidad y dirección de una asociación lineal entre dos variables numéricas. El coeficiente de correlación tiene el mismo signo que la pendiente de la recta de mejor ajuste. Cuanto más cerca de 0 está el coeficiente de correlación, más débil es la relación lineal. Cuanto más cerca de 1 o -1 está el coeficiente de correlación, más se ajusta el modelo lineal a los datos.

    En la primera figura, el coeficiente de correlación es cercano a 1. En la segunda, el coeficiente de correlación es positivo, pero cercano a 0. En la tercera, el coeficiente de correlación es cercano a -1.

  • relación causal

    Una relación causal es una relación en la que un cambio en una de las variables causa un cambio en la otra variable.

  • relación débil

    Una relación entre dos variables numéricas es débil si los datos no están tan cerca de la recta de mejor ajuste.

  • relación fuerte

    Una relación entre dos variables numéricas es fuerte si los datos están muy cerca de la recta de mejor ajuste.

  • relación negativa

    Una relación entre dos variables numéricas es negativa si el valor de los datos de una de las variables tiende a disminuir cuando el valor de los datos de la otra variable aumenta.

  • relación positiva

    Una relación entre dos variables numéricas es positiva si el valor de los datos de una de las variables tiende a aumentar cuando el valor de los datos de la otra variable aumenta.