Unidad 6 materiales para la familia

Asociaciones de datos

¿Esto predice aquello?

Esta semana nuestros estudiantes van a trabajar con diagramas de dispersión. Los diagramas de dispersión muestran cómo se relacionan dos variables distintas.

En el ejemplo, cada punto corresponde a un perro, y sus coordenadas nos indican la altura y el peso de ese perro. Por ejemplo, el punto de más abajo a la izquierda, en la gráfica, representa un perro con una altura de 8 pulgadas y un peso de alrededor de 5 libras. El diagrama muestra que, en general, los perros altos pesan más que los perros bajos. Dado que un valor grande en una característica (altura) generalmente implica un valor grande en la otra característica (peso), decimos que hay una asociación positiva entre la altura y el peso de los perros.

En el siguiente ejemplo, cada punto corresponde a un automóvil, y sus coordenadas nos indican el peso del automóvil y la eficiencia en el consumo de combustible. Esta vez observamos que valores grandes para una característica (peso del automóvil) generalmente se asocian a valores pequeños para la otra característica (eficiencia), por lo tanto, decimos que hay una asociación negativa entre el peso y la eficiencia del automóvil.

Esta es una tarea para que trabajen en familia:

El siguiente diagrama de dispersión muestra la relación entre la temperatura ambiente promedio y el uso de gas para calentar las calderas de un edificio. Cada punto representa un día distinto.

  1. ¿Cuántos puntos del gráfico describen el edificio en un día en el que la temperatura ambiente era 70 grados? ¿Aproximadamente, cuánto gas se usó en cada uno de esos días?
  2. ¿Las variables en el diagrama de dispersión muestran una asociación positiva o negativa?
  3. En un día en el cual la temperatura ambiente sea 78 grados, ¿qué parece más posible que el edificio use: (a) 1,800 termias de gas, (b) 4,200 termias de gas, o (c) 5,800 termias de gas?

Solución:

  1. Hay dos puntos que describen el uso de gas en días en los que la temperatura fue de 70 grados. En uno de esos días el edificio usó un poco menos de 4,000 termias de gas. En el otro, el edificio usó alrededor 6,500 termias.
  2. Como en los días más cálidos se usa menos gas, hay una asociación negativa.
  3. Siguiendo la tendencia del gráfico, es más posible que el edificio use alrededor de 1,800 termias en un día de 78 grados. Podríamos dibujar una recta, como en los diagramas de los perros y de los automóviles, para que nos ayudara a ver esto.

Asociaciones en datos categóricos

Esta semana nuestros estudiantes van a usar tablas de doble entrada. Las tablas de doble entrada son una manera de comparar dos variables. Por ejemplo, esta tabla muestra los resultados de un estudio sobre la relación entre la meditación y el estado de ánimo de los atletas antes de una competencia.

meditó no meditó total
calmado 45 8 53
agitado 23 21 44
total 68 29 97

23 de las personas que meditaron estaban agitadas, mientras que 21 de las personas que no meditaron estaban agitadas. ¿Significa esto que la meditación no tiene impacto o, incluso, una asociación ligeramente negativa con el estado de ánimo? Probablemente no. Cuando buscamos asociaciones entre variables, conocer los porcentajes en cada categoría suele dar más información. Así:

meditó no meditó
calmado 66% 28%
agitado 34% 72%
total 100% 100%

Entre aquellos que meditaron, el 66% estaba calmado y el 34% estaba agitado. Cuando comparamos eso con los porcentajes para las personas que no meditaron, podemos ver más fácilmente que el grupo de personas que meditó tiene un porcentaje más bajo de atletas agitados. Los porcentajes en esta tabla se llaman frecuencias relativas.

Esta es una tarea para que trabajen en familia:

La siguiente tabla contiene datos que indican si las personas de varios grupos de edades usan su teléfono celular como su despertador principal.

usan su teléfono como despertador no usan su teléfono como despertador total
18 a 29 años 47 16 63
30 a 49 años 66 23 89
50+ años 31 39 70
total 144 78 222
  1. Completen los espacios en la tabla de abajo con las frecuencias relativas en cada fila. Esto nos va a indicar el porcentaje de personas en cada grupo de edad que usa su teléfono celular como despertador.
    usan su teléfono como despertador no usan su teléfono como despertador total
    18 a 29 años \(75\%\), pues \(\frac{47}{63}=0.75\) 100%
    30 a 49 años
    50+ años 
  2. Si comparan únicamente los grupos "18 a 29 años" y "30 a 49 años", ¿existe una asociación entre el uso del teléfono celular como despertador y la edad?
  3. Si comparan los dos grupos más jóvenes con el grupo de "50+ años", ¿existe una asociación entre el uso del teléfono celular como despertador y la edad?

Solución:

  1. usan su teléfono como despertador no usan su teléfono como despertador total
    18 a 29 años \(75\%\), pues \(\frac{47}{63}=0.75\) \(25\%\), pues \(\frac{16}{63}=0.25\) 100%
    30 a 49 años \(74\%\), pues \(\frac{66}{89}=0.74\) \(26\%\), pues \(\frac{23}{89}=0.26\) 100%
    50+ años   \(44\%\), pues \(\frac{31}{70}=0.44\) \(56\%\), pues \(\frac{39}{70}=0.56\) 100%
  2. No: las frecuencias relativas son muy parecidas.
  3. Sí: usar el teléfono celular como alarma está asociado con estar en los grupos de personas más jóvenes. Alrededor de 75% de los de 18 a 29 años y los de 30 a 49 años usan su teléfono celular como despertador, pero solo 44% de las personas de 50 años o más lo hacen.