Lección 8

Analicemos datos bivariados

Analicemos datos como un profesional.

8.1: Rapidez vs. longitud de un paso

Un investigador encontró una asociación entre la longitud de un paso de un perro y su rapidez: entre más larga es la longitud de un paso, más rápido anda. La rapidez predicha en metros por segundo, \(s\), como una función de la longitud de un paso en metros, \(l\), es

\(\displaystyle s = 4l-1.6\)

¿Qué te dice la tasa de cambio de la función sobre la asociación entre la longitud de un paso y la rapidez?

8.2: Cerebros de animales

¿Hay una asociación entre el peso del cuerpo de un animal y el peso del cerebro del animal?

Usa los datos de la tabla para hacer un diagrama de dispersión. ¿Hay datos atípicos?

animal peso del animal (kg) peso del cerebro (g)
vaca 465 423
lobo 36 120
cabra 28 115
burro 187 419
caballo 521 655
mono potar 10 115
gato 3 26
jirafa 529 680
gorila 207 406
humano 62 1,320
mono rhesus 7 179
canguro 35 56
oveja 56 175
jaguar 100 157
chimpancé 52 440
cerdo 192 180
  1. Sin tener en cuenta los datos atípicos, ¿parece que hubiera una asociación entre el peso del cuerpo y el peso del cerebro? Describe la asociación en una frase.
  2. Usando una tira de espagueti y una regla, ajusta una recta a tu diagrama de dispersión y estima su pendiente. ¿Qué significa esta pendiente en el contexto del peso del cuerpo y del cerebro?
  3. ¿La recta de ajuste te ayuda a identificar datos atípicos adicionales?


Usa una de estas sugerencias o encuentra otro conjunto de datos en el que estés interesado para buscar asociaciones entre las variables.

  • El número de partidos ganados vs. el número de puntos por partido de tu equipo deportivo favorito en varias temporadas.
  • La cantidad de dinero recaudada vs. la calificación de los críticos a tus películas favoritas.
  • El precio de un boleto vs. la capacidad del estadio para grupos musicales famosos de gira.

Después de que hayas recolectado los datos,

  1. Crea un diagrama de dispersión para los datos.
  2. ¿Hay puntos que estén muy lejos del resto de los datos?
  3. ¿Un modelo lineal se ajustaría a los datos en tu diagrama de dispersión? Si es así, dibújalo. Si no, ¿explica por qué una recta sería un ajuste inadecuado.
  4. ¿Hay una asociación entre las dos variables? Explica tu razonamiento.

8.3: Dimensiones del cuerpo iguales

Anteriormente, tu clase recolectó datos sobre la estatura y la distancia que abarcan los brazos.

  1. Algunas veces la distancia que abarcan los brazos y la estatura de una persona son iguales. ¿Esto es verdad para alguien en tu clase?

  2. Haz un diagrama de dispersión para los datos de la distancia que abarcan los brazos y la estatura, y describe cualquier asociación que haya.

    A blank coordinate plane with 29 horizontal units and 21 vertical units.

     

  3. ¿La recta \(y = x\) es un buen ajuste para los datos? Si es así, explica por qué. Si no, encuentra la ecuación de una recta que se ajuste mejor a los datos.
  4. Analiza el diagrama de dispersión. ¿Quién en tu clase tiene la razón más grande entre la distancia que abarcan sus brazos y su estatura? Explica o muestra tu razonamiento.

Resumen

La gente generalmente recolecta datos en dos variables numéricas para investigar las posibles asociaciones entre ellas, usar las conexiones que encuentran y, así, predecir otros valores de las variables.

  1. Recolectar datos.
  2. Organizar y representar los datos, y buscar una asociación.
  3. Identificar los datos atípicos y tratar de explicar por qué estos puntos de datos son excepciones a la tendencia que describe la asociación.
  4. Encontrar una función que se ajuste bien a los datos.

Aunque los programas informáticos pueden ayudar a hacer análisis de datos al graficarlos, encontrar una función que puede ajustarse a ellos y usar esa función para hacer predicciones, es importante entender el proceso y pensar en lo que está pasando. Puede que un programa informático encuentre una función que no tenga sentido o que use una recta cuando la situación sugiere que un modelo diferente sería más adecuado.

Entradas del glosario

  • asociación negativa

    Una asociación negativa es una relación entre dos cantidades en la cual una tiende a disminuir cuando la otra aumenta. En un diagrama de dispersión, los puntos de datos tienden a agruparse alrededor de una recta con pendiente negativa.

    Distintas tiendas en el país venden un libro a distintos precios.

    El diagrama de dispersión muestra que hay una asociación negativa entre el precio del libro (en dólares) y el número de libros vendidos a ese precio.

  • asociación positiva

    Una asociación positiva es una relación entre dos cantidades en la cual una tiende a aumentar cuando la otra aumenta. En un diagrama de dispersión, los puntos de datos tienden a agruparse alrededor de una recta con pendiente positiva.

    La relación entre la altura y el peso de 25 perros se muestra en este diagrama de dispersión. Hay una asociación positiva entre la altura del perro y el peso del perro.

  • dato atípico

    Un dato atípico es un dato que está lejos de los demás datos en un conjunto de datos.

    Este es un diagrama de dispersión que muestra largos y anchos de 20 pies izquierdos distintos. El pie con 24.5 cm de largo y 7.8 cm de ancho es un dato atípico.