Lección 5

Describamos tendencias en diagramas de dispersión

Busquemos asociaciones entre variables.

5.1: ¿Cuál es diferente?: diagramas de dispersión

¿Cuál es diferente?

Four scatterplots.

 

5.2: Ajustemos rectas

Tu profesor te va a entregar una tira de pasta y una regla.

  1. Estas son dos copias del mismo diagrama de dispersión. Experimenta dibujar rectas que se ajusten a los datos. Escoge la recta que creas que mejor se ajusta a los datos. Compárala con la de un compañero.

    Scatterplot.
    Scatterplot.
  2. Estas son dos copias de otro diagrama de dispersión. Experimenta dibujando rectas que se ajusten a los datos. Escoge la recta que creas que mejor se ajusta a los datos. Compárala con la de un compañero.

    Scatterplot.
    Scatterplot.
  3. En tus propias palabras, describe los aspectos que hagan que una recta se ajuste bien a los datos.

5.3: Buen ajuste, mal ajuste

Los dos diagramas de dispersión muestran el año y el precio de los mismos 17 automóviles usados. Pero, cada diagrama de dispersión tiene un modelo diferente para la relación entre año y precio.

  1. En el diagrama A:
    1. ¿Para cuántos automóviles el modelo hace una buena predicción de sus precios?

    2. ¿Para cuántos automóviles el modelo subestima el precio?

    3. ¿Para cuántos automóviles el modelo sobrestima el precio?

  2. En el diagrama B:
    1. ¿Para cuántos automóviles el modelo hace una buena predicción de sus precios?

    2. ¿Para cuántos automóviles el modelo subestima el precio?

    3. ¿Para cuántos automóviles el modelo sobrestima el precio?

  3. ¿Para cuántos automóviles la predicción del modelo del diagrama A difiere del precio real por más de \$3,000?, ¿y para cuántos automóviles, con respecto al modelo del diagrama B?

  4. ¿Cuál modelo hace un mejor trabajo en predecir el precio de un automóvil usado a partir de su año?

5.4: Practiquemos cómo ajustar rectas

  1. ¿Esta recta es un buen ajuste para los datos? Explica tu razonamiento.
    A scatterplot. Horizontal, from 1000 to 1500, by 125’s. Vertical, from 0 to 4000, by 1000’s. 21 data po0nts above and below line. Trends downward and right. 
  2. Dibuja una recta que se ajuste mejor a los datos.
    A scatterplot. Horizontal, from 1000 to 1500, by 125’s. Vertical, from 0 to 4000, by 1000’s. 21 data po0nts. Trend downward and to right.
  3. ¿Esta recta es un buen ajuste para los datos? Explica tu razonamiento.
    A scatterplot.
  4. Dibuja una recta que se ajuste mejor a los datos.
    A scatterplot. Horizontal, from 0 to 100 by 25’s. Vertical, from 0 to 200, by 50’s. 20 data points.. Trends upward and right, clustered in two groups.


A scatterplot, 30 points arranged very close to the line from 0 comma 0 to 10 comma 30.
A scatterplot, points at x= 0 lie between negative 2 and 8, generally trend up and to the right. Points at x = 9 lie between 20 and 35.
A scatterplot, points at x= 0 lie between negative 18 and negative 2, generally trend up and to the right. Points at x = 9 lie between 15 and 40.

Estos diagramas de dispersión fueron hechos multiplicando la coordenada en \(x\) por 3 y luego sumando un número aleatorio entre dos valores para obtener la coordenada en \(y\). En el primer diagrama de dispersión se sumó un número entre -0.5 y 0.5 a la coordenada en \(y\). En el segundo diagrama de dispersión se sumó un número entre -2 y 2 a la coordenada en \(y\). En el tercer diagrama de dispersión se sumó un número aleatorio entre -10 y 10 a la coordenada en \(y\).

  1. En cada diagrama de dispersión, dibuja una recta que se ajuste a los datos.
  2. Explica por qué con algunas fue más fácil hacer esto que con otras.

Resumen

Cuando una función lineal se ajusta bien a los datos, decimos que hay una asociación lineal entre las variables. Por ejemplo, la relación entre altura y peso de 25 perros y la función lineal cuya gráfica se muestra junto con el diagrama de dispersión.

Dado que el modelo se ajusta bien a los datos y que la pendiente de la recta es positiva, decimos que hay una asociación positiva entre el peso del perro y la altura del perro.

¿Cuál asociación crees que hay entre el peso de un automóvil y su eficiencia de combustible?

Como la pendiente de una recta que se ajusta bien a los datos es negativa, decimos que hay una asociación negativa entre la eficiencia de combustible y el peso de un automóvil.

Entradas del glosario

  • asociación negativa

    Una asociación negativa es una relación entre dos cantidades en la cual una tiende a disminuir cuando la otra aumenta. En un diagrama de dispersión, los puntos de datos tienden a agruparse alrededor de una recta con pendiente negativa.

    Distintas tiendas en el país venden un libro a distintos precios.

    El diagrama de dispersión muestra que hay una asociación negativa entre el precio del libro (en dólares) y el número de libros vendidos a ese precio.

  • asociación positiva

    Una asociación positiva es una relación entre dos cantidades en la cual una tiende a aumentar cuando la otra aumenta. En un diagrama de dispersión, los puntos de datos tienden a agruparse alrededor de una recta con pendiente positiva.

    La relación entre la altura y el peso de 25 perros se muestra en este diagrama de dispersión. Hay una asociación positiva entre la altura del perro y el peso del perro.

  • dato atípico

    Un dato atípico es un dato que está lejos de los demás datos en un conjunto de datos.

    Este es un diagrama de dispersión que muestra largos y anchos de 20 pies izquierdos distintos. El pie con 24.5 cm de largo y 7.8 cm de ancho es un dato atípico.