Lección 5
Describamos tendencias en diagramas de dispersión
Busquemos asociaciones entre variables.
5.1: ¿Cuál es diferente?: diagramas de dispersión
¿Cuál es diferente?
5.2: Ajustemos rectas
Tu profesor te va a entregar una tira de pasta y una regla.
-
Estas son dos copias del mismo diagrama de dispersión. Experimenta dibujar rectas que se ajusten a los datos. Escoge la recta que creas que mejor se ajusta a los datos. Compárala con la de un compañero.
-
Estas son dos copias de otro diagrama de dispersión. Experimenta dibujando rectas que se ajusten a los datos. Escoge la recta que creas que mejor se ajusta a los datos. Compárala con la de un compañero.
- En tus propias palabras, describe los aspectos que hagan que una recta se ajuste bien a los datos.
5.3: Buen ajuste, mal ajuste
Los dos diagramas de dispersión muestran el año y el precio de los mismos 17 automóviles usados. Pero, cada diagrama de dispersión tiene un modelo diferente para la relación entre año y precio.
- En el diagrama A:
-
¿Para cuántos automóviles el modelo hace una buena predicción de sus precios?
-
¿Para cuántos automóviles el modelo subestima el precio?
-
¿Para cuántos automóviles el modelo sobrestima el precio?
-
- En el diagrama B:
-
¿Para cuántos automóviles el modelo hace una buena predicción de sus precios?
-
¿Para cuántos automóviles el modelo subestima el precio?
-
¿Para cuántos automóviles el modelo sobrestima el precio?
-
-
¿Para cuántos automóviles la predicción del modelo del diagrama A difiere del precio real por más de \$3,000?, ¿y para cuántos automóviles, con respecto al modelo del diagrama B?
- ¿Cuál modelo hace un mejor trabajo en predecir el precio de un automóvil usado a partir de su año?
5.4: Practiquemos cómo ajustar rectas
- ¿Esta recta es un buen ajuste para los datos? Explica tu razonamiento.
- Dibuja una recta que se ajuste mejor a los datos.
- ¿Esta recta es un buen ajuste para los datos? Explica tu razonamiento.
- Dibuja una recta que se ajuste mejor a los datos.
Estos diagramas de dispersión fueron hechos multiplicando la coordenada en \(x\) por 3 y luego sumando un número aleatorio entre dos valores para obtener la coordenada en \(y\). En el primer diagrama de dispersión se sumó un número entre -0.5 y 0.5 a la coordenada en \(y\). En el segundo diagrama de dispersión se sumó un número entre -2 y 2 a la coordenada en \(y\). En el tercer diagrama de dispersión se sumó un número aleatorio entre -10 y 10 a la coordenada en \(y\).
- En cada diagrama de dispersión, dibuja una recta que se ajuste a los datos.
- Explica por qué con algunas fue más fácil hacer esto que con otras.
Resumen
Cuando una función lineal se ajusta bien a los datos, decimos que hay una asociación lineal entre las variables. Por ejemplo, la relación entre altura y peso de 25 perros y la función lineal cuya gráfica se muestra junto con el diagrama de dispersión.
Dado que el modelo se ajusta bien a los datos y que la pendiente de la recta es positiva, decimos que hay una asociación positiva entre el peso del perro y la altura del perro.
¿Cuál asociación crees que hay entre el peso de un automóvil y su eficiencia de combustible?
Como la pendiente de una recta que se ajusta bien a los datos es negativa, decimos que hay una asociación negativa entre la eficiencia de combustible y el peso de un automóvil.
Entradas del glosario
- asociación negativa
Una asociación negativa es una relación entre dos cantidades en la cual una tiende a disminuir cuando la otra aumenta. En un diagrama de dispersión, los puntos de datos tienden a agruparse alrededor de una recta con pendiente negativa.
Distintas tiendas en el país venden un libro a distintos precios.
El diagrama de dispersión muestra que hay una asociación negativa entre el precio del libro (en dólares) y el número de libros vendidos a ese precio.
- asociación positiva
Una asociación positiva es una relación entre dos cantidades en la cual una tiende a aumentar cuando la otra aumenta. En un diagrama de dispersión, los puntos de datos tienden a agruparse alrededor de una recta con pendiente positiva.
La relación entre la altura y el peso de 25 perros se muestra en este diagrama de dispersión. Hay una asociación positiva entre la altura del perro y el peso del perro.
- dato atípico
Un dato atípico es un dato que está lejos de los demás datos en un conjunto de datos.
Este es un diagrama de dispersión que muestra largos y anchos de 20 pies izquierdos distintos. El pie con 24.5 cm de largo y 7.8 cm de ancho es un dato atípico.