Lección 5
Describamos tendencias en diagramas de dispersión
Busquemos asociaciones entre variables.
5.1: ¿Cuál es diferente?: diagramas de dispersión
¿Cuál es diferente?
![Four scatterplots.](https://cms-im.s3.amazonaws.com/MoppH7by3E9YwZCQwbVG2QAw?response-content-disposition=inline%3B%20filename%3D%228-8.6.B3.Image.Revision.01.png%22%3B%20filename%2A%3DUTF-8%27%278-8.6.B3.Image.Revision.01.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240630%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240630T163322Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=ef8cebf942ec050bd31f3793330dfa4cdc8ca25fa86d05aa3498659a9a2f2884)
5.2: Ajustemos rectas
Tu profesor te va a entregar una tira de pasta y una regla.
-
Estas son dos copias del mismo diagrama de dispersión. Experimenta dibujar rectas que se ajusten a los datos. Escoge la recta que creas que mejor se ajusta a los datos. Compárala con la de un compañero.
-
Estas son dos copias de otro diagrama de dispersión. Experimenta dibujando rectas que se ajusten a los datos. Escoge la recta que creas que mejor se ajusta a los datos. Compárala con la de un compañero.
- En tus propias palabras, describe los aspectos que hagan que una recta se ajuste bien a los datos.
5.3: Buen ajuste, mal ajuste
Los dos diagramas de dispersión muestran el año y el precio de los mismos 17 automóviles usados. Pero, cada diagrama de dispersión tiene un modelo diferente para la relación entre año y precio.
![](https://cms-im.s3.amazonaws.com/rgSd4DwuCXMRXa47mrdHyyze?response-content-disposition=inline%3B%20filename%3D%228.6AScatter.pdf-8_es.png%22%3B%20filename%2A%3DUTF-8%27%278.6AScatter.pdf-8_es.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240630%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240630T163322Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=52549a78b0df1c872ca59c8cf001cf854d88f8d8269c77870b7964a8f0c275e3)
- En el diagrama A:
-
¿Para cuántos automóviles el modelo hace una buena predicción de sus precios?
-
¿Para cuántos automóviles el modelo subestima el precio?
-
¿Para cuántos automóviles el modelo sobrestima el precio?
-
- En el diagrama B:
-
¿Para cuántos automóviles el modelo hace una buena predicción de sus precios?
-
¿Para cuántos automóviles el modelo subestima el precio?
-
¿Para cuántos automóviles el modelo sobrestima el precio?
-
-
¿Para cuántos automóviles la predicción del modelo del diagrama A difiere del precio real por más de \$3,000?, ¿y para cuántos automóviles, con respecto al modelo del diagrama B?
- ¿Cuál modelo hace un mejor trabajo en predecir el precio de un automóvil usado a partir de su año?
5.4: Practiquemos cómo ajustar rectas
- ¿Esta recta es un buen ajuste para los datos? Explica tu razonamiento.
- Dibuja una recta que se ajuste mejor a los datos.
- ¿Esta recta es un buen ajuste para los datos? Explica tu razonamiento.
- Dibuja una recta que se ajuste mejor a los datos.
![A scatterplot, 30 points arranged very close to the line from 0 comma 0 to 10 comma 30.](https://cms-im.s3.amazonaws.com/kbMUGDPVxMkfHMx3mD6DUNjf?response-content-disposition=inline%3B%20filename%3D%228.6.Extension.Image.03.png%22%3B%20filename%2A%3DUTF-8%27%278.6.Extension.Image.03.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240630%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240630T163322Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=68f99b461d640665fd00f34aa2bb30ac73cc84eb67abcf1c6264b8a62f249ebc)
![A scatterplot, points at x= 0 lie between negative 2 and 8, generally trend up and to the right. Points at x = 9 lie between 20 and 35.](https://cms-im.s3.amazonaws.com/5t7faPLDKZNmsNpwtAvDRUHB?response-content-disposition=inline%3B%20filename%3D%228.6.Extension.Image.05.png%22%3B%20filename%2A%3DUTF-8%27%278.6.Extension.Image.05.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240630%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240630T163322Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=51bd38e29bfe3ed50979ee3e980a90f1f1682cdcd93276e74cecc7a92d1dcaa2)
![A scatterplot, points at x= 0 lie between negative 18 and negative 2, generally trend up and to the right. Points at x = 9 lie between 15 and 40.](https://cms-im.s3.amazonaws.com/5d1XiFUELXNiJiQHM9E6Ha1V?response-content-disposition=inline%3B%20filename%3D%228.6.Extension.Image.04.png%22%3B%20filename%2A%3DUTF-8%27%278.6.Extension.Image.04.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240630%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240630T163322Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=cdc3c93bece1516c7d7873f9468fe161b5b28f406d02b3473949424675c688db)
Estos diagramas de dispersión fueron hechos multiplicando la coordenada en \(x\) por 3 y luego sumando un número aleatorio entre dos valores para obtener la coordenada en \(y\). En el primer diagrama de dispersión se sumó un número entre -0.5 y 0.5 a la coordenada en \(y\). En el segundo diagrama de dispersión se sumó un número entre -2 y 2 a la coordenada en \(y\). En el tercer diagrama de dispersión se sumó un número aleatorio entre -10 y 10 a la coordenada en \(y\).
- En cada diagrama de dispersión, dibuja una recta que se ajuste a los datos.
- Explica por qué con algunas fue más fácil hacer esto que con otras.
Resumen
Cuando una función lineal se ajusta bien a los datos, decimos que hay una asociación lineal entre las variables. Por ejemplo, la relación entre altura y peso de 25 perros y la función lineal cuya gráfica se muestra junto con el diagrama de dispersión.
![](https://cms-im.s3.amazonaws.com/RUbr3MDwNR5uBJ358KEEEZTA?response-content-disposition=inline%3B%20filename%3D%228.6.B2.Image.08_es%20%25281%2529.png%22%3B%20filename%2A%3DUTF-8%27%278.6.B2.Image.08_es%2520%25281%2529.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240630%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240630T163322Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=b70b5ff13a6637f4ccbab1c75f56d0aada48d423a8eab7e6d150a48da15f285e)
Dado que el modelo se ajusta bien a los datos y que la pendiente de la recta es positiva, decimos que hay una asociación positiva entre el peso del perro y la altura del perro.
¿Cuál asociación crees que hay entre el peso de un automóvil y su eficiencia de combustible?
![](https://cms-im.s3.amazonaws.com/reQLYnDsEz8BnaLojm6cvh3e?response-content-disposition=inline%3B%20filename%3D%228.6.B4.Image.03_es.png%22%3B%20filename%2A%3DUTF-8%27%278.6.B4.Image.03_es.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240630%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240630T163322Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=9fef3281afacaab0fa1ef543ed406f0ca08818153bc8032278ddf1d9a027f43a)
Como la pendiente de una recta que se ajusta bien a los datos es negativa, decimos que hay una asociación negativa entre la eficiencia de combustible y el peso de un automóvil.
Entradas del glosario
- asociación negativa
Una asociación negativa es una relación entre dos cantidades en la cual una tiende a disminuir cuando la otra aumenta. En un diagrama de dispersión, los puntos de datos tienden a agruparse alrededor de una recta con pendiente negativa.
Distintas tiendas en el país venden un libro a distintos precios.
El diagrama de dispersión muestra que hay una asociación negativa entre el precio del libro (en dólares) y el número de libros vendidos a ese precio.
- asociación positiva
Una asociación positiva es una relación entre dos cantidades en la cual una tiende a aumentar cuando la otra aumenta. En un diagrama de dispersión, los puntos de datos tienden a agruparse alrededor de una recta con pendiente positiva.
La relación entre la altura y el peso de 25 perros se muestra en este diagrama de dispersión. Hay una asociación positiva entre la altura del perro y el peso del perro.
- dato atípico
Un dato atípico es un dato que está lejos de los demás datos en un conjunto de datos.
Este es un diagrama de dispersión que muestra largos y anchos de 20 pies izquierdos distintos. El pie con 24.5 cm de largo y 7.8 cm de ancho es un dato atípico.