Lección 5
Describamos tendencias en diagramas de dispersión
Busquemos asociaciones entre variables.
5.1: ¿Cuál es diferente?: diagramas de dispersión
¿Cuál es diferente?
![Four scatterplots.](https://cms-im.s3.amazonaws.com/MoppH7by3E9YwZCQwbVG2QAw?response-content-disposition=inline%3B%20filename%3D%228-8.6.B3.Image.Revision.01.png%22%3B%20filename%2A%3DUTF-8%27%278-8.6.B3.Image.Revision.01.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240727%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240727T002547Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=abed34a932216bed4eca940b820ba22274b371f15fd232ce2bae1a77a7595b76)
5.2: Ajustemos rectas
Tu profesor te va a entregar una tira de pasta y una regla.
-
Estas son dos copias del mismo diagrama de dispersión. Experimenta dibujar rectas que se ajusten a los datos. Escoge la recta que creas que mejor se ajusta a los datos. Compárala con la de un compañero.
-
Estas son dos copias de otro diagrama de dispersión. Experimenta dibujando rectas que se ajusten a los datos. Escoge la recta que creas que mejor se ajusta a los datos. Compárala con la de un compañero.
- En tus propias palabras, describe los aspectos que hagan que una recta se ajuste bien a los datos.
5.3: Buen ajuste, mal ajuste
Los dos diagramas de dispersión muestran el año y el precio de los mismos 17 automóviles usados. Pero, cada diagrama de dispersión tiene un modelo diferente para la relación entre año y precio.
![](https://cms-im.s3.amazonaws.com/rgSd4DwuCXMRXa47mrdHyyze?response-content-disposition=inline%3B%20filename%3D%228.6AScatter.pdf-8_es.png%22%3B%20filename%2A%3DUTF-8%27%278.6AScatter.pdf-8_es.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240727%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240727T002547Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=396b519a9faec584b5cde4611f713b5b55dacee6226ed4403ed28b894bb79e47)
- En el diagrama A:
-
¿Para cuántos automóviles el modelo hace una buena predicción de sus precios?
-
¿Para cuántos automóviles el modelo subestima el precio?
-
¿Para cuántos automóviles el modelo sobrestima el precio?
-
- En el diagrama B:
-
¿Para cuántos automóviles el modelo hace una buena predicción de sus precios?
-
¿Para cuántos automóviles el modelo subestima el precio?
-
¿Para cuántos automóviles el modelo sobrestima el precio?
-
-
¿Para cuántos automóviles la predicción del modelo del diagrama A difiere del precio real por más de \$3,000?, ¿y para cuántos automóviles, con respecto al modelo del diagrama B?
- ¿Cuál modelo hace un mejor trabajo en predecir el precio de un automóvil usado a partir de su año?
5.4: Practiquemos cómo ajustar rectas
- ¿Esta recta es un buen ajuste para los datos? Explica tu razonamiento.
- Dibuja una recta que se ajuste mejor a los datos.
- ¿Esta recta es un buen ajuste para los datos? Explica tu razonamiento.
- Dibuja una recta que se ajuste mejor a los datos.
![A scatterplot, 30 points arranged very close to the line from 0 comma 0 to 10 comma 30.](https://cms-im.s3.amazonaws.com/kbMUGDPVxMkfHMx3mD6DUNjf?response-content-disposition=inline%3B%20filename%3D%228.6.Extension.Image.03.png%22%3B%20filename%2A%3DUTF-8%27%278.6.Extension.Image.03.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240727%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240727T002547Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=832802499c6502b1e766f3fd616b77bdbde404ab22ec7c4e3c745b5f5e0a4aef)
![A scatterplot, points at x= 0 lie between negative 2 and 8, generally trend up and to the right. Points at x = 9 lie between 20 and 35.](https://cms-im.s3.amazonaws.com/5t7faPLDKZNmsNpwtAvDRUHB?response-content-disposition=inline%3B%20filename%3D%228.6.Extension.Image.05.png%22%3B%20filename%2A%3DUTF-8%27%278.6.Extension.Image.05.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240727%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240727T002547Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=d2647d2c697934fbd70f4e98157480a62fcd7b0090ab5b8fe29798b542012aff)
![A scatterplot, points at x= 0 lie between negative 18 and negative 2, generally trend up and to the right. Points at x = 9 lie between 15 and 40.](https://cms-im.s3.amazonaws.com/5d1XiFUELXNiJiQHM9E6Ha1V?response-content-disposition=inline%3B%20filename%3D%228.6.Extension.Image.04.png%22%3B%20filename%2A%3DUTF-8%27%278.6.Extension.Image.04.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240727%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240727T002547Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=0d46591d3307f96cf3ddeac1477d366b803e6d246e9ce3e1773998fff1e3f6ab)
Estos diagramas de dispersión fueron hechos multiplicando la coordenada en \(x\) por 3 y luego sumando un número aleatorio entre dos valores para obtener la coordenada en \(y\). En el primer diagrama de dispersión se sumó un número entre -0.5 y 0.5 a la coordenada en \(y\). En el segundo diagrama de dispersión se sumó un número entre -2 y 2 a la coordenada en \(y\). En el tercer diagrama de dispersión se sumó un número aleatorio entre -10 y 10 a la coordenada en \(y\).
- En cada diagrama de dispersión, dibuja una recta que se ajuste a los datos.
- Explica por qué con algunas fue más fácil hacer esto que con otras.
Resumen
Cuando una función lineal se ajusta bien a los datos, decimos que hay una asociación lineal entre las variables. Por ejemplo, la relación entre altura y peso de 25 perros y la función lineal cuya gráfica se muestra junto con el diagrama de dispersión.
![](https://cms-im.s3.amazonaws.com/RUbr3MDwNR5uBJ358KEEEZTA?response-content-disposition=inline%3B%20filename%3D%228.6.B2.Image.08_es%20%25281%2529.png%22%3B%20filename%2A%3DUTF-8%27%278.6.B2.Image.08_es%2520%25281%2529.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240727%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240727T002547Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=b2db95aa3cfc8a0fb09d17494c523613e3a0f5b98bd132a0d7f20e686b0f256e)
Dado que el modelo se ajusta bien a los datos y que la pendiente de la recta es positiva, decimos que hay una asociación positiva entre el peso del perro y la altura del perro.
¿Cuál asociación crees que hay entre el peso de un automóvil y su eficiencia de combustible?
![](https://cms-im.s3.amazonaws.com/reQLYnDsEz8BnaLojm6cvh3e?response-content-disposition=inline%3B%20filename%3D%228.6.B4.Image.03_es.png%22%3B%20filename%2A%3DUTF-8%27%278.6.B4.Image.03_es.png&response-content-type=image%2Fpng&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAXQCCIHWF3XOEFOW4%2F20240727%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240727T002547Z&X-Amz-Expires=604800&X-Amz-SignedHeaders=host&X-Amz-Signature=1b3d8c0d14276bcf3317beaf9d76107d9bf317b1c720af2f6f9fe087e160aebb)
Como la pendiente de una recta que se ajusta bien a los datos es negativa, decimos que hay una asociación negativa entre la eficiencia de combustible y el peso de un automóvil.
Entradas del glosario
- asociación negativa
Una asociación negativa es una relación entre dos cantidades en la cual una tiende a disminuir cuando la otra aumenta. En un diagrama de dispersión, los puntos de datos tienden a agruparse alrededor de una recta con pendiente negativa.
Distintas tiendas en el país venden un libro a distintos precios.
El diagrama de dispersión muestra que hay una asociación negativa entre el precio del libro (en dólares) y el número de libros vendidos a ese precio.
- asociación positiva
Una asociación positiva es una relación entre dos cantidades en la cual una tiende a aumentar cuando la otra aumenta. En un diagrama de dispersión, los puntos de datos tienden a agruparse alrededor de una recta con pendiente positiva.
La relación entre la altura y el peso de 25 perros se muestra en este diagrama de dispersión. Hay una asociación positiva entre la altura del perro y el peso del perro.
- dato atípico
Un dato atípico es un dato que está lejos de los demás datos en un conjunto de datos.
Este es un diagrama de dispersión que muestra largos y anchos de 20 pies izquierdos distintos. El pie con 24.5 cm de largo y 7.8 cm de ancho es un dato atípico.