Lección 4

Ajustemos una recta a los datos

Analicemos diagramas de dispersión como un todo.

4.1: Predecir esto

Este es un diagrama de dispersión que muestra los pesos y eficiencias de combustible de 20 tipos de automóviles diferentes.

Si un automóvil pesa 1,750 kg, ¿esperarían que su eficiencia de combustible estuviera más cerca de 22 mpg o de 28 mpg? Expliquen su razonamiento.

4.2: Brillo resplandeciente

Esta es una tabla que muestra los pesos y precios de 20 diamantes diferentes.

peso (quilates) precio real (dólares) precio que se predice (dólares)
1 3,772 4,429
1 4,221 4,429
1 4,032 4,429
1 5,385 4,429
1.05 3,942 4,705
1.05 4,480 4,705
1.06 4,511 4,760
1.2 5,544 5,533
1.3 6,131 6,085
1.32 5,872 6,195
1.41 7,122 6,692
1.5 7,474 7,189
1.5 5,904 7,189
1.59 8,706 7,686
1.61 8,252 7,796
1.73 9,530 8,459
1.77 9,374 8,679
1.85 8,169 9,121
1.9 9,541 9,397
2.04 9,125 10,170

El diagrama de dispersión muestra los precios y pesos de los 20 diamantes y la gráfica de \(y = 5,\!520x- 1,\!091\).

La función descrita por la ecuación \(y = 5,\!520x- 1,\!091\) es un modelo de la relación entre el peso de un diamante y su precio.

Este modelo predice el precio de un diamante a partir de su peso. Estos valores que se predicen se muestran en la tercera columna de la tabla.

  1. Dos diamantes que pesan 1.5 quilates tienen precios diferentes. ¿Cuáles son sus precios? ¿Cómo puedes ver esto en la tabla? ¿Cómo puedes ver esto en la gráfica?
  2. El modelo predice que cuando el peso es 1.5 quilates, el precio será \$7,189. ¿Cómo puedes ver esto en la gráfica? ¿Cómo puedes ver esto usando la ecuación?
  3. Uno de los diamantes pesa 1.9 quilates. ¿Qué precio predice el modelo para este diamante? ¿Compara la predicción con el precio real?
  4. Encuentra un diamante para el que el modelo haga una muy buena predicción del precio real. ¿Cómo puedes ver esto en la tabla?, ¿en la gráfica?
  5. Encuentra un diamante para el que la predicción del modelo no esté muy cerca del precio real. ¿Cómo puedes ver esto en la tabla?, ¿en la gráfica?

4.3: La agonía de los pies

Este es un diagrama de dispersión que muestra el ancho y el largo de 20 pies izquierdos diferentes.

  1. Estima el ancho del pie más largo y del más corto.

  2. Estima el largo del pie más ancho y del más angosto.

  3. Este es el mismo diagrama de dispersión junto con la gráfica de un modelo de la relación entre el largo y el ancho del pie.

    Marca el punto de dato que parece extraño cuando se compara con el modelo. ¿Qué largo y qué ancho representa ese punto?

Resumen

Algunas veces, podemos usar una función lineal como un modelo de la relación entre dos variables. Por ejemplo, este es un diagrama de dispersión que muestra las alturas y los pesos de 25 perros junto con la gráfica de una función lineal que es un modelo de la relación entre la altura de un perro y su peso.

Podemos ver que el modelo hace un buen trabajo al predecir el peso dada la altura de algunos perros. Estos corresponden a los puntos que están en la recta o cerca de la recta. El modelo no hace un buen trabajo prediciendo los pesos dadas las alturas de los perros cuyos puntos están lejos de la recta.

Por ejemplo, hay un perro que mide aproximadamente 20 pulgadas y pesa un poco más de 16 libras. El modelo predice que el peso debería ser 48 libras. Decimos que el modelo sobrestima el peso de este perro. También hay un perro que mide 27 pulgadas y pesa aproximadamente 110 libras. El modelo predice que el peso debería ser 48 libras. Decimos que el modelo subestima el peso de este perro.

Algunas veces un punto de dato está lejos de los otros puntos o no encaja con una tendencia que se aplica para todos los otros puntos. A estos los llamamos datos atípicos.

Entradas del glosario

  • dato atípico

    Un dato atípico es un dato que está lejos de los demás datos en un conjunto de datos.

    Este es un diagrama de dispersión que muestra largos y anchos de 20 pies izquierdos distintos. El pie con 24.5 cm de largo y 7.8 cm de ancho es un dato atípico.