Lección 18

Utilicemos datos para resolver problemas

Comparemos conjuntos de datos utilizando representaciones visuales.

18.1: Osos salvajes

En un estudio sobre osos salvajes, los investigadores midieron la longitud y el ancho, en pulgadas, de las cabezas de 143 osos salvajes. Las edades de los osos van desde recién nacidos (0 años) hasta 15 años. Los diagramas de caja sintetizan los datos del estudio.

  1. Escriban cuatro preguntas estadísticas que se puedan responder utilizando los diagramas de caja: dos preguntas sobre la longitud de la cabeza y dos preguntas sobre el ancho de la cabeza.
  2. Intercambia las preguntas con tu compañero.
    1. Decide si cada pregunta es una pregunta estadística.
    2. Utiliza los diagramas de caja para responder cada pregunta.

18.2: Tareas de matemáticas (Parte 1)

Durante un periodo de dos semanas, Mai anotó el número de ejercicios que tenían sus tareas de matemáticas cada día.

2

15

20

0

5

25

1

0

10

12

  1. Calcula los siguientes valores. Muestra tu razonamiento.
    1. La media del número de ejercicios de matemáticas en las tareas
    2. La desviación media absoluta (MAD)
  2. Interpreta la media y la MAD. ¿Qué te dicen sobre el número de ejercicios en las tareas que Mai tuvo durante esas dos semanas?
  3. Halla o calcula los siguientes valores y muestra tu razonamiento.
    1. La mediana, los quartiles, el máximo y el mínimo de los datos de Mai.
    2. El rango intercuartil (IQR)
  4. ¿Qué par de medidas de centro y variabilidad (media y MAD o mediana e IQR) crees que sintetiza mejor la distribución de las tareas de Mai? Explica tu razonamiento.

18.3: Tareas de matemáticas (Parte 2)

Jada quería saber si un diagrama de puntos, un histograma o un diagrama de caja sintetizaría mejor el centro, la variabilidad y otros aspectos del número de ejercicios en sus tareas.

2

15

20

0

5

25

1

0

10

12

  1. Utiliza el eje para hacer un diagrama de puntos que represente los datos. Marca la posición de la media en el diagrama de puntos utilizando un triángulo (\(\Delta\)). Traza un segmento de recta horizontal desde el triángulo hacia los lados izquierdo y derecho para representar la MAD.

  2. Utiliza la cuadrícula y el resumen de cinco números de la actividad anterior para dibujar un diagrama de caja que represente los datos de las tareas de Jada.

  3. Trabaja con tu grupo para dibujar tres histogramas que representen los datos de las tareas de Jada. El ancho de las barras de cada histograma debe representar un número distinto de ejercicios en las tareas, como se especifica a continuación.

    1. El ancho de una barra representa 10 ejercicios.
    2. El ancho de una barra representa 5 ejercicios.
    3. El ancho de una barra representa 2 ejercicios.
  4. ¿Cuál de las cinco representaciones debería utilizar Jada para sintetizar sus datos? ¿Debería utilizar un diagrama de puntos, un diagrama de caja o uno de los histogramas? Explica tu razonamiento.

18.4: ¿Sobrevivirán las percas amarillas?

Los científicos que estudian las percas amarillas (que son una especie de peces), creen que la longitud de estos peces está relacionada con su edad. Esto significa que entre más largo sea el pez, más viejo es. Las percas amarillas adultas varían en tamaño, pero usualmente están entre 10 y 25 centímetros.

Los científicos del Instituto de aguas de los Grandes Lagos recogieron, midieron y liberaron algunas percas amarillas de varios lugares en el Lago Michigan. El siguiente resumen se basa en una muestra de percas amarillas de uno de estos lugares.

longitud de los peces en centímetros número de peces
0 a menos de 5 5
5 a menos de 10 7
10 a menos de 15 14
15 a menos de 20 20
20 a menos de 25 24
25 a menos de 30 30
  1. Utiliza los datos para hacer un histograma que muestre las longitudes de las percas amarillas recogidas. Cada barra debe contener las longitudes que se muestran en cada fila de la tabla.

  2. ¿Cuántos peces se midieron? ¿Cómo lo sabes?
  3. Utiliza el histograma para responder las siguientes preguntas.

    1. ¿Cómo describirías la forma de la distribución?
    2. Estima la mediana de las longitudes de esta muestra. Describe cómo hiciste esta estimación.
    3. Predice si la media de las longitudes de esta muestra es mayor que, menor que o casi igual a la mediana de las longitudes de los peces de esta muestra. Explica tu predicción.
    4. ¿Utilizarías la media o la mediana para describir una longitud normal de los peces que se están estudiando? Explica tu razonamiento.
  4. Con base en el trabajo que has hecho hasta el momento:

    1. ¿Describirías una edad normal para las percas amarillas de esta muestra como, "joven", "adulto" o "viejo"? Explica tu razonamiento.
    2. Algunos investigadores están preocupados por la supervivencia de las percas amarillas. ¿Crees que las longitudes (o las edades) de los peces de esta muestra son preocupantes? Explica tu razonamiento.

Resumen

El diagrama de puntos muestra la distribución de los pesos de 30 galletas en gramos.

La media de los pesos de las galletas, marcada con el triángulo, es de 21 gramos. Esto nos dice que si los pesos de todas las galletas fueran redistribuidos de tal forma que todas pesaran lo mismo, cada galleta pesaría 21 gramos. La MAD es 5.6 gramos, lo que sugiere que una galleta por lo general pesa entre 15.4 y 26.6 gramos.

El diagrama de caja para el mismo conjunto de datos se muestra sobre el diagrama de puntos. La mediana muestra que la mitad de los pesos son mayores o iguales a 20.5 gramos y la mitad son menores o iguales a 20.5 gramos. La caja muestra que el IQR es 10 y que la mitad central de las galletas pesa entre 16 y 26 gramos.

En este caso, la mediana de los pesos está muy cerca de la media de los pesos y el IQR es más o menos el doble de la MAD. Esto nos dice que las dos parejas de medidas de centro y dispersión son muy similares.

Ahora veamos otro ejemplo de 30 galletas distintas.

Aquí la mediana es 21 gramos y la MAD es 3.4 gramos. Esto sugiere que una galleta pesa por lo general entre 17.6 y 24.4 gramos. La mediana del peso de las galletas es 23 gramos y el diagrama de caja muestra que la mitad central de los datos está entre 20 y 24 gramos. Estas dos parejas de medidas nos dan dos perspectivas muy distintas de la variabilidad de los pesos de las galletas.

La mediana (23 gramos) está más cerca del medio de la agrupación grande de valores. Si ignoráramos las galletas más pequeñas, la mediana y el IQR darían una perspectiva más precisa de cuánto pesa generalmente una galleta.

Cuando una distribución no es simétrica, la mediana y el IQR son por lo general una mejor medida de centro y dispersión que la media y la MAD. Sin embargo, la decisión de qué pareja de medidas utilizar depende de qué queremos saber sobre el grupo que estamos investigando.