Lección 16

Diagramas de caja

Exploremos cómo los diagramas de cajas nos pueden ayudar a sintetizar las distribuciones.

16.1: Observa y pregúntate: pesos de cachorros

Estos son los pesos al nacer, en onzas, de todos los cachorros que nacieron en un criadero de perros durante el mes pasado:

  • 13
  • 14
  • 15
  • 15
  • 16
  • 16
  • 16
  • 16
  • 17
  • 17
  • 17
  • 17
  • 17
  • 17
  • 17
  • 18
  • 18
  • 18
  • 18
  • 18
  • 18
  • 18
  • 18
  • 19
  • 20

¿Qué observas y qué te preguntas sobre la distribución de los pesos de los cachorros?

16.2: Diagrama de caja humano

Tu profesor te dará los datos sobre las longitudes de los nombres de los estudiantes en tu clase. Escribe un resumen de cinco números, hallando el mínimo, el Q1, el Q2, el Q3 y el máximo del conjunto de datos.

Haz una pausa para esperar instrucciones adicionales de tu profesor.

16.3: Estudiemos los parpadeos

Veinte personas participaron en un estudio sobre los parpadeos. Se registró el número de veces que cada persona parpadeó mientras veía un video durante un minuto. Estos son los valores de datos, en orden de menor a mayor:

  • 3
  • 6
  • 8
  • 11
  • 11
  • 13
  • 14
  • 14
  • 14
  • 14
  • 16
  • 18
  • 20
  • 20
  • 20
  • 22
  • 24
  • 32
  • 36
  • 51
    1. Utiliza la cuadrícula y el eje para hacer un diagrama de puntos de este conjunto de datos.
    2. Halla la mediana (Q2) y marca su ubicación en el diagrama de puntos.
    3. Halla el primer cuartil (Q1) y el tercer cuartil (Q3). Marca sus ubicaciones en el diagrama de puntos.
    4. ¿Cuáles son los valores mínimo y máximo?
  1. Un diagrama de caja puede ser utilizado para representar gráficamente el resumen de cinco números. Dibujemos un diagrama de caja para los datos del número de parpadeos. En la cuadrícula, sobre el diagrama de puntos:

    1. Dibuja una caja que se extienda desde el primer cuartil (Q1) hasta el tercer cuartil (Q3). Etiqueta los cuartiles.
    2. En la mediana (Q2), dibuja una recta vertical desde la parte superior de la caja hasta la parte inferior de la caja. Etiqueta la mediana.
    3. Desde el lado izquierdo de la caja (Q1), dibuja una recta horizontal (un bigote) que se extienda hasta el valor mínimo del conjunto de datos. En el lado derecho de la caja (Q3), dibuja una recta similar que se extienda hasta el valor máximo del conjunto de datos.
  2. Has creado un diagrama de caja para representar los datos del número de parpadeos. ¿Qué fracción de los datos está representada por cada uno de estos elementos del diagrama de caja?

    1. El bigote izquierdo

    2. La caja

    3. El bigote derecho



Supongamos que hubo algunos errores en el conjunto de datos: el valor más pequeño debió haber sido 6 en lugar de 3 y el valor más grande debió haber sido 41 en lugar de 51. Decide si alguna de las partes del resumen de cinco números cambiaría. Si así lo crees, describe cómo cambiaría. Si no, explica cómo lo sabes

Resumen

Un diagrama de caja representa el resumen de cinco puntos de un conjunto de datos.

Este nos muestra el primer cuartil (Q1) y el tercer cuartil (Q3) como los lados izquierdo y derecho de un rectángulo o una caja. La mediana (Q2) se muestra como un segmento vertical dentro de la caja. En el lado izquierdo, se extiende un segmento de recta horizontal (un "bigote") desde Q1 hasta el valor mínimo. En el lado derecho, se extiende un bigote desde Q3 hasta el valor máximo.

El rectángulo que está en el medio representa la mitad central de los datos. Su ancho es el IQR. Los bigotes representan el cuarto inferior y el cuarto superior del conjunto de datos.

Antes vimos diagramas de puntos que representaban los pesos de pugs y beagles. Los diagramas de caja para estos conjuntos de datos se muestran encima de los diagramas de puntos correspondientes:

A partir de los diagramas de caja, podemos decir que, en general, los pugs del grupo son más livianos que los beagles: la mediana de los pesos de los pugs es 7 kilogramos y la mediana de los pesos de los beagles es 10 kilogramos. Como los dos diagramas de caja tienen la misma escala y los rectángulos tienen anchos similares, también podemos decir que los IQR de ambas razas son muy similares. Esto sugiere que la variabilidad en los pesos de los beagles es muy similar a la variabilidad en los pesos de los pugs.

Entradas del glosario

  • cuartil

    Los cuartiles son los números que separan un conjunto de datos ordenado de menor a mayor en cuatro partes, cada una con igual cantidad de datos.

    Por ejemplo, en este conjunto de datos el primer cuartil es 25. El segundo cuartil es lo mismo que la mediana, que es 33. El tercer cuartil es 40.

    12 19 25 27 28 33 34 35 40 40 49
        Q1     Q2     Q3    

     

  • diagrama de caja

    Un diagrama de caja es una forma de representar un resumen de unos datos en una recta numérica. Los datos de separan en cuatro partes. Los lados de la caja representan el primer y tercer cuartil. La línea dentro de la caja representa la mediana. Las líneas por fuera de la caja la conectan con los valores mínimo y máximo.

    Por ejemplo, este diagrama de caja muestra un conjunto de datos con 2 como valor mínimo y 15 como valor máximo. La mediana es 6, el primer cuartil es 5 y el tercer cuartil es 10.

  • mediana

    La mediana es una medida de centro de un conjunto de datos. Es el valor que queda en el medio cuando escribimos los datos en orden.

    En el conjunto de datos 7, 9, 12, 13, 14, la mediana es 12.

    En el conjunto de datos 3, 5, 6, 8, 11, 12, hay dos números en el medio. La mediana es 7, el promedio de estos dos números. \(6+8=14\) y \(14 \div 2=7\).

  • rango

    El rango es la distancia entre el valor más pequeño y el valor más grande en un conjunto de datos. Por ejemplo, en el conjunto de datos 3, 5, 6, 8, 11, 12, el rango es 9 porque \(12-3=9\).

  • rango intercuartil (IQR)

    El rango intercuartil es una forma de medir qué tan dispersos están los datos. A menudo nos referimos a este como el IQR (por sus siglas en inglés). Para encontrar el rango intercuartil restamos el valor del primer cuartil del valor del tercer cuartil.

    Por ejemplo, el IQR de este conjunto de datos es 20 porque \(50-30=20\).

    22 29 30 31 32 43 44 45 50 50 59
        Q1     Q2     Q3