Lección 15

Cuartiles y rango intercuartil

Estudiemos otras medidas para describir las distribuciones.

15.1: Observa y pregúntate: dos fiestas

Estos son dos diagramas de puntos que incluyen la media marcada con un triángulo. Cada uno muestra las edades de los asistentes a una fiesta.

¿Qué observas y qué te preguntas sobre las distribuciones mostradas en los dos diagramas de puntos?

15.2: El resumen de cinco números

Estas son las edades del grupo de 20 asistentes a la fiesta que viste anteriormente, mostradas en orden de menor a mayor:

  • 7
  • 8
  • 9
  • 10
  • 10
  • 11
  • 12
  • 15
  • 16
  • 20
  • 20
  • 22
  • 23
  • 24
  • 28
  • 30
  • 33
  • 35
  • 38
  • 42
    1. Halla y marca la mediana en la tabla y etiquétala como "percentil 50". Los datos ahora están divididos en una mitad superior y una mitad inferior.

    2. Halla y marca el valor del medio de la mitad inferior de los datos, sin incluir la mediana. Si hay un número par de valores, halla y escribe el promedio de los dos valores del medio. Etiqueta este valor como "percentil 25".

    3. Halla y marca el valor del medio de la mitad superior de los datos, sin incluir la mediana. Si hay un número par de valores, halla y escribe el promedio de los dos valores del medio. Etiqueta el valor como "percentil 75".

  1. Ahora has dividido el conjunto de datos en cuatro partes. Cada uno de los tres valores que "separan" los datos se llama un cuartil.

    • El primer cuartil (o cuartil inferior) es la marca del percentil 25. Escribe "Q1" al lado de "percentil 25".
    • El segundo cuartil es la mediana. Escribe "Q2" al lado de esa etiqueta.
    • El tercer cuartil (o cuartil superior) es la marca del percentil 75. Escribe "Q3" al lado de esa etiqueta.
  2. Etiqueta el menor valor del conjunto como "mínimo" y el mayor valor como "máximo".

  3. Anota los cinco valores que acabas de identificar. Estos forman el resumen de cinco números de los datos.

    Mínimo: _____     Q1: _____     Q2: _____     Q3: _____     Máximo: _____

  4. El valor de la mediana (o Q2) de este conjunto de datos es 20. Esto nos dice que la mitad de los asistentes a la fiesta tiene 20 años o menos y la otra mitad tiene 20 años o más. ¿Qué nos dice cada uno de los siguientes valores sobre las edades de los asistentes a la fiesta?

    1. Q3
    2. El mínimo
    3. El máximo


Este es el resumen de cinco números de la distribución de las edades en otra fiesta de 21 personas:

Mínimo: 5 años    Q1: 6 años     Q2: 27 años    Q3: 32 años     Máximo: 60 años

  1. ¿Crees que esta fiesta tiene más o menos niños que la otra fiesta de esta actividad? Explica tu razonamiento.
  2. En esta fiesta, ¿hay más niños o más adultos? Explica tu razonamiento.

15.3: Rango y rango intercuartil

  1. Este es un diagrama de puntos que viste en una tarea anterior. Muestra cuánto tiempo en minutos tardó el bus de Elena en llegar a la escuela durante 12 días.

    Escribe el resumen de cinco números de este conjunto de datos hallando el mínimo, Q1, Q2, Q3 y el máximo. Muestra tu razonamiento.

  2. El rango de un conjunto de datos es una forma de describir la dispersión de los valores del conjunto. Es la diferencia entre el valor mayor y el valor menor de los datos. ¿Cuál es el rango de los datos de Elena?

  3. Otro número que se utiliza comúnmente para describir la dispersión de los valores en un conjunto de datos es el rango intercuartil (IQR), que es la diferencia entre Q1, el cuartil inferior, y Q3, el cuartil superior.

    1. ¿Cuál es el rango intercuartil (IQR) de los datos de Elena?

    2. ¿Qué fracción de los valores de datos está entre los cuartiles inferior y superior? Utiliza tu respuesta para completar la siguiente afirmación:

      El rango intercuartil (IQR) es la longitud que contiene la ______ central de los valores en un conjunto de datos.

  4. Estos son dos diagramas de puntos que representan dos conjuntos de datos:

    Sin hacer cálculos, predice:

    1. ¿Cuál conjunto de datos tiene el IQR más pequeño? Explica tu razonamiento.

    2. ¿Cuál conjunto de datos tiene el rango más pequeño? Explica tu razonamiento.

  5. Comprueba tus predicciones calculando el IQR y el rango para los datos de cada diagrama de puntos.

Resumen

Antes aprendimos que la media es una medida del centro de una distribución y la MAD es una medida de la variabilidad (o dispersión) que va con la media. También hay una medida de la dispersión asociada con la mediana, llamada el rango intercuartil (IQR).

Para hallar el IQR debemos dividir el conjunto de datos en cuartos. Cada uno de los tres valores que separan los datos en cuartos se llama cuartil.

  • La mediana, que separa el conjunto de datos en una mitad inferior y una mitad superior, es el segundo cuartil (Q2).
  • El primer cuartil (Q1) es el valor del medio de la mitad inferior de los datos.
  • El tercer cuartil (Q3) es el valor del medio de la mitad superior de los datos.

Este es un conjunto de datos con 11 valores:

12 19 20 21 22 33 34 35 40 40 49
    Q1     Q2     Q3    
  • La mediana (Q2) es 33. 
  • El primer cuartil (Q1) es 20, la mediana de los números menores que 33.
  • El tercer cuartil (Q3) es 40, la mediana de los números mayores que 33.

La diferencia entre los valores mínimo y máximo de un conjunto de datos es el rango.

La diferencia entre Q1 y Q3 es el rango intercuartil (IQR). Como la distancia entre Q1 y Q3 incluye a los dos cuartos que están en medio de la distribución, los valores que están entre esos dos cuartiles a veces se llaman la mitad central de los datos.

Mientras más grande sea el IQR, más dispersa es la mitad central de los datos. Mientras más pequeño sea el IQR, más cercanos son los datos de la mitad central. Por esta razón, consideramos al IQR como una medida de la dispersión.

Un resumen de cinco números, que incluye al mínimo, a Q1, a Q2, a Q3 y al máximo, se puede utilizar para sintetizar una distribución.

Los cinco números en este ejemplo son 12, 20, 33, 40 y 49. Sus ubicaciones se marcan con diamantes en el siguiente diagrama de puntos:

A dot plot. The numbers 10 through 50, in increments of 5, are indicated. 

Distintos conjuntos de datos pueden tener el mismo resumen de cinco números. Por ejemplo, los siguientes datos tienen los mismos máximo, mínimo y cuartiles que los datos de arriba:

A dot plot. The numbers 10 through 50, in increments of 5, are indicated. 

Entradas del glosario

  • cuartil

    Los cuartiles son los números que separan un conjunto de datos ordenado de menor a mayor en cuatro partes, cada una con igual cantidad de datos.

    Por ejemplo, en este conjunto de datos el primer cuartil es 25. El segundo cuartil es lo mismo que la mediana, que es 33. El tercer cuartil es 40.

    12 19 25 27 28 33 34 35 40 40 49
        Q1     Q2     Q3    

     

  • mediana

    La mediana es una medida de centro de un conjunto de datos. Es el valor que queda en el medio cuando escribimos los datos en orden.

    En el conjunto de datos 7, 9, 12, 13, 14, la mediana es 12.

    En el conjunto de datos 3, 5, 6, 8, 11, 12, hay dos números en el medio. La mediana es 7, el promedio de estos dos números. \(6+8=14\) y \(14 \div 2=7\).

  • rango

    El rango es la distancia entre el valor más pequeño y el valor más grande en un conjunto de datos. Por ejemplo, en el conjunto de datos 3, 5, 6, 8, 11, 12, el rango es 9 porque \(12-3=9\).

  • rango intercuartil (IQR)

    El rango intercuartil es una forma de medir qué tan dispersos están los datos. A menudo nos referimos a este como el IQR (por sus siglas en inglés). Para encontrar el rango intercuartil restamos el valor del primer cuartil del valor del tercer cuartil.

    Por ejemplo, el IQR de este conjunto de datos es 20 porque \(50-30=20\).

    22 29 30 31 32 43 44 45 50 50 59
        Q1     Q2     Q3