Lección 6

Histogramas

Exploremos cómo los histogramas representan conjuntos de datos.

6.1: Show de perros (Parte 1)

Este es un diagrama de puntos que muestra los pesos, en libras, de 40 perros en un show de perros.

  1. Escribe dos preguntas estadísticas que se puedan contestar usando el diagrama de puntos.
  2. ¿Qué peso considerarías típico para un perro en este show de perros? Explica tu razonamiento.

6.2: Show de perros (Parte 2)

Este es un histograma que muestra los pesos de algunos perros en libras.

Cada barra incluye el valor del extremo izquierdo pero no el valor del extremo derecho. Por ejemplo, la primera barra incluye perros que pesan 60 libras y 68 libras, pero no 80 libras.

  1. Usa el histograma para responder las siguientes preguntas.

    1. ¿Cuántos perros pesan al menos 100 libras?

    2. ¿Cuántos perros pesan exactamente 70 libras?

    3. ¿Cuántos perros pesan al menos 120 libras y menos de 160 libras?

    4. ¿Cuánto pesa el perro más pesado en el show?

    5. ¿Cuál considerarías un peso típico para un perro en este show? Explica tu razonamiento.
  2. Discute con un compañero:

    • Si usaras un diagrama de puntos para responder las mismas cinco preguntas que acabas de responder, ¿qué diferencias habría en tus respuestas?

    • ¿En qué se parecen los histogramas y los diagramas de puntos? ¿En qué se diferencian?

6.3: Población de estados

Cada diez años, se hace un censo en Estados Unidos, el cuál es un esfuerzo para contar la totalidad de la población. El diagrama de puntos muestra los datos poblacionales del censo de 2010 para cada uno de los cincuenta estados y el Distrito de Columbia (D. C.).

  1. Estas son algunas preguntas estadísticas sobre la población de los cincuenta estados y de D. C. ¿Qué tan difícil sería contestar las preguntas usando un diagrama de puntos?

    En la columna central, evalúa cada pregunta con una F (fácil de contestar), D (difícil de contestar) o I (imposible de contestar). Prepárate para explicar tu razonamiento.

  2. Estos son los datos poblacionales para todos los estados y el Distrito de Columbia del censo de 2010. Usa la información para completar la tabla.

    A table of population of states in millions.
    población (millones) frecuencia
    0–5  
    5–10  
    10–15  
    15–20  
    20–25  
    25–30  
    30–35  
    35–40  
  3. Usa la cuadrícula y la información en tu tabla para crear un histograma.

  4. Regresa a las preguntas estadísticas al principio de la actividad. ¿Cuáles son ahora más fáciles de contestar?

    En la última columna de la tabla, evalúa cada pregunta con una F (fácil de contestar), D (difícil de contestar) o I (imposible de contestar). Prepárate para explicar tu razonamiento.



Piensa en dos preguntas estadísticas adicionales que se puedan contestar usando los datos sobre la población de los estados. Luego, decide si cada pregunta se puede contestar mejor usando un diagrama de puntos, un histograma o ambos.

Resumen

Además de usar diagramas de puntos, también podemos representar distribuciones de datos numéricos usando histogramas.

Este es un diagrama de puntos que muestra los pesos de 30 perros en kilogramos, seguido de un histograma que muestra la misma distribución.

En un histograma, los valores están ubicados en grupos o "intervalos" de cierto tamaño y cada grupo se representa con una barra. La altura de la barra nos dice la frecuencia de ese grupo.

Por ejemplo, la altura de la barra más alta es 10 y la barra representa pesos desde 20 hasta menos de 25 kilogramos, entonces hay 10 perros cuyo peso está en ese grupo. De forma similar, hay 3 perros que pesan entre 25 y menos de 30 kilogramos.

Observa que el histograma y el diagrama de puntos tienen una forma similar. El diagrama de puntos tiene la ventaja de mostrar todos los valores, pero el histograma es más fácil de dibujar e interpretar cuando hay muchos valores o cuando estos son diferentes.

Este es un diagrama de puntos que muestra la distribución de pesos de 40 perros. Esta vez, los pesos se midieron al 0.1 kilogramo más cercano, y no al kilogramo más cercano.

Este es un histograma que muestra la misma distribución.

En este caso, es difícil dar sentido a la distribución a partir del diagrama de puntos porque los puntos están muy cerca unos de otros y todos están sobre una línea. El histograma del mismo conjunto de datos muestra mejor la distribución de pesos, aunque no podamos ver los valores individuales.

Entradas del glosario

  • centro

    El centro de un conjunto de datos numéricos es un valor en el medio de la distribución. Este valor representa un valor típico para el conjunto de datos.

    Por ejemplo, el centro de esta distribución de pesos de gatos se encuentra entre 4.5 y 5 kilogramos.

  • dispersión

    La dispersión de un conjunto de datos numéricos nos dice qué tan separados están los valores.

    Por ejemplo, estos dos diagramas de puntos muestran que las duraciones de viaje de los estudiantes de Sudáfrica están más dispersas que las de los estudiantes de Nueva Zelanda.

  • distribución

    La distribución nos dice cuántas veces que aparece cada valor en un conjunto de datos. Por ejemplo, en el conjunto de datos "azul, azul, verde, azul, naranja", la distribución es 3 azules, 1 verde y 1 naranja.

    Este diagrama de puntos muestra la distribución del conjunto de datos 6, 10, 7, 35, 7, 36, 32, 10, 7, 35.

  • frecuencia

    La frecuencia de un valor es el número de veces que aparece en el conjunto de datos.

    Por ejemplo, había 20 perros en un parque. La tabla muestra la frecuencia de cada color de perro.

    color frecuencia
    blanco 4
    marrón 7
    negro 3
    multicolor 6
  • histograma

    Un histograma es una forma de representar datos sobre una recta numérica. Los datos se agrupan en rangos de valores. La altura de la barra muestra el número de datos que se encuentran en ese rango de valores.

    Por ejemplo, este histograma muestra que hubo 10 personas que recibieron 2 o 3 boletos. No podemos saber cuántas personas recibieron exactamente 2 boletos, o cuántas personas recibieron exactamente 3 boletos. Cada barra incluye el valor del extremo izquierdo pero no el valor del extremo derecho. (Hubo 12 personas que recibieron 4 o 5 boletos y 13 personas que recibieron 6 o 7 boletos.)