Lección 18

Comparemos poblaciones usando muestras

Comparemos poblaciones diferentes usando muestras.

18.1: ¿Misma media? ¿Misma MAD?

Sin calcular, di si cada pareja de conjuntos de datos tienen la misma media y si tienen la misma desviación media absoluta.

  1.  

    conjunto A

    1

    3

    3

    5

    6

    8

    10

    14

      

    conjunto B

    21

    23

    23

    25

    26

    28

    30

    34

  2.  

    conjunto X

    1

    2

    3

    4

    5

      

    conjunto Y

    1

    2

    3

    4

    5

    6

  3.  

    conjunto P

    47

    53

    58

    62

      

    conjunto Q

    37

    43

    68

    72

18.2: Con una carga pesada

Consideren la pregunta: "¿Las mochilas de los estudiantes de décimo grado generalmente pesan más que las mochilas de los estudiantes de séptimo grado?".

Estos son diagramas de puntos de los pesos de las mochilas de una muestra aleatoria de estudiantes de estos dos grados:

  1. ¿Alguna mochila de séptimo grado en la muestra pesa más que una mochila de décimo grado?  
  2. El peso medio de esta muestra de mochilas de séptimo grado es 6.3 libras. ¿Crees que el peso medio de las mochilas de todos los estudiantes de séptimo grado es exactamente 6.3 libras?

  3. El peso medio de esta muestra de mochilas de décimo grado es 14.8 libras. ¿Crees que hay una diferencia significativa entre el peso de las mochilas de los estudiantes de séptimo y décimo grado? Explica o muestra tu razonamiento.

18.3: ¿Ellos cargan más?

Estas son 10 muestras aleatorias más de pesos de mochilas de estudiantes de séptimo grado.

muestra
número
media de los
pesos (libras)
1 5.8
2 9.2
3 5.5
4 7.3
5 7.2
6 6.6
7 5.2
8 5.2
9 6.3
10 6.4

  

    1. ¿Cuál muestra tiene la media más grande?
    2. ¿Cuál muestra tiene la media más pequeña?
    3. ¿Cuál es la diferencia entre las medias de estas dos muestras?
  1. Todas las muestras tienen desviación media absoluta de aproximadamente 2.8 libras. Expresen la diferencia entre las medias de estas dos muestras como un múltiplo de la MAD.
  2. ¿Estas muestras son muy diferentes? Expliquen o muestren su razonamiento.
  3. Recuerden que nuestra muestra de las mochilas de los estudiantes de décimo grado tuvo un peso medio de 14.8 libras. La MAD para esta muestra es 2.7 libras. Su profesor les va a asignar una de la muestras de las mochilas de los estudiantes de séptimo grado para que trabajen.

    1. ¿Cuál es la diferencia entre las medias de las muestras de las mochilas de los estudiantes de décimo grado y las mochilas de los estudiantes de séptimo grado?
    2. Expresen la diferencia entre las medias de estas dos muestras como un múltiplo de la MAD más grande.
  4. ¿Piensan que hay una diferencia significativa entre los pesos de las mochilas de todos los estudiantes de séptimo grado y las mochilas de los estudiantes de décimo grado? Expliquen o muestren su razonamiento.

18.4: Acero de regiones diferentes

Cuando los antropólogos encuentran artefactos de acero, pueden evaluar la cantidad de carbono en el acero para aprender sobre la gente que fabricó los artefactos. Estos son algunos diagramas de cajas que muestran el porcentaje de carbono en muestras de acero que se encontraron en dos regiones diferentes:

  1. Determinen si alguna pieza de acero encontrada en la región 1 tuvo:

    1. más carbono que alguna pieza de acero encontrada en la región 2
    2. menos carbono que alguna pieza de acero encontrada en la región 2
  2. ¿Piensan que hay una diferencia significativa entre los artefactos de acero encontrados en las regiones 1 y 2?

  3. ¿Cuál muestra tiene una distribución que no es aproximadamente simétrica?
  4. ¿De cuánto es la diferencia entre las medianas de las muestras de estas dos regiones?

      mediana de la
    muestra (%)
    IQR
    (%)
    región 1 0.64 0.05
    región 2 0.47 0.03
  5. Expresen la diferencia entre las medianas de estas dos muestras como un múltiplo del rango intercuartil más grande.
  6. Los antropólogos que hicieron el estudio concluyeron que había una diferencia significativa entre el acero de estas dos regiones. ¿Están de acuerdo? Expliquen o muestren su razonamiento.

Resumen

Algunas veces queremos comparar dos poblaciones diferentes. Por ejemplo, ¿hay una diferencia significativa entre los pesos de los pugs y los beagles? Estos son los histogramas de los pesos de una muestra de perros de cada una de estas razas:

Los triángulos rojos indican el peso medio de cada muestra, 6.9 kg para los pugs y 10.1 kg para los beagles. Las líneas rojas indican los pesos que están a 1 MAD de la media. Podemos pensar en estos como pesos "típicos" de la raza. Estos pesos típicos no se superponen. De hecho, la distancia entre las medias es \(10.1-6.9 \) o 3.2 kg, ¡más de 6 veces la MAD más grande! Así que podemos decir que hay una diferencia significativa entre los pesos de los pugs y los beagles.

¿Hay una diferencia significativa entre los pesos de los pugs machos y los pugs hembras? Estos son diagramas de cajas que muestran los pesos de una muestra de pugs machos y pugs hembras:

Podemos ver que las medianas son diferentes, pero los pesos entre el primer y tercer cuartil se superponen. Basados en estas muestras, diríamos que no hay una diferencia significativa entre los pesos de los pugs machos y los pugs hembras.

En general, si las medidas de centro de dos muestras están al menos a dos medidas de variabilidad, decimos que la diferencia entre las medidas de centro es significativa. Visualmente, esto quiere decir que los rangos de los valores típicos no se superponen. Si están más cerca, entonces no consideramos que la diferencia sea significativa.

Entradas del glosario

  • proporción

    Una proporción de un conjunto de datos es la fracción de los datos en una categoría dada.

    Por ejemplo, una clase tiene 20 estudiantes. Hay 2 estudiantes zurdos y 18 estudiantes diestros en la clase. La proporción de estudiantes que son zurdos es \(\frac{2}{20}\), es decir 0.1.

  • rango intercuartil (IQR)

    El rango intercuartil es una forma de medir qué tan dispersos están los datos. A menudo nos referimos a este como el IQR (por sus siglas en inglés). Para encontrar el rango intercuartil restamos el valor del primer cuartil del valor del tercer cuartil.

    Por ejemplo, el IQR de este conjunto de datos es 20 porque \(50-30=20\).

    22 29 30 31 32 43 44 45 50 50 59
        Q1     Q2     Q3