Lección 14

Muestreo de manera imparcial

Exploremos maneras de escoger muestras representativas.

14.1: Edades de los asistentes a cine

Se realizó una encuesta en una sala de cine para estimar la edad promedio de quienes van a ver películas.

Este es un diagrama de puntos que muestra las edades de las primeras 20 personas encuestadas.

  1. ¿Qué preguntas tienes sobre los datos de la encuesta?
  2. ¿Qué suposiciones harías con base en estos resultados?

14.2: Comparemos métodos para seleccionar muestras

Toma turnos con tu compañero para leer cada opción en voz alta. Para cada situación, discutan:

  • ¿Los diferentes métodos para seleccionar una muestra llevarán a conclusiones diferentes sobre la población?
  • ¿Cuáles son los beneficios de cada método?
  • ¿Qué puede pasar por alto cada método?
  • ¿Cuál de los métodos propuestos sería más probable que produjera muestras que fueran representativas de la población que se estudia?
  • ¿Puedes pensar en alguna manera de seleccionar una muestra para esta situación que sea mejor?
  1. Lin está haciendo campaña para ser elegida presidente de séptimo grado. Ella quiere predecir sus posibilidades de ganar. Ella tiene las siguientes ideas para encuestar a una muestra de los estudiantes que van a votar:

    1. Preguntar a todos los de su equipo de baloncesto por quién van a votar.

    2. Preguntar a cada tercer niña en la fila del almuerzo, por quién va a votar.

    3. Preguntar a los primeros 15 estudiantes que lleguen a la escuela por la mañana, por quién van a votar.

  2. Un nutricionista quiere recolectar datos sobre cuánta cafeína consume el estadounidense promedio por día. Ella tiene las siguientes ideas sobre cómo podría obtener una muestra:

    1. Preguntar a los primeros 20 adultos que lleguen al supermercado a partir de las 10:00 a.m. sobre la cantidad promedio de cafeína que consumen cada día.

    2. Cada 30 minutos, preguntar al primer adulto que entre a un café sobre la cantidad promedio de cafeína que consume cada día.

14.3: Ese es el primer popote

Su profesor va a hacer que algunos estudiantes saquen popotes de una bolsa.

  1. Cada vez que saquen un popote y lo midan, anoten su medida (en pulgadas) en la tabla.
      popote 1 popote 2 popote 3 popote 4 popote 5
    muestra 1          
    muestra 2          
  2. Estimen la media de las longitudes de todos los popotes en la bolsa con base en:

    1. La media de la primera muestra.

    2. La media de la segunda muestra. 

  3. ¿Sus dos estimaciones son iguales? ¿La media de las longitudes de todos los popotes de la bolsa cambió de una muestra a la otra? Expliquen su razonamiento.
  4. La media real de las longitudes de los popotes en la bolsa es aproximadamente 2.37 pulgadas. ¿En qué se parecen o diferencian sus estimaciones a esta media?
  5. Si repitieran el mismo proceso otra vez pero seleccionaran una muestra más grande (de 10 o 20 popotes, en vez de solo 5), ¿su estimación sería más precisa? Expliquen su razonamiento.

14.4: Ese es el último popote

Había un total de 35 popotes en la bolsa. Supongamos que ordenamos los popotes del más corto al más largo y le asignamos a cada popote un número del 1 al 35. Para cada uno de estos métodos, decidan si este constituye una forma imparcial de seleccionar una muestra de 5 popotes. Expliquen su razonamiento.

  1. Seleccionar los popotes enumerados del 1 al 5.

  2. Escribir los números de 1 al 35 en pedazos de papel, todos del mismo tamaño. Ponerlos en una bolsa de papel. Sin mirar, seleccionar 5 papeles de la bolsa. Usar los popotes que correspondan a esos números para su muestra.

  3. Usar la misma bolsa de papel que en la pregunta anterior, seleccionar un papel de la bolsa. Usar el número en ese papel para seleccionar el popote para su muestra. Luego usar los 4 números que le siguen para completar su muestra. (Por ejemplo, si seleccionaron el número 17, entonces también usarán los popotes 18, 19, 20 y 21 para su muestra).

  4. Crear una ruleta con 35 secciones que sean todas del mismo tamaño y enumerarlas del 1 al 35. Girar la ruleta 5 veces y usar los popotes con esos números para su muestra.



Las computadoras reciben entradas, siguen instrucciones y producen resultados, así que en realidad no pueden generar números aleatorios. Si supieras la entrada, siguiendo las mismas instrucciones que sigue la computadora podrías predecir el resultado. Cuando realmente se necesitan números aleatorios, los científicos miden fenómenos naturales como la descomposición radioactiva o variaciones de temperatura. Antes de que fuera posible medir estas cosas, los estadísticos usaban tablas de números aleatorios, como esta:

11 by 9 table of random numbers.

Usa esta tabla para seleccionar una muestra de 5 popotes. Elige aleatoriamente un punto de partida en la tabla. Si el número está entre 01 y 35, incluye el popote con ese número en tu muestra. Si el número ya ha sido seleccionado o no está entre 01 y 35, ignóralo y elige el siguiente número.

Resumen

Una muestra es seleccionada aleatoriamente de una población si esta tiene la misma posibilidad de ser seleccionada que cualquier otra muestra del mismo tamaño. Por ejemplo, si hay 25 estudiantes en una clase, podemos escribir los nombres de cada uno de los estudiantes en un pedazo de papel y elegir 5 papeles de una bolsa para obtener una muestra de 5 estudiantes, seleccionados aleatoriamente de la clase.

Otros métodos para elegir una muestra de una población suelen estar sesgados. Esto quiere decir que es menos probable que la muestra sea representativa de la población en conjunto. Por ejemplo, si elegimos los 5 primeros estudiantes que entren por la puerta, no tendremos una muestra aleatoria porque no es probable que los estudiantes que generalmente llegan tarde sean seleccionados. Una muestra que se selecciona aleatoriamente no siempre es una muestra representativa, pero es probable que sea más representativa que las que se seleccionan con otros métodos.

No siempre es posible seleccionar una muestra aleatoriamente. Por ejemplo, si queremos saber la longitud promedio del salmón salvaje, no es posible identificar a cada uno individualmente, seleccionar a unos pocos de la lista, después atraparlos y medir esos pescados elegidos. Cuando una muestra no se puede seleccionar aleatoriamente, es importante tratar de reducir los sesgos tanto como sea posible al seleccionar la muestra.

Entradas del glosario

  • desviación media absoluta (MAD)

    La desviación media absoluta es una medida de la dispersión de un conjunto de datos. A veces la llamamos la MAD (por sus siglas en inglés). Por ejemplo, para el conjunto de datos 7, 9, 12, 13, 14, la MAD es 2.4. Esto nos dice que estos tiempos de viaje están, por lo general, a 2.4 minutos de diferencia de la media que es 11.

    Para encontrar la MAD, sumamos las distancias de cada dato a la media y después dividimos entre la cantidad de datos. \(4+2+1+2+3=12\), y \(12 \div 5 = 2.4\).

  • media

    La media es una medida de centro de un conjunto de datos. Podemos pensar en la media como un punto de equilibrio. Por ejemplo, para el conjunto de datos 7, 9, 12, 13, 14, la media es 11.

    Para encontrar la media, sumamos todos los números en el conjunto de datos y después dividimos entre la cantidad de datos. \(7+9+12+13+14=55\) y \(55 \div 5 = 11\).

  • mediana

    La mediana es una medida de centro de un conjunto de datos. Es el valor que queda en el medio cuando escribimos los datos en orden.

    En el conjunto de datos 7, 9, 12, 13, 14, la mediana es 12.

    En el conjunto de datos 3, 5, 6, 8, 11, 12, hay dos números en el medio. La mediana es 7, el promedio de estos dos números. \(6+8=14\) y \(14 \div 2=7\).

  • muestra

    Una muestra es una parte de la población. Por ejemplo, si la población consiste de todos los estudiantes de séptimo grado, una muestra de esa población podría ser todos los estudiantes de séptimo grado que están en una banda.

  • población

    Una población es un conjunto de personas o cosas que queremos estudiar.

    Por ejemplo, si queremos estudiar la estatura de las personas que conforman distintos equipos deportivos, la población sería todas las personas de esos equipos.

  • representativa

    Una muestra es representativa de una población si su distribución se parece a la distribución de la población (en su centro, su forma y su dispersión).

    Por ejemplo, este diagrama de puntos representa una población.

    Este diagrama de puntos exhibe una muestra que es representativa de la población.