muestreo

Cómo seleccionar y calcular muestras de una población

Muestras, muestreo, qué es y qué tipos hay

El objetivo principal del muestreo es la posibilidad de generalizar, es decir, extraer conclusiones generales basadas solo en el estudio de unos cuantos casos. Cómo se obtiene una muestra representativa, cómo se seleccionan los casos de la muestra y qué tamaño debe tener una muestra es importante ya que malos muestreos llevan a malas investigaciones.

muestreo

El tema del muestreo es muy importante pero también algo aburrido. Mejor leerlo con música de fondo. Para hacer más ameno este tema aquí una recomendación musical, b.s.o. de un peliculón. 

Qué es una muestra y qué es una población o universo

Aclaración inicial: el universo o población es el conjunto de actores (personas, organizaciones, países…) que comparten alguna/s característica/s. La muestra es un número reducido de actores tomados de una población. Estudiamos muestras debido a la imposibilidad de estudiar toda una población.

Hay 3 preguntas que nos debemos hacer para extraer una muestra:

Muestra representativa

1. ¿Queremos una muestra representativa? Si queremos generalizar, es decir, señalar que lo estudiado con una muestra se puede atribuir a toda la población, necesitamos muestras representativas. Tenemos una muestra representativa cuando las principales características de la población están presentes en proporción en la muestra. La proporción puede ser extraída equitativamente del número de categorías de la variable, o en proporción equivalente a como están en la población las diferentes categorías. Por ejemplo, si consideramos que es importante en nuestra investigación la variable género y sus dos categorías son hombre y mujer, la muestra deberá contener tanto hombres como mujeres. Puede ser 50% hombres y 50% mujeres (criterio equitativo), o bien la proporción equivalente que haya en la población, si hay 800 hombres y 200 mujeres en el universo o población, la muestra deberá contener 80% de hombres y 20% de mujeres. La decisión final de si serán 50% hombres y 50% mujeres, o 80% hombres y 20% mujeres, la toma el investigador basándose en los objetivos de la investigación y las hipótesis a comprobar. 

Tipos de muestras

2. ¿Qué tipo de procedimiento seguiremos para seleccionar los actores de una muestra? Hay dos estrategias: muestreo no-aleatorio y muestreo aleatorio. También se suelen denominar no-probabilístico y probabilístico. 

a. Muestreo no-aleatorio: El investigador deliberadamente elige los casos y no el azar. Hay varios subtipos:

  1. Por conveniencia o accidental: El investigador elige aquellos actores que estén a su alrededor y disponibles. Por ejemplo: encuestar en una calle a los transeúntes. 
  2. Por cuotas: El investigador elige los actores teniendo en cuenta que haya actores de las diversas categorías de una variable. Por ejemplo: encuestar a un grupo de hombres y a
    un grupo de mujeres proporcionalmente, es decir, con cuotas de ambas categorías de la variable género.
  3. Intencional o de juicio. El investigador selecciona los casos siguiendo su criterio o el de expertos. Por ejemplo, encuestar a personajes claves siguiendo el juicio de un experto en el tema.
  4. Bola de nieve: Un actor entrevistado pone en contacto al investigador con otros posibles actores a entrevistar. Útil para investigar poblaciones clandestinas o de difícil acceso
    por el investigador.
  5. Voluntariado: Son los sujetos o actores de estudio los que acuden para ser investigados ante una convocatoria o llamado del investigador. Usado en investigaciones experimentales donde se presentan candidatos voluntariamente para la investigación.

b. Muestreo aleatorio: El azar selecciona los actores. Todos los actores de la población deben tener las mismas posibilidades de ser elegidos. Hay varios subtipos:

  1. Aleatorio simple: Se realiza un “sorteo” entre todos los actores. Se necesita el listado de toda la población. Se enumeran todos los actores y se elige al azar el número de actores según el tamaño de la muestra.
  2. Aleatorio sistemático: Teniendo el listado enumerado de la población se van dando “saltos” en la lista siguiendo un intervalo fijo para seleccionar a los actores. Pasos: a) Se dispone del listado de la población de p.ej. 10000 actores, b) se divide el tamaño del
    universo por el tamaño de la muestra y así obtenemos el intervalo, p.ej. 10000/200=50, el intervalo será 50, c) escogemos un actor de la lista al azar y a partir de él contamos el número del intervalo (50) para escoger al siguiente, y a partir de éste, contando 50 más obtenemos el siguiente, así hasta alcanzar el tamaño de la muestra. Útil en encuestas telefónicas usando el directorio o guía telefónica.
  3. Aleatorio estratificado: Se necesita también el listado de la población y se realiza un “sorteo” de los actores pero teniendo en cuenta recoger actores de categorías de una variable relevante en la investigación. Por ejemplo: seleccionar aleatoriamente hombres y mujeres en proporción equivalente a la población.
  4. Aleatorio por conglomerados. En este caso se realiza un sorteo de los lugares u organizaciones a los que pertenecen los actores y se escogen los actores que pertenecen a estas organizaciones o conglomerados. Si se sortean posteriormente subdivisiones de estos conglomerados u organizaciones se trata de un muestreo por conglomerados polietápico (varias etapas). Por ejemplo: para entrevistar a los estudiantes de un país, se seleccionan al azar universidades y se entrevistan a los estudiantes de las universidades elegidas. Como el número de estudiantes de las universidades es elevado, en una segunda etapa se sortean facultades de las universidades seleccionadas. De las facultades elegidas se seleccionan al azar aulas en esta tercera etapa y ahí se entrevistan a los estudiantes.

Lo más habitual es que se combinen los diferentes tipos de muestreo. El más usado en investigaciones sociológicas suele ser el conglomerado polietápico estratificado, aunque todos son igual de válidos y legítimos. Es clave justificar por qué se elige un
procedimiento u otro.

Tamaño de la muestra

3. ¿Qué tamaño debe tener la muestra?   

Si queremos que la muestra sea representativa seguiremos un proceso de cálculo
del tamaño teniendo en cuenta 4 factores:

  1. Tamaño de la población. Cuanto más
    grande es una población, mayor será el tamaño de la muestra, aunque llega un
    momento que no por aumentar más el tamaño de la muestra más representativo
    serán los resultados
  2. Heterogeneidad: hace referencia a la dispersión en alguna variable relevante en la investigación. Cuanto más heterogénea sea una población, mayor será el tamaño de la muestra. Por ejemplo, si consideramos el nivel educativo como variable relevante en nuestra investigación y hay cuatro niveles (sin estudios, primarios, secundarios y terciarios), el porcentaje de heterogeneidad será 25% o 0.25. Si no hay ninguna variable clave en nuestra investigación, la heterogeneidad será 50% o 0.5.
  3. Error muestral: hace referencia a cuánto varían los resultados de la muestra respecto del universo o población. Equivale a un rango de valores en el que se encuentra el resultado de la población. Lo escoge el investigador, aunque suelen ser en investigaciones sociológicas 3% o 5%. Cuanto menor sea el error muestral, más grande será el tamaño de la muestra ya que para ser más precisos (menos error) deberemos estudiar más actores (más tamaño de la muestra). 
  4. Nivel de confianza: es la probabilidad que el resultado obtenido se encuentro dentro del intervalo de confianza. Se suelen utilizar niveles de confianza del 95% en investigaciones sociológicas. Es un poco complejo de entender pero con un ejemplo se clarifica.

Estudiamos una muestra usando un nivel de confianza del 95% y obtenemos que la media de consumo de cigarrillos es 5,5 y la desviación estándar es 1,5. El intervalo de confianza del 95% se expresa como la media +/- 2 desviaciones estándar, es decir, el intervalo irá entre aprox. 8,5 y 2,5. Es decir, hay un 95% de posibilidades que la media de cigarrillos de toda la población se encuentre entre 8,5 y 2,5. Si usamos niveles de confianza mayores para ser más precisos como el 99%, el tamaño de la muestra será mayor.

Hoy en día existen calculadoras online para saber el tamaño de la muestra conveniente teniendo en cuenta estos factores. Es fácil usarlos y permite jugar con diferentes niveles para saber el tamaño de la población más adecuado. Incluso permite calcular el error muestral si ya tenemos elegido el tamaño de la muestra. 

Cuando se realizan investigaciones experimentales (estudiar un grupo experimental y un grupo de control) el cálculo del tamaño muestral varía un poco. Trataremos esto en futuros posts. Si te sirvió este artículo, por favor, compártelo por Facebook, Twitter, Google+ o Linkedin

Publicado por

Julian Cardenas

Profesor de investigación cuantitativa y análisis de redes. Doctor en Sociología. Aficionado al fútbol y escuchar música. @juliancardenasx

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies