Las estimaciones en encuestas complejas

Las estimaciones en encuestas complejas

Las estimaciones en encuestas complejas

La encuesta por muestreo, dependiendo de las características de la población para la que se diseña, y los requerimientos de la persona o empresa que ordena el estudio, ofrece varias opciones de diseño de la muestra, que van desde uno simple hasta el más complejo.

Los diseños complejos casi siempre son desproporcionados, y requieren un cuidado especial en el cálculo de las estimaciones agregadas, que es el tema de esta entrega que, como se muestra a continuación, requiere tener conocimientos avanzados en muestreo estadístico, ya que no es elemental, como erróneamente se cree.

¿Qué se entiende por muestra compleja en una encuesta?
En el muestreo probabilístico, que es el que garantiza probabilidad de selección a cada unidad de muestreo contenida en el marco de muestreo, vale decir en la población objeto de estudio, cuyos elementos están perfectamente identificados en una lista, directorio, padrón, cartografía censal, etc., cuando no se accede directamente a la unidad de muestreo, se dice que la muestra es compleja.

Esto ocurre cuando el diseño combina varios métodos de muestreo, verbigracia la combinación de muestreo aleatorio estratificado y muestreo aleatorio simple o la combinación de muestreo de conglomerados, muestreo aleatorio estratificado y muestreo aleatorio simple.

En estadística, el método de muestreo de referencia es el muestreo aleatorio simple, que es el más elemental, ya que permite acceder directamente a la unidad de muestreo.

Pero, este método no se recomienda cuando las variables a medir o las asociadas con las de interés en la población objeto de estudio, tienen un comportamiento heterogéneo, vale decir, tienen una alta dispersión, en las que subyacen subpoblaciones con marcadas diferencias unas de otras, como es el caso de las clases sociales y el acceso a educación de calidad o la situación ocupacional de la población económicamente activa y su opinión acerca del gobierno de turno o la intención de voto y el grupo de edad al que pertenece el votante.

Dionicio Hernández Leonardo

Cabe señalar, en el mercado de votantes, por ejemplo, hay muchas subpoblaciones en las que se ha demostrado que la preferencia electoral tiene un comportamiento diferenciado, estadísticamente significativo, como son: sexo, nivel educativo, zona de residencia, región, grupos de edades, clase social, etc.

En estos casos, el método de muestreo aleatorio simple no garantiza representatividad de la muestra para cada una de las subpoblaciones o estratos, por lo que hay que descartar el uso de un diseño simple.

Sin embargo, hay casos en que se puede aplicar un diseño simple, pero, por su naturaleza, especialmente en los casos de que la población esté muy dispersa en la geografía, tendría un costo muy elevado, lo que le resta factibilidad a la investigación.

En estos escenarios, la estadística nos ofrece la opción de la encuesta compleja, ya sea para aumentar la precisión en las estimaciones, como es el caso del muestreo aleatorio estratificado combinado con el método aleatorio simple, o para disminuir el costo de la investigación, como es el caso del muestreo de conglomerados combinado con el estratificado y el muestreo aleatorio simple.

¿Se calculan igual las estimaciones en muestras simples y complejas?
La respuesta es, no. Cuando la encuesta se basa en una muestra compleja, como es el caso de la muestra aleatoria estratificada con asignación desproporcionada en los estratos, hay que determinar el peso relativo que tiene cada estrato en la población, y ese peso relativo usarlo como factor de ponderación en las estimaciones agregadas. Este tipo de diseño no es muy comprendido en los estudios de opinión y las encuestas preelectorales.

De hecho, hay quienes erróneamente creen que ponderar una estimación es arreglarla o maquillarla para favorecer a alguien, y es todo lo contrario, es lo correcto y lo que manda la buena práctica en materia de encuestas.

En este sentido, para mejor comprensión del tema, si en una encuesta preelectoral en la población electoral nacional dominicana, para medir la intención de voto por los candidatos presidenciales, si se hace usando un diseño complejo, en donde la muestra que se asigne por región geográfica no guarde relación con la proporción de votantes de cada región, entonces las estimaciones resultantes requieren ser ponderadas, usando como peso relativo la propia proporción de votantes de cada región, y es justo a eso que se le llama estimación ponderada. Si no se hace la ponderación, puede haber un sesgo de estimación.

Visto lo anterior, cuando una determinada firma encuestadora utiliza un diseño muestral complejo debe comunicarlo en la ficha técnica y, a la vez, también comunicar cuáles fueron los pesos relativos usados para realizar la ponderación.

Las buenas prácticas en materia de diseño de muestras y cálculo de estimaciones deben ser asumidas como parte de una cultura de respeto a la ciencia estadística y, fundamentalmente, a las personas que usan los datos para orientarse.

*Por Dionicio Hernández Leonardo