El error de muestreo en las encuestas

El error de muestreo en las encuestas

El error de muestreo  en las encuestas

En las encuestas por muestreo los errores se clasifican en dos categorías principales, que son: 1) los errores de muestreo; y 2) los errores ajenos al muestreo.

De estos, los de muestreo, que es el tema de esta entrega, como se muestra a continuación, constituyen un factor relevante a la hora de analizar, interpretar y valorar las estimaciones estadísticas que arroje la encuesta.

¿Qué se entiende por error de muestreo en una encuesta?
Técnicamente, es la diferencia entre el valor de la estimación, que se obtiene a partir de una encuesta, y el valor verdadero de la población, que se obtiene a partir de un censo, que en estadística se denomina parámetro poblacional.

Visto esto, la diferencia entre ambas medidas, estimación vs parámetro, es lo que se conoce como error de muestreo.

La explicación lógica es que el hecho de trabajar con una muestra, vale decir con una parte de la población, en lugar de hacer un censo de la población, es donde se origina el error de muestreo, que no tiene nada que ver con los errores que se cometen en el proceso de recolección de los datos, que los cometen los entrevistadores, los entrevistados, un cuestionario mal elaborado, etc., y que en estadística se denominan errores ajenos al muestreo.

En otras palabras, el error de muestreo es el que expresa la desviación entre la estimación que se obtiene a partir de una muestra ideal respecto al verdadero valor de la población.

Cabe aclarar, el hecho de que en la encuesta se hable de error de muestreo, no significa que ese error estará presente, sino que es probable que esté presente, y que en el cálculo del tamaño de la muestra se expresa como la desviación máxima a permitir respecto al valor verdadero de la población.

En este sentido, cuando se diseña una muestra para una determinada encuesta, el error de muestreo se asume como el margen de incertidumbre que nos dice con qué probabilidad una determinada estimación se aleja hacia arriba o hacia abajo del valor verdadero si se hubiese realizado un censo.

Además, ese error se reduce aumentando el tamaño de la muestra, mientras más grande sea la muestra, más pequeño será el error de muestreo.

Sin embargo, para las estimaciones agregadas, muchas veces, lo que se gana en precisión aumentando el tamaño de la muestra no resulta tan significativo si lo comparamos con el alto costo que representa trabajar con una muestra grande.

Es por esta razón que los investigadores procuran una posición ecléctica, vale decir de equilibrio, entre la precisión deseada en las estimaciones, los niveles de desagregación deseados, los objetivos de la encuesta, el tamaño de la muestra y el costo del trabajo de campo de la encuesta que, como es de suponer, varía en función del tamaño de la muestra, la cobertura y la dispersión geográfica de la misma.

¿Cómo minimizar el error de muestreo?
La forma más efectiva para minimizar el error de muestreo es tomando las tres acciones más determinantes en este aspecto, que son: 1) aplicando un correcto diseño muestral que garantice una buena representatividad, de manera que todas las posibles subpoblaciones que integren la población estén debidamente representadas en la muestra; 2) aumentando el tamaño de la muestra hasta un número óptimo, que reduzca el error, garantice buena precisión en las estimaciones y no aumente significativamente el costo del trabajo de campo de la encuesta; y 3) optar por una apropiada técnica de muestreo aleatorio, que es la forma más objetiva de estimar el parámetro, vale decir el valor verdadero que se desea conocer en la población.

Cabe aclarar, el hecho de que el error de muestreo se minimice por las acciones anteriores, y otras que no describimos por tema de espacio, no significa que las estimaciones estarán libres de errores, ya que los errores ajenos al muestreo pueden invalidar los resultados de la encuesta.

¿Qué implicaciones tiene el error de muestreo?
Lo primero en señalar es que el error de muestreo le permite al investigador o investigadora expresar la precisión de las estimaciones que ha calculado.

A la vez, tomando como elemento complementario el nivel de confianza del estimador seleccionado, le permite construir intervalos de confianza donde se espera estén los valores verdaderos de la población que son de interés para la encuesta.

En este aspecto, si el error es grande, el intervalo de confianza se hace más amplio, lo que se traduce en una mayor incertidumbre en las estimaciones.

Es oportuno aclarar que tanto las estimaciones que se obtienen mediante alguna técnica de encuesta por muestreo, como los parámetros que se obtienen a partir de un censo, es casi imposible evitar que no haya algún tipo de error de los descritos al inicio de esta entrega.

*Por Dionicio Hernández Lenardo



El Día

Periódico independiente.