Tamaño de la muestra en las encuestas

Tamaño de la muestra en las encuestas

Tamaño de la muestra en las encuestas

En el ámbito de las encuestas por muestreo, uno de los componentes al que no se le presta mucha atención es al tamaño de la muestra, que es el tema de esta entrega, el cual, aunque parece algo elemental, es fundamental para entender la validez y alcance de las estimaciones y expansiones resultantes.

Dionicio Hernández Leonardo

Visto lo anterior, cuando se tiene interés en una estimación objetiva del valor verdadero de la población, hay que acogerse a la metodología que establece el muestreo estadístico en lo referente al tamaño de la muestra, que implica decidir previamente los siguientes criterios técnicos: 1) el error máximo que se está dispuesto a permitir en la estimación; 2) el nivel de confianza que se desea en el estimador; 3) la varianza conocida o asumida; y 4) el tamaño de la población, el cual es usado como factor de ajuste hacia abajo del tamaño original de la muestra que, cuando la población es muy grande, el ajuste es mínimo o cero, y que no constituye un factor obligatorio para calcular la muestra, ya que se puede partir del criterio de población de tamaño desconocido, a lo que en el argot estadístico se le denomina población infinita.

Ahora bien, cuando se tiene interés en expandir los resultados de la muestra a la población, entonces sí se necesita conocer su tamaño.

La muestra
¿Qué tan grande debe ser el tamaño de la muestra para una encuesta por muestreo? La respuesta obligada es otra pregunta, a saber: ¿cuál es la desagregación que se quiere hacer con los datos de la encuesta? Muchas firmas encuestadoras, en especial las que incursionan en el ámbito de las encuestas preelectorales que, como si se tratara de una constante de uso universal casi siempre trabajan con una muestra tamaño 1,200, un nivel de confianza de 95 % y un error máximo que ronda ±3 % (específicamente ±2.828 %).

En este caso, para los fines de estimaciones agregadas a nivel de la población total, una muestra tamaño 1,200 se considera una muestra grande.

Ahora bien, el problema se presenta cuando el investigador o investigadora ofrece estimaciones desagregadas para algunas subpoblaciones o grupos de interés que no se contemplaron en el diseño original de la investigación, en las cuales el tamaño de la muestra se reduce considerablemente y, por consiguiente, el error en la estimación aumenta, con la gravedad de que, con raras excepciones, en la ficha técnica no se le informa al lector cuál es el error de la estimación en la subpoblación, lo cual constituye una doble mala práctica en la materia. ¿Por qué doble mala práctica? Primero, porque el diseño de la muestra debe hacerse a partir de la salida que se quiere con los datos.

De esta manera, por ejemplo, si en una encuesta preelectoral se quiere conocer la intención de votos que tienen los candidatos presidenciales en una o más subpoblación o estrato (región, provincia, grupo de edad, clase social, sexo, etc.), la muestra debe diseñarse tomando en cuenta los criterios de la desagregación deseada, garantizando una muestra de tamaño óptimo y la necesaria representatividad en cada estrato de interés; calcular una muestra de 1,000 o 1,200 personas, distribuirla con cualquier criterio de proporcionalidad o desproporcionalidad entre las distintas subpoblaciones que integran la población total, y luego publicar resultados desagregados para esas subpoblaciones, es una mala práctica.

Segundo, cuando se publican estimaciones para estratos específicos, hay que informar el error que tienen esas estimaciones y no hacer creer que el error que se publica es válido para todas las estimaciones dadas a conocer.

Informar bien
Los usuarios de los datos, en especial quienes siguen la publicación de encuestas, deben ser debidamente informados sobre los hallazgos que se publican, incluyendo información relativa de la validez y alcance de las estimaciones que se ofrezcan para subpoblaciones; ir más allá de lo que se permite en muestreo estadístico es una mala práctica y un engaño.

Propedéutica
En el marco de las buenas prácticas en materia de diseño de encuestas, por respeto a la ciencia Estadística, a los usuarios de los datos y al público en general, hay que hacer las cosas bien o no hacerlas y, fundamentalmente, evitar las desinformaciones y los engaños.

*Por Dionicio Hernández Leonardo