El análisis de toda encuesta por muestreo debe iniciar en la ficha técnica, que es la que resume los aspectos metodológicos que le dan sustento científico a la investigación.
Uno de los aspectos que se incluye en el análisis es el relativo a la representatividad de la muestra, que es el tema de esta entrega, el cual, como se muestra a continuación, es un aspecto fundamental que determina hasta qué punto los datos que arroja la encuesta son válidos o no.
¿Qué se entiende por representatividad de una muestra?
Una muestra estadística se considera representativa de la población de donde se extrae cuando en ella están presentes las principales características de la población de origen.
En este sentido, este solo aspecto es un claro indicador de lo delicado que resulta el diseño de una muestra, que no es elemental, como erróneamente se cree.
Además de tener dominio de muestreo estadístico, de probabilidad estadística y de metodología de investigación, para diseñar una muestra para una determinada encuesta, sin importar su naturaleza, se requiere tener conocimientos previos de los aspectos fundamentales de la población objeto de estudio, en especial de las subpoblaciones subyacentes que se conoce tienen un comportamiento diferenciado, estadísticamente significativo. En caso de no conocerse ese posible comportamiento, hay que tratar de conocerlo consultando estudios previos o mediante un estudio exploratorio de datos.
En ocasiones las subpoblaciones ya vienen definidas en los objetivos específicos de la investigación por decisión de quien la auspicia, que requiere estimaciones desagregadas para grupos de interés, y esos grupos de interés deben quedar representados en la muestra.
Visto lo anterior, a partir del conocimiento pleno de la población objeto de estudio es que se define la representatividad de la muestra.
Por ejemplo, si se desea realizar una encuesta preelectoral con el objetivo de conocer la intención de voto favorable de los candidatos presidenciales en la población electoral, aunque no se especifique en los objetivos, quien diseñe la muestra, antes de proceder con la fase de recolección de datos, debe conocer los aspectos fundamentales de esa población.
Esto implica conocer, entre otras cosas: a) la distribución geoespacial de la población electoral, en especial determinar la posible concentración de votantes en puntos geográficos específicos; b) conocer la distribución de la población por zona de residencia; c) conocer la composición por sexo y grupos de edad; d) conocer la composición por clase social; e) conocer la composición conforme a la situación ocupacional; f) conocer, o por lo menos tener una idea, de la variabilidad existente en las subpoblaciones identificadas o de interés del estudio, en los casos que no se logre conseguir información sobre la referida variabilidad, hay que consignarlo en la metodología, ya que esto implica asumir el criterio estadístico de imputarle un valor a dicha varianza, lo que en estadística se conoce como criterio de varianza máxima; entre otros aspecto.
Todos estos detalles hay que ponerlos sobre la mesa, y conocer su importancia relativa en la población. Luego, se procede con el diseño de la muestra, que incluye la elección del método de muestreo más apropiado, garantizando que cada grupo o subpoblación subyacente identificada esté debidamente representada en la muestra.
Si esto se logra, entonces se puede decir que la muestra es representativa de la población de origen.
Comparativamente hablando, se puede decir que una muestra representativa es una especie de población en miniatura.
Erróneamente se cree que el tamaño de la muestra garantiza representatividad a una muestra, que mientras más grande sea la muestra más representativa es de la población. Sobre este particular, el tamaño de la muestra es importante, pero no suficiente.
De nada sirve que la muestra sea grande si, deliberadamente o no, se concentra en uno de los grupos subyacentes de la población sin que esa concentración forme parte del diseño de la muestra, previamente concebido; una muestra grande, concentrada en algún grupo sin criterio estadístico, es una fuente importante de sesgo, que daña las estimaciones deseadas.
En el marco del muestreo estadístico, es preferible trabajar con una muestra relativamente pequeña, que sea representativa de la población de origen, y no una muestra grande sesgada.
¿Cómo determinar si una muestra es representativa o no?
La ficha técnica, que es una especie de acta de nacimiento in extensa de la encuesta, debe explicar cómo se hizo el diseño de la muestra, indicando todas las subpoblaciones identificadas en la población que quedaron representadas en la muestra, y en qué proporción se garantizó esa representatividad.
No se trata de decir que la muestra fue representativa y probabilística, como se acostumbra a indicar en muchas de las encuestas que se publican. Es ir más hacia el fondo, con informaciones que orienten debidamente a los usuarios de los datos y, fundamentalmente, a quienes siguen la publicación de encuestas.
*Por Dionicio Hernández Leonardo