Para ser elementos tan ubicuos en la conversación pública, las encuestas son poco y mal entendidas. El reto para encuestadores y académicos es llevar a cabo un trabajo pedagógico sobre sus alcances y limitaciones. No es una tarea fácil, puesto que se cruzan dos circunstancias que han puesto en tela de juicio su valor como puntos de referencia en el debate público. Por un lado, está el uso abusivo que hacen de ellas los medios y los actores políticos. Por otro lado, la irrupción de nuevas tecnologías que han supuesto una disrupción total tanto en la industria de opinión pública como en el mundo académico, y que significan una verdadera revolución habiendo relegado las metodologías tradicionales a un segundo o tercer plano.
Todo esto tiene dos fuertes implicaciones para las casas encuestadoras y los centros de investigación. La primera es que las encuestas hoy enfrentan un grave descrédito entre amplios sectores de la población, así como entre politólogos y comentaristas, quienes, aunque muchas veces las desestiman, a menudo se ven atrapados en su influencia. Además, las encuestas son vistas hoy en día, a veces con razón, como vehículos de desinformación y manipulación al servicio de actores políticos, tanto nacionales como extranjeros.
La segunda implicación es que las casas encuestadoras y los centros de investigación, que durante décadas han mostrado reticencia hacia el uso de metodologías no tradicionales, se ven ahora obligados a abandonar su zona de confort y experimentar con nuevas tecnologías y metodologías.
De forma tal que los retos actuales de las encuestas (énfasis en las electorales aunque no exclusivamente) son múltiples pero se subsumen en uno: crisis de confiabilidad producto de: 1) la revolución digital que a su vez ha puesto en crisis, o de plano empujado a la obsolescencia, las metodologías tradicionales; 2) la perenne incomprensión de sus alcances y limitaciones entre amplias capas de la población, e incluso entre sectores ilustrados, que las consideran una especie de ágora tecnológica infalible; y 3) el uso abusivo de las encuestas por parte de políticos y analistas interesados que suponen que publicar encuestas a favor de sus candidatos les puede favorecer a éstos, algo que por cierto está a debate (Iida et al., 2022).
Todo lo cual sucede, irónicamente, en un momento en que el mundo político y de investigación de mercados presenta un apetito voraz por más y más datos, y un deseo rayano en la fe de que nuestras decisiones sean “data-driven”. Pareciera por momentos que nuestra demanda por saber qué opinan los votantes y los consumidores, dónde están, qué les motiva, y cómo reaccionan ante eventos, se encuentra en el punto más alto de la historia. A día de hoy, centenares de decisiones que revisten altísima gravedad se toman con información basada en estudios de opinión. Y millones de pesos se mueven de un lado a otro en base a “lo que dicen las encuestas”. Ello no obstante a que, como lo señalaba líneas arriba, la encuesta como herramienta de investigación social se haya en una grave crisis.
Es crucial entonces examinar con detenimiento este tema y analizar los desafíos que las encuestas enfrentan en la segunda década del siglo veintiuno. Abordemos este análisis de manera sistemática.
Los orígenes de las encuestas
Si queremos hablar del futuro, es fundamental comenzar por entender el pasado. Podemos decir que la encuesta como método de investigación social tiene sus raíces en los años treinta del siglo veinte. En la comunidad académica existe un consenso en torno a que la práctica de la encuesta moderna se inició con la publicación del artículo “On the Two Different Aspects of the Representative Method: The Method of Stratified Sampling and the Method of Purposive Selection” (Neyman, 1934). Este artículo marcó el comienzo de la encuesta moderna al demostrar de manera concluyente el riesgo de introducir sesgos en una muestra si ésta no se recopila mediante un muestreo aleatorio.
La importancia de Neyman en el desarrollo de la encuesta no puede subestimarse, ya que fue él quien introdujo las herramientas básicas de la profesión, incluyendo los criterios para estimar los intervalos de confianza y los métodos para realizar muestras por conglomerados (cluster samples). Además, Neyman popularizó conceptos fundamentales como representatividad, sesgos, marco muestral y cuestionario, entre otros. Los trabajos de Neyman sentaron las bases para el diseño de la Sample Survey of Unemployment en los Estados Unidos, la primera encuesta moderna de empleo llevada a cabo en 1940.
Es importante destacar que, en aquellos tiempos, las herramientas disponibles para los encuestadores eran aún rudimentarias. Esto se aplica especialmente al marco muestral, que generalmente consistía en registros catastrales que, en teoría, deberían incluir a toda la población. Sin embargo, en la práctica, esto distaba mucho de ser cierto, principalmente debido a la falta de actualización regular de dichos registros. Además, el levantamiento de datos en ese entonces se realizaba cara a cara, una metodología que persiste hasta nuestros días y es muy común en nuestros países latinoamericanos, pero no tanto ya en otras latitudes.
También es de esta época la invención de la famosa escala de Likert (1932), que aún se utiliza ampliamente en estudios de mercado de diversos tipos. Esta escala permitió la realización de estudios masivos basados en una gradación de cinco puntos sobre las actitudes y sentimientos de las personas hacia eventos sociales y políticos en su entorno. La simplicidad y facilidad para capturar valores cualitativos de aprobación o desaprobación con esta nueva escala, así como la facilidad para convertirlos en valores numéricos (es decir, cuantitativos), abrieron nuevas posibilidades de aplicación de las encuestas en disciplinas como la psicología, las ciencias sociales y la economía, entre otras.
En su Three eras of survey research, Groves (2011) destaca un punto interesante: señala que en aquella época, uno de los grandes problemas que afectan a las encuestas en la actualidad era prácticamente inexistente. Se refiere al sesgo de no respuesta, que ocurre cuando aquellos que deciden no participar o dejan incompleta una encuesta son sistemáticamente diferentes de aquellos que la completan. Diferentes, claro está, en formas que son significativas para el estudio de investigación. Este problema, tan prevalente en la actualidad, era casi inexistente al principio de la profesión, con tasas de participación de hasta un 90%, algo impensable en la actualidad (Groves, 2011, p. 863). Tal vez se debía a la novedad de la encuesta o al hecho de que en aquellos tiempos casi nadie era encuestado. En cualquier caso, los pioneros de la profesión se beneficiaron de la curiosidad que generaba esta nueva herramienta de investigación social.
El mediodía histórico de la encuesta
La llegada al gran público de las encuestas naturalmente coincide y se debe a la rápida expansión de la telefonía entre las clases sociales medias y altas entre los años sesenta y noventa del siglo pasado. Por ejemplo, en 1970 en México había poco más de un millón de líneas telefónicas, lo que significaba que solo once de cada cien hogares tenían un teléfono fijo (Procuraduría Federal del Consumidor, 2020). Para 1990, había más de cinco millones de líneas (Procuraduría Federal del Consumidor 2020, p. 7). Más allá de este aumento quíntuple, lo más valioso era que establecía un marco muestral basado en la red telefónica, lo que permitía crear muestras aleatorias de forma rápida.
No todo, sin embargo, fue idóneo. Por principio, y en el caso mexicano, el servicio telefónico cubría por la mayor parte los sectores medios y altos de la población, con todas las implicaciones que ello supone: mayores niveles educativos y de consumo, capas urbanas de profesionales, etc. Además, en esta época comenzamos a ver uno de los sesgos más comunes en las encuestas: el ya mencionado sesgo de no respuesta. Esto se debe a que el anonimato proporcionado por las encuestas telefónicas, en comparación con las entrevistas cara a cara, facilitaba colgar el teléfono y abandonar la encuesta a discreción del entrevistado, algo más difícil de hacer en una entrevista presencial.
Este hecho incontrovertible marca un hito en el desarrollo de las encuestas y los métodos de recolección de datos, al reconocer que diferentes medios requieren diferentes enfoques. Esto tiene un fuerte impacto en los estudios metodológicos para ciencias sociales, al demostrar la necesidad de cuestionarios más cortos y ágiles para medios más impersonales.
Llegados a este punto, vale señalar que llegamos a un mediodía histórico en las encuestas. Un altiplano en su desarrollo en donde aparentemente lo que sigue es su perfeccionamiento e incremento de cobertura a medida que la telefonía se extiende geográficamente y alcanza a todas las clases sociales. Sin embargo, este periodo es relativamente corto, abarcando desde los años 1960 hasta 1990. A partir de entonces, empieza un proceso de transformación empujado por el avance tecnológico imparable que finalmente arroja el oficio de encuestador en una grave crisis de capacidades y credibilidad de la cual aún no nos hemos recuperado. Y si bien esto plantea problemas en diversos ámbitos donde se utilizan las encuestas, como los negocios, la salud pública y los estudios de mercado, en el ámbito político la situación es muy preocupante. Como señalé al inicio de estas líneas, hoy en día, entre amplios sectores de la población, las encuestas electorales son percibidas como potenciales vehículos de desinformación o manipulación. Examinemos con más detalle los desafíos actuales que enfrentan.
Impacto de los cambios tecnológicos en las encuestas
Como mencioné anteriormente, las encuestas electorales se encuentran actualmente en una grave crisis de credibilidad, en buena parte como resultado de los cambios tecnológicos. Estos cambios marcaron el fin de lo que algunos llaman la época dorada de las encuestas, caracterizada por la expansión masiva de la telefonía fija en los hogares entre los años 1960 y 1990. Durante este periodo, la disponibilidad generalizada de teléfonos fijos proporcionó una herramienta poderosa para gobiernos, académicos y profesionales del marketing para llevar a cabo encuestas. Se basaban en un marco muestral que utilizaba el directorio telefónico, el cual se perfeccionaba y ampliaba su cobertura año tras año.
Pero como bien sabemos, nada permanece inmutable. Con el tiempo, nuevas tecnologías surgieron y gradualmente comenzaron a erosionar el aparente círculo virtuoso que se había establecido con la expansión constante de la telefonía fija. Quizás uno de los primeros elementos que, a veces, pasamos por alto debido a su aparente simplicidad, fue la llegada del identificador de llamadas.
Este avance representó un cambio significativo en la relación de las personas con sus teléfonos, y para el caso que nos ocupa, marcó el comienzo del declive en las tasas de respuesta a las encuestas telefónicas domiciliarias. De repente, el aura de misterio que rodeaba un timbrazo telefónico, y que permitía a los encuestadores pasar desapercibidos, se desvaneció de un momento a otro. Los usuarios ahora tenían el poder de saber quién los llamaba antes de contestar. Este fenómeno persiste hasta nuestros días y explica en gran medida las bajas tasas de participación en las encuestas telefónicas, así como los sesgos resultantes. Por ejemplo, las encuestas telefónicas domiciliarias tienden a otorgar más peso a los adultos mayores y menos a la población joven.
Hablemos ahora sobre la telefonía móvil. La llegada de los omnipresentes teléfonos celulares marcó en gran medida el fin de una de las metodologías más tradicionales para realizar encuestas: el marcado aleatorio de dígitos (random digit dialing, RDD). Esto se debió a que, con la masificación de los teléfonos móviles, los marcos muestrales fueron gradualmente erosionándose y volviéndose obsoletos. La razón de esto es evidente: la geolocalización de las personas a través de un número de celular se volvió cada vez más difícil de lograr, y la movilidad de los individuos significó que la cobertura geográfica se volviera cada vez más imprecisa. Todo esto resultó en un sesgo de cobertura en aumento.
Relacionado con lo anterior, al abandonar la telefonía fija a favor de la telefonía móvil, los consumidores dictaron que el marco muestral proporcionado por el directorio telefónico se redujera cada vez más, limitándose principalmente a hogares con adultos mayores con todos los sesgos asociados a ello. Y no es todo: los cambios tecnológicos van de la mano con los cambios en el comportamiento humano. La popularización de los teléfonos móviles, junto con el inicialmente alto costo por minuto de llamada, resultó en comunicaciones más breves pero más frecuentes, con una preferencia creciente por los mensajes de texto. De hecho, muchos señalan que hoy en día los grupos etarios más jóvenes casi no se comunican a través de llamadas telefónicas (Sarla, 2020).
Es evidente lo que este cambio de comportamiento ha significado para los profesionales de las encuestas: tasas de respuesta más bajas y, como consecuencia, cuestionarios aún más cortos. Y justo cuando estábamos lidiando con estos cambios, llegó Internet, pero esa historia merece un tratamiento aparte.
Internet y las encuestas electorales
La llegada y la expansión del uso de Internet a principios del siglo veintiuno solucionaron dos desafíos fundamentales que enfrentaban las encuestas electorales. En primer lugar, permitió el acceso a millones de posibles participantes que realizan una amplia gama de actividades en línea, desde compras hasta trabajo, estudio, búsqueda de pareja y entretenimiento, entre otras muchas cosas. Este vasto y diverso conjunto de individuos estaba al alcance de unos pocos clics, lo que resultó en una disminución significativa de los costos asociados con la realización de encuestas en línea en comparación con las encuestas presenciales cara a cara en vivienda (Zhang, 2000).
Esta situación representaba una situación ganar-ganar: por un lado, el aumento en el número de participantes teóricamente podría mejorar la precisión de las estimaciones, mientras que, por otro lado, los costos disminuían drásticamente (Wright, 2005; Andrews, Nonnecke, & Preece, 2007; Vehovar y Manfreda, 2017). Hoy en día, estamos rodeados de encuestas en línea que reclutan participantes de manera mucho más rápida de lo que nunca se había imaginado con las encuestas presenciales.
De forma tal que la Internet ha introducido tres mejoras significativas en el mundo de las encuestas electorales. En primer lugar, ha proporcionado un universo de participantes amplio y en constante crecimiento. En segundo lugar, ha generado una disminución exponencial de los costos asociados. Y, en tercero, ha permitido una mayor velocidad en la recolección de datos, incluso en tiempo real.
Si todo esto suena demasiado bueno para ser cierto, es porque lo es. Las encuestas en línea están plagadas de sus propios problemas (Van Selm y Jankowski, 2006). Un punto crucial a tener en cuenta es que estas encuestas solo incluyen a la población que tiene acceso a Internet. Este problema tiende a ser menos pronunciado en países en desarrollo en comparación con aquellos de ingresos altos y medianos. Por ejemplo, mientras que en Canadá la penetración de Internet es del 93%, y en México del 76%, en Mozambique es del 17% (World Bank, s.f.). Sin embargo, incluso en países con altas tasas, la población que utiliza esta tecnología tiende a estar sesgada hacia un grupo demográfico específico: varones jóvenes (Rakhmawati et al., 2021). Este sesgo hacia la juventud se explica en parte porque los grupos de edad más jóvenes están más familiarizados con el uso de Internet que sus contrapartes mayores. El sesgo hacia varones es más complejo y puede estar influenciado por factores sociales y económicos, como el grado de representación de las mujeres en la fuerza laboral (Amber y Chichaibelu, 2023).
Sin embargo, más allá de los problemas inherentes que podríamos describir como congénitos de las encuestas en línea, el mayor obstáculo para esta metodología es absolutamente crucial desde el punto de vista estadístico: no existe en Internet un marco muestral como lo hubo en la época de la expansión de la telefonía fija en los hogares. En otras palabras, no hay un registro de usuarios que identifique a cada uno de ellos con un número de identificación personal (NIP) en cada país o ciudad. Simplemente no existe, no existió y no existirá.
Para dejarlo claro: no tenemos forma de saber cuántas personas están navegando en el ciberespacio y quiénes son. Esta realidad contrasta fuertemente con lo que veíamos en las encuestas telefónicas, donde los directorios proporcionaban un marco muestral que, aunque imperfecto, era un excelente punto de partida y permitía crear muestras aleatorias. Lo mismo ocurría con las encuestas cara a cara, donde el censo de población y vivienda, o los registros catastrales, ofrecían un marco muestral que permitía un muestreo estratificado para el levantamiento de datos. Desafortunadamente, nada de eso está disponible en Internet.
Ante esta dificultad inherente al medio, una forma de superarla ha sido crear marcos muestrales ad hoc en forma de paneles que incluyan a una variedad de participantes, ya sea a través de métodos de reclutamiento o mediante la inclusión voluntaria (Callegaro et al., 2014). Similar a un rompecabezas que se va armando para formar una imagen de la vida real, un panel bien equilibrado incluiría todas las piezas que componen la sociedad en su conjunto, reproduciendo así en miniatura la diversidad social en términos de género, edad, ingresos, composición racial, idioma, religión y otros aspectos.
Una vez que se ha formado el panel, se puede utilizar como marco muestral que permita realizar un muestreo aleatorio, similar al utilizado en encuestas telefónicas y presenciales en viviendas, donde todos los participantes o panelistas tendrían la misma probabilidad de ser seleccionados para una encuesta que, en teoría, sería representativa.
Los paneles, sin embargo, están cargados de problemas (Scherpenzeel, 2018).
El principal de ellos radica en que los paneles presentan un fuerte sesgo en cuanto a quienes incluyen y excluyen en sus bases de datos. Esto es particularmente notable en el caso de Latinoamérica como lo muestran Castorena et al. (2023). Su estudio analiza nueve encuestas en línea realizadas en seis países de la región para examinar el sesgo en sus muestras, y sus hallazgos son reveladores: existe un sesgo significativo debido a la falta de representación de grupos socioeconómicos bajos en los paneles, lo que influye en las correlaciones educativas, preferencias políticas, hábitos de consumo, entre otros aspectos (Castorena et al., 2023, p. 277).
Además, el sesgo de no respuesta también es un problema importante entre los panelistas, quienes pueden ser reacios a expresar su opinión en temas delicados debido a la falta de anonimato. De hecho, muchas casas encuestadoras evitan proyectos en contextos de países autoritarios o en temas socialmente sensibles, debido a las bajas tasas de participación o al riesgo percibido tanto para ellas mismas como para los encuestados.
Dificultades y sesgos en el uso de paneles en encuestas en línea
Para profundizar en las limitaciones de los paneles, es importante destacar que varios estudios sugieren que los individuos incluidos en los paneles son sistemáticamente diferentes de la población en general (Cantor, 2008; Halpern-Manners et al., 2017; Struminskaya y Bosnjak, 2021). Por ejemplo, Halpern-Manners et al. (2017) sugieren que los panelistas tienden a ser personas que disfrutan expresando sus opiniones, tienen ideas firmes, están altamente politizados, y están bien informados sobre los eventos nacionales. Son aquellos que, por así decirlo, podrían dominar una conversación sobre política en una cena. Este perfil de panelista es más propenso a aceptar la invitación de una encuestadora para formar parte de un panel, o incluso a inscribirse por iniciativa propia, con el objetivo de hacer oír su voz. Sin embargo, es evidente que la mayoría de la población no encaja en este perfil, lo que sugiere que las opiniones expresadas en los paneles pueden estar sesgadas hacia este tipo de individuo.
Esta posibilidad es objeto de debate, ya que es plausible suponer que los panelistas sean sistemáticamente diferentes de la población en general, pero en un sentido distinto: es decir, podrían ser más introvertidos que el resto de la población. De hecho, es posible concebir que las voces representadas en los paneles sean las más calladas y tímidas, pertenecientes a individuos que optan por expresar sus opiniones políticas a través de encuestas en línea, considerando que eso es suficiente para cumplir con su deber cívico. No es descabellado imaginar que los panelistas sean personas que prefieren permanecer detrás de una computadora, contestando cuestionarios en línea en busca de recompensas como puntos para canjear en un Starbucks. Este perfil es muy distinto al de los individuos que participan en manifestaciones y se enfrentan a la policía en el Zócalo capitalino bajo el rayo del sol. Esta posibilidad sugeriría que los paneles no están capturando las voces que realmente están influyendo en el panorama político de manera más activa y enérgica, ya que estas personas podrían sentir que participar en encuestas por correo electrónico no es suficiente para hacer oír su voz.
Otro aspecto a considerar es que, incluso si asumimos (aunque improbable) que los panelistas son representativos de la población en general, existe la posibilidad de que a largo plazo sean condicionados y terminen siendo diferentes de la población. Este fenómeno ha sido ampliamente estudiado (Cantor, 2008) y sugiere que los panelistas, inicialmente similares a su conciudadanos, pueden volverse notablemente más informados con el tiempo. Al participar constantemente en encuestas, tienden a estar más al tanto de la política nacional, familiarizarse con los temas y los actores políticos. Es posible que su curiosidad se despierte, y aunque inicialmente no estén familiarizados con ciertos temas o figuras políticas, buscarán información para formarse una opinión informada. De esta manera, quizá no sepan de inicio el nombre del Primer Ministro de Canadá, pero al ser cuestionados sobre su opinión de él, buscarán en Google su nombre para informarse. En resumen, después de un tiempo, un panelista que antes era similar al resto de la población puede terminar siendo, en comparación, un experto en política nacional e internacional.
Aclaro: con esto no digo que los tres sesgos arriba descritos sean ineludibles, digo que son posibilidades. Como lo he dicho antes, esto es un debate, y por lo mismo cabe aclarar que no se está diciendo que los estudios panel no sean útiles. Al contrario, en ciencias sociales y en estudios electorales se ha hecho mucho y muy buen trabajo usando paneles, son fundamentales además si se quieren hacer estudios longitudinales donde se le vuelva a preguntar a la misma gente por sus opiniones, estado de salud, nivel de ingresos, etcétera -aspectos estos siempre cambiantes. Lo que hay que saber es que el panel va a traer irremediablemente la posibilidad de un sesgo de muestra, el cual no podemos eliminar pero quizá sí mitigar, o al menos poner sobre aviso a los consumidores de encuestas y/o colegas académicos. En la práctica, mucho de lo que hacemos en ciencia social es tomar decisiones difíciles sobre diseño de investigación. En un mundo ideal, y si tuviéramos acceso a un saco repleto de dólares, sí se podrían hacer encuestas altamente representativas y mitigar, quizá incluso eliminar, ciertos sesgos. Pero ese mundo ideal no existe, y los investigadores están sujetos a presupuestos limitados, fechas de entrega de publicaciones, otras responsabilidades académicas, etcétera. Lo que sí podemos y debemos hacer es informar a nuestros lectores de los posibles riesgos que corremos al levantar los datos y darles al lector la posibilidad de emitir su propio dictamen y decir “estos datos tienen estos méritos”, “estos datos tienen estos otros méritos”.
El futuro de las encuestas
Todo lo anterior sugiere que, a pesar de las complicaciones inherentes, las encuestas en línea son una tendencia que perdurará: son el futuro. Ello porque cada vez más personas realizan actividades cotidianas a través de medios digitales: compras, estudios, búsqueda de pareja, entretenimiento e incluso asistencia a servicios religiosos, entre otras. Esta realidad nos insta a ser innovadores y creativos al reclutar participantes en línea para responder encuestas. Una estrategia efectiva implica adoptar un enfoque inclusivo y diversificado, evitando limitar los puntos de acceso a uno o dos, como sucede con las encuestas en Facebook (Bennetts et al., 2019). Aunque esta red social sigue siendo un canal relevante, existen millones de personas fuera de ella que también deben ser alcanzadas.
Pero seamos claros: los desafíos metodológicos que enfrentan las encuestas en la actualidad son, en cierta medida, los mismos de siempre. Es decir, consisten en obtener la mayor cantidad de voces posible para garantizar que los datos sean inclusivos y representativos. Idealmente, necesitamos desarrollar herramientas que nos brinden una señal fidedigna de las opiniones del público, en medio del ruido mediático y político en el que estamos inmersos. Estas herramientas deben estar alineadas con las tecnologías actuales y los cambios sociales y de comportamiento que observamos en la sociedad contemporánea. En este sentido, emergen nuevas tecnologías y metodologías que, lejos de intimidarse por la vastedad del ciberespacio y la falta de marcos muestrales, intentan capitalizar la increíble diversidad de voces que se expresan en él.
Un ejemplo de esto es la tecnología de intercepción de dominios aleatorios (Random Domain Intercept Technology, RDIT por sus siglas en inglés) y la participación aleatoria de dispositivos (Random Device Engagement o RDE). RDIT fue desarrollada en 2009 en la Universidad de Toronto como un proyecto académico para rastrear la propagación del virus H1N1 en la provincia canadiense de Ontario (Sargent et al., 2022). Seeman et al. (2016) explican que RDIT tuvo dos objetivos principales: recopilar datos en tiempo real y ofrecer a todos los usuarios de Internet en la provincia la oportunidad de participar en una encuesta, algo que las empresas de paneles como YouGov, Ipsos y Gallup no podían lograr. La ventaja de este método radica en la amplia diversidad de voces que captura en tiempo real al utilizar miles de puntos de entrada. Sin embargo, la desventaja es el sesgo inherente que existe en todos los países con respecto a la población de usuarios de Internet, que tiende a estar dominada por hombres jóvenes, como se mencionó anteriormente.
Otro método similar es el mencionado RDE, que utiliza miles de aplicaciones (apps) para ofrecer a sus usuarios algún tipo de beneficio, como créditos, vidas extras o acceso a contenido premium, a cambio de participar en una encuesta. Es tan simple como suena. Para ejemplos de su uso, consulte Piltch-Loeb et al. (2021), Benjamin, Sauer y Buchenrieder (2022), o Gande et al. (2023). Quizás lo único que vale la pena señalar es que este intercambio se realiza de manera orgánica, es decir, dentro de la misma aplicación en la que se encuentra el usuario, sin necesidad de redirigirlo a otra plataforma, registrarlos en una base de datos y enviarles el cuestionario por correo electrónico. Por ejemplo, mientras alguien juega a Candy Crush, podría recibir un aviso ofreciéndole la oportunidad de obtener una barra de oro, la moneda ‘premium’ del juego, a cambio de completar una encuesta. Estas barras de oro permiten a los usuarios de Candy Crush adquirir vidas extras, mejoras y otros objetos que los ayuden a progresar en el juego.
Para concluir esta sección, es necesario abordar al “elefante en la habitación”: la Inteligencia Artificial (IA). Según académicos y expertos de la industria, la IA representa el futuro de las encuestas, ya que transformará aspectos fundamentales del diseño de la investigación. Por ejemplo, los cuestionarios podrán ser optimizados para ser más personalizados y dinámicos, lo que permitirá una comprensión más clara y honesta de las respuestas. Además, la IA tiene la capacidad de analizar los datos y comprender los sentimientos detrás de las respuestas, identificando áreas de satisfacción e insatisfacción que podrían pasar desapercibidas. Por último, y quizás lo más controvertido, la IA tiene el potencial de reemplazar a los encuestados humanos y obtener datos y predicciones en cuestión de segundos. ¿Estamos presenciando el fin de las encuestas tradicionales? ¿Hasta qué punto puede la IA replicar la complejidad del comportamiento humano en constante cambio? ¿Cuál sería el valor de estos datos sintéticos? ¿Y cuáles serían sus posibles sesgos? Estas son preguntas que aún no han sido completamente exploradas y que merecen un tratamiento aparte y en otro momento.
¿Existe una crisis de credibilidad de las encuestas?
Los errores en las encuestas electorales han sido evidentes en varios eventos recientes, como las elecciones en el Estado de México, donde se pronosticó una amplia ventaja para la candidata de MORENA, Delfina Gómez, pero su margen de victoria fue mucho menor de lo anticipado. No es fenómeno aislado; se ha observado en distintas elecciones en México y Latinoamérica. Ejemplo de lo anterior fue el plebiscito constitucional en Chile, donde las encuestas favorecían ligeramente al Rechazo, pero al final esta opción ganó con una avalancha de votos sobre el Apruebo. En Brasil también se vió algo similar en 2022, cuando todas las encuestas daban una ventaja considerable a Lula sobre Bolsonaro, pero al final casi quedaron empatados.
Vale la pena aclarar que las encuestas pueden equivocarse, ya lo creo que sí. Además, a posteriori es fácil encontrar razones para ello: voto oculto, muestra sesgada o insuficiente, interpretación equivocada o abusiva por parte de los medios de comunicación o actores políticos, etcétera. Equivocarse, sin embargo, no es lo mismo que manipular. En política siempre habrá sorpresas. Para ejemplos ahí está el colapso de la URSS que nadie vio venir, o la inesperada llegada de la Primavera Árabe. Pero es importante distinguir claramente entre cometer errores y cometer fraude. En las elecciones recientes en el Estado de México, el partido MORENA fue sancionado por difundir resultados de encuestas sin ninguna metodología válida, lo que revela la tentación que enfrentan los políticos de utilizar herramientas de investigación, con todas sus fortalezas y debilidades, como armas políticas contra sus opositores.
A modo de colofón, me gustaría ofrecer algunas sugerencias clásicas de académicos que recogí en un artículo publicado recientemente (García Magos, 2024) a menudo pasadas por alto en el bullicio político, donde lo esencial parece no ser la búsqueda honesta de la verdad mediante herramientas estadísticas, sino más bien el uso del lenguaje científico para disfrazar intereses políticos.
Las empresas de encuestas utilizan diversas metodologías, como encuestas cara a cara, telefónicas y en línea. En México, muchas prefieren el método cara a cara en viviendas particulares. Sin embargo, este enfoque puede introducir sesgos de deseabilidad social y falta de respuesta, especialmente cuando los funcionarios del gobierno recopilan información de puerta en puerta, lo que puede llevar a que los encuestados mientan o retengan información.
La metodología de una encuesta tiene un impacto significativo en los resultados. Por ejemplo, una encuesta cara a cara, especialmente en viviendas particulares, puede introducir un sesgo de deseabilidad social que podría inflar las preferencias hacia la candidata del oficialismo. En contraste, una encuesta telefónica tiende a dar más peso a los adultos mayores y menos a los jóvenes, lo que puede resultar en una subrepresentación de ciertos grupos demográficos.
La frase “cobertura representativa a nivel nacional” se usa muchas veces sin base técnica. Todas las encuestas pueden ajustarse para ser representativas, pero eso no asegura la calidad de los datos. En resumen, este término puede ser ambiguo y poco informativo. Los consumidores de encuestas merecen más transparencia en la selección de participantes y los métodos estadísticos utilizados.
Es crucial preguntarse: ¿representativa en comparación con qué? La mayoría de las encuestas buscan ser representativas, pero es fundamental especificar en qué aspectos. La representatividad por sí sola no es una realidad en el ámbito de las encuestas. Siempre se debe aclarar en relación con qué: ¿representativa de qué grupo demográfico específico? Esto no necesariamente es un problema, pero sí lo es cuando se asume que esta muestra refleja completamente a la sociedad, lo cual no es cierto.
No todas las encuestas requieren ser representativas. A veces, pueden ofrecer datos útiles sin esta condición. Por ejemplo, una encuesta electoral sobre el voto de los burócratas mexicanos no necesita ser representativa para entender las opiniones de este grupo específico. Lo mismo se aplica a encuestas dirigidas a grupos sociales específicos o dentro de organizaciones, donde el objetivo es comprender las opiniones de esos grupos en lugar de generalizar a toda la población.
No sobrevalorar el tamaño de la muestra. Más participantes no siempre significan mejores resultados. La calidad a menudo se ve sacrificada por la cantidad, especialmente en encuestas que buscan reducir costos. La Paradoja de los Macrodatos o Big Data Paradox (Meng, 2018) ejemplifica esto: mientras más datos tengamos, mayor es la precisión, pero cualquier error en los datos se magnifica, lo que puede tener un impacto significativo en las conclusiones.
Aunque se cree que las encuestas influyen en la participación electoral, su efecto no es tan pronunciado como se supone, especialmente en encuestas poco confiables. Los estudios muestran que los votantes son más sofisticados de lo que se piensa, reaccionando activamente a la información y defendiendo a sus candidatos.
Las encuestas pueden capturar la intención de voto, pero no siempre predicen con precisión los resultados electorales. La preferencia electoral es volátil y votar implica costos. Preguntar quién creen que ganará, en lugar de por quién votarán, puede producir predicciones más precisas.
No se deje impresionar por “gurús de YouTube” que usan términos técnicos sin comprender y luego se refugian en los márgenes de error. Aunque el margen de error indica la proximidad del resultado de la encuesta al valor real de la población, no puede explicar errores significativos de diez puntos o más. Tales errores suelen deberse a problemas de diseño, metodología o interpretación inadecuada de los resultados.
En relación al punto anterior, el margen de error efectivo puede ser el doble del que se informa, e incluso superior. Las encuestas suelen ser menos precisas de lo que se asume, dado que el margen de error estadístico no tiene en cuenta otros errores potenciales en el diseño, la metodología y los sesgos de respuesta.