¿Por qué fallaron las encuestas en 2020

¿Las encuestas volverán a equivocarse en este ciclo electoral?

Es probable que esa sea la pregunta que más me hacen, por razones obvias. Desafortunadamente, no es fácil de responder, y una de las razones podría sorprenderte: los encuestadores aún no saben exactamente por qué las encuestas subestimaron a Donald Trump hace cuatro años.

Como decía un informe posterior a las elecciones elaborado por encuestadores profesionales: “Identificar de manera concluyente por qué las encuestas sobrevaloraron el margen demócrata-republicano en relación con el voto certificado parece imposible con los datos disponibles”.

La explicación exacta importa. Según algunas teorías, las encuestas pueden ser mucho mejores en 2024; según otras, los encuestadores siguen siendo vulnerables a las fallas.

A falta de una respuesta clara, la mayoría de las teorías se centran en el “sesgo de falta de respuesta”, según el cual los partidarios de Trump tenían menos probabilidades de responder a las encuestas que los votantes demográficamente similares de Biden. Esto es bastante razonable, pero los detalles son turbios y, de nuevo, son importantes. En particular, tienen que explicar por qué las encuestas han sido a veces precisas durante la era Trump.

Es fácil olvidarlo, pero las encuestas no siempre han sido terribles desde que Trump incursionó en la política. A pesar de todos los problemas con las encuestas estatales en 2016, los sondeos nacionales de alta calidad fueron excelentes, y casi todas las encuestas de alta calidad destacaron en las elecciones de medio mandato de 2022. Esta variación en los resultados requiere que los encuestadores y analistas construyan una teoría que se ajuste al error cambiante. Requiere algo mucho más matizado que “los partidarios de Trump no responden”.

Los encuestadores y analistas han estudiado muy de cerca los últimos ocho años (y han introducido cambios sustanciales, que exploraremos mañana). Aunque tienen innumerables hipótesis, yo diría a grandes rasgos que hay dos teorías no del todo mutuamente excluyentes sobre los fallos de las encuestas en 2016 y 2020. Dependiendo de cuál te parezca más convincente, tendrás una opinión diferente sobre lo vulnerables que son las encuestas a la posibilidad de registrar fallos en noviembre.

La teoría unificada

Al primer enfoque podemos llamarlo “la teoría unificada”. Trata de explicar, de un plumazo, por qué las encuestas y los demócratas obtienen buenos resultados en las elecciones de medio mandato, mientras que las encuestas y los demócratas obtienen malos resultados en las elecciones presidenciales.

Esta teoría sostiene que los encuestadores simplemente no pueden contactar a suficientes votantes políticamente menos comprometidos, y esos votantes apoyan de manera mayoritaria a Trump. Las encuestas pueden hacerlo bien en las elecciones de medio mandato, cuando solo votan los muy comprometidos (y ahora relativamente de tendencia demócrata), pero subestiman a Trump en las elecciones presidenciales.

Si eres un lector liberal de este boletín, esta teoría puede provocarte un escalofrío. Durante todo el ciclo, hemos observado la fuerza de Trump entre los votantes menos comprometidos. Hemos agonizado sobre los retos de las encuestas. Recientemente, hemos observado que la encuesta Times/Siena muestra extrañas similitudes con las elecciones de medio mandato. La teoría unificada une todo esto en una pesadilla potencial para los demócratas, en la que todos los sutiles patrones de los datos del Times/Siena se suman como un presagio de otro error en las encuestas, y de otra presidencia de Trump.

Una versión de esta teoría es popular entre los más reputados encuestadores y científicos de datos, y hay muchas pruebas que la apoyan. Desde hace décadas, los encuestadores saben que los votantes menos comprometidos y menos políticos son los menos propensos a responder a las encuestas. Esto puede parecer obvio: un adicto a la política estaría naturalmente más dispuesto a responder a una encuesta que alguien sin ningún interés en la política.

También lo vemos en nuestros datos: en una encuesta típica del Times/Siena, las personas que han votado previamente en unas primarias tienen aproximadamente el doble de probabilidades de responder a una encuesta que las que no lo han hecho. Peor aún, está claro que las personas sin historial de voto que responden a las encuestas no son representativas del conjunto de los no votantes. Es mucho más probable que voten los no votantes anteriores que responden encuestas, en comparación con los inscritos similares que se niegan a responder a las encuestas. (Lo sabemos porque, cuando pasan las elecciones, podemos ver cuáles personas de las que hemos encuestado han votado realmente).

También hay pruebas considerables de que los votantes menos comprometidos son más propensos a apoyar a Trump, especialmente después de tener en cuenta sus características demográficas. Los datos del Times/Siena han respaldado esta proposición durante todo el ciclo, incluso cuando Kamala Harris se convirtió en la candidata, aunque en menor medida.

Si lo juntamos, es posible que los encuestadores se queden atascados: por mucho que lo intenten, nunca representarán adecuadamente a los votantes políticamente desvinculados y, por tanto, nunca mostrarán suficiente apoyo a Trump, al menos cuando esos votantes desvinculados decidan votar, como suelen hacer en unas elecciones presidenciales.

La teoría del mosaico (pero, en última instancia, la pandemia)

La segunda teoría no está tan unificada. Llamémosla la teoría del mosaico, aunque en última instancia se centra mucho en que “fue la pandemia”.

En esta teoría, los errores de las encuestas en 2016 y 2020 pueden parecer similares, pero en realidad fueron muy diferentes. Por un lado, las encuestas nacionales “patrón oro” fueron bastante buenas en 2016, mientras que fueron terribles en 2020. Esto sugiere que hubo retos distintos en ambas elecciones, como los votantes republicanos indecisos a quienes no les gustaba Trump en 2016, el fracaso de los encuestadores estatales a la hora de ponderar por educación y, en última instancia, la pandemia.

En la mayoría de los casos, estos desafíos o bien se han desvanecido desde 2016 y 2020 o bien han sido solucionados por los encuestadores. Esta teoría no niega necesariamente que exista un reto para llegar a los votantes de Trump menos comprometidos, pero quizás ese solo sea uno de los muchos problemas. Si esos otros problemas desaparecen, las encuestas podrían estar preparadas para un ciclo de 2024 mucho más preciso.

La teoría del mosaico carece obviamente de la coherencia arrolladora de la teoría unificada, pero en muchos aspectos hay más pruebas a su favor, empezando por las elecciones de 2016:

La educación. En 2016, la mayoría de las encuestas estatales —incluidas las encuestas de las campañas— no se ponderaron por la educación autodeclarada y, en consecuencia, tenían demasiados licenciados universitarios. (Antes de 2016, el hecho de tener un título universitario no era un indicador significativo de si alguien votaría a los demócratas o a los republicanos, pero ya no es así). Según nuestras estimaciones de ese entonces, la ponderación por educación desplazó las encuestas una media de cuatro puntos porcentuales hacia Trump. Esto ayudó a explicar la exactitud de las encuestas nacionales tradicionales, que casi siempre se ponderaban por la educación.
Votantes que se decidieron tardíamente. Las elecciones de 2016 también contaron con un número inusual de votantes indecisos y de votantes que apoyaban a candidatos de terceros partidos. Estos votantes eran desproporcionadamente republicanos, y parecían inclinarse por Trump en los últimos días, según los sondeos a pie de urna y los estudios postelectorales que volvieron a contactar a los votantes indecisos encuestados previamente. También en este caso, los sondeos nacionales tenían ventaja: se hicieron muchas encuestas nacionales durante los últimos días de la contienda, y eran precisas y mostraban que Trump iba ganando. Por el contrario, en los últimos cinco días de la contienda se realizaron pocas o ninguna encuesta estatal de alta calidad. Por ejemplo, todas las encuestas nacionales finales se realizaron totalmente después del final de la última encuesta de alta calidad ponderada por la educación en Wisconsin: una encuesta de Marquette realizada entre el 26 y el 31 de octubre.

Estos factores hicieron que los encuestadores tuvieran motivos para ser optimistas de cara a 2020. En teoría, la ponderación por la educación por sí sola arreglaría muchas encuestas estatales, mientras que los cambios tardíos no serían un problema muy grande con menos votantes indecisos. Si se combinaban, los encuestadores entraban en 2020 confiados en que no se produciría otro error en las encuestas.

Esta confianza resultó estar fuera de lugar. En 2020, las encuestas se equivocaron aún más que en 2016. Esto fue especialmente cierto en el caso de los encuestadores nacionales, quienes parecieron acertar en las elecciones de 2016. Las encuestas estatales no obtuvieron mejores resultados que en 2016, y a menudo se equivocaron en los mismos lugares, como en Wisconsin, donde las encuestas subestimaron a Trump en unos ocho puntos. Erraron a pesar de que casi todos los encuestadores estatales ponderaban por educación, y a pesar de que el número de votantes indecisos y conflictivos había descendido. Entonces, ¿qué ocurrió?

La teoría unificada sostiene que el mismo problema subyacente estuvo detrás de los fallos en las encuestas de 2016 y 2020, ayudando a explicar la similar distribución geográfica del error en los estados disputados del Norte en ambas elecciones. Desde este punto de vista, el problema de la falta de respuesta se agravó aún más cuando la participación alcanzó niveles modernos récord y atrajo al electorado a un número aún mayor de votantes desvinculados que apoyaron a Trump. De hecho, la mayor participación en 2020 anuló los datos de la ventaja que los encuestadores obtuvieron al ponderar la educación.

En lo que respecta a 2020, la teoría del mosaico se apoya mucho en una explicación: la pandemia, un acontecimiento extraordinario que afectó a todos los estadounidenses. Y lo que es más importante, la pandemia afectó al comportamiento de la gente. Mucha gente dejó de salir a la calle y empezó a trabajar desde casa. Todo esto tuvo un claro efecto en las encuestas. Los índices de respuesta aumentaron, y las encuestas se hicieron más baratas y aparentemente más representativas desde el punto de vista demográfico, hasta el punto de que los encuestadores se alegraron.

Es posible que los encuestadores tuvieran razón al alegrarse en abril, pero en otoño la pandemia se estaba volviendo partidista. Los demócratas tendían a usar mascarillas y a quedarse en casa, y era más probable que respondieran las encuestas. La historia (excesivamente simplista pero plausible) es que los demócratas estaban libres y disponibles para hacer encuestas todo el día, solos y agradecidos de hablar con un ser humano, enfurecidos por Trump y la pandemia, mientras que los republicanos tendían a estar afuera viviendo sus vidas.

Hay una mezcla de pruebas que apoyan un papel importante, aunque difícil de cuantificar, de la pandemia en el error de las encuestas de 2020.

Tasas de respuesta. Como se ha mencionado antes, hay pruebas claras de que los índices de respuesta aumentaron durante la pandemia. Los índices de respuesta de los demócratas fueron significativamente más altos que los de los republicanos en 2020 —cerca de un 20 por ciento más altos en los datos del Times/Siena—, aunque no podemos estar seguros de que la pandemia fuera la razón de los mayores índices de respuesta de los demócratas en relación con los republicanos.
El momento. Antes de la pandemia, las encuestas mostraban una contienda altamente competitiva. Las encuestas del Times/Siena de noviembre de 2019, por ejemplo, estuvieron muy cerca del resultado final, al igual que los promedios de las encuestas por estado a principios de 2020. Por supuesto, es posible que las encuestas estuvieran siempre equivocadas y que Trump mantuviera en realidad una ventaja significativa hasta que su respuesta a la pandemia puso al presidente Biden por encima. Pero el patrón es, no obstante, el que cabría esperar si la pandemia hubiera inducido un problema en las encuestas.
Teléfonos fijos. Los sondeos por teléfono fijo, que cabría esperar que se vieran más afectados por el hecho de que la gente se quedara en casa, tuvieron un error de sondeo extraordinario. ¿Recuerdas la infame encuesta de ABC/Washington Post en la que Biden ganaba por 17 puntos en Wisconsin? Los encuestados de teléfonos fijos apoyaron a Biden por 30 puntos.

En el sondeo de Times/Siena, los demócratas registrados tenían el doble de probabilidades de responder que los republicanos por teléfono fijo, pero apenas había diferencia entre los que respondían por teléfono móvil (la mayoría de nuestros encuestados).
Geografía. Hubo una relación entre la prevalencia del coronavirus en noviembre de 2020 y el error de sondeo. Wisconsin fue el epicentro de los casos a finales de noviembre, junto con otros estados del norte. En su momento, esto se consideró la explicación más probable de por qué Biden estaba subiendo en Wisconsin en la recta final, según un sondeo de ABC News que decía: “El aumento de la covid perjudica a Trump en Wisconsin”. En retrospectiva, la pandemia podría haber sido simplemente una ayuda para Biden en las encuestas.

¿Cuál teoría es la correcta?

Hemos examinado dos formas básicas de entender el error de las encuestas en 2016 y 2020, pero casi todos los analistas se situarían probablemente en algún punto entre ambas.

Al fin y al cabo, casi todas las teorías sobre los errores descritas hasta ahora tienen mérito. Se basan en teorías razonables sobre la respuesta a las encuestas. Están respaldadas por pruebas. Ayudarían a explicar por qué las encuestas fueron peores en 2020 que en 2016, y por qué las encuestas fueron mejores en 2022 y 2018 que en cualquiera de las elecciones presidenciales.

Desafortunadamente, casi no hay manera de desentrañar el mérito relativo de las distintas teorías.

El mejor escenario para los encuestadores sería algo así: los encuestadores solucionaron los problemas que les perjudicaron en 2016, y la pandemia les perjudicó en 2020, pero ya ha pasado. Por eso es probable que las encuestas tendrán un buen ciclo en 2024, aunque no introduzcan ningún cambio metodológico significativo. Quizá las encuestas puedan incluso subestimar a los demócratas ahora, si hay alguna nueva fuente de error que favorezca a Trump. Después de todo, las encuestas subestimaron a los demócratas en 2012.

Al respecto, es digno de mención que muchos de los peores encuestadores de 2020 parecen estar produciendo resultados mucho mejores para Trump en 2024, incluso cuando no están haciendo muchos o ningún cambio metodológico. La encuesta de Quinnipiac quizá sea el mejor ejemplo. Es la última que queda de las encuestas políticas telefónicas tradicionales que utilizan la marcación aleatoria, y ha mostrado resultados mucho mejores para Trump que hace cuatro años. No es fácil explicar cómo la encuesta de Quinnipiac puede mostrar que Trump va por delante en Wisconsin y Míchigan según la versión más extrema de la teoría unificada, a menos que Trump vaya camino de una victoria aplastante.

Del mismo modo, es difícil argumentar que los encuestados que dieron a Biden una ventaja de 17 puntos en Wisconsin fueran representativos del electorado de las elecciones de medio mandato, lo que implica la teoría unificada. Esos encuestados probablemente no habrían dicho que favorecían al republicano Ron Johnson en la contienda al Senado de EE.UU., si se les hubiera preguntado dos años después. Está claro que para los encuestadores fue un poco más fácil acertar en las elecciones de medio mandato.

Aunque es razonable decir que las cosas podrían ir mejor para los encuestadores, el peor de los casos sigue vigente: no hay razón para suponer que los encuestadores puedan contactar a los votantes menos interesados políticamente en números suficientes, y hay muchas razones para pensar que respaldarán a Trump en noviembre. Si este reto sigue siendo igual de grande, las encuestas podrían volver a fallar de manera estrepitosa. Tal vez los sondeos podrían salir aún peor parados si a Trump le va aún mejor entre los votantes menos comprometidos que hace cuatro años, como han demostrado las encuestas durante todo el ciclo.

En ese caso, los encuestadores esperarán que los cambios que han introducido desde 2020 ayuden a resolver los problemas que se avecinan. Mañana analizaremos de cerca esos cambios, y si eso les da la oportunidad de evitar otro error de sondeo como el de 2020.

¿Por qué fallaron las encuestas en 2020 y qué implicaciones tiene para 2024?

La teoría unificada

La teoría del mosaico (pero, en última instancia, la pandemia)

¿Cuál teoría es la correcta?

Otras Noticias

Hallan el cuerpo sin vida de una mujer en un estanque de la Autopista Sur en Valencia

Ronald Acuña Jr podría ser activado para triplete contra Baltimore

Iniciada conmemoración de los 55 años de la parroquia Miguel Peña en Valencia

Fuerte choque frontal deja dos heridos en El Socorro

Más Leídas

Hallan el cuerpo sin vida de una mujer en un estanque de la Autopista Sur en Valencia

Ronald Acuña Jr podría ser activado para triplete contra Baltimore

Iniciada conmemoración de los 55 años de la parroquia Miguel Peña en Valencia

Fuerte choque frontal deja dos heridos en El Socorro