Sobre el modelo espacial de la opinión pública, primera parte: exploración de opciones gráficas

May 10 2022
Introducción:
El año pasado escribí un artículo sobre este popular gráfico que pretendía mostrar “dos dimensiones” de la opinión pública: Desde entonces, he estado pensando mucho en estos modelos dimensionales o espaciales de la opinión pública, y en las diferentes formas en que podría ser capaz de visualizar y comprender instancias de ellos. Después de todo, el modelo espacial sigue apareciendo.

El año pasado escribí un artículo sobre este popular gráfico que pretendía mostrar “dos dimensiones” de la opinión pública:

Desde entonces, he estado pensando mucho sobre estos modelos dimensionales o espaciales de la opinión pública, y sobre las diferentes formas en que podría visualizar y comprender instancias de ellos. Después de todo, el modelo espacial sigue apareciendo. La popularidad de los “memes de la brújula política” es simplemente otro ejemplo:

¿Qué es el modelo espacial?:

El modelo espacial o dimensional de la votación y la opinión pública es el siguiente: Las personas pueden modelarse como puntos en una línea o en un espacio n-dimensional, con diferentes temas o proyectos de ley o preguntas modelados como líneas o planos que los separan.

Por ejemplo, bajo el modelo unidimensional, debería poder alinear a todos los encuestados de manera consistente, para poder separar a las personas por su elección (binaria) de color favorito:

O por su elección (binaria) de helado favorito:

¿Por qué un enfoque gráfico?:

No tengo ningún problema matemático o sustantivo con algoritmos como "DW-Nominate" o "ideal". Se trata más de un principio general. En general, siempre preferiría tener una visualización de datos, basada en cálculos bastante simples, que pueda verificar antes de ejecutar el algoritmo, no después. A modo de comparación, antes de ejecutar una regresión lineal, podría hacer un diagrama de dispersión de las variables dependientes independientes y principales, para asegurarme de que la regresión lineal sea incluso el enfoque correcto.

En otras palabras, me gustaría asegurarme de que puedo detectar al gorila , que puedo inspeccionar y explorar la estructura de los datos y ver qué se destaca, antes de hacer operaciones matemáticas avanzadas:

Creo que esto también es importante para la persuasión. Cuando se escribe sobre DW-Nominate o puntos ideales, la gente suele mostrarse escéptica , y creo que eso se debe a que los algoritmos parecen una caja negra, con los datos sin procesar que conducen a los resultados invisibles.

El caso unidimensional:

Comenzaré con el caso más simple: un modelo espacial unidimensional. Recuerde que el modelo espacial asigna personas a puntos y los divide por preguntas o temas. (En general, para la opinión pública y los datos de votación, diré que las preguntas tienen "respuestas de izquierda" o "respuestas de derecha", aunque no voy a entrar en cuál es chocolate y cuál es vainilla).

Considere el ejemplo anterior del color favorito y el helado. Tenga en cuenta que, considerando ambas líneas, todos están en uno de los tres grupos:

A todos les gusta el chocolate y el verde (porque están a la izquierda de ambas líneas), o les gusta el vainilla y el verde (porque están entre las dos líneas), o les gusta el vainilla y el amarillo (porque están a la derecha de ambas líneas). No hay forma de que las personas a las que les gusta el chocolate y el amarillo encajen en este modelo.

En otras palabras: en un modelo espacial puramente unidimensional, para cualquier Q1 y Q2, en las respuestas aparecerán como máximo tres de las cuatro combinaciones posibles de (sí/no) sobre (Q1/Q2).

Este hecho matemático tiene una clara interpretación visual si trazas los datos de una manera particular. Escribí un simple "caso unidimensional" simulado. Para cualquier pregunta, dividí a los encuestados en aquellos que dieron una "respuesta de izquierda" y una "respuesta de derecha", y comparé qué porcentaje de ellos dio la "respuesta de izquierda" para cada otra pregunta:

Por ejemplo, el 100 % de las personas que dieron una respuesta de izquierda a la pregunta 15 también dieron una respuesta de izquierda a la pregunta 13, la pregunta 9, la pregunta 12, la pregunta 2 y la pregunta 11, aunque se dividieron en las demás, con solo alrededor de 40 % que da una respuesta de izquierda a P14. Y el 100 % de las personas que dieron una respuesta de derecha a la pregunta 8 dieron respuestas de derecha a cada una de las preguntas 14, 16, 7, 10, etc., aunque se dividieron en las demás, con alrededor del 15 % dando una respuesta de izquierda. respuesta a P1.

En otras palabras, cuando divido por Q15, las preguntas "más fáciles" aparecen "en el eje y", ya que todos los que dieron una respuesta de izquierda a Q15 necesariamente dieron respuestas de izquierda a esas preguntas. Y las preguntas "más difíciles" aparecen "en el eje x", ya que todos los que dieron una respuesta de derecha a la P15 dieron respuestas de derecha a esas preguntas. De cualquier manera, en un modelo unidimensional, cada vez que divido por una pregunta, todas las demás preguntas aparecen "en los ejes", ya que solo se completan tres de las cuatro tablas de referencias cruzadas posibles.

Como resultado, puedo hacer el gráfico anterior para cada pregunta, y ese mismo patrón en forma de L es evidente:

Tenga en cuenta que podría hacer este gráfico para un conjunto de datos del mundo real, no solo uno simulado. Cuanto más se parezca una gráfica de un conjunto de datos del mundo real a este caso simulado, con cada pregunta terminando en los ejes en el mismo orden, más cerca probablemente estará el conjunto de datos del mundo real de ajustarse a un modelo unidimensional, como el caso simulado.

El caso bidimensional (más simple):

El gráfico aplicado a un caso unidimensional puro es bastante sencillo. ¿Qué pasa con un caso bidimensional puro?

El caso bidimensional más simple es cuando cada pregunta divide a los encuestados por completo en una dimensión u otra. En otras palabras, cada encuestado es un punto en un espacio bidimensional, pero las preguntas solo pueden dividirlos "horizontalmente" (llame a esas preguntas "Tema 1") o "verticalmente" ("Tema 2").

Recuerde el ejemplo anterior y diga que el helado favorito y el color favorito son "Tema 1", dividiendo a los encuestados "horizontalmente":

Mientras que otra pregunta, tal vez "¿asiento de ventana o asiento de pasillo?", divide a los mismos encuestados verticalmente:

(Puede pensar en esto como "dos copias ortogonales del caso unidimensional" en lugar del "caso bidimensional completo", donde también puede haber preguntas correspondientes a líneas diagonales que dividen a los encuestados, pero eso es un poco más complicado. )

Ejecuté otra simulación básica del caso bidimensional más simple e hice el cuadro anterior nuevamente para cada pregunta:

Tenga en cuenta que, para las preguntas sobre el mismo "tema" que la pregunta de división, es lo mismo que en el caso unidimensional: terminan en los ejes.

¿Qué pasa con las preguntas en el otro "tema" que no sea la pregunta de división? ¡Terminan en la diagonal!

Y tenga en cuenta también que, si no lo supiera antes de tiempo, esta visualización revelaría qué preguntas corresponden a qué temas/dimensiones.

Por lo tanto, estos gráficos pueden interpretarse con esa regla general: en comparación con la pregunta de división, las preguntas de la misma dimensión terminan en los ejes, las preguntas de dimensiones ortogonales terminan en la diagonal, las preguntas de dimensiones intermedias terminan en algún lugar entre.

Conclusión:

¿Puede este enfoque gráfico revelar información interesante sobre la estructura espacial en un conjunto de datos del "mundo real"? En la siguiente parte de esta serie, aplicaré este enfoque gráfico a un conjunto de datos del "mundo real" ampliamente considerado como una de las mejores aplicaciones para los modelos espaciales: la votación nominal en el Congreso.

© Copyright 2021 - 2022 | unogogo.com | All Rights Reserved