Articulo de El Estadista: "Un Cafecito para Scioli"

 

Twitter de los politicos

A modo de introduccion: A partir de la nota "Un Cafecito para Scioli", recibimos solicitudes para incorporar mas politicos a la base de datos y explicar con mayor detalle como procesar los datos. En esta pagina ponemos a disposicion datos para mapear las preferencias de 127 politicos argentinos. Tambien explicamos como bajar los datos de Twitter, como procesarlos y como producir los estimados del articulo. Luego de agregar politicos y depurar la data, las posiciones de los politicos cambiaron ligeramente en el mapa. La descripcion que presentamos en el articulo se mantiene, pero para obtener un mapa identico al del articulo hacer click aqui.

Para los usuarios de R que quieran toda la data en un objeto .RData por favor solicitarlo a ecalvo@umd.edu. Para los demas usuarios, presentamos la data en formato "Comma-Delimited". Pueden abrirlo con excel o importarlo a Stata, SPSS u otro paquete estadistico.

Para los Impacientes, aqui pueden bajar las distintas bases de datos:

Base de Datos 1: Los 127 politicos argentinos con su informacion de Twitter

BASE 1

Esta base tiene 127 observaciones y 17 Variables. Los nombres de las variables son los campos de "Twitter" tal y como son creados por el paquete "TwitteR" en R 3.01. Ello incluye el nombre del politico, la cantidad de seguidores, la cantidad de amigos, la descripcion escrita por el titular de la cuenta, etc.

Base de Datos 2: 59,808 "amigos" de los politicos con su informacion de Twitter

BASE 2

Esta base tien 59,808 observaciones y 16 variables, describiendo a los "amigos" de los politicos en twitter (a quienes siguen los politicos). La informacion de los politicos que tiene mas de 10,000 "amigos" fue truncada. La base incluye las mismas variables que las de los politicos argentinos (algunos incluidos tambien en esta base como amigos de otros politicos).

Base de Datos 3: La lista completa de los "amigos" de los politicos (ID)

BASE 3

Esta base tiene 409,616 observaciones y 2 variables, conectando politicos y amigos. Con ella se arma la matriz de afiliacion para estimar las posiciones de los politicos.

Base de Datos 4: Matriz de Afiliacion (Relacion entre Politicos).

BASE 4

Esta base tiene 127 observaciones y 127 columnas. Cada celda describe la cantidad de amigos en comun de cada politico argentino. Esta matriz de afiliacion puede ser considerada como una medida de "coincidencias." Con un poco de estadistica, puede ser transformada en "distancias" entre los politicos.

 

Como estimamos la posicion de los politicos?

Todas las actividades sociales revelan informacion sobre el proceso social que genera la data. Por ejemplo, los politicos firman mas proyectos con pares con los que tienen afinidad, votan junto con su bloque, participan en comisiones con colegas que tienen similares perfiles profesionales, etc. En las redes sociales los politicos tambien revelan informacion sobre sus preferencias. Por ejemplo, politicos con afinidades ideologicas pueden elegir utilizar los mismos terminos. Por ejemplo, palabras como "la corpo", "instituciones republicanas", "gorila", "autoritarismo," son pronunciadas con distinta frecuencia por politicas de los distintos partidos. Del mismo modo, a quien le solicitamos que sea nuestro "amigo" varia de modo sistematico. No es lo mismo agregar como amigo a 6,7,8 que al diario La Nacion.

Para estimar la proximidad entre politicos en las redes sociales existen muchas opciones. Una opcion es crear una "Matriz de afinidad" que cuenta la cantidad de coincidencias (cuantos amigos en comun) tienen los politicos en las redes sociales.

Por ejemplo, en la siguiente Matriz de Afiliacion podemos ver que Cristina Fernandez de Kirchner tiene 57 "amigos" a los que sigue. De ellos, hay 30 que son compartidos con Agustin Rossi, comparado con tan solo 4 que comparte con Bonfatti, 7 con Estenssoro y 4 con GugaLusto.

Agustinrossi AntonioBonfatti CFKArgentina EstenssoroME GugaLusto
Agustinrossi 500 30 30 27 16
AntonioBonfatti 30 122 4 20 9
CFKArgentina 30 4 57 7 2
EstenssoroME 27 20 7 198 27
GugaLusto 16 9 2 27 126

 

El conjunto de datos presentados en la matriz de afiliacion nos da una radiografia de los amigos en comun, la cual puede ser transformada (resumida) en valores en un espacio cartesiano.

Existen una gran variedad de estrategias para reducir mucha informacion a unas pocas coordenadas. Para el articulo de el Estadista utilizamos estadistica de Componente Principal, pero podriamos tambien haber utilizado analisis de redes, SMACOF, analisis factorial, etc. El codigo para estimar estos datos en R se encuentra aqui.

Tomando las primeras dos dimensiones (los dos primeros componentes), podemos crear el mapa del articulo. En realidad, el primer componente explica la mayor parte de la variacion en nuestra data:

Una vez que ponemos los puntos en el espacio que describen la proximidad relativa de los politicos (en funcion del numero de amigos que tienen), podemos utilizar analizar la densidad de los puntos en el espacio usando el paquete "KernSmooth" en R. Eso genera los contornos:

 

Creacion de mapa de Twitter utilizado en el articulo "Un Cafecito para Scioli"

Aqui ponemos la data original del articulo y el codigo para producir los graficos en R 3.01. La data utilizada en el articulo fue recolectada por Martin Gonzales y Juan Manuel Garcia. Es distinta que los datos en las Bases 1, 2, 3 y 4 (un menor numero de politicos y los amigos fueron truncados por debajo de 3000).

Dato y Codigos de la articulo del Estadista.