#Campaña26J: ¿Qué candidato recibe más apoyo real en Twitter? #periodismodatos

El objetivo de este análisis es intentar averiguar, sin que haya lugar a dudas, cuál de los cuatro candidatos a la presidencia de Gobierno de España recibe más apoyo en la red social Twitter, así como el orden en que quedarían situados los tres restantes.candidatos

Se han tomado dos períodos de estudio en función de cuál haya sido el endpoint de la API de Twitter utilizado para la extracción de datos: el primero va del 1 de enero al 4 de junio de 2016 y el segundo del 4 de mayo al 4 de junio.

De forma intencionada se ha prescindido de las habituales estadisticas de followers ya que desde nuestro punto de vista no reflejan de manera idónea el apoyo suscitado por los candidatos. Tampoco se han utilizado en este caso las menciones hacia los candidatos ya que en ellas se mezclan opiniones de apoyo y de rechazo difíciles de catalogar. En su lugar se han analizado mediante varias técnicas los retweets (RTs) y los favoritos/likes (FAVs) recibidos por las cuentas Twitter de los candidatos, cuentas_candidatosAl mismo tiempo se ha intentado estimar el peso del tuiteo masivo del ciberactivismo de cada partido sobre los retweets que reciben los candidatos con objeto de saber en qué medida es real el apoyo que reciben en esta red social.

 

1. ANÁLISIS DE RETWEETS

retweetLos RETWEETS (RTs) se producen cuando alguien reenvia tweets emitidos por otros usuarios. Las personas más influyentes obtienen más RTs. Por ello el número de RTs  que reciben los candidatos a las elecciones 26J puede servir como referencia del grado de aceptación que tienen en redes sociales.

Retweets recibidos por cada candidato

En el siguiente gráfico se ha representado la cantidad de retweets semanales recibidos por los cuatro candidatos desde el 1 de enero hasta el 4 de junio de 2016.Comp_RTs_ene_jun_1

Durante el período analizado la cuenta que recibió más retweets fue la de @pablo_iglesias_ (PODEMOS) seguido de @albert_rivera (CIUDADANOS), @sanchezcastejon (PSOE) y @marianorajoy (PP)

Al representar la cantidad diaria de retweets recibidos durante el mismo período, se obtiene un gráfico algo más enrevesado pero que permite ver cuales han sido las fechas más significativas desde el punto de vista de la repercusión de los tweets de los candidatos.Comp_RTs_Ene-Jun_DIARIOLos dos tweets más retuiteados corresponden a @pablo_iglesias_ y @albert_rivera. El primero, un tweet en clave de humor que incluía vídeo, alcanzó los 24.684 RTs; y el segundo, tratando sobre ETA (Otegui) y Venezuela (Leopoldo López), los 17.487 RTs.top_2En el ranking de los 10 más retuiteados encontramos 8 tweets de @pablo_iglesias_ y 2 de @albert_rivera. Este resultado puede ser interpretado como un indicio de la superioridad de los “nuevos partidos” en las redes sociales frente a los partidos tradicionales.top10 De hecho, el primer tweet de @marianorajoy figura en la posición 13 y el más retuiteado de @sanchezcastejon no aparece hasta la posición 65. pos13y65

Rendimiento de los tweets

Podría darse el caso de que alguno de los candidatos sea un gran emisor de tweets, y por ello obtenga al final más cantidad de RTs que el resto de los candidatos por el mero hecho de ser más activo en la red social. Para informar sobre esa posibilidad es útil el parámetro que representa el número de retweets obtenidos por cada tweet enviado como forma de calcular el rendimiento medio obtenido por cada tweet. La evolución comparada de este ratio se puede ver en el siguiente gráfico en el que por períodos semanales se ha dividido el número de RTs obtenidos por cada candidato entre el número de tweets que había emitido.RTsportweet1No se aprencian variaciones respecto a los resultados obtenidos por retweets totales. La mayor parte de las semanas el candidato que obtuvo más retweets por cada tweet enviado fue Pablo Iglesias, aunque en tres ocasiones Albert Rivera consiguió ponerse por delante en el rendimiento obtenido de los tweets, la última de ellas durante su reciente viaje a Venezuela. Son precisamente los dos candidatos que reciben menos RTs quienes obtienen un rendimeinto más bajo por sus tweets.

¿Influyen los retweets masivos en estos resultados?

Acabamos de ver la cantidad de retweets que han recibido los cuatro candidatos durante lo que va de año 2016. Teniendo en cuenta dicho parámetro Pablo Iglesias se perfila como el candidato con más tirón en Twiiter, seguido por Albert Rivera, Pedro Sánchez y Mariano Rajoy. Pero, ¿que hay de la calidad de los retweets? A continuación trataremos de comprobar si los retweets recibidos por los candidatos representan realmente el apoyo de los usuarios de Twitter, estimando en qué medida están influidos por el ciberactivismo de partido.

Composición de los retweets

En general la cantidad de RTs hacia una cuenta expresa de una manera bastante fiable el interés de los usuarios de Twitter por los contenidos que esta genera, y también el grado de simpatía o admiración que despierta. Sin embargo en ocasiones la cantidad de RTs es aumentada artificialmente mediante retweets masivos. En el ámbito político esto ocurre principalmente de dos maneras:

  • retweets procedentes de ciberactivistas políticos organizados desde cada partido. Son personas comprometidas con un proyecto político, que emiten desde sus propias cuentas o bien desde cuentas de partido asociadas a diferentes localidades. Pensamos que es una manera lícita de promoción siempre que los RTs se hagan desde las propias cuentas de los ciberactivistas o desde cuentas reales de partido. De esta manera cualquier lector del tweet podrá conocer la implicación de la cuenta emisora con la ideología que transmite.
  • retweets emitidos por cuentas de perfil falso (también llamadas bots), cuyos contenidos ideologizados son proporcionados por un administrador, bien de manera manual, bien de manera automatizada mediante determinadas herramientas. Estas emisiones son consideradas spam político y pretenden promocionar una determinada ideología, partido político o persona. El engaño está en que pretenden ser opiniones espontáneas de personas desvinculadas con la política. Tendemos a dar menos credibilidad a las informaciones que llegan desde cuentas de un partido o personas identificadas con el mismo. Por eso en algunas ocasiones se intenta modificar el voto de los usuarios de Twitter mediante redes de perfiles falsos. En Twitter Bots hemos dedicado el último año y medio a denunciarlas.

Detección de retweets masivos

Una parte de los retweets recibidos por los cuatro candidatos fue realizada desde cuentas de tuiteo masivo, generalmente procedente de cuentas de partido y ciberactivistas. Para estimar el peso que tienen los retweets masivos hemos calculado, para cada candidato, una curva que representa el número de RTs recibidos en el período de estudio en función de la cantidad total de RTs sobre el candidato que emitieron sus retuiteadores. Para entenderlo utilizaremos la curva de los RTs obtenidos por los tweets del candidato Pedro Sánchez.ejemplo_sanchezcastejonEl período analizado ha sido los 30 días que van desde el 4 de Mayo hasta el 4 de junio de 2016. En la parte de abajo (eje x) se pueden ver cantidades que van desde 0 hasta 400. Ahí se van a representar los RT totales (sobre el candidato) que ha enviado cada una de las cuentas que retuitearon a @sanchezcastejon. En el eje vertical (eje y) se muestran unas cantidades entre 0 y 70.000 que se corresponden con el número de retweets recibidos por @sanchezcastejon en dicho período. Como ejemplo, el punto negro situado en la curva, cuyas coordentadas son 150 (eje x) y 20.000 (eje y), significa que el número total de RTs emitido por las cuentas que han hecho 150 o más retweets hacia @sanchezcastejon durante el período de estudio es de 20.000. Cuanto más pegada hacia los dos ejes esté la curva, menos afectado por retweets masivos está el candidato.

Se han representado en un mismo gráfico las curvas correspondientes a los cuatro candidatos, expresándolas en porcentaje sobre los RTs totales para permitir su comparación.

comparativa_RTs_masivos2La curva que aparece más ajustada hacia los ejes es la de los retweets recibidos por Albert Rivera y las más alejada la de Pedro Sánchez. Independientemente de lo que cada cual considere retweets masivos o ciberactivismo (nosotros hemos fijado el umbral en los 2 RTs diarios sobre el candidato, 60 al mes), este gráfico permite comparar en qué medida llos líderes de los cuatro principales partidos de España son beneficiados por las cuentas de retuiteo masivo.

El PSOE se perfila como el más beneficiado por las emisiones masivas en Twitter. Esto concuerda con las menciones masivas hacia @sanchezcastejon halladas en el estudio sobre el debate a tres que tuvo lugar el 7 de diciembre de 2015, en el que encontramos cuentas pertenecientes al antiguo Equipo Sugus ejerciendo un agresivo ciberactivismo. El PP es el segundo más beneficiado por los retweets masivos, seguido de PODEMOS y CIUDADANOS en tercer y cuarto puesto.

Las principales cuentas que aparecen como grandes retuiteadoras pertenecientes al ciberactivismo de cada partido (las 20 primeras de cada uno) figuran en la siguiente lista junto al número de RTs que hicieron sobre los candidatos en el período analizado. Obviamente es sólo una muestra, y hay bastantes más.cuentas_rt_masivo_1Hemos encontrando cuentas ciberactivistas en los cuatro principales partidos políticos de España. La proporción de los retweets masivos sobre los RTs totales es mayor en el caso de los partidos tradicionales (PSOE y PP), seguramente para compensar su menor influencia en redes sociales. Hay que hacer notar que en la imagen anterior solamente se están considerando retweets hacia los cuatro candidatos, siendo su volumen de emisiones mucho mayor.

Se constata que los cuatro candidatos son beneficiados por retweets masivos desde cuentas ciberactivistas. El porcentaje de retweets masivos que recibe cada candidato depende el umbral que se fije para considerarlos masivos. Por ejemplo, si tomamos ese umbral como 60 tweets/mes hacia un candidato (ver gráfico), el 40% de los retweets que obtiene Pedro Sánchez (PSOE) procederían del ciberactivismo de su partido; al igual que el 19% de los que obtiene Mariano Rajoy (PP), y el 11% de los que obtienen Pablo Iglesias (PODEMOS) y Albert Rivera (CIUDADANOS). Los candidatos que aparecen más beneficiadas por el retuiteo masivo son precisamente los que obtienen menos RTs en sus tweets. Los porcentajes varían según el umbral que se tome

 

2. ANÁLISIS DE LOS FAVs

El FAV es otra manera de interactuar puesta a disposición de los usuarios de Twitter. Inicialmente estaba pensado para marcar tweets como favoritos, pero desde finales de 2015 se cambió la habitual estrella por el símbolo de un corazón para unificarlo con el Like de otras redes sociales. CambioFAVsEs utilizado de diferentes formas aunque el uso más generalizado es seguramente para mostrar el acuerdo o agrado por el contenido de un tweet o por quien lo emite. El total de RTs y FAVs alcanzados por un tweet es la suma de estas tres posibilidades:

  • usuarios que han hecho retweet pero no lo marcaron como FAV: hay personas que no acostumbran a utilizar el FAV o sólo lo hacen en contadas ocasiones. También puede darse el caso de que un tweet sea retuiteado aunque no se esté de acuerdo con su contenido.
  • usuarios que han hecho retweet y también marcado como FAV al mismo tiempo: les gusta el tweet (FAV) y lo comparten (RT).
  • usuarios que lo han marcado como FAV pero no lo han retuiteado: en algunos casos el contenido de un tweet ha gustado, pero el usuario no quiere retuitear a la persona que lo ha emitido.

La mayoría de los tweets consiguen más RTs que FAVs, ya que normalmente la primera de las tres posibilidades mencionadas supera a la tercera de ellas. En las siguientes líneas se ven varios ejemplos de tweets en los que sin embargo el número de FAVs ha superado al de RTs. Hemos seleccionado uno de cada candidato.

Este tweet de @pablo_iglesias_ celabrando el nuevo nombre de la coalición para las eleccioens del 26J, consiguió una parte considerable de sus de FAVs (símbolo de corazón) de personas que sin embargo no lo retuitearon (7.916 FAVs frente a 6.713 RT). Una posible explicación es el apoyo al tweet con FAVs por parte de algunas personas pertenecientes a Izquierda Unida, socio de coalición, que sin embargo prefieren no retuitear al lider de PODEMOS.

ej_FAV-RT_1Algo simliar ocurre con este tweet de @albert_rivera en el que hace mención al tema del terrorismo y homenajea a sus víctimas recibiendo 4.364 FAVs frente a 3.878 RTs. Probablemente ha recibido apoyos en forma de FAVs desde sumpatizantes del Partido Popular u otro partido, y que sin embargo prefieren no retuitearlo.ej_FAV-RT_2Otro ejemplo, en este caso de un tweet de @sanchezcastejon emitido como recuerdo hacia el político y activista Pedro Zerolo, muestra nuevamente cómo se puede marcar un tweet como FAV por simpatía hacia su contenido, aunque no se quiera beneficiar con un RT a quien lo emite.ej_FAV-RT_3Por último el ejemplo correspondiente a @marianorajoy donde se hace referencia al independentismo y radicalismo, y que también ha conseguido más apoyos en forma de FAV que retweets.ej_FAV-RT_4

Comparación entre los candidatos

Es interesante establecer el peso que tienen los FAVs en los tweets de cada uno de los candidatos. Hemos calculado en primer lugar el porcentaje de FAVs sobre el total de FAVs y RTs de todos los tweets emitidos por los candidatos en dos períodos: el último mes y lo que va de 2016.

Período 04-05-2016 a 04-06-16 (último mes)

Porc_FAVs

Período 01-01-2016 a 04-06-2016 (desde comienzo de año)Porc_FAVs_Ene-MayEn ambos períodos el candidato que acumula más FAVs y RTs en sus tweets es Pablo Iglesias, dándose la circunstancia de que suman más de el doble de los recibidos por Albert Rivera, situado en segunda posición. Pedro Sánchez y Mariano Rajoy oculpan tercer y cuarto puesto bastante igualados. Estos resultados podrían estar relacionados con el hecho de que el electorado y simpatizantes PSOE y PP se sitúan predominantemente en la población de mayor edad, con menor penetración en redes sociales.

El gráfico de FAVs de los candidatos es muy similar al gráfico de RTs mostrado anteriormente. De hecho, son casi idénticos, ya que el número de RTs y FAVs de un tweet suele ser bastante similar.FAVs-2016

 

Los FAVs y las redes de perfiles falsos (bots)

Hemos visto antes cómo de los retweets era posible extraer información sobre la actividad de RTs masivos que favorecían a los candidatos. De una manera más indirecta (la API de Twitter no permite la extracción de listados de FAVs) es posible detectar casos en los que una cuenta es favorecida por retweets masivos procedentes de redes de perfiles falsos. bots2Nos valdremos de un hecho que hemos constatado repetidamente: las redes políticas de bots son utilizadas normalmente sólo para hacer retweets, no para emitir FAVs. Sólo en una ocasión encontramos una peculiar red que lo hacía.

Como ejemplo ilustrativo, que además sirva para poder comparar después con los cuatro candidatos, necesitaremos una cuenta que sea retuiteada masivamente por perfiles falsos. Utilizaremos la del conocido y reincidente spammer político @andres_cano42 (Andrés Cano Bonillo, del Partido Popular), que se sirve de una red de casi 50 bots que hacen RT sobre muchos de sus tweets. Desde febrero de 2016 esta red lleva emitidos más de 284.000 tweets. andres_cano42_BAunque fue denunciada por este blog  en mayo de 2016, sigue emitiendo grandes cantidades de spam político destinado a los usuarios de Twitter, sin que desde @TwitterSpain se haya tomado ningún tipo de medida.

Hemos representado los RTs y FAVs recibidos por @andres_cano42 desde enero a junio de 2016.RTs_FAVs_andres_cano42En este gráfico saltan a la vista dos aspectos que delatan la presencia de retweets masivos hacia @andres_cano42 emitidos desde cuentas de perfil falso:

  • la diferencia entre la cantidad de RTs y FAVs es mucho mayor de lo que sería normal.
  • las curvas de RTs (azul) y FAVs (roja) deberían de estar alineadas, con muy similares fases de crecimeinto y decrecimiento; sin embargo no se aprecia apenas correlación entre ellas.

Estos dos síntomas, cuando son muy evidentes, indican que con gran probabilidad una cuenta es favorecida mediante RTs por redes de perfiles falsos.

El aspecto que presentan las mismas curvas para cada uno de los cuatro candidatos difiere bastante de las de @andres_cano42. Ambas curvas (FAVs y RTs) están alineadas, manteniéndose la diferencia RT – FAV dentro de unos márgenes que indican que los RTs procedentes de redes de bots no son significativos.RT-FAV-candidatosEn algunos períodos la media semanal de FAVs (línea roja) es superior incluso a la de RTs indicando abundancia de tweets en los que hay usuarios apoyando con fav, pero sin reenviar, como se vió más arriba.

Los posibles RTs procedentes de redes de cuentas de perfil falso (bots) no son significativos respecto al total de retweets recibidos por los candidatos.

 

4. INFLUENCIA DE LOS RETWEETS MASIVOS SOBRE CADA CANDIDATO

Los retweets masivos emitidos por cuentas ciberactivistas de partido no muestran un apoyo espontáneo hacia el candidato. Al contrario, es un apoyo incondicional y acrítico repetido artificialmente, y cercano en muchos casos a la propaganda. En este apartado intentaremos aproximarnos al fenómeno de los retweets masivos desde una nueva óptica consistente en cuantificar el número de cuentas únicas que hacen RT sobre cada tweet y compararlo con los RTs que recibe, mostrando los resultados diarios. El volumen de datos necesitado para este tipo de análisis es mayor que antes, por lo que el período de estudio será desde el 04-05-2016 al 04-06-2016, es decir, los últimos 30 días.

Para cada candidato se han confeccionado dos gráficos.  En el de la izquierda se muestran dos líneas:

  • la línea azul: representa la suma de RTs diarios que ha recibido el candidato
  • la línea rosa: es el número de cuentas diferentes que han emitido dichos RTs

Cuanto más próximas y alineadas estén ambas líneas, más representativos son los RTs que recibe el candidato del apoyo espontáneo que recibe en Twitter.  El gráfico de la derecha es el que permite la comparación entre los distintos candidatos al referirse al porcentaje de cuentas únicas sobre el total de RTs. Estos son los resultados para cada candidato:

PEDRO SÁNCHEZ

A partir del 8 de Mayo el porcentaje de cuentas únicas en los RTs sobre la cuenta de @sanchezcastejon cae hasta niveles inferiores al 30%, perdiendo la curva a de cuentas únicas alineación con la curva de retweets. Son signos evidentes de retweets masivos procedentes del equipo de ciberactivistas del PSOE actuando de manera continuada. El carácter espontáneo de los RTs que recibe Pedro Sánchez queda bastante desvirtuado.

RM_sanchezcastejon

MARIANO RAJOY

Retweets masivos de manera discontinua, evidenciados por perdidas de alineamiento entre la curva de cuentas únicas y la curva de retweets. El ciberactivismo se activa a impulsos, lo cual se traduce en los dientes de sierra observados en el gráfico de la derecha. Obsérvese en el gráfico de la izquierda la óptima alineación entre los días 15 y 20 de mayo, período en que hubo poca actividad ciberactivista.RM_marianorajoy1

ALBERT RIVERA

Desde el 4 hasta el 23 de mayo los retweets sobre @albert_rivera muestran una baja incidencia de retweets masivos. Sin embargo a partir del día 23 de mayo, coincidiendo con su estancia en Venezuela, la cuenta de Albert Rivera recibió varias decenas de miles de retweets coincidiendo con una drástica caida del porcentaje de cuentas únicas (cuadro de la derecha) que bajó hasta el 30%. Durante esos días se vió beneficiado por los RTs del ciberactivismo opositor a Maduro. Se observa cómo al volver Albert a España los RTs sobre sus tweets caen drásticamente, aumentando el porcentaje de cuentas únicas hasta una media cercana al 70%.

RM_albertriveraHemos hecho un pequeño ejercicio consistente en segmentar los retweets recibidos por @albert_ribera el tiempo que estuvo en Venezuela, y también los días anteriores y posteriores. El parámetro elegido para la segmentación es el “Timezone”, que informa de la zona horaria configurada por las cuentas que emiten los tweets. Dado que es voluntario configurar este parámetro, en muchos casos figura como ‘None’, pero en este caso el Timezone servirá de aproximación.  Observando la línea roja se aprecia cómo @albert_rivera comienza el día 23 de mayo a ser retuiteado por cuentas configuradas con la zona horaria ‘Caracas’ (línea roja), superando estas incluso a las configuradas con la zona horaria ‘Madrid’ (línea azul). A su vuelta a España dicho fenómeno desaparece.Timezone_caracas

PABLO IGLESIAS

La curva de cuentas únicas estuvo alineada con la curva de retweets sobre @pablo_iglesias_ durante el período estudiado. En el gráfico derecho se observa que el porcentaje de cuentas únicas no baja del 70%, lo que indica que la cantidad de retweets masivos de los ciberactivistas de PODEMOS no llega a ser significativa frente al total de RTs recibidos por el candidato.

RM_pabloiglesias

Por último, y para que sirva de comparación, recurriremos nuevamente a la cuenta del influencer del Partido Popular Andrés Cano (@andres_cano42), mostrando los mismos gráficos para el período que va desde el 24/05/16 al 09/06/16 (que son los datos de que disponemos).RM_andres_cano42Como era de esperar, las curvas de cuentas únicas y RTs prácticamente no están alineadas y el porcentaje de cuentas únicas oscila en valores que van del 20 al 40%. Estos resultados son coherentes con el hecho de que los tweets de @andres_cano42 son extensamente retuiteados tanto por el ciberactivismo del Partido Popular como por el ciberactivismo opositor en Venezuela.

Mediante esta forma de detectar la actividad ciberactivista han quedado confirmadas las estimaciones obtenidas en el apartado primero sobre en qué medida están afectando, para cada candidato, los retweets masivos procedentes del ciberactivismo de partido al parámetro de los RTs recibidos como métrica para el apoyo espontáneo del candidato en Twitter. Por una vía diferente se vuelve a llegar a la conclusión de que Pedro Sánchez es el candidato más beneficiado por el ciberactivismo, seguido por Mariano Rajoy. El peso de los retweets ciberactivistas estaría bastante igualado para los otros dos candidatos, si bien en parte del período estudiado Albert Ribera se vio beneficiado por los retweets del ciberactivismo opositor venezolano.

 

4. RESULTADOS

Los retweets (RTs) y favoritos/Likes (FAVs) pueden utilizarse para medir el apoyo hacia un candidato. Dado que una parte de los retweets que reciben los candidatos son RTs masivos fue necesario estimar su porcentaje para cada uno de los candidatos. Estableciendo un umbral exigente de lo que se considera ciberactivismo se calcularon los siguientes porcentajes de retweets masivos durante el período estudiado: Pedro Sánchez (40%), Mariano Rajoy (19%), Pablo Iglesias y Albert Rivera (ambos 11%). Una vez descontados de las cantidades respectivas de retweets el resultado es el siguiente:resultados_finalesHay que hacer notar que la elección del umbral de lo que se considera ciberactivismo (60 tweets/mes sobre el candidato) podría haber sido cualquier otra sin afectar a las posiciones relativas de los candidatos en los resultados finales.

Utilizando el número de retweets y favoritos/likes como medida del apoyo de los usuarios de Twitter hacia los candidatos y después de descontar los retweets masivos procedentes del ciberactivismo de partido, el candidato que recibe más apoyo de los usuarios de Twitter ha resultado ser Pablo Iglesias siendo destacable la gran diferencia que le separa de los otros tres candidatos. En segundo lugar por apoyo recibido lo obtivo Albert Ribera y la tercera posición fue para Mariano Rajoy. El candidato Pedro Sánchez ha quedado en último lugar dado el alto nivel de retweets masivos que una vez descontados le colocaron en apoyo real por debajo de Mariano Rajoy.ranking-1Estaríamos encantados en recibir opiniones, sugerencias, críticas razonadas y cualquier tipo de realimentaición de los lectores sobre este estudio.
BotsPoliticosNoSi te ha parecido interesante puedes difundirlo en redes sociales y sitios web agregadores de noticias.

nuestra cuenta en twitter: @BotsPoliticosNo

Pagina Principal

Licencia Creative Commons
Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial 4.0 Internacional.

Anuncios

#ELPAISDebate ¿Qué opinó realmente la gente?

1B

El 30 de Noviembre tuvo lugar un debate organizado por el diario El País con la presencia de los candidatos de PSOE, Ciudadanos y PODEMOS, definido por su organizador como “el primer gran debate electoral de la democracia a través de internet”. Se puede visionar en este o en este otro enlace.

ImagenDebateNuestro propósito es tratar de sondear cuál fue la opinión de la audiencia que vió el debate, a través de los comentarios que se emitieron en Twitter durante el mismo y ver si coincide con los resultados de las encuestas que se realizaron ese día.

A través de la API de Twitter hemos extraido todos los tweets que contienen el hashtag #ELPAISDebate hasta el día 1 de Diciembre a las 13:00h. En total son 311.120 tweets, aunque nos hemos centrado en el análisis de la parte de ellos que se emitió durante el debate, que tuvo lugar entre las 21 h y las 23h.

notas1

 

 

1. EL DEBATE Y LAS ENCUESTAS

En el siguiente gráfico está representado el número de tweets emitidos en dicho hashtag por períodos de 1 minuto, desde unas horas antes del comienzo del debate hasta el mediodía del día siguiente. La zona coloreada en verde corresponde al tiempo durante el cual se emitió el debate.

Grafico1Durante buena parte del debate el ritmo de emisión de tweets estuvo por encima de los 2.000 tweets por minuto, tal como muestra este gráfico.

Grafico1bSe hicieron dos encuestas entre el público que seguía el debate por internet durante la retransmisión del mismo:

Encuesta de El País en web

El Diario El País organizó una encuesta a la que se podía acceder a través de su página web. Una vez finalizado el debate se hicieron públicos los resultados de la encuesta realizada entre los internautas en la que se preguntaba cuál de los tres políticos había ganado.

Resultados_ElPais_al_finalizar_debateEl sistema bloqueaba las IP despues de cada voto para evitar que se votase más de una vez.

“Este sondeo no es una encuesta rigurosamente científica que siga todos los criterios demoscópicos, pero sí un buen termómetro de la impresión de los lectores y espectadores que ayer siguieron el debate” (Diario El Pais).

Los resultados dieron ganador a Pablo Iglesias, con un 47% de los votos y bastante margen sobre los otros dos políticos, situándose ambos entre 25% y 30%.

Encuesta en Twitter mediante birdops.com

Paralelamente a la anterior encuesta tuvo lugar en Twitter otra encuesta similar a través de birdops.com a la que se podía acceder a través de los tweets de @el_pais.

birdopsEn este caso además de por los tres políticos presentes en el debate, también se podía votar la opción “Ninguno”.

Elpais_quienhaganado_votaSólo se podía participar siendo usuario de Twitter y al votar se emitía un tweet como estos:

Ejemplo_tweets_encuestaLos resultados de esta otra encuesta fueron similares a la encuesta de la web de EL PAIS, con la salvedad de que en este caso había una cuarta opción para decir que ninguno había ganado. Esta última opción fue utilizada sobretodo por los que pensaban que el debate debía haber contado con la participación de Alberto Garzón o Andrés Herzog.

opcion_ningunoLos avances de esta encuesta en Twitter durante el debate pueden verse en el siguiente gráfico (la opción “Ninguno” se ha omitido).

grafico_encuesta_twitterEl resultado concuerda con la encuesta a través de la web de El PAIS en cuanto al ganador y también en cuanto a la diferencia entre el primero y los otros dos.

 

 

2. EL ENGAÑO DE LAS MENCIONES

Pedro Sánchez fue el mas mencionado…por tuiteadores masivos de partido

Hay quien intenta ver en las menciones en Twitter una relación con la opinión real de la gente, deduciendo de ello un ganador del debate. Las siguientes imágenes han sido tomadas de tweets publicados en Twitter y dan a Pedro Sánchez el honor de ser el más mencionado, seguido de Albert Rivera y por último Pablo Iglesias.

menciones_tiempomenciones1Como veremos a continuación, las menciones no son útliles para sondear opiniones cuando estan distorsionadas y sobredimensionadas por los tuiteos masivos, en este caso procedentes en su mayor parte del aparato de propaganda de partido.

Hemos tomado los tweets emitidos durante el debate (211.989 tweets) y sobre ellos se han calculado el número de menciones. Los seis usuarios más mencionados son precisamente los tres participantes y sus respectivos partidos.

menciones_debateSi estas menciones estuviesen reflejando el sentir de los internautas los resultados deberían parecerse a los resultados de las encuestas de referidas en el apartado anterior. Pero aquí las menciones hacia @sanchezcastejon dominan con mucha diferencia ¿Por qué esa superioridad no se vió refelajada en los resultados de las encuestas? La respuesta es simple: en las encuestas hubo un control. En la encuesta de la web de EL PAIS cada dirección ip era bloqueada despés de votar para que no pudiese hacerlo más de una vez. En la encuesta a través de Twitter solo se admitía un voto por cada cuenta. Sin embargo para emitir menciones en Twitter no hay límites, siendo esto aprovechado por algunos partidos.

El listado que mostraremos a continuación es una relación de las 30 cuentas de Twitter que más tuitearon durante el debate. Hablamos de cientos de tweets emitidos por cada una de esas cuentas a lo largo de dos horas. La mayoría de ellos se podrían considerar ciberactivistas, aunque para estos tuiteos masivos también se suelen utilizar perfiles falsos. A la izquierda de cada cuenta hemos señalado a favor de qué partido tuiteó durante el debate.

UsuariosQueEmitieronMasTweetsDuranteDebate1Del listado anterior se pueden sacar las siguientes conclusiones:

  • el PSOE se empleó a fondo con sus cuentas de tuiteos masivos, sumando 20 de las 30 cuentas que más tuitearon. Eso explica el desproporcionado número de menciones que obtuvo Pedro Sánchez.
  • entre los nombres aparecen personas del llamado “Equipo Sugus” que estaba bajo las órdenes del actual senador del PSOE José Cepeda (@cepeda). En enero de 2015 fue descubierta y desactivada una extensa red de perfiles falsos que favorecía a Pedro Sánchez y José Cepeda. Muchos indicios indicaron que dicha red estaba gestionada por el Equipo Sugus, al que pertenecían algunas de las cuentas que durante este debate retuitearon cientos de tweets mencionando a Pedro Sánchez: Antonio Galán (@antgalan), Cris Papin (@crispapin) y Magda Sevilla (@magda_sevilla)

sugusLas menciones a Pedro Sánchez son, como veremos en el apartado siguiente, de los tres candidatos las que menos reflejan la opinión de la gente.

  • Nos ha llamado la atención también ver en esta lista de grandes tuiteadores, con 224 tweets, la cuenta @davidbonillo5.  David Bonillo Viciana es candidato por Ciudadanos en las elecciones del 20D por Almería. Pensamos, y así lo publicamos hace unas semanas, que está relacionado con las decenas de miles de tweets de spam político que emiten las cuentas @fraviven y @jobofern promocionando a Ciudadanos y a @Almeria_Cs. David Bonillo, los tres concejales de Ciudadanos en Almería y @Almeria_Cs han sido beneficiados con miles de menciones de dos cuentas de perfil falso que todavía no han sido suspendidas por @TwitterSpain.

DavidBonillo

 

3. ANALIZAMOS LAS MENCIONES

En el apartado anterior hemos visto que en temática política el número de menciones por sí mismo y sin aportar más información no debe ser utilizado para sacar conclusiones sobre las preferencias de los usuarios de Twitter ya que estas suelen ser distorsionadas por tuiteadores masivos (ciberactivistas y cuentas de partido). También por perfiles falsos, ya que algunos políticos están dispuestos a incrementar su índice de influencia mediante trampas.

El lector atento habrá notado que en el listado de las 30 cuentas que más tuitearon durante el debate que se vió en el apartado anterior no había ninguna que tuiteara a favor del Partido Popular. Las fuerzas online de este partido, al no participar Mariano Rajoy en el debate, se concentraron en potenciar su aparición simultánea en Tele5 (hashtag #RajoyConPiqueras) como notaron algunas personas durante la retransmisión del mismo.

AusenciaPPPor esa razón las menciones a Rajoy durante el debate estuvieron poco distorsionadas al no verse afectadas por el tuiteo masivo de su aparato de propaganda y sirven de ejemplo para que veamos cómo es la estructura natural de las menciones en Twitter.

Hemos representado el número de menciones a “Rajoy” o “Mariano” segmentando según el número de tweets que ha enviado durante el debate el usuario que hizo la mención (ojo, el eje horizontal no es el tiempo, sino el número de tweets enviados durante el debate por quienes hacen las menciones). A este tipo de gráfico lo llamamos espectro de menciones.

menciones_Rajoy OR MarianoLa columna de la izquierda, que llega hasta unas 2.600 menciones, es el número de tweets con menciones a Rajoy emitidos por personas que sólo enviaron un tweet durante el debate. La segunda columna, que llega hasta unas 1.500 menciones es el número de tweets con menciones a Rajoy emitidos por personas que enviaron dos tweets durante el debate, y así sucesivamente. El comportamiento del número de menciones es asintótico, de forma que al movernos hacia la derecha tiende rápidamente hacia cero. Esta estructura del espectro de menciones se aproxima mucho a la forma que tomaría en el caso de menciones totalmente espontáneas.

Desde el punto de vista de la “espontaneidad” de las opiniones, pensamos que son más significativas las primeras columnas empezando por la izquierda (cuentas que emitieron pocos tweets durante el debate) ya que a medida que nos desplazamos a la derecha en el gráfico los usuarios emisores de los tweets tienen más probabilidades de estar “ideologizados” o de ser perfiles falsos. Por esa razon para comparar las menciones de los tres candidatos se debería utilizar un índice que ponderase los valores de las primeras columnas.

La mayoría de los tweets que mencionan a Rajoy son opiniones espontáneas sobre su ausencia del debate. Hemos elegido al azar un minuto cualquiera durante la emisión del debate. Las menciones a Rajoy durante este minuto (21:13h.) muestran la naturaleza de estas opiniones, críticas e irónicas hacia el Presidente del Gobierno por no haber asistido. Esta fue la tónica durante todo el debate.

OpinionesRajoy_21_13

 

Comparación de las menciones hacia los tres candidatos

Ahora vamos a analizar el espectro de menciones hacia los tres candidatos comparándolas entre sí, y también con el espectro de menciones esperado en caso de opiniones “espontánteas” que vimos anteriormente.

menciones a PedroSanchezEl espectro de menciones a Pedro Sánchez es el más afectado por tuiteos masivos. Ha perdido su carácter asintótico y se observan gran cantidad de cuentas “ideologizadas” emitiendo masivamente. Las menciones espontáneas de la audiencia a @sanchezcastrejon han sido distorsionadas por los tuiteos masivos procedentes de cuentas de partido y ciberactivistas del PSOE.

menciones a AlbertRiveraLas tres primeras columnas del espectro de menciones de Albert Rivera tienen estructura normal y reflejan la parte de menciones más más espontánea. Se observa también pérdida de asintoticidad debido a la presencia de grandes emisores de tweets, aunque no tanto como en el caso de Pedro Sánchez.

menciones a PabloIglesiasLas menciones a Pablo Iglesias presentan una estructura más asintótica que las otras dos y por tanto menos distorsionada por los tuiteos masivos (obsérvense las 10 primeras columnas). Hay al igual que en los otros candidatos cuentas que emiten tweets de manera masiva, aunque en menor medida.

La siguiente imagen es una comparativa de las primeras columnas del espectro de menciones para cada uno de los candidatos. En los tres casos se observa “ideologización” (la altura de las columnas debería descender más rápido al movernos hacia la derecha), que es menor en el caso de las menciones a Pablo Iglesias. Las menciones a Albert Rivera aun conservan parte de asintoticidad en las primeras columnas. El caso de Pedro Sanchez es el más evidente de cómo los grandes tuiteadores distorsionan la forma asintótica de las menciones.

menciones_comparacionesPara el propósito que nos ocupa (conocer cual de los tres líderes tuvo más menciones “espontáneas”, menos “ideologizadas”) debemos ignorar las menciones emitidas por los ciberactivistas, cuentas de partido y perfiles falsos. Nos interesa el dato cualitativo y no tanto el cuantitativo, así que para evitar complicaciones innecesarias y sin restar validez a los resultados, hemos considerado sólamente en el valor de la primera columna del espectro (las menciones hechas por usuarios que sólo han emitido un tweet durante el debate) de cada candidato.

comparativa_menciones_segmentadasLos valores de primera columna aproximados (nos interesa sólo el dato cualitativo) son: Pablo Iglesias 1.129 menciones, Albert Rivera 922 menciones, Pedro Sánchez 780 menciones. Lo interesante en este caso es el orden de los candidatos. Estas son las menciones que reflejan la opinion menos militante y por tanto las menciones más representativas de la opinión de la audiencia.

Como conclusión, comparando las menciones segmentadas de los tres candidatos se puede establecer que:

  • las menciones a @Pablo_Iglesias_, pese a ser las menos numerosas en total, son las menos afectadas por tuiteos masivos, lo que se traduce en el mayor número de menciones “espontáneas” y el espectro de menciones con mayor carácter asintótico, y por tanto mayor espontaneidad.
  • las menciones a @sanchezcastejon, pese a ser las más numerosas en total, son las más afectadas por tuiteos masivos, lo que se traduce en la estructura de menciones más distorsionada y el menor número de menciones de calidad, es decir, con baja carga ideológica.
  • en un estado intermedio entre los dos anteriores se encuentran las menciones a @Albert_Rivera.

Las conclusiones anteriores concuerdan con los resultados de las encuestas que tuvieron lugar durante el debate. El más favorecido por estas menciones “de calidad” (menos afectadas por los tuiteos masivos) es Pablo Iglesias, seguido de Albert Rivera y Pedro Sánchez.

@sanchezcastejon el más beneficiado por el tuiteo masivo.

Por último, vamos ha hacer una comparación entre las cuentas más mencionadas durante el debate buscando ver cuáles de ellas han sido beneficiadas por el efecto del tuiteo masivo militante. En primer lugar consideraremos la totalidad de las menciones que tuvieron lugar durante el debate, y en segundo lugar las menciones procedentes de usuarios que han emitido un sólo tweet durante el debate. En ambos casos veremos cuáles son las 30 cuentas más mencionadas, ordenándolas por número de menciones.

ComparacionCuentasMasMencionadas1bSe han coloreado las cuentas políticas, dejando sin colorear las cuentas de influencers o de medios de comunicación.

  • color ROJO: cuentas que se han beneficiado del tuiteo masivo y por tanto bajan o desaparecen del ranking de menciones cuando éste no es tenido en cuenta. Entre ellas las de Pedro Sánchez (pasa del puesto 1º al 4º) y Albert Rivera (pasa del puesto 2º al 3º).
  • color VERDE: cuentas que suben o no se mueven en el ranking de menciones cuando se deja de notar el efecto del tuiteo masivo. Son las de Pablo Iglesias (pasa del 4º puesto al 1º), Alberto Garzón (se mantiene en el 11º puesto) y Partido PACMA (entra en el puesto 29º).

En esta página hemos encontrado otro estudio que ha tratado también el tema de las elevadas menciones a Pedro Sánchez durante el debate.

 

4. OTRAS FUENTES DE OPINIÓN

Tweets más retuiteados

Otra forma de aproximación a la opinión de la audiencia consiste en ver cuáles son los tweets que han tenido más retweets y por tanto más aceptación. En hashtags como #ELPAISDebate, que llegó a ser TT mundial, los grandes emisores de retweets no tienen por lo general tanta fuerza como para modificar los primeros puestos del ranking de los tweets más retuiteados.

Hemos calculado el Top 10 de los tweets que han obtenido más RTs durante el debate. La mayoría de ellos son tweets que ironizan sobre la ausencia de Mariano Raoy. Son los siguientes (hemos modificado el orden de algunos de los tweets por cuestión de espacio).

Tweets_mas_retuiteados_debateLos tweets emitidos por los distintos partidos políticos no han sido capaces de situarse en el Top 10 de retuiteos del hashtag #ELPAISDebate. Los tweets más retuiteados han procedido de los influencers y del organizador del evento, @el_pais, que propuso una serie de encuestas entre los usuarios de Twitter.

Top5

Primeros tweets favorables

Otra forma de acercarnos a la opinión de los usuarios de twitter que vieron el debate es contabilizar en qué posiciónes del ranking encontramos los tres primeros tweets favorables para cada uno de los candidatos a presidente.

Posiciones_primeros_tweetsLos tres primeros tweets favorables a Pablo Iglesias son los mejor posicionados en el Ranking (posiciones 2,6 y 12). A continuación los favorables a Pedro Sánchez (posiciones 11,23 y 29) y por último los favorables a Albert Rivera (posiciones 28,29 y 46).

Pero sin duda el tema que más tweets acaparó en los primeros puestos del ranking fue la ausencia de Mariano Rajoy dando lugar a tweets que trataron el tema con humor (posiciónes 1,2 y 5) como se vio anteriormente.

 

5. AUSENCIAS DE GARZÓN Y HERZOG

Una parte de los tweets mostraban el malestar por las ausencias de Alberto Garzón y Andrés Herzog, que no fueron invitados al debate.

Garzon-HerzogAdjuntamos el espectro de menciones para cada uno de ellos en los que se segmentan las menciones según el número de tweets enviados por los usuarios que las emiten.

menciones_@agarzon or garzonmenciones_Herzog or UPyD

 

6. Conclusiones

Durante el debate a tres del 30/11/2015 organizado por el diario EL PAIS el tema más comentado por los usuarios de Twitter fue la ausencia del presidente del gobierno Mariano Rajoy, siendo objeto de multitud de comentarios humorísticos.

RajoyAusenteLas encuestas realizadas por EL PAIS durante el debate (que dispusieron de mecanismos de control) dieron como ganador a Pablo Iglesias por amplio margen. Sin embargo el usuario más mecionado con diferencia era Pedro Sánchez, lo cual a priori parecía contradictorio.

Hemos comprobado que dichas menciones estuvieron distorsionadas y sobredimensionadas por cuentas militantes que emitieron tweets de manera masiva, entre ellas cuentas asociadas al Equipo Sugus del PSOE. Analizando el espectro de menciones de cada uno de los candidatos es posible filtrar las menciones de calidad, más espontáneas y menos afectadas por la ideología militante. Al hacerlo se elimina el efecto de las cuentas de tuiteo masivo, resultando entonces el orden de los más mencionados similar a los resultados reflejados en las encuestas.

Si te ha parecido interesante, por favor difúndelo.

nuestra cuenta en twitter: @BotsPoliticosNo

Pagina Principal

Licencia Creative Commons
Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial 4.0 Internacional.