Primarias del PSOE ¿Quién tiene más apoyo en Twitter?

A falta de poco más de un mes para las primarias hemos analizado la red social para tratar de comparar el apoyo recibido en Twitter por las distintas candidaturas. La información extraida permite visualizar sin ambigüedades la fuerza y debilidades de cada una de ellas, detectando ataques a hashtags y cuentas creadas para exagerar simpatías.

El período estudiado abarca desde el comienzo de 2016 hasta el 13 de abril de 2017, cuando la campaña sufre un parón debido a las vacaciones de semana santa y al fallecimiento de la socialista Carme Chacón.

En este trabajo analizaremos el timeline de los candidatos y se estimará el apoyo con que cuentan en Twitter en base a RTs y FAVs/Likes. Comprobaremos qué hashtags están siendo más seguidos en la campaña, expondremos nuestra opinión sobre la actividad de cada una de las candidaturas, daremos un repaso a la historia reciente del PSOE en Twitter de la mano del “Comando Susana” y el “Equipo Sugus” y finalmente se expondrán las conclusiones.

Con el fin de facilitar la lectura hemos tratado de hacer una exposición preferentemente visual evitando en la medida de lo posible complicaciones innecesarias.

 

1. Sobre la actividad los candidatos en Twitter

El más veterano en la red social es Patxi López, que lleva tuiteando desde septiembre de 2008, seguido por Pedro Sánchez (2009), siendo Susana Díaz la última en incorporarse en 2012. Todos ellos tuitean preferentemente desde dispositivo iPhone, y en el caso de Susana es el único medio que utiliza.

Es posible acercarse a los hábitos de tuiteo de los tres candidatos si representamos sus tweets en función del horario de emisión. Cuanto más activo en Twitter sea el candidato mejor se pueden reconstruir sus hábitos. En este caso Pedro es quien más utiliza la red social, aprovechando aparentemente la hora del almuerzo para hacerlo, aunque también a media mañana y un rato a última hora. Susana es quien menos tuitea y precisamente al disponer de pocos tweets es difícil apreciar pautas definidas. En el caso de Patxi, utiliza también la hora de comer con preferencia al resto del día con un parón sobre las 4 de la tarde.

En cuanto al volumen de tweets emitidos, el siguiente gráfico refleja el número de tweets semanales emitidos por cada uno de los candidatos desde enero de 2016: Lo primero que se observa es una gran diferencia entre la cantidad de tweets lanzados por Pedro (línea roja) y los otros candidatos durante 2016, dado que estaba inmerso en la campaña de las generales del 26 de junio. Otro hito que explica esa diferencia de actividad es la situación de crisis y enfrentamiento que se vivió en el partido una vez pasadas las elecciones y ya con más intensidad en septiembre, que terminó con la dimisión de Pedro como secretario general el 1 de octubre tras el Comité Federal. La cuenta de Patxi (línea verde) es la segunda en número de emisiones, alcanzando su máximo también durante las pasadas elecciones y teniendo un incremento de actividad durante los últimos meses. Susana (línea azul), con la media semanal de emisiones más baja, es la que menos utiliza Twitter. Llama la atención que en distintas ocasiones aparecen períodos de varias semanas enteras en los que no hay actividad emisora en su cuenta: 20 días seguidos sin tuitear en febrero de 2017, 30 días durante el verano de 2016, 16 días en abril de 2016, etc. De todas formas desde el inicio de la precampaña todos los candidatos, incluso Susana, han incrementado su locuacidad en la red.

 

2. Estimación del apoyo en función de RTs y FAVs/Likes

Las dos vías más evidentes por las que se percibe el apoyo que recibe una cuenta en Twitter es mirando en qué medida sus tweets son reenviados (RTs) o marcados como favoritos (actualmente los FAVs se han convertido en Likes, aunque aquí mantendremos el nombre tradicional).

Retweets

El siguiente gráfico muestra la evolución  del número semanal de retweets recibido por los actuales candidatos desde enero de 2016:Es manifiesta la superioridad en retweets recibidos por parte de Pedro (línea roja) sobre los otros dos. Hasta el momento de las pasadas elecciones (junio de 2016) era lo esperado, ya que siendo candidato a las generales contó con el apoyo del partido. Pero vemos que tanto durante la crisis como después de su dimisión como secretario general ha estado siempre por encima. Durante los últimos meses esa diferencia de retweets se ha vuelto aparentemente insalvable por parte de Susana y Patxi, aún cuando ambos están experimentando un incremento de RTs.

Hemos seleccionado los dos tweets que más apoyos recibieron para cada candidato en el período considerado:Pedro Sánchez recibe su mayor apoyo cuando ya no es secretario general en un tweet emitido días antes de entregar su acta de diputado en el cual pronostica la reconstrucción del PSOE por parte de su militancia. El tweet con más retweets de Susana Díaz data de la campaña de las generales. En él decía que el PSOE era la única alternativa para echar a Rajoy, afirmación que se demostró incorrecta pocos meses después cuando gracias a la abstención propiciada por ella misma el candidato popular pudo seguir gobernando. Patxi López alcanzó su mayor apoyo con un tweet dedicado a la violencia machista.

FAVs

Si ahora consideramos el numero de FAVs/Likes recibidos, el gráfico sale similar al de los retweets, siendo más acusadas si cabe las diferencias. El momento más destacado en apoyos tiene lugar en octubre de 2016 la semana en que Pedro entrega su acta de diputado tras haber sido sustituido por una gestora.

Diferencia entre FAVs y RTs

Pensamos que el parámetro FAVs menos RTs (FAVs – RTs) es un buen indicador para medir el grado de apoyo recibido por una cuenta. No cabe duda que en el ámbito de la temática política el hecho de retuitear significa en cierta medida apoyo hacia la cuenta que lo emite. Pensamos que el uso de los FAVs (ahora Likes), que se ha ido extendiendo durante los últimos años, puede ser algo más complejo pero en general indica un claro apoyo.

El total de RTs y FAVs alcanzados por un tweet es la suma de estas tres posibilidades:

  • usuarios que han hecho retweet pero no lo marcaron como FAV: hay personas que no acostumbran a utilizar el FAV o sólo lo hacen en contadas ocasiones. También puede darse el caso de que un tweet sea retuiteado aunque no se esté de acuerdo con su contenido.
  • usuarios que han hecho retweet y también marcado como FAV al mismo tiempo: les gusta el tweet (FAV) y lo comparten (RT).
  • usuarios que lo han marcado como FAV pero no lo han retuiteado: a veces se marcan como FAVs tweets con los que se simpatiza pero que por algún motivo no se quiere hacer visible ese apoyo con un retweet. Otras veces la simpatía por una persona hace que muchos de sus tweets, aunque sean poco trascendentes, sean marcados como FAV pero sin llegar a hacer RT.

Al considerar la suma de FAVs y RTs hacia una cuenta durante un período de tiempo se suma el efecto de cada tweet individual, haciéndose más visible la tendencia general hacia el candidato. Al observar la diferencia FAVs – RTs en los tres candidatos del PSOE desde comienzos de 2016 aparecen dos variantes: las cuentas @sanchezcastejon y @patxilopez se comportan de manera parecida, mientras que @susanadiaz lo hace de forma diferente. Las zonas superiores coloreadas de naranja expresan períodos en los que se reciben más FAVs que RTs (diferencia positiva entre FAVs y RTs), mientras que si la zona superior es verde se reciben más RTs que FAVs.Durante la primera mitad de 2016 tanto Pedro como Patxi recibieron mensualmente más RTs que FAVs (el cálculo semanal arroja el mismo resultado, pero se muestra por meses por la claridad de los gráficos). Es significativo que justamente después de tener lugar las elecciones generales del 26 de junio los tweets de ambos candidatos comenzaron a sumar más FAVs que RTs, siendo más acusado ese efecto en Pedro. Posibles explicaciones no excluyentes a este fenomeno son las siguientes:

  1. Durante la época de campaña y precampaña se incrementan los RTs de campaña, muchos de ellos desde cuentas de partido, que no suelen llevar asociado el correspondiente FAV. Esto haría que una vez pasado el 26J, cuando buena parte de estos “RTs electorales” han cesado la situación refleje mejor el sentimiento en Twitter.
  2. Al tiempo que se gestaba el golpe de timón que puso a una gestora al frente del PSOE, las simpatías hacia los futuros candidatos se fueron agudizando, sobretodo hacia Pedro Sánchez que había sido elegido por los militantes en primarias.

Para tratar de verificar si son correctas estas hipótesis sobre el cambio de tendencia de la diferencia entre FAVs y RTs haremos uso de diagramas de dispersión. Vamos a representar los tweets emitidos por Pedro en función del número de RTs y FAVs que cosecharon, pero añadiendo información sobre la fecha en que fueron emitidos mediante el color de los puntos. Cada punto representa un tweet emitido por el candidato. Todos los tweets que aparezcan por debajo de la diagonal que divide el gráfico tienen más RTs que FAVs y los que estén por encima han cosechado más FAVs.En el caso de Pedro Sánchez los tweets que emitió durante la campaña de las elecciones generales del 26J aparecen en color amarillo y por debajo de la diagonal (reciben más RTs que FAVs). Sin embargo los tweets emitidos durante la crisis (color primero blanco que se va transformando en azul) aparecen por encima de la diagonal (reciben más FAVs que RTs). Esa marcada tendencia permite considerar la hipótesis de que las dimisiones en bloque para forzar la salida de Sánchez y el hecho de que la gestora actuase de forma contraria a lo prometido en campaña electoral, provocó un aumento considerable de simpatías hacia Pedro Sánchez que influyó en el número de FAVs cosechados por sus tweets.

El gráfico de FAVs y RTs para Susana muestra que su cuenta en todo momento recibe más RTs que FAVs.Si las hipótesis anteriores fuesen correctas, ese plus de RTs sobre FAVs recibido por Susana podría deberse a RTs de partido que “inflarían” el apoyo percibido, elevando artificialmente la línea verde por encima de la amarilla también fuera de período electoral. Más abajo se aportarán algunos datos que apoyan esta suposición. En el diagrama de dispersión la mayoría de los tweets de Susana aparecen por debajo de la diagonal.

 

3. Estimación del apoyo en función de los hashtags

Durante las campañas en Twitter, la estrategia de los equipos de redes siempre pasa por lanzar una serie de hashtags con los eslogans que se pretenden asociar a su candidato. En Twitter Bots hemos hecho un seguimiento de los hashtags más utilizados por las tres candidaturas con objeto de medir el éxito de las campañas.En el gráfico anterior están representados 20 hashtags asociados a las candidaturas de Pedro (en color rojo), Susana (azul) y Patxi (verde). Llama la atención la diferencia de volumen conseguido por tres de los hashtags (#SiEsSi, #100Por100PSOE y #SomosSocialistas) respecto al resto. Los de la candidatura de Patxi López y la mayoría de la de Susana Díaz quedan apelotonados en esta representación. Haciendo un zoom se puede apreciar la diferencia de tamaño con los anteriores.

El hashtag más empleado: #SiEsSi

El hashtag más seguido está siendo el #SiEsSi de la candidatura de Pedro Sánchez. Lleva casi 150.000 tweets en total y es tuiteado diariamente como muestra el siguiente diagrama temporal:El día 26 de marzo este hashtag alcanzó casi los 160 tweets/minuto y fue utilizado por unas 3.000 cuentas. Si hacemos zoom sobre dicho día y desglosamos entre tweets y retweets nos queda esta representación, donde se han desglosado los tweets(color rojo) y los retweets(verde):La máxima intensidad de utilización del #SiEsSi tuvo lugar durante la mañana y el hecho de que el 26 de marzo alcanzase sus mayores cotas no es casualidad ya que en ese mismo momento Susana hacía una demostración de fuerza en Madrid ante miles de personas anunciando que presentaría su candidatura para liderar el PSOE. Esta fue por tanto la respuesta en la red a Susana por parte de los seguidores de Pedro y el día 26 el momento en que las candidaturas activaron la maquinaria de guerra. La visualización con la herramienta Gephi de las relaciones de retweets correspondientes a #SiEsSi da una idea de la cantidad de cuentas que participaron en dicho hashtag.Cada diminuto punto en este tipo de gráfico representa una cuenta, y las líneas unen las cuentas que hacen retweet con las cuentas retuiteadas, apareciendo representadas más grandes cuantos más RTs reciben. La apariencia de bola compacta significa cohesión entre sus miembros por medio de RTs. Como se verá en el siguiente punto, cuando diferentes comunidades tuitean el mismo hashtag aparecen diferentes aglomeraciones.

Segundo hashtag más utilizado: #100por100PSOE

Pertenece a la candidatura de Susana Díaz, aunque este segundo lugar alcanzado en cuanto a seguimiento es mérito sobretodo de los detractores de Susana. Al igual que en el caso anterior, es precisamente durante la mañana del 26 de marzo cuando alcanzó su máximo apogeo.

Obsérvese en primer lugar que casi alcanza los 180 tweets/minuto, ya que el #100por100PSOE estaba siendo utilizado ese día tanto por los partidarios de Susana como por sus detractores. En segundo lugar hay que hacer notar que el resto de los días, tanto anteriores como posteriores el seguimiento de este hashtag no alcanza niveles comparables. En estos dos gráficos que acabamos de ver no es posible diferenciar entre los tweets afines y contrarios a Susana Díaz. Para ello hay que recurrir nuevamente a la visualización de las relaciones de retuiteo con Gephi. Observaremos que los participantes en #100por100PSOE están divididos en dos grupos bien diferenciados: uno compacto alrededor de las cuentas de la candidatura de Susana (color azul), y otro más diverso enfrentado al anterior.Se podría decir que ese día el #100por100PSOE fue “atacado” por sus detractores, que llegaron a superar en número a los propios promotores del hashtag. Se puede comprobar haciendo zoom sobre cada uno de los dos grupos. Los enfrentamientos en torno a un hashtag forman parte de la normalidad en Twitter siempre y cuando no se efectúen con cuentas de perfil falso automatizadas. El bando azul se agrupa en torno a la cuenta @100por100PSOE del equipo de campaña de Susana.Observamos que además de la propia cuenta de @susanadiaz, aparecen recibiendo RTs cuentas como las de @carbajo_herrera y @cristinacabezon, supuestos integrantes del “Comando Susana” sobre los que en otra ocasión se ha hablado en relación a las redes de perfiles falsos que beneficiaban al PSOE-A. En el bando contrario retuitean los usuarios críticos con Susana en torno a una diversidad de cuentas influencers de tipo variado de tendencia progresista, incluido también algún político como @gabrielrufian.El efecto de todos estos usuarios hace que este hashtag susanista incluyera ese día una mayoría de tweets críticos con la candidata. Ahondando sobre este tema, recomendamos este trabajo de Mariluz Congosto donde identifica las distintas comunidades que participaron en el hashtag.

Debido a que se prolongaría mucho este estudio, obviaremos los detalles sobre el resto de hashtags analizados, limitándonos a mostrar sus relaciones de retweets de forma visual. El período de extracción de datos de hashtags ha sido desde el 23 de marzo al 13 de abril. Hay hashtags que han sido empleados durante los 22 días que duró el estudio, pero otros tuvieron una vigencia más corta. Por esa razon el dato de “tweets por cuenta” que mide el número medio de tweets que emitió cada cuenta que participó en cada hashtag debe valorarse en función de los días que éste estuvo vigente (no es lo mismo por ejemplo 10 tweets por cuenta si el empleo del hashtag se extendió durante los 22 días que si su vigencia fue de solamente de 1 día).

Más hashtags de la candidatura de Pedro Sánchez:

#SomosSocialistas: máximo alcanzado 80 tweets/min.#YoConPedro: máximo alcanzado 25 tweets/min.#EscuelaDeInvierno: máximo alcanzado 82 tweets/min.#YoAvaloAPedro: máximo alcanzado 13 tweets/min

Más hashtags de la candidatura de Susana Díaz:

#SusanaIlusiona: máximo alcanzado 23 tweets/min.#QuieroPSOE: máximo alcanzado 25 tweets/min.

#SusanaDiazT5: Como suele suceder en los hashtag televisivos de debate político, tuvo lugar un enfrentamiento entre los afines a Susana (arriba a la derecha) y sus detractores (abajo a la izquierda). Llegó a un pico de 160 tweets/min.#ConSusanaGanamos: máximo alcanzado de 23 tweets/min. Fue “atacado” por usuarios críticos con un reciente decreto que regula un nuevo modelo de escolarización en las escuelas infantiles y está siendo contestado por el sector.#SusanaDiazenLaSER: hashtag nuevamente disputado, máximo alcanzado de 133 tweets/min.

Los hashtags de Patxi López

El alcance de la campaña de Patxi está siendo el más discreto, lo que atestiguan los resultados alcanzados por sus hashtags:

#ConPatxiGanamosTodos: máximo alcanzado 11 tweets/min.

#100RazonesParaUnir: máximo alcanzado 12 tweets/min.#PatxiLopezT5: máximo alcanzado 26 tweets/min.

Pensamos que la relación de hashtags mostrados es representativa del volumen de tweets y retweets que están consiguiendo movilizar las tres candidaturas hasta mediados de abril de 2017.

 

4. Actividad de campaña

Una vez repasado el timeline de los candidatos y el alcance de los distintos hashtags que se están empleando hemos tratado de hallar las cuentas más relevantes de la campaña tomando las que más retweets están recibiendo en el ámbito de los hashtags mencionados anteriormente, aprovechando para dar nuestra opinión en relación cada una de las campañas.

Candidatura de Pedro Sánchez

La estrategia seguida esta candidatura parece basarse en la fuerza de sus apoyos en la red y la utilización de dos hashtags principales que se tuitean de manera contínua (#SiEsSi y #SomosSocialistas) y otros de carácter temporal que tienen que ver con las ciudades por donde va pasando el candidato. De momento no hemos encontrado ninguna red automatizada de cuentas de campaña, ni tampoco parece haber sido creada para la ocasión una gran estructura de cuentas de apoyo. Las cuentas favorables a esta candidatura que están recibiendo más RTs (sin contar la de su lider) son las siguientes:La mayoría están asociadas a personas reales, algunas de políticos en activo que apoyan la candidatura y otras de militantes, de los cuales varios pertenecieron al antiguo Equipo Sugus, del que se hablará más abajo.

Candidatura de Susana Díaz

Desde esta candidatura se ha creado una estructura de cuentas con el fin de aparentar un apoyo proveniente de todo el territorio nacional. Algunas se han especializado en emitir contenidos y otras en retuitearlos de manera automatizada como se verá en el siguiente apartado. Se están lanzando variedad de hashtags (#SusanaIlusiona, #QuieroPSOE, #ConSusanaGanamos, #QuieroSusana, #YoConSusana, etc), aunque sobre el que parece girar la campaña es el #100por100PSOE. Como hemos visto, en algunas ocasiones los hashtags susanistas son contestados desde la red por sus detractores.

Las cuentas favorables a esta candidatura que figuran recibendo más RTs (exceptuando la de su candidata) son:En su mayor parte son cuentas de apoyo creadas para la ocasión y las personas reales que aparecen residen en Sevilla, feudo de Susana.

La artificial red de apoyo a Susana Díaz

En el mes de febrero de este año comenzó a operar una red de 34 cuentas en apoyo a la candidatura de Susana Díaz. El nombre de usuario de dichas cuentas comienza siempre con el nombre de una localidad española, seguido de “consusana”. La mayoría fueron creadas durante el verano del pasado año 2016 y su objetivo parece ser dar la sensación de que la candidata andaluza goza de apoyo en todo el estado.Comenzaron a emitir todas al mismo tiempo el 15 de febrero de este año y diariamente hacen campaña a favor de su candidata. En este gráfico está representada su actividad, cuyo máximo de 600 tweet/día tuvo lugar el 26 de marzo.La mayoría de las veces sus contenidos están automatizados con la aplicación Hootsuite, la cual hemos tenido ocasión de comprobar en el pasado que es la preferida por el entorno de redes del PSOE-A. Hootsuite se utilizó en las redes de perfiles falsos del “Comando Susana”, y también es la aplicación que se usa para automatizar los mensajes de las cuentas oficiales del PSOE-A.

Este otro es un grupo de 40 cuentas oficiales del PSOE de Andalucía que emiten normalmente contenidos de propaganda institucional de manera automatizada también con Hootsuite. Entre ellas están cuentas como la cuenta oficial del PSOE de Andalucía (@psoedeandalucia), la del PSOE de la provincia de Granada (@PSOEGranada) o las juventudes socialistas de Huelva (@jsahuelva).Hemos encontrado que el grupo de cuentas en apoyo creadas para la candidatura de Susana Díaz lanza la mayoría de sus emisiones en los mismos tiempos que la red oficial del PSOE-A y desde la misma aplicación Hootsuite. Incluso en ocasiones retuitean el mismo tuit.Lo anterior permite suponer que el mismo equipo que lleva el Twitter de la red oficial de cuentas del PSOE de Andalucía está gestionando también la red de cuentas en apoyo a la candidatura de Susana Díaz como secretaria general del PSOE.

Candidatura de Patxi López

La actividad de esta candidatura es la que está pasando más desapercibida siendo sus resultados bastante discretos. Los principales hashtags impulsados son: #ConPatxiGanamosTodos y #100RazonesParaUnir.

Hay una serie de cuentas creadas en apoyo a Patxi para esta campaña: @psoeconpatxi, @lariojaconpoatxi, @jovenesconpatxi, @almerioa_patxi, @valencia_patxi, @navarraconpatxi, @patximostoles, @asturiasxpatxi, @zamoraconpatxi, @cyl_conpatxi, @patximurcia, @plataformapatxi, @burgosconpatxi y @leonconpatxi,. Parecen estar gestionadas por diferentes personas y sin automatización, excepto en el caso de tres de ellas ( @cyl_conpatxi, @jovenesconpatxi y @burgosconpatxi) que pensamos están administradas por la misma persona, concejal en un pequeño municipio de Burgos.

Las cuentas más representativas (por ser las que reciben más RTs) de la campaña de Patxi son, además de la cuenta del propio candidato:

En este punto conviene pararse a recordar el pasado reciente de los equipos de redes del PSOE en Twitter. Existen fundamentalmente dos grupos (uno asociado a Pedro Sánchez y otro a Susana Díaz) enfrentados desde hace tiempo, y en el pasado ambos han sido encontrados utilizando cuentas de perfil falso.

 

5. Antecedentes en Twitter

En el pasado las cuentas de dos de los candidatos han resultado beneficiadas por retweets, menciones y comentarios procedentes de redes de cuentas de perfil falso y así lo hemos documentado. En el siguiente resumen se hará un breve repaso de los hitos más destacados en relación a trampas con perfiles falsos que beneficiaron en el pasado a los dos principales candidatos. Este repaso también servirá para conocer a los dos equipos de redes enfrentados en el PSOE.

Equipo Sugus

Desde el verano de 2014, y a partir del nombramiento de Pedro Sánchez como secretario general del PSOE, se fueron creando en Twitter una serie de cuentas de identidad falsa que desde septiembre y hasta comienzos de 2015 se dedicaron a promocionar al líder socialista y sobretodo a su jefe de campaña, José Cepeda. Éste comandaba un grupo de personas autodenominado “Equipo Sugus” desde las primarias de julio, y que a partir de entonces se encargaría de la promoción de Pedro Sánchez, contando con un grupo especialmente dedicado a redes sociales.La red, que llegó a tener más de 80 cuentas, fue denunciada a principios de enero de 2015.  Era la primera vez que se aportaban pruebas de una red de esas carácterísticas e indicios sobre sus posibles responsables, que infructuosamente intentaron durante las horas siguientes a la denuncia “hacer hablar” a algunas de las cuentas para que pareciesen reales. Dada la repercusión de la noticia fueron suspendidas todas ellas por @TwitterEspana, incluso la cuenta que utilizaba el equipo sugus para promocionar a su candidato llamada @jovconpsanchez. Sorpresivamente Cepeda recibiría apenas tres semanas después como despedida un premio de una organización afín al partido socialista, por su “trabajo eficaz” realizado con “juego limpio” como comunicador político. En marzo, dos meses después, Maritcha Ruiz Mateos pasa a ser la Directora de Comunicación del PSOE y aunque el hashtag #EquipoSugus había dejado de ser utilizado por el equipo a raiz del escándalo, la labor de redes prosiguió de forma más discreta. Las grandes redes automatizadas son fácilmente reconocibles y no volvimos a detectar su uso en beneficio de Pedro Sánchez. Sí hubo posteriormente acusaciones en prensa sobre la utilización de cuentas troll por parte del activismo pro Pedro Sánchez, como se verá más adelante.

Red pro PSOE-Almeria

Por esa época (marzo de 2015) nos encontramos con otra peculiar red de cuentas falsas cuyo objetivo es modificar la intención de voto del electorado almeriense. Almeria, como feudo del Partido Popular en Andalucía, es un reto para las redes sociales del PSOE-A. Los perfiles falsos, supuestas personas residentes en Almería, emiten noticias de carácter neutro entre las que intercalan enlaces a mensajes favorables a Susana Díaz y PSOE.Otras veces dichas cuentas lanzan directamente su spam favorable a Susana Díaz.A pesar de que esta red, aparentemente gestionada desde el entorno PSOE-A, fue denunciada en 2015, desde la red social parece haberse tomado ningún tipo de medida y la mayoría de las cuentas siguen operando hasta la fecha.

Redes pro PSOE-Andalucia

En julio de 2016 salieron a la luz casi 80 cuentas distribuidas en dos grupos, utilizadas para mejorar la imagen de la presidenta de Andalucía Susana Díaz, desprestigio de sus adversarios políticos y acciones de trolleo contra cuentas partidarias de Pedro Sánchez. . Las personas a las que apuntan los indicios obtenidos en dicho estudio coinciden con algunas de las mencionadas en este artículo de un confidencial digital como integrantes del “Comando Susana”. Según esa información periodística, un antiguo miembro de dicho “comando” identifica como “responsable de agitación en las redes” a Ismael Perea (@iperea) persona de confianza de Susana Díaz, Juan Carlos Carbajo (@carbajo_herrera) como “responsable informático”, Miguel de la Rosa (@miguel_delarosa) concejal en Alhaurin el Grande, Cristina Galán Cabezón (@cristinacabezon) ex concejala en Sevilla, Jerónimo Guerrero (@JeronimoGJ), ex alcalde de El Coronil, etc.

Como consecuencia del descubrimiento de esta red utilizada para beneficiar al PSOE-A y a su presidenta, desde el Partido Popular se pidieron explicaciones a la Junta de Andalucía, amenazando con llevar una iniciativa parlamentaria para preguntar al Gobierno andaluz si se utilizaron medios públicos. Una vez más @TwitterEspana parece haber optado por no actuar, dejando que las cuentas fueran recicladas para su posterior uso mediante la modificación de fotos de perfil y nombres de usuario.

Comando Luena

Con ese nombre se conoce al entorno organizado de los partidarios en redes de Pedro Sánchez supuestamente desde Ferraz. La primera referencia al “comando Luena” que hemos encontrado es de agosto de 2016 (un mes después del escándalo del “comando Susana”) en respuesta a un tweet del antes nombrado Jerónimo Guerrero (@JerónimoGJ).Aparentemente por tanto, el concepto “comando Luena” procede del entorno del llamado “comando Susana” (nótese que no nos referimos al autor de este tuit de respuesta, @juanjobaldovar, sino a usuario al que está respondiendo) cuyas actividades habían sido puestas al descubierto un mes antes. Ninguna referencia más hasta el 14 de septiembre, cuando dicho “comando luena” es nombrado en los medios masivos como posible responsable de las críticas recibidas en redes por Guillermo Fernández Vara. Dos días antes, una información acusaba a una de las responsables de redes de Pedro Sánchez y ex Equipo Sugus, Cris Papin (@crispapin) de atacar a Susana Díaz desde perfiles falsos, aportando el indicio de la pantalla que ofrece Twitter para la recuperación de la contraseña, cuyas trazas de correo electrónico y teléfono se ajustarían a los de Cris Papín. Es difícil no enmarcar todo ese revuelo mediático de septiembre en el contexto de la operación para apear a Pedro Sánchez de la Secretaría General del PSOE tal como se describe en este artículo, lo cual no significa que las acusaciones al “Comando Luena” tengan que ser falsas, al menos algunas de ellas. Nos ha parecido interesante, si bien no sabemos el grado de credibilidad que debe dársele, un relato fechado en marzo de 2017 sobre el “Comando Luena” hallado entre los comentarios de esta noticia, según el cual dicho comando sería una evolución del Equipo Sugus, que se habría trasladado a un “bunker” situado en el Paseo de Pintor Rosales de Madrid, cerca de Ferraz.La situación de contexto de estas primarias es entonces la de dos grandes bloques partidarios de Pedro y Susana, cada uno con su grupo de redes e inmersos en un antiguo enfrentamiento, entre los que Patxi intenta hacerse un hueco.

 

6. Conclusiones

Desde nuestro punto de vista y en el momento actual (mediados de abril de 2017) Pedro Sánchez es quien más apoyo tiene en Twitter. Está dominando claramente tanto en retweets y FAVs (me gusta) sobre sus tweets como en el volumen y alcance de los hashtags de su campaña. El apoyo de Susana Díaz parece estar bastante focalizado en Andalucía, habiéndose detectado una red de cuentas automatizadas para simular apoyo en el resto del país. Algunos de sus hashtags son contestados con cierto éxito por sus detractores en Twitter. Por último la candidatura de Patxi López no lo tiene fácil para competir con líderes y equipos ya asentados. Está teniendo un papel discreto, aunque con posibilidades de mejorar en la medida que consiga llegar a los militantes menos polarizados.

No hay que perder sin de vista sin embargo que todavía queda mucha campaña y que de momento la gente con presencia en Twitter no es representativa de la sociedad española ni de los militantes del PSOE. Está todavía por ver en qué medida los resulltados obtenidos en Twitter son trasladables a las urnas.

BotsPoliticosNo

nuestra cuenta en twitter: @BotsPoliticosNo

Pagina Principal

Licencia Creative Commons
Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial 4.0 Internacional.

Anuncios

#Campaña26J: ¿Qué candidato recibe más apoyo real en Twitter? #periodismodatos

El objetivo de este análisis es intentar averiguar, sin que haya lugar a dudas, cuál de los cuatro candidatos a la presidencia de Gobierno de España recibe más apoyo en la red social Twitter, así como el orden en que quedarían situados los tres restantes.candidatos

Se han tomado dos períodos de estudio en función de cuál haya sido el endpoint de la API de Twitter utilizado para la extracción de datos: el primero va del 1 de enero al 4 de junio de 2016 y el segundo del 4 de mayo al 4 de junio.

De forma intencionada se ha prescindido de las habituales estadisticas de followers ya que desde nuestro punto de vista no reflejan de manera idónea el apoyo suscitado por los candidatos. Tampoco se han utilizado en este caso las menciones hacia los candidatos ya que en ellas se mezclan opiniones de apoyo y de rechazo difíciles de catalogar. En su lugar se han analizado mediante varias técnicas los retweets (RTs) y los favoritos/likes (FAVs) recibidos por las cuentas Twitter de los candidatos, cuentas_candidatosAl mismo tiempo se ha intentado estimar el peso del tuiteo masivo del ciberactivismo de cada partido sobre los retweets que reciben los candidatos con objeto de saber en qué medida es real el apoyo que reciben en esta red social.

 

1. ANÁLISIS DE RETWEETS

retweetLos RETWEETS (RTs) se producen cuando alguien reenvia tweets emitidos por otros usuarios. Las personas más influyentes obtienen más RTs. Por ello el número de RTs  que reciben los candidatos a las elecciones 26J puede servir como referencia del grado de aceptación que tienen en redes sociales.

Retweets recibidos por cada candidato

En el siguiente gráfico se ha representado la cantidad de retweets semanales recibidos por los cuatro candidatos desde el 1 de enero hasta el 4 de junio de 2016.Comp_RTs_ene_jun_1

Durante el período analizado la cuenta que recibió más retweets fue la de @pablo_iglesias_ (PODEMOS) seguido de @albert_rivera (CIUDADANOS), @sanchezcastejon (PSOE) y @marianorajoy (PP)

Al representar la cantidad diaria de retweets recibidos durante el mismo período, se obtiene un gráfico algo más enrevesado pero que permite ver cuales han sido las fechas más significativas desde el punto de vista de la repercusión de los tweets de los candidatos.Comp_RTs_Ene-Jun_DIARIOLos dos tweets más retuiteados corresponden a @pablo_iglesias_ y @albert_rivera. El primero, un tweet en clave de humor que incluía vídeo, alcanzó los 24.684 RTs; y el segundo, tratando sobre ETA (Otegui) y Venezuela (Leopoldo López), los 17.487 RTs.top_2En el ranking de los 10 más retuiteados encontramos 8 tweets de @pablo_iglesias_ y 2 de @albert_rivera. Este resultado puede ser interpretado como un indicio de la superioridad de los “nuevos partidos” en las redes sociales frente a los partidos tradicionales.top10 De hecho, el primer tweet de @marianorajoy figura en la posición 13 y el más retuiteado de @sanchezcastejon no aparece hasta la posición 65. pos13y65

Rendimiento de los tweets

Podría darse el caso de que alguno de los candidatos sea un gran emisor de tweets, y por ello obtenga al final más cantidad de RTs que el resto de los candidatos por el mero hecho de ser más activo en la red social. Para informar sobre esa posibilidad es útil el parámetro que representa el número de retweets obtenidos por cada tweet enviado como forma de calcular el rendimiento medio obtenido por cada tweet. La evolución comparada de este ratio se puede ver en el siguiente gráfico en el que por períodos semanales se ha dividido el número de RTs obtenidos por cada candidato entre el número de tweets que había emitido.RTsportweet1No se aprencian variaciones respecto a los resultados obtenidos por retweets totales. La mayor parte de las semanas el candidato que obtuvo más retweets por cada tweet enviado fue Pablo Iglesias, aunque en tres ocasiones Albert Rivera consiguió ponerse por delante en el rendimiento obtenido de los tweets, la última de ellas durante su reciente viaje a Venezuela. Son precisamente los dos candidatos que reciben menos RTs quienes obtienen un rendimeinto más bajo por sus tweets.

¿Influyen los retweets masivos en estos resultados?

Acabamos de ver la cantidad de retweets que han recibido los cuatro candidatos durante lo que va de año 2016. Teniendo en cuenta dicho parámetro Pablo Iglesias se perfila como el candidato con más tirón en Twiiter, seguido por Albert Rivera, Pedro Sánchez y Mariano Rajoy. Pero, ¿que hay de la calidad de los retweets? A continuación trataremos de comprobar si los retweets recibidos por los candidatos representan realmente el apoyo de los usuarios de Twitter, estimando en qué medida están influidos por el ciberactivismo de partido.

Composición de los retweets

En general la cantidad de RTs hacia una cuenta expresa de una manera bastante fiable el interés de los usuarios de Twitter por los contenidos que esta genera, y también el grado de simpatía o admiración que despierta. Sin embargo en ocasiones la cantidad de RTs es aumentada artificialmente mediante retweets masivos. En el ámbito político esto ocurre principalmente de dos maneras:

  • retweets procedentes de ciberactivistas políticos organizados desde cada partido. Son personas comprometidas con un proyecto político, que emiten desde sus propias cuentas o bien desde cuentas de partido asociadas a diferentes localidades. Pensamos que es una manera lícita de promoción siempre que los RTs se hagan desde las propias cuentas de los ciberactivistas o desde cuentas reales de partido. De esta manera cualquier lector del tweet podrá conocer la implicación de la cuenta emisora con la ideología que transmite.
  • retweets emitidos por cuentas de perfil falso (también llamadas bots), cuyos contenidos ideologizados son proporcionados por un administrador, bien de manera manual, bien de manera automatizada mediante determinadas herramientas. Estas emisiones son consideradas spam político y pretenden promocionar una determinada ideología, partido político o persona. El engaño está en que pretenden ser opiniones espontáneas de personas desvinculadas con la política. Tendemos a dar menos credibilidad a las informaciones que llegan desde cuentas de un partido o personas identificadas con el mismo. Por eso en algunas ocasiones se intenta modificar el voto de los usuarios de Twitter mediante redes de perfiles falsos. En Twitter Bots hemos dedicado el último año y medio a denunciarlas.

Detección de retweets masivos

Una parte de los retweets recibidos por los cuatro candidatos fue realizada desde cuentas de tuiteo masivo, generalmente procedente de cuentas de partido y ciberactivistas. Para estimar el peso que tienen los retweets masivos hemos calculado, para cada candidato, una curva que representa el número de RTs recibidos en el período de estudio en función de la cantidad total de RTs sobre el candidato que emitieron sus retuiteadores. Para entenderlo utilizaremos la curva de los RTs obtenidos por los tweets del candidato Pedro Sánchez.ejemplo_sanchezcastejonEl período analizado ha sido los 30 días que van desde el 4 de Mayo hasta el 4 de junio de 2016. En la parte de abajo (eje x) se pueden ver cantidades que van desde 0 hasta 400. Ahí se van a representar los RT totales (sobre el candidato) que ha enviado cada una de las cuentas que retuitearon a @sanchezcastejon. En el eje vertical (eje y) se muestran unas cantidades entre 0 y 70.000 que se corresponden con el número de retweets recibidos por @sanchezcastejon en dicho período. Como ejemplo, el punto negro situado en la curva, cuyas coordentadas son 150 (eje x) y 20.000 (eje y), significa que el número total de RTs emitido por las cuentas que han hecho 150 o más retweets hacia @sanchezcastejon durante el período de estudio es de 20.000. Cuanto más pegada hacia los dos ejes esté la curva, menos afectado por retweets masivos está el candidato.

Se han representado en un mismo gráfico las curvas correspondientes a los cuatro candidatos, expresándolas en porcentaje sobre los RTs totales para permitir su comparación.

comparativa_RTs_masivos2La curva que aparece más ajustada hacia los ejes es la de los retweets recibidos por Albert Rivera y las más alejada la de Pedro Sánchez. Independientemente de lo que cada cual considere retweets masivos o ciberactivismo (nosotros hemos fijado el umbral en los 2 RTs diarios sobre el candidato, 60 al mes), este gráfico permite comparar en qué medida llos líderes de los cuatro principales partidos de España son beneficiados por las cuentas de retuiteo masivo.

El PSOE se perfila como el más beneficiado por las emisiones masivas en Twitter. Esto concuerda con las menciones masivas hacia @sanchezcastejon halladas en el estudio sobre el debate a tres que tuvo lugar el 7 de diciembre de 2015, en el que encontramos cuentas pertenecientes al antiguo Equipo Sugus ejerciendo un agresivo ciberactivismo. El PP es el segundo más beneficiado por los retweets masivos, seguido de PODEMOS y CIUDADANOS en tercer y cuarto puesto.

Las principales cuentas que aparecen como grandes retuiteadoras pertenecientes al ciberactivismo de cada partido (las 20 primeras de cada uno) figuran en la siguiente lista junto al número de RTs que hicieron sobre los candidatos en el período analizado. Obviamente es sólo una muestra, y hay bastantes más.cuentas_rt_masivo_1Hemos encontrando cuentas ciberactivistas en los cuatro principales partidos políticos de España. La proporción de los retweets masivos sobre los RTs totales es mayor en el caso de los partidos tradicionales (PSOE y PP), seguramente para compensar su menor influencia en redes sociales. Hay que hacer notar que en la imagen anterior solamente se están considerando retweets hacia los cuatro candidatos, siendo su volumen de emisiones mucho mayor.

Se constata que los cuatro candidatos son beneficiados por retweets masivos desde cuentas ciberactivistas. El porcentaje de retweets masivos que recibe cada candidato depende el umbral que se fije para considerarlos masivos. Por ejemplo, si tomamos ese umbral como 60 tweets/mes hacia un candidato (ver gráfico), el 40% de los retweets que obtiene Pedro Sánchez (PSOE) procederían del ciberactivismo de su partido; al igual que el 19% de los que obtiene Mariano Rajoy (PP), y el 11% de los que obtienen Pablo Iglesias (PODEMOS) y Albert Rivera (CIUDADANOS). Los candidatos que aparecen más beneficiadas por el retuiteo masivo son precisamente los que obtienen menos RTs en sus tweets. Los porcentajes varían según el umbral que se tome

 

2. ANÁLISIS DE LOS FAVs

El FAV es otra manera de interactuar puesta a disposición de los usuarios de Twitter. Inicialmente estaba pensado para marcar tweets como favoritos, pero desde finales de 2015 se cambió la habitual estrella por el símbolo de un corazón para unificarlo con el Like de otras redes sociales. CambioFAVsEs utilizado de diferentes formas aunque el uso más generalizado es seguramente para mostrar el acuerdo o agrado por el contenido de un tweet o por quien lo emite. El total de RTs y FAVs alcanzados por un tweet es la suma de estas tres posibilidades:

  • usuarios que han hecho retweet pero no lo marcaron como FAV: hay personas que no acostumbran a utilizar el FAV o sólo lo hacen en contadas ocasiones. También puede darse el caso de que un tweet sea retuiteado aunque no se esté de acuerdo con su contenido.
  • usuarios que han hecho retweet y también marcado como FAV al mismo tiempo: les gusta el tweet (FAV) y lo comparten (RT).
  • usuarios que lo han marcado como FAV pero no lo han retuiteado: en algunos casos el contenido de un tweet ha gustado, pero el usuario no quiere retuitear a la persona que lo ha emitido.

La mayoría de los tweets consiguen más RTs que FAVs, ya que normalmente la primera de las tres posibilidades mencionadas supera a la tercera de ellas. En las siguientes líneas se ven varios ejemplos de tweets en los que sin embargo el número de FAVs ha superado al de RTs. Hemos seleccionado uno de cada candidato.

Este tweet de @pablo_iglesias_ celabrando el nuevo nombre de la coalición para las eleccioens del 26J, consiguió una parte considerable de sus de FAVs (símbolo de corazón) de personas que sin embargo no lo retuitearon (7.916 FAVs frente a 6.713 RT). Una posible explicación es el apoyo al tweet con FAVs por parte de algunas personas pertenecientes a Izquierda Unida, socio de coalición, que sin embargo prefieren no retuitear al lider de PODEMOS.

ej_FAV-RT_1Algo simliar ocurre con este tweet de @albert_rivera en el que hace mención al tema del terrorismo y homenajea a sus víctimas recibiendo 4.364 FAVs frente a 3.878 RTs. Probablemente ha recibido apoyos en forma de FAVs desde sumpatizantes del Partido Popular u otro partido, y que sin embargo prefieren no retuitearlo.ej_FAV-RT_2Otro ejemplo, en este caso de un tweet de @sanchezcastejon emitido como recuerdo hacia el político y activista Pedro Zerolo, muestra nuevamente cómo se puede marcar un tweet como FAV por simpatía hacia su contenido, aunque no se quiera beneficiar con un RT a quien lo emite.ej_FAV-RT_3Por último el ejemplo correspondiente a @marianorajoy donde se hace referencia al independentismo y radicalismo, y que también ha conseguido más apoyos en forma de FAV que retweets.ej_FAV-RT_4

Comparación entre los candidatos

Es interesante establecer el peso que tienen los FAVs en los tweets de cada uno de los candidatos. Hemos calculado en primer lugar el porcentaje de FAVs sobre el total de FAVs y RTs de todos los tweets emitidos por los candidatos en dos períodos: el último mes y lo que va de 2016.

Período 04-05-2016 a 04-06-16 (último mes)

Porc_FAVs

Período 01-01-2016 a 04-06-2016 (desde comienzo de año)Porc_FAVs_Ene-MayEn ambos períodos el candidato que acumula más FAVs y RTs en sus tweets es Pablo Iglesias, dándose la circunstancia de que suman más de el doble de los recibidos por Albert Rivera, situado en segunda posición. Pedro Sánchez y Mariano Rajoy oculpan tercer y cuarto puesto bastante igualados. Estos resultados podrían estar relacionados con el hecho de que el electorado y simpatizantes PSOE y PP se sitúan predominantemente en la población de mayor edad, con menor penetración en redes sociales.

El gráfico de FAVs de los candidatos es muy similar al gráfico de RTs mostrado anteriormente. De hecho, son casi idénticos, ya que el número de RTs y FAVs de un tweet suele ser bastante similar.FAVs-2016

 

Los FAVs y las redes de perfiles falsos (bots)

Hemos visto antes cómo de los retweets era posible extraer información sobre la actividad de RTs masivos que favorecían a los candidatos. De una manera más indirecta (la API de Twitter no permite la extracción de listados de FAVs) es posible detectar casos en los que una cuenta es favorecida por retweets masivos procedentes de redes de perfiles falsos. bots2Nos valdremos de un hecho que hemos constatado repetidamente: las redes políticas de bots son utilizadas normalmente sólo para hacer retweets, no para emitir FAVs. Sólo en una ocasión encontramos una peculiar red que lo hacía.

Como ejemplo ilustrativo, que además sirva para poder comparar después con los cuatro candidatos, necesitaremos una cuenta que sea retuiteada masivamente por perfiles falsos. Utilizaremos la del conocido y reincidente spammer político @andres_cano42 (Andrés Cano Bonillo, del Partido Popular), que se sirve de una red de casi 50 bots que hacen RT sobre muchos de sus tweets. Desde febrero de 2016 esta red lleva emitidos más de 284.000 tweets. andres_cano42_BAunque fue denunciada por este blog  en mayo de 2016, sigue emitiendo grandes cantidades de spam político destinado a los usuarios de Twitter, sin que desde @TwitterSpain se haya tomado ningún tipo de medida.

Hemos representado los RTs y FAVs recibidos por @andres_cano42 desde enero a junio de 2016.RTs_FAVs_andres_cano42En este gráfico saltan a la vista dos aspectos que delatan la presencia de retweets masivos hacia @andres_cano42 emitidos desde cuentas de perfil falso:

  • la diferencia entre la cantidad de RTs y FAVs es mucho mayor de lo que sería normal.
  • las curvas de RTs (azul) y FAVs (roja) deberían de estar alineadas, con muy similares fases de crecimeinto y decrecimiento; sin embargo no se aprecia apenas correlación entre ellas.

Estos dos síntomas, cuando son muy evidentes, indican que con gran probabilidad una cuenta es favorecida mediante RTs por redes de perfiles falsos.

El aspecto que presentan las mismas curvas para cada uno de los cuatro candidatos difiere bastante de las de @andres_cano42. Ambas curvas (FAVs y RTs) están alineadas, manteniéndose la diferencia RT – FAV dentro de unos márgenes que indican que los RTs procedentes de redes de bots no son significativos.RT-FAV-candidatosEn algunos períodos la media semanal de FAVs (línea roja) es superior incluso a la de RTs indicando abundancia de tweets en los que hay usuarios apoyando con fav, pero sin reenviar, como se vió más arriba.

Los posibles RTs procedentes de redes de cuentas de perfil falso (bots) no son significativos respecto al total de retweets recibidos por los candidatos.

 

4. INFLUENCIA DE LOS RETWEETS MASIVOS SOBRE CADA CANDIDATO

Los retweets masivos emitidos por cuentas ciberactivistas de partido no muestran un apoyo espontáneo hacia el candidato. Al contrario, es un apoyo incondicional y acrítico repetido artificialmente, y cercano en muchos casos a la propaganda. En este apartado intentaremos aproximarnos al fenómeno de los retweets masivos desde una nueva óptica consistente en cuantificar el número de cuentas únicas que hacen RT sobre cada tweet y compararlo con los RTs que recibe, mostrando los resultados diarios. El volumen de datos necesitado para este tipo de análisis es mayor que antes, por lo que el período de estudio será desde el 04-05-2016 al 04-06-2016, es decir, los últimos 30 días.

Para cada candidato se han confeccionado dos gráficos.  En el de la izquierda se muestran dos líneas:

  • la línea azul: representa la suma de RTs diarios que ha recibido el candidato
  • la línea rosa: es el número de cuentas diferentes que han emitido dichos RTs

Cuanto más próximas y alineadas estén ambas líneas, más representativos son los RTs que recibe el candidato del apoyo espontáneo que recibe en Twitter.  El gráfico de la derecha es el que permite la comparación entre los distintos candidatos al referirse al porcentaje de cuentas únicas sobre el total de RTs. Estos son los resultados para cada candidato:

PEDRO SÁNCHEZ

A partir del 8 de Mayo el porcentaje de cuentas únicas en los RTs sobre la cuenta de @sanchezcastejon cae hasta niveles inferiores al 30%, perdiendo la curva a de cuentas únicas alineación con la curva de retweets. Son signos evidentes de retweets masivos procedentes del equipo de ciberactivistas del PSOE actuando de manera continuada. El carácter espontáneo de los RTs que recibe Pedro Sánchez queda bastante desvirtuado.

RM_sanchezcastejon

MARIANO RAJOY

Retweets masivos de manera discontinua, evidenciados por perdidas de alineamiento entre la curva de cuentas únicas y la curva de retweets. El ciberactivismo se activa a impulsos, lo cual se traduce en los dientes de sierra observados en el gráfico de la derecha. Obsérvese en el gráfico de la izquierda la óptima alineación entre los días 15 y 20 de mayo, período en que hubo poca actividad ciberactivista.RM_marianorajoy1

ALBERT RIVERA

Desde el 4 hasta el 23 de mayo los retweets sobre @albert_rivera muestran una baja incidencia de retweets masivos. Sin embargo a partir del día 23 de mayo, coincidiendo con su estancia en Venezuela, la cuenta de Albert Rivera recibió varias decenas de miles de retweets coincidiendo con una drástica caida del porcentaje de cuentas únicas (cuadro de la derecha) que bajó hasta el 30%. Durante esos días se vió beneficiado por los RTs del ciberactivismo opositor a Maduro. Se observa cómo al volver Albert a España los RTs sobre sus tweets caen drásticamente, aumentando el porcentaje de cuentas únicas hasta una media cercana al 70%.

RM_albertriveraHemos hecho un pequeño ejercicio consistente en segmentar los retweets recibidos por @albert_ribera el tiempo que estuvo en Venezuela, y también los días anteriores y posteriores. El parámetro elegido para la segmentación es el “Timezone”, que informa de la zona horaria configurada por las cuentas que emiten los tweets. Dado que es voluntario configurar este parámetro, en muchos casos figura como ‘None’, pero en este caso el Timezone servirá de aproximación.  Observando la línea roja se aprecia cómo @albert_rivera comienza el día 23 de mayo a ser retuiteado por cuentas configuradas con la zona horaria ‘Caracas’ (línea roja), superando estas incluso a las configuradas con la zona horaria ‘Madrid’ (línea azul). A su vuelta a España dicho fenómeno desaparece.Timezone_caracas

PABLO IGLESIAS

La curva de cuentas únicas estuvo alineada con la curva de retweets sobre @pablo_iglesias_ durante el período estudiado. En el gráfico derecho se observa que el porcentaje de cuentas únicas no baja del 70%, lo que indica que la cantidad de retweets masivos de los ciberactivistas de PODEMOS no llega a ser significativa frente al total de RTs recibidos por el candidato.

RM_pabloiglesias

Por último, y para que sirva de comparación, recurriremos nuevamente a la cuenta del influencer del Partido Popular Andrés Cano (@andres_cano42), mostrando los mismos gráficos para el período que va desde el 24/05/16 al 09/06/16 (que son los datos de que disponemos).RM_andres_cano42Como era de esperar, las curvas de cuentas únicas y RTs prácticamente no están alineadas y el porcentaje de cuentas únicas oscila en valores que van del 20 al 40%. Estos resultados son coherentes con el hecho de que los tweets de @andres_cano42 son extensamente retuiteados tanto por el ciberactivismo del Partido Popular como por el ciberactivismo opositor en Venezuela.

Mediante esta forma de detectar la actividad ciberactivista han quedado confirmadas las estimaciones obtenidas en el apartado primero sobre en qué medida están afectando, para cada candidato, los retweets masivos procedentes del ciberactivismo de partido al parámetro de los RTs recibidos como métrica para el apoyo espontáneo del candidato en Twitter. Por una vía diferente se vuelve a llegar a la conclusión de que Pedro Sánchez es el candidato más beneficiado por el ciberactivismo, seguido por Mariano Rajoy. El peso de los retweets ciberactivistas estaría bastante igualado para los otros dos candidatos, si bien en parte del período estudiado Albert Ribera se vio beneficiado por los retweets del ciberactivismo opositor venezolano.

 

4. RESULTADOS

Los retweets (RTs) y favoritos/Likes (FAVs) pueden utilizarse para medir el apoyo hacia un candidato. Dado que una parte de los retweets que reciben los candidatos son RTs masivos fue necesario estimar su porcentaje para cada uno de los candidatos. Estableciendo un umbral exigente de lo que se considera ciberactivismo se calcularon los siguientes porcentajes de retweets masivos durante el período estudiado: Pedro Sánchez (40%), Mariano Rajoy (19%), Pablo Iglesias y Albert Rivera (ambos 11%). Una vez descontados de las cantidades respectivas de retweets el resultado es el siguiente:resultados_finalesHay que hacer notar que la elección del umbral de lo que se considera ciberactivismo (60 tweets/mes sobre el candidato) podría haber sido cualquier otra sin afectar a las posiciones relativas de los candidatos en los resultados finales.

Utilizando el número de retweets y favoritos/likes como medida del apoyo de los usuarios de Twitter hacia los candidatos y después de descontar los retweets masivos procedentes del ciberactivismo de partido, el candidato que recibe más apoyo de los usuarios de Twitter ha resultado ser Pablo Iglesias siendo destacable la gran diferencia que le separa de los otros tres candidatos. En segundo lugar por apoyo recibido lo obtivo Albert Ribera y la tercera posición fue para Mariano Rajoy. El candidato Pedro Sánchez ha quedado en último lugar dado el alto nivel de retweets masivos que una vez descontados le colocaron en apoyo real por debajo de Mariano Rajoy.ranking-1Estaríamos encantados en recibir opiniones, sugerencias, críticas razonadas y cualquier tipo de realimentaición de los lectores sobre este estudio.
BotsPoliticosNoSi te ha parecido interesante puedes difundirlo en redes sociales y sitios web agregadores de noticias.

nuestra cuenta en twitter: @BotsPoliticosNo

Pagina Principal

Licencia Creative Commons
Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial 4.0 Internacional.

#ELPAISDebate ¿Qué opinó realmente la gente?

1B

El 30 de Noviembre tuvo lugar un debate organizado por el diario El País con la presencia de los candidatos de PSOE, Ciudadanos y PODEMOS, definido por su organizador como “el primer gran debate electoral de la democracia a través de internet”. Se puede visionar en este o en este otro enlace.

ImagenDebateNuestro propósito es tratar de sondear cuál fue la opinión de la audiencia que vió el debate, a través de los comentarios que se emitieron en Twitter durante el mismo y ver si coincide con los resultados de las encuestas que se realizaron ese día.

A través de la API de Twitter hemos extraido todos los tweets que contienen el hashtag #ELPAISDebate hasta el día 1 de Diciembre a las 13:00h. En total son 311.120 tweets, aunque nos hemos centrado en el análisis de la parte de ellos que se emitió durante el debate, que tuvo lugar entre las 21 h y las 23h.

notas1

 

 

1. EL DEBATE Y LAS ENCUESTAS

En el siguiente gráfico está representado el número de tweets emitidos en dicho hashtag por períodos de 1 minuto, desde unas horas antes del comienzo del debate hasta el mediodía del día siguiente. La zona coloreada en verde corresponde al tiempo durante el cual se emitió el debate.

Grafico1Durante buena parte del debate el ritmo de emisión de tweets estuvo por encima de los 2.000 tweets por minuto, tal como muestra este gráfico.

Grafico1bSe hicieron dos encuestas entre el público que seguía el debate por internet durante la retransmisión del mismo:

Encuesta de El País en web

El Diario El País organizó una encuesta a la que se podía acceder a través de su página web. Una vez finalizado el debate se hicieron públicos los resultados de la encuesta realizada entre los internautas en la que se preguntaba cuál de los tres políticos había ganado.

Resultados_ElPais_al_finalizar_debateEl sistema bloqueaba las IP despues de cada voto para evitar que se votase más de una vez.

“Este sondeo no es una encuesta rigurosamente científica que siga todos los criterios demoscópicos, pero sí un buen termómetro de la impresión de los lectores y espectadores que ayer siguieron el debate” (Diario El Pais).

Los resultados dieron ganador a Pablo Iglesias, con un 47% de los votos y bastante margen sobre los otros dos políticos, situándose ambos entre 25% y 30%.

Encuesta en Twitter mediante birdops.com

Paralelamente a la anterior encuesta tuvo lugar en Twitter otra encuesta similar a través de birdops.com a la que se podía acceder a través de los tweets de @el_pais.

birdopsEn este caso además de por los tres políticos presentes en el debate, también se podía votar la opción “Ninguno”.

Elpais_quienhaganado_votaSólo se podía participar siendo usuario de Twitter y al votar se emitía un tweet como estos:

Ejemplo_tweets_encuestaLos resultados de esta otra encuesta fueron similares a la encuesta de la web de EL PAIS, con la salvedad de que en este caso había una cuarta opción para decir que ninguno había ganado. Esta última opción fue utilizada sobretodo por los que pensaban que el debate debía haber contado con la participación de Alberto Garzón o Andrés Herzog.

opcion_ningunoLos avances de esta encuesta en Twitter durante el debate pueden verse en el siguiente gráfico (la opción “Ninguno” se ha omitido).

grafico_encuesta_twitterEl resultado concuerda con la encuesta a través de la web de El PAIS en cuanto al ganador y también en cuanto a la diferencia entre el primero y los otros dos.

 

 

2. EL ENGAÑO DE LAS MENCIONES

Pedro Sánchez fue el mas mencionado…por tuiteadores masivos de partido

Hay quien intenta ver en las menciones en Twitter una relación con la opinión real de la gente, deduciendo de ello un ganador del debate. Las siguientes imágenes han sido tomadas de tweets publicados en Twitter y dan a Pedro Sánchez el honor de ser el más mencionado, seguido de Albert Rivera y por último Pablo Iglesias.

menciones_tiempomenciones1Como veremos a continuación, las menciones no son útliles para sondear opiniones cuando estan distorsionadas y sobredimensionadas por los tuiteos masivos, en este caso procedentes en su mayor parte del aparato de propaganda de partido.

Hemos tomado los tweets emitidos durante el debate (211.989 tweets) y sobre ellos se han calculado el número de menciones. Los seis usuarios más mencionados son precisamente los tres participantes y sus respectivos partidos.

menciones_debateSi estas menciones estuviesen reflejando el sentir de los internautas los resultados deberían parecerse a los resultados de las encuestas de referidas en el apartado anterior. Pero aquí las menciones hacia @sanchezcastejon dominan con mucha diferencia ¿Por qué esa superioridad no se vió refelajada en los resultados de las encuestas? La respuesta es simple: en las encuestas hubo un control. En la encuesta de la web de EL PAIS cada dirección ip era bloqueada despés de votar para que no pudiese hacerlo más de una vez. En la encuesta a través de Twitter solo se admitía un voto por cada cuenta. Sin embargo para emitir menciones en Twitter no hay límites, siendo esto aprovechado por algunos partidos.

El listado que mostraremos a continuación es una relación de las 30 cuentas de Twitter que más tuitearon durante el debate. Hablamos de cientos de tweets emitidos por cada una de esas cuentas a lo largo de dos horas. La mayoría de ellos se podrían considerar ciberactivistas, aunque para estos tuiteos masivos también se suelen utilizar perfiles falsos. A la izquierda de cada cuenta hemos señalado a favor de qué partido tuiteó durante el debate.

UsuariosQueEmitieronMasTweetsDuranteDebate1Del listado anterior se pueden sacar las siguientes conclusiones:

  • el PSOE se empleó a fondo con sus cuentas de tuiteos masivos, sumando 20 de las 30 cuentas que más tuitearon. Eso explica el desproporcionado número de menciones que obtuvo Pedro Sánchez.
  • entre los nombres aparecen personas del llamado “Equipo Sugus” que estaba bajo las órdenes del actual senador del PSOE José Cepeda (@cepeda). En enero de 2015 fue descubierta y desactivada una extensa red de perfiles falsos que favorecía a Pedro Sánchez y José Cepeda. Muchos indicios indicaron que dicha red estaba gestionada por el Equipo Sugus, al que pertenecían algunas de las cuentas que durante este debate retuitearon cientos de tweets mencionando a Pedro Sánchez: Antonio Galán (@antgalan), Cris Papin (@crispapin) y Magda Sevilla (@magda_sevilla)

sugusLas menciones a Pedro Sánchez son, como veremos en el apartado siguiente, de los tres candidatos las que menos reflejan la opinión de la gente.

  • Nos ha llamado la atención también ver en esta lista de grandes tuiteadores, con 224 tweets, la cuenta @davidbonillo5.  David Bonillo Viciana es candidato por Ciudadanos en las elecciones del 20D por Almería. Pensamos, y así lo publicamos hace unas semanas, que está relacionado con las decenas de miles de tweets de spam político que emiten las cuentas @fraviven y @jobofern promocionando a Ciudadanos y a @Almeria_Cs. David Bonillo, los tres concejales de Ciudadanos en Almería y @Almeria_Cs han sido beneficiados con miles de menciones de dos cuentas de perfil falso que todavía no han sido suspendidas por @TwitterSpain.

DavidBonillo

 

3. ANALIZAMOS LAS MENCIONES

En el apartado anterior hemos visto que en temática política el número de menciones por sí mismo y sin aportar más información no debe ser utilizado para sacar conclusiones sobre las preferencias de los usuarios de Twitter ya que estas suelen ser distorsionadas por tuiteadores masivos (ciberactivistas y cuentas de partido). También por perfiles falsos, ya que algunos políticos están dispuestos a incrementar su índice de influencia mediante trampas.

El lector atento habrá notado que en el listado de las 30 cuentas que más tuitearon durante el debate que se vió en el apartado anterior no había ninguna que tuiteara a favor del Partido Popular. Las fuerzas online de este partido, al no participar Mariano Rajoy en el debate, se concentraron en potenciar su aparición simultánea en Tele5 (hashtag #RajoyConPiqueras) como notaron algunas personas durante la retransmisión del mismo.

AusenciaPPPor esa razón las menciones a Rajoy durante el debate estuvieron poco distorsionadas al no verse afectadas por el tuiteo masivo de su aparato de propaganda y sirven de ejemplo para que veamos cómo es la estructura natural de las menciones en Twitter.

Hemos representado el número de menciones a “Rajoy” o “Mariano” segmentando según el número de tweets que ha enviado durante el debate el usuario que hizo la mención (ojo, el eje horizontal no es el tiempo, sino el número de tweets enviados durante el debate por quienes hacen las menciones). A este tipo de gráfico lo llamamos espectro de menciones.

menciones_Rajoy OR MarianoLa columna de la izquierda, que llega hasta unas 2.600 menciones, es el número de tweets con menciones a Rajoy emitidos por personas que sólo enviaron un tweet durante el debate. La segunda columna, que llega hasta unas 1.500 menciones es el número de tweets con menciones a Rajoy emitidos por personas que enviaron dos tweets durante el debate, y así sucesivamente. El comportamiento del número de menciones es asintótico, de forma que al movernos hacia la derecha tiende rápidamente hacia cero. Esta estructura del espectro de menciones se aproxima mucho a la forma que tomaría en el caso de menciones totalmente espontáneas.

Desde el punto de vista de la “espontaneidad” de las opiniones, pensamos que son más significativas las primeras columnas empezando por la izquierda (cuentas que emitieron pocos tweets durante el debate) ya que a medida que nos desplazamos a la derecha en el gráfico los usuarios emisores de los tweets tienen más probabilidades de estar “ideologizados” o de ser perfiles falsos. Por esa razon para comparar las menciones de los tres candidatos se debería utilizar un índice que ponderase los valores de las primeras columnas.

La mayoría de los tweets que mencionan a Rajoy son opiniones espontáneas sobre su ausencia del debate. Hemos elegido al azar un minuto cualquiera durante la emisión del debate. Las menciones a Rajoy durante este minuto (21:13h.) muestran la naturaleza de estas opiniones, críticas e irónicas hacia el Presidente del Gobierno por no haber asistido. Esta fue la tónica durante todo el debate.

OpinionesRajoy_21_13

 

Comparación de las menciones hacia los tres candidatos

Ahora vamos a analizar el espectro de menciones hacia los tres candidatos comparándolas entre sí, y también con el espectro de menciones esperado en caso de opiniones “espontánteas” que vimos anteriormente.

menciones a PedroSanchezEl espectro de menciones a Pedro Sánchez es el más afectado por tuiteos masivos. Ha perdido su carácter asintótico y se observan gran cantidad de cuentas “ideologizadas” emitiendo masivamente. Las menciones espontáneas de la audiencia a @sanchezcastrejon han sido distorsionadas por los tuiteos masivos procedentes de cuentas de partido y ciberactivistas del PSOE.

menciones a AlbertRiveraLas tres primeras columnas del espectro de menciones de Albert Rivera tienen estructura normal y reflejan la parte de menciones más más espontánea. Se observa también pérdida de asintoticidad debido a la presencia de grandes emisores de tweets, aunque no tanto como en el caso de Pedro Sánchez.

menciones a PabloIglesiasLas menciones a Pablo Iglesias presentan una estructura más asintótica que las otras dos y por tanto menos distorsionada por los tuiteos masivos (obsérvense las 10 primeras columnas). Hay al igual que en los otros candidatos cuentas que emiten tweets de manera masiva, aunque en menor medida.

La siguiente imagen es una comparativa de las primeras columnas del espectro de menciones para cada uno de los candidatos. En los tres casos se observa “ideologización” (la altura de las columnas debería descender más rápido al movernos hacia la derecha), que es menor en el caso de las menciones a Pablo Iglesias. Las menciones a Albert Rivera aun conservan parte de asintoticidad en las primeras columnas. El caso de Pedro Sanchez es el más evidente de cómo los grandes tuiteadores distorsionan la forma asintótica de las menciones.

menciones_comparacionesPara el propósito que nos ocupa (conocer cual de los tres líderes tuvo más menciones “espontáneas”, menos “ideologizadas”) debemos ignorar las menciones emitidas por los ciberactivistas, cuentas de partido y perfiles falsos. Nos interesa el dato cualitativo y no tanto el cuantitativo, así que para evitar complicaciones innecesarias y sin restar validez a los resultados, hemos considerado sólamente en el valor de la primera columna del espectro (las menciones hechas por usuarios que sólo han emitido un tweet durante el debate) de cada candidato.

comparativa_menciones_segmentadasLos valores de primera columna aproximados (nos interesa sólo el dato cualitativo) son: Pablo Iglesias 1.129 menciones, Albert Rivera 922 menciones, Pedro Sánchez 780 menciones. Lo interesante en este caso es el orden de los candidatos. Estas son las menciones que reflejan la opinion menos militante y por tanto las menciones más representativas de la opinión de la audiencia.

Como conclusión, comparando las menciones segmentadas de los tres candidatos se puede establecer que:

  • las menciones a @Pablo_Iglesias_, pese a ser las menos numerosas en total, son las menos afectadas por tuiteos masivos, lo que se traduce en el mayor número de menciones “espontáneas” y el espectro de menciones con mayor carácter asintótico, y por tanto mayor espontaneidad.
  • las menciones a @sanchezcastejon, pese a ser las más numerosas en total, son las más afectadas por tuiteos masivos, lo que se traduce en la estructura de menciones más distorsionada y el menor número de menciones de calidad, es decir, con baja carga ideológica.
  • en un estado intermedio entre los dos anteriores se encuentran las menciones a @Albert_Rivera.

Las conclusiones anteriores concuerdan con los resultados de las encuestas que tuvieron lugar durante el debate. El más favorecido por estas menciones “de calidad” (menos afectadas por los tuiteos masivos) es Pablo Iglesias, seguido de Albert Rivera y Pedro Sánchez.

@sanchezcastejon el más beneficiado por el tuiteo masivo.

Por último, vamos ha hacer una comparación entre las cuentas más mencionadas durante el debate buscando ver cuáles de ellas han sido beneficiadas por el efecto del tuiteo masivo militante. En primer lugar consideraremos la totalidad de las menciones que tuvieron lugar durante el debate, y en segundo lugar las menciones procedentes de usuarios que han emitido un sólo tweet durante el debate. En ambos casos veremos cuáles son las 30 cuentas más mencionadas, ordenándolas por número de menciones.

ComparacionCuentasMasMencionadas1bSe han coloreado las cuentas políticas, dejando sin colorear las cuentas de influencers o de medios de comunicación.

  • color ROJO: cuentas que se han beneficiado del tuiteo masivo y por tanto bajan o desaparecen del ranking de menciones cuando éste no es tenido en cuenta. Entre ellas las de Pedro Sánchez (pasa del puesto 1º al 4º) y Albert Rivera (pasa del puesto 2º al 3º).
  • color VERDE: cuentas que suben o no se mueven en el ranking de menciones cuando se deja de notar el efecto del tuiteo masivo. Son las de Pablo Iglesias (pasa del 4º puesto al 1º), Alberto Garzón (se mantiene en el 11º puesto) y Partido PACMA (entra en el puesto 29º).

En esta página hemos encontrado otro estudio que ha tratado también el tema de las elevadas menciones a Pedro Sánchez durante el debate.

 

4. OTRAS FUENTES DE OPINIÓN

Tweets más retuiteados

Otra forma de aproximación a la opinión de la audiencia consiste en ver cuáles son los tweets que han tenido más retweets y por tanto más aceptación. En hashtags como #ELPAISDebate, que llegó a ser TT mundial, los grandes emisores de retweets no tienen por lo general tanta fuerza como para modificar los primeros puestos del ranking de los tweets más retuiteados.

Hemos calculado el Top 10 de los tweets que han obtenido más RTs durante el debate. La mayoría de ellos son tweets que ironizan sobre la ausencia de Mariano Raoy. Son los siguientes (hemos modificado el orden de algunos de los tweets por cuestión de espacio).

Tweets_mas_retuiteados_debateLos tweets emitidos por los distintos partidos políticos no han sido capaces de situarse en el Top 10 de retuiteos del hashtag #ELPAISDebate. Los tweets más retuiteados han procedido de los influencers y del organizador del evento, @el_pais, que propuso una serie de encuestas entre los usuarios de Twitter.

Top5

Primeros tweets favorables

Otra forma de acercarnos a la opinión de los usuarios de twitter que vieron el debate es contabilizar en qué posiciónes del ranking encontramos los tres primeros tweets favorables para cada uno de los candidatos a presidente.

Posiciones_primeros_tweetsLos tres primeros tweets favorables a Pablo Iglesias son los mejor posicionados en el Ranking (posiciones 2,6 y 12). A continuación los favorables a Pedro Sánchez (posiciones 11,23 y 29) y por último los favorables a Albert Rivera (posiciones 28,29 y 46).

Pero sin duda el tema que más tweets acaparó en los primeros puestos del ranking fue la ausencia de Mariano Rajoy dando lugar a tweets que trataron el tema con humor (posiciónes 1,2 y 5) como se vio anteriormente.

 

5. AUSENCIAS DE GARZÓN Y HERZOG

Una parte de los tweets mostraban el malestar por las ausencias de Alberto Garzón y Andrés Herzog, que no fueron invitados al debate.

Garzon-HerzogAdjuntamos el espectro de menciones para cada uno de ellos en los que se segmentan las menciones según el número de tweets enviados por los usuarios que las emiten.

menciones_@agarzon or garzonmenciones_Herzog or UPyD

 

6. Conclusiones

Durante el debate a tres del 30/11/2015 organizado por el diario EL PAIS el tema más comentado por los usuarios de Twitter fue la ausencia del presidente del gobierno Mariano Rajoy, siendo objeto de multitud de comentarios humorísticos.

RajoyAusenteLas encuestas realizadas por EL PAIS durante el debate (que dispusieron de mecanismos de control) dieron como ganador a Pablo Iglesias por amplio margen. Sin embargo el usuario más mecionado con diferencia era Pedro Sánchez, lo cual a priori parecía contradictorio.

Hemos comprobado que dichas menciones estuvieron distorsionadas y sobredimensionadas por cuentas militantes que emitieron tweets de manera masiva, entre ellas cuentas asociadas al Equipo Sugus del PSOE. Analizando el espectro de menciones de cada uno de los candidatos es posible filtrar las menciones de calidad, más espontáneas y menos afectadas por la ideología militante. Al hacerlo se elimina el efecto de las cuentas de tuiteo masivo, resultando entonces el orden de los más mencionados similar a los resultados reflejados en las encuestas.

Si te ha parecido interesante, por favor difúndelo.

nuestra cuenta en twitter: @BotsPoliticosNo

Pagina Principal

Licencia Creative Commons
Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial 4.0 Internacional.