Menú Cerrar

Big data. Se puede usar para cambiar resultados de elecciones?

Si Obama usó técnicas de big data en sus campañas y ganó, es fácil atribuir causalidad a esa correlación. Si Trump, supuestamente, se valió de los servicios de Big Data de la controversial empresa Cambridge Analytica y también ganó, no es difícil atribuirlo a los efectos de la tecnología.

En la Argentina, en 2015, también se dijo que Cambiemos utilizó en su campaña recursos técnicos inspirados en el modelo de Obama y que, de otro modo, no hubiera logrado ganar.

Sin embargo, en 2019 probablemente haya usado en las PASO los mismos métodos con, evidentemente, otros resultados. Es hora de preguntarse qué se entiende por big data en las campañas políticas, si no hay mucho de hype en la casi magia que se atribuye a ese concepto y si realmente su aplicación hace ganar elecciones.

 

Qué es y qué no es 

Hoy casi todo lo que hacemos deja una huella registrable. Cuando buscamos algo en internet desde el celular, cuando entramos a redes sociales o cuando usamos WhatsApp. Potencialmente, cada interacción podría ir alimentando un inmenso perfil personal. Una planilla de Excel o una base de datos tradicional SQL probablemente colapsaría o se haría muy lenta si tuviera semejante cantidad de datos.


 

El presidente habló de Conicet y la institución salió a cruzarlo. Qué se dijeron.

Por cierto, el volumen de los datos potencialmente recolectables sobre cada persona (que puede llegar a ser de unos 40 terabytes, por ejemplo), no es la razón de que no sean fáciles de utilizar. Cualquier conjunto de datos, por grande que sea, puede analizarse sin problemas si el universo es representable por una muestra.

El problema de los conjuntos de datos de los que estamos hablando es que, precisamente, no son universos construidos ad hoc, no son estables, ni siquiera son conocidos en su totalidad y, en general, no son muestreables. Si lo fueran no habría necesidad de utilizar todos los datos disponibles, bastaría una porción.

Cuando un universo es muestreable, lo recomendable justamente es hacerlo, porque es más sencillo y barato. Es lo que se hace, por ejemplo, cuando se diseña y procesa una encuesta. 

Las técnicas de big bata se usan justamente cuando no es válido extraer una muestra de datos representativa del universo. Como explica el científico de datos Ernesto Mislej —cofundador de 7Puentes, firma dedicada a la extracción de datos y el aprendizaje automático—, “se mencionan ciertas técnicas en el paraguas de Big Data por amabilidad, pero cosas como computer vision, procesamiento de lenguaje natural, robots de scraping de la web, estrictamente, no implican big data. A la inversa, lo que sí es big data porque requiere el procesamiento en tiempo real de datos masivos, diversos y con errores, también podría reducirse a una práctica más pequeña y simple si no se cuenta con los recursos suficientes”

 

Para qué se usa en política

El uso que se da al big data en política no es muy diferente a cualquier tipo de marketing. Como explica Mislej, “el cambio radical es que hoy se puede partir una pauta publicitaria en millones de micropautas. Hace veinte años uno simplemente firmaba un contrato con un programa de televisión por una pequeña pauta publicitaria que se emitiría tal hora y tal día. Hoy, un programador y un analista pueden sentarse en una computadora y diagramar una campaña dividida en millones de microcampañas. Y testear dentro cuáles performaron bien, cuáles mal, experimentar con variantes de público target y microtargetizar según características de cada persona”. 

En última instancia, el propósito es simplemente obtener una lista de ciudadanos para contactar. La ciencia de datos, de la cual big data es solo una parte, ayuda a generar hipótesis, identificar variables instrumentales y a diseñar experimentos a una escala muy granular.

Todo esto, supuestamente, ayuda a generar mensajes distintos para cada microsegmento de votantes, y así optimizar las probabilidades de que incurran en diversas formas de conductas políticas, no solamente votar, sino también fiscalizar, donar dinero o ser voluntario.

Orlando D’Adamo, consultor político y director del Centro de Opinión Pública de la Universidad de Belgrano, añade que “la campaña de las PASO, marcadamente, tuvo un tono en WhatsApp y otro en los medios audiovisuales tradicionales. En WhatsApp se vio mucha campaña negativa, donde más que mostrar la propia propuesta se señalan defectos de los otros”.

Es usual, asimismo, la creación de páginas en Facebook que quizá no hablan de política sino, por ejemplo, de mascotas, cuyo análisis permite dividir a los visitantes en nichos a los cuales mandar mensajes diferenciados. Además es posible crear redes artificiales de simpatizantes para dar la impresión de tener mucho apoyo. 

También, en caso de disponer de datos de consumo, por ejemplo, de supermercados, es posible correlacionar determinadas pautas con reacciones más o menos favorables hacia ciertos discursos.

“Esto también se utilizó en la segunda campaña de Obama”, destaca Mislej. Incluso pueden sumarse datos satelitales, de flujos de tráfico y de geolocalización. Otros datos de interés pueden provenir de fuentes públicas, como la Encuesta Permanente de Hogares. También pueden considerarse los datos históricos de resultados de elecciones pasadas, mesa por mesa. 

Ahora bien, todas estas técnicas ciertamente requieren ciencia de datos, pero no necesariamente big data. Aplican matemática clásica que, en caso de requerir capacidad de procesamiento excesiva para los tiempos de que se dispone, pueden resolverse mejor usando tecnologías de procesamiento en paralelo que sí son propias del big data, como Hadoop con MapReduce o Cassandra.

Además, como explica Orlando D’Adamo “no cualquiera puede pagar el big data. Las encuestas sí las puede hacer cualquiera. Pero el procesamiento de toda la información que la gente vuelca en diversos medios, como las redes sociales, para establecer perfiles de votantes a los cuales llegar con propuestas muy específicas y aumentar la posibilidad de tener éxito, es más costoso”.

Eduardo Mislej, científico de datos y cofundador de 7 Puentes.

Qué es de Cambridge Analytica

Cuando se habla de big data en campañas políticas, inmediatamente viene a la mente el llamado “caso de Cambridge Analytica”. Como se recordará, se trató de una investigación de The Guardian, The Observer y The New York Times que reveló que datos provenientes de cierto test de personalidad publicado en Facebook por un académico, Aleksandr Kogan, terminaron en manos de la empresa de marketing político Cambridge Analytica quien, a su vez, los usó para hacer perfiles y mensajes orientados.

La aplicación que hacía el test también utilizaba los contactos en Facebook de quienes lo respondían, con lo cual fueron millones las personas cuyos datos fueron recolectados y usados sin consentimiento ni conocimiento por Cambridge Analytica. Supuestamente, conocer la personalidad de millones de posibles votantes permitiría hacerles llegar anuncios eficaces para ganar su intención de voto. Esta actividad habría sido lo que convirtió a Donald Trump en presidente en 2016.

Además, en una cámara oculta que le hizo el Canal 4 News de Inglaterra a Alexander Nix, CEO de Cambridge Analytica, éste aseguró haber trabajado en más de 200 elecciones del mundo, en particular, en la Argentina. En la misma filmación aparecía el entonces director de Política Global de Cambridge Analytica, Mark Turnbull, quien afirmaba que, tras haber conseguido material nocivo para oponentes políticos, la empresa podía viralizarlo discretamente en redes sociales. 

Luego del escándalo, se supo que Cambridge Analytica efectivamente trabajó en la campaña de Ted Cruz, quien había competido en las primarias contra Trump y perdió. Pero, como publicó en su momento el New York Times, no está claro si realmente luego trabajó para Trump. Por cierto, como refirió dicho periódico, “los datos y modelos de Cambridge Analytica fueron ligeramente menos efectivos que los del existente sistema del Comité Nacional Republicano”. El artículo también refiere que más de la mitad de los votantes de Oklahoma que Cambridge había identificado como simpatizantes de un partido, en realidad favorecieron a otro. 

A la postre, Cambridge Analytica cerró y Mark Turnbull, junto con otros ex directivos de aquella empresa, crearon otra: Auspex International. Según un comunicado de prensa, esta firma quiere “dejar atrás la historia de Cambridge Analytica y hablar sobre el nuevo enfoque ético para el uso de big data/data analytics para siempre, incluyendo discusiones sobre cómo las interacciones del gobierno con los ciudadanos (y viceversa) podrían mejorarse a través de una comprensión impulsada por las necesidades y preferencias de las personas”. 

En entrevista con Infotechnologyel ahora Managing Director de Auspex International, Mark Turnbull refirió que “el caso Cambridge Analytica abrió un debate largamente esperado sobre la propiedad y el uso de los datos de los individuos. Las personas tienen derecho a saber cómo se recogen, utilizan y almacenan sus datos. Utilizar la información de la seguridad social de los ciudadanos con fines electorales sin su consentimiento sería totalmente contrario a la ética, pero al mismo tiempo muchas personas no se opondrían a que su gobierno combinara los datos de la seguridad social con otras fuentes de datos con el fin de combatir la evasión fiscal, por ejemplo. En última instancia, se trata de una cuestión de transparencia y consentimiento”.

Ante la pregunta de si están asesorando a algún partido político en el país, Turnbull responde que “respetamos la confidencialidad de nuestros clientes y nunca revelamos su identidad o los detalles del trabajo que realizamos. Sin embargo, puedo decir que nos interesan mucho las elecciones actuales y que estamos deseosos de desarrollar nuestros negocios en la Argentina y en toda la región”

 

.

¿El oficialismo corre con ventaja?

Antes de las elecciones, se produjeron debates acerca del posible uso que el oficialismo podría dar a datasets obtenidos de bases de gestión estatal para reforzar su propia campaña electoral. Por ejemplo, fue cuestionada una resolución en julio de 2016 de la Jefatura de Gabinete de Ministros de la Nación donde se establecía que la Anses remitiría periódicamente su base de datos de nombres y apellidos, DNI, domicilio, teléfonos, correo electrónico, fecha de nacimiento, estado civil y estudios de los ciudadanos a la Secretaría de Comunicación, para instrumentar políticas de comunicación pública.

Al respecto, el gobierno siempre aseguró que no había usado estos datos con fines electoralistas. Si lo hizo, evidentemente no le supuso una ventaja crucial. Es cierto que, como dice Mislej, “en general, el que tiene más dinero tiene más recursos y el que tiene datos más recientes, tiene ventaja”. Pero si se usaron o no se usaron los datos de Anses de modos objetables es difícil de verificar. 

Por otra parte, según Mark Turnbull, ex Cambridge Analytica y actual CEO de Auspex Internacional, “las bases de datos como la de la ANSES tienen un valor limitado en términos electorales, ya que, si bien pueden proporcionar cierta información sobre la confianza de los individuos en el Estado, no revelan otros factores que influyen en sus decisiones de voto, tales como las necesidades de su familia en general, o sus puntos de vista sobre la igualdad, la religión, el medio ambiente, entre otros”.

Más allá de su eficacia, el uso de datos como los de Anses para fines electorales puede ser ilegal o no ético. La Agencia de Protección de Datos Personales y Acceso a la Información Pública publicó una guía oficial sobre el tratamiento de los datos personales en este tipo de contextos. Su director, Eduardo Bertoni, dice que “cualquiera que advierta que no se cumple con esa guía tiene abierta la puerta para denunciar al Estado o a los particulares que pudieran estar involucrados”.

Respecto del tratamiento de datos en bases de datos públicas también la Agencia ha iniciado acciones de oficio: “Existen actualmente tres que están en trámite, porque advertimos posibles fallas de seguridad. Por el buen progreso de las investigaciones me excuso de dar mayores precisiones”, refiere Bertoni. 

Y, con respecto a las apps que podrían recolectar datos personales, el funcionario asegura que “la Agencia, como autoridad de control autárquica e independiente, realiza sobre las apps diseñadas para la campaña electoral el mismo control que sobre aplicaciones móviles y el tratamiento de datos personales en caso de privados. A veces actuamos por denuncias. Otras iniciamos investigaciones de oficio. De oficio, en el ámbito privado, recientemente hemos sancionado a Yahoo!, como para citar un ejemplo”. 

¿Tiene efecto?

Los resultados de las PASO permiten poner en duda que la ciencia de datos tenga un poder preocupante para manipular la voluntad de los votantes en determinada dirección. Como dice Ernesto Calvo, profesor de Ciencia Política de la Universidad de Maryland, “Big Data implica tener mejor data y, tener mejor data, hace que uno invierta mejor los recursos que tiene para una campaña. Eso es todo. Se pueden hacer muchas cosas con Big Data en relación con una elección, pero ninguna de ellas tiene un efecto demasiado dramático, salvo que la diferencia en intención de voto sea por muy poco margen. Se puede orientar los mensajes de acuerdo con los consumos de medios, redes sociales, perfil sociodemográfico, del mismo modo que en cualquier campaña, hacia votantes con mayor probabilidad de votar por determinado partido».

«También se pueden usar trolls, bots y formas organizadas de distribución de la violencia política online para distribuir información, pero el efecto de todo esto es bastante modesto. Sin duda, quien tiene mejores datos puede hacer mejor campaña. Pero, de ahí a que el que hizo mejor campaña gane, hay un trecho. Tampoco es muy creíble que las campañas de inoculación de información, como las que presuntamente trataron de influir en la campaña de los Estados Unidos, tengan el efecto de cambiar el voto. Sí pueden tener efecto en desmovilizar y reducir la participación política.»

Según Turnbull: “Los datos en sí mismos no son una varita mágica electoral. Convertir las ideas que se extraen de ella en contenido que resuene con su público objetivo es lo que marca una verdadera diferencia en la campaña electoral”.