¿Sueñan los algoritmos con párrafos eléctricos?

Este artículo sobre robots periodistas o journobots apareció en una versión mejorada en la revista Periodistas 44.

Los textos creados a partir de algoritmos están de actualidad. Cabeceras de todo el mundo los usan: Los Angeles Times, Associated Press, ProPublica, The New York Times, Forbes, The Washington Post, Le Monde o, en nuestro país, El Confidencial.

Los algoritmos tienen muchas aplicaciones en el periodismo, pero sobresalen especialmente dos: el análisis de enormes bases de datos y la producción velocísima de noticias (el tema principal de este artículo). Si se combinan las dos áreas, podemos hablar de periodismo automatizado, donde un algoritmo es capaz de crear una noticia breve a partir de datos sin tratar. El algoritmo localiza los datos, los extrae, los analiza, los convierte en frases y coloca estas frases en un orden lógico para que puedan ser leídas como una noticia breve. En la elaboración del algoritmo, que es un conjunto de instrucciones escritas en código, interviene un equipo humano formado por programadores y periodistas.

Associated Press es probablemente la empresa periodística que más presume de trabajar con algoritmos. Empezó a usarlos en 2015, y desde entonces los utiliza para difundir cotizaciones bursátiles y crónicas deportivas de competiciones menores. Associated Press usa la plataforma de desarrollo de algoritmos de Automated Insights, compañía tecnológica que también trabaja para Yahoo! y para el equipo de la NBA Orlando Magic. La competencia de Automated Insights en EE. UU. es Narrative Science, que nutre de algoritmos a Forbes y a otros tantos medios sin identificar. (Salvo excepciones, los medios no suelen confesar que usan algoritmos, tal y como se verá más adelante)

Un usuario de algoritmos bien conocido es The Washington Post. El diario estadounidense destaca porque tiene su propio sistema de algoritmos, Heliograf, un producto desarrollado entre las paredes del mismo Post por su laboratorio tecnológico, Arc Publishing. Según publicó Jeremy Gilbert, director de iniciativas estratégicas del Post, Heliograf les permite crear un “nuevo modelo de cobertura hiperlocal”, es decir, publicar contenidos dirigidos expresamente a comunidades muy concretas. De momento lo están utilizando para redactar crónicas deportivas de ligas locales. Un ejemplo (la traducción es propia):

Los Yorktown Patriots triunfaron sobre los visitantes Wilson Tigers en un disputado partido el jueves, 20-14.

El partido comenzó con un primer cuarto sin anotaciones.

En el segundo cuarto, Paul Dalzell, de los Patriots, fue el primero en anotar puntos en el marcador con un touchdown de dos yardas a pase del quaterback William Porter.

Wilson estuvo detrás de Yorktown 7-0 en la segunda mitad. Anton Reed, de Wilson, empató el marcador con una carrera de touchdown de dos yardas. Los Patriots tomaron la delantera de Wilson con un touchdown de dos yardas dirigido por Tanner Wall. Los Patriots anotaron nuevamente el gol de campo de 29 yardas de Adam Luncher.

(Y así cuatro párrafos más. Al final del texto se aclara que el artículo fue desarrollado con ayuda de Heliograf)

En España es complicado dar con medios que reconozcan abiertamente que usan robots periodistas para escribir textos. Para la realización de este artículo se consultó a los principales, y contestaron tres: El Confidencial, que sí los usa, eldiario.es, que no, y El Español, que tampoco. El Confidencial lleva unos meses experimentando con algoritmos para la elaboración de crónicas deportivas. “A partir de datos de varios proveedores escribimos noticias como lo haría un redactor”, explica Alejandro Laso, responsable de Elconfidencial.LAB, el área de innovación del digital español. “Nuestra redacción de deportes ha estado entrenando a los algoritmos para que los textos no sean tan robóticos”.

Las tripas del periodismo automatizado

Para que pueda producirse un texto automatizado, es necesario que existan varios elementos: una fuente que ofrezca los datos, un algoritmo que seleccione los datos y los convierta en texto, un ingeniero encargado de la programación del algoritmo y un periodista que diseñe cómo se expondrá la información. Fuente de datos, algoritmo, programador y periodista.

Para la fuente de datos, imaginemos un documento Excel con las estadísticas de un partido de fútbol. Tendrá goles, asistencias, pases clave, entradas, tarjetas amarillas, tarjetas rojas, pases intentados, pases completados, pases interceptados… Según Opta, el proveedor de estadísticas deportivas más utilizado del mundo, cada partido de fútbol reúne unos 2.000 acontecimientos. Esta será la sopa de datos donde el algoritmo meterá la cuchara. ¿Por dónde empezar? Lo decidirá el periodista, que señalará qué es importante y qué no, unas instrucciones que el programador añadirá al algoritmo.

Una vez las prioridades hayan sido programadas en el algoritmo, éste buceará en el Excel y pescará sólo las cifras de los campos señalados como importantes. En este punto, el algoritmo sabrá que el equipo local marcó dos goles, pero no podrá explicarlo con palabras. El periodista suministrará al algoritmo el lenguaje suficiente para que pueda convertir los datos en frases con sentido. Así, marcar un gol más que el contrario se convertirá en una “victoria por la mínima”. Ocho goles contra el equipo local, en una “humillación a domicilio”.

La noticia empezará a ir tomando forma, pero de momento como un texto difuso con apenas unas cuantas frases sueltas. Para ordenarlas, el periodista creará una plantilla para que el algoritmo ordene sus frases. Una estructura podría ser la siguiente: el resultado del partido deberá aparecer en el titular, en el primer párrafo se resumirán los goles, en el siguiente, lo que pasó durante la primera parte, a continuación, lo que sucedió en la segunda parte, la actuación arbitral irá después y las declaraciones de los protagonistas se reservarán para el final.

Cuando el algoritmo tenga claro dónde están los datos que tiene que buscar, cómo tiene que interpretarlos para que se conviertan en texto y dónde tiene que situar sus frases dentro de la noticia, será cuestión de segundos que el robot periodista produzca su noticia. Las primeras veces el resultado podría resultar algo robótico, pero ahí entrará de nuevo la dupla periodista-programador para limar el lenguaje y retocar la estructura del texto.

Salvo que el lector vaya avisado, o sea un detective de la sintaxis, los textos producidos por robots suelen pasar desapercibidos entre los artículos desarrollados desde cero por periodistas humanos.

Más ventajas que desventajas

Las implicaciones de este tipo de tecnología ahora mismo son numerosas. Entre las más evidentes se encuentra la velocidad de producción de noticias. Publicar una noticia rápidamente no depende ya tanto de las capacidades creativas y motrices del periodista como del volumen de producción de la propia fuente. Una vez optimizados los trabajos de programación y adaptación semántica, al algoritmo poco le va a importar si tiene que hacer una noticia sobre la cotización de una empresa o de 35. Esas 35 noticias estarán listas en segundos.

Además de la velocidad de producción, otra novedad importante es la personalización de las noticias, lo que también podemos llamar hiperlocalización. Le Monde utiliza algoritmos para cubrir todas sus elecciones desde las departamentales de 2015, cuando recurrió al sistema de algoritmos de la compañía francesa Syllabs para llevar los resultados de los comicios a los 34.000 municipios en liza. En vez de una sola publicación con miles de resultados sin filtrar, los algoritmos permitieron a Le Monde publicar miles de páginas con los resultados locales.

Más allá de las ventajas en torno a la difusión y personalización de la información, los algoritmos también están ayudando en la propia elaboración de la información. Tareas como analizar datos, segmentar y extraer conclusiones pueden ser realizadas en poco tiempo por los algoritmos. “Estamos inmersos en la inmediatez”, explica Alejandro Laso, de El Confidencial, “y si tienes una máquina que puede procesar los datos por el periodista, pues el periodista tendrá más tiempo y podrá dedicarse a las labores periodísticas que a todos nos gusta hacer”.

Iluminar detalles que sirvan de mecha para iniciar historias es otro punto positivo del uso de algoritmos en periodismo. Heliograf, el sistema de algoritmos del Washington Post, se utilizó durante las últimas elecciones estadounidenses para prevenir cambios de intención de voto. Heliograf comprobaba las progresiones de los datos y, si detectaba alguna anomalía, alertaba a los periodistas sobre un posible cambio de tendencia. El Story Discovery Engine, o Motor de Descubrimiento de Noticias, es otro ejemplo de esta práctica basada en el desarrollo de modelos predictivos. Desarrollado por Meredith Broussard, investigadora del Tow Center for Digital Journalism, este algoritmo se dedica a fiscalizar la financiación de las campañas políticas, avisando si algo no huele bien.

Pero no todas las ventajas tienen una clara vocación periodística. En estos tiempos de sobreatención a lo localizables que seamos para Google, la publicación masiva que permite la escritura automatizada puede ser un aliado para el SEO. Tal y como explicó a EFE Helena Blancafort, una de las fundadoras de Syllabs, la compañía que trabaja con Le Monde, Les Echos o Slate.fr, “estos robots redactores permiten publicar de manera rápida un gran volumen de textos y así consigues (sic) aumentar la audiencia de tu sitio en Internet y posicionar mejor tu web en los buscadores”. “Antes un periódico no tenía que producir tanto contenido pero ahora, en las páginas web, si quieres existir y tener visibilidad, tienes que producir constantemente contenidos nuevos”.

Es esta producción masiva de contenidos la que levanta sospechas entre algunos periodistas. En el artículo When Reporters get Hands-on with Robo-writing: Professionals Consider Automated Journalism’s Capabilities and Consequences, publicado por Digital Journalism, varios periodistas ingleses reflexionaban acerca del uso de algoritmos. Entre sus conclusiones aparecía el temor a que esta tecnología provocase un exceso de información que hiciera difícil, tanto a los periodistas como a los consumidores, elegir qué información era importante entre un mar de noticias.

Otro de los temores principales ante el avance de las noticias automatizadas es la pérdida de empleo. Por el momento no está claro que la automatización de ciertas coberturas signifique un descenso automático del empleo –suponerlo sería sugerir que hay gente en las redacciones que dedica el 100% de su tiempo a escribir crónicas de deportes minoritarios o resultados de bolsa–, pero tampoco se descarta. Para Mª Jesús Alonso, directora de Comunicación y Marketing en BigML, una compañía española especializada en Inteligencia Artificial que trabaja con medios internacionales, la pérdida de empleo sí parece más clara: “los trabajos que probablemente desaparezcan serán los más estructurados”, como “el periodista que escriba artículos muy similares siempre”. En cambio, “los trabajos que requieran entender la psicología humana, o habilidades que requieran cierta estrategia para generar más beneficio, todavía van a necesitar de un buen periodista que pueda generar una historia que enganche a sus lectores”. Por otra parte, Alejandro Laso, responsable de Elconfidencial.LAB, no ve clara la relación entre algoritmos y despidos: “no se trata del miedo a que nos sustituyan con máquinas, se trata de que las máquinas hagan el trabajo más sencillo, más trivial, para que el periodista pueda usar su cabeza y sus fuentes y se dedique a labores más sofisticadas”. El periodista Kevin Roose también iba por ahí cuando dijo en su artículo Robots Are Invading the News Business, and It’s Great for Journalists, publicado en la New York Magazine, que “las historias que los robots de hoy pueden escribir son, francamente, el tipo de historias que los humanos odian escribir de todos modos”. Lo dijo en 2014.

De momento, parece que los robots periodistas van a limitarse a las crónicas deportivas, a contar los vaivenes bursátiles, a la información meteorológica y a las breves informaciones hiperlocalizadas. De momento. Cómo evolucionará el uso de los algoritmos a largo plazo no podemos preverlo, ni tampoco si tendrán repercusiones en el mercado laboral. Ahora mismo todo apunta a una convivencia entre la máquina y el humano, donde la capacidad de trabajo para el análisis y el procesado de datos de los algoritmos se dibuja como un complemento oportuno (y necesario) para el trabajo del periodista humano. Los robots pueden ayudar a conseguir un mejor periodismo, pero también lo contrario. Que se consiga lo uno o lo otro no dependerá de ellos, en tanto que herramientas, sino de cómo los periodistas, y los dueños de los medios, las usen.

Deja un comentario