Programadores en las redacciones

Hoy tenemos acceso a tan gigantesca cantidad de datos que para referirnos a ellos ya no son suficientes los números y recurrimos a las letras. Y aunque buena parte de esos petabytes son cookies, comunicaciones M2M solo comprensibles entre máquinas, contenidos duplicados y/o copiados y/o requetecopiados, vídeos ilegales que YouTube tarda demasiado tiempo en borrar…, en definitiva, morralla digital que ocupa lugar, sí hay datos que son relevantes. Y accesibles. La transparencia tomada en serio ha hecho emerger desde los archivos de instituciones públicas, organizaciones y algunas empresas todo tipo de datos que sí importan porque nos dicen cómo somos. Y es en este océano de datos, cuando los libros de Excel se vuelven torpes e incapaces, donde los programadores se convierten en imprescindibles compañeros de los periodistas.

Y no sólo hablamos de las imaginativas infografías interactivas de los Juegos Olímpicos o del detalle del voto barrio a barrio de las elecciones. El trabajo de los programadores va mucho más allá de la visualización de datos, que es cierto que es la parte más reconocible y viral de sus funciones, pero ésta solo se sostiene si detrás hay una base de datos suficientemente depurada y trabajada.

La combinación de programación y periodismo llegó hace más de un lustro a España, y ya son varios los cursos y másteres que se imparten sobre esta especialidad, casi siempre bajo el paraguas del periodismo de datos. Su implantación en la prensa española es general, al menos entre los medios más grandes y los nativos digitales. Normalmente suelen ser equipos de dos o tres personas a los que se recurre para buscar o plasmar datos una vez está decidido el enfoque de la información. Los programadores no suelen participan a la hora de elegir los temas, salvo en unos pocos casos: cuando quien escribe el código no es un ingeniero, sino un periodista con conocimientos de programación.

Periodistas que saben programación

En El Confidencial trabajan cinco perfiles relacionados con la programación: uno en la unidad de datos, otro en automatización de contenidos y tres más en formato que comparten su tiempo con el departamento de branded content (contenidos vinculados a una marca). En total, cinco programadores para una redacción de noventa redactores.

Jesús Escudero es quien trabaja en la unidad de datos. Terminó Periodismo, cursó un máster de periodismo de datos y, después, hizo un curso MOOC (siglas en ingles de Cursos Online Gratis) de R, un lenguaje de programación muy útil para el análisis estadístico y gráfico de ingentes cantidades de datos. “Cuando entré [al máster], no sabía casi ni Excel. Había trabajado con informes de sueldos de alcaldes, pero siempre a mano, con Word y algo de Excel. Entré en la programación por necesidad, porque si te encuentras con un proyecto que necesite una base de datos extensa, entonces Excel no te vale porque solo te deja trabajar con un millón de filas y no vas a trocear la base de datos”, explica Escudero mientras recuerda que para un reportaje sobre el éxodo urbano analizaron 53 millones de filas de datos procedentes de 31 archivos.

Aunque se define como un noventa por ciento periodista y diez por ciento programador, Escudero emplea casi todo su tiempo en combinar datos, limpiarlos y homogeneizarlos. “Raro es que me llegue una base de datos limpia. Como con las elecciones. Lo suyo sería que Interior te mandara todos los datos en un CSV (archivo de Excel), pero la realidad es que no vienen así y tú tienes que limpiar todo eso para que luego se pueda usar”.

Y limpiar no es solo separar el grano de la paja, sino adecentar los formatos —a veces pueden llegar varios formatos distintos en un mismo documento o ser ilegibles para los lenguajes de programación—, reordenar las cifras en nuevas columnas buscando la sencillez o crear fórmulas que crucen datos para que los periodistas puedan obtener números que ayuden a explicar lo que están contando en el reportaje.

En el caso de Escudero, su relación con los periodistas es fluida. “En El Confidencial no hay una jerarquía rígida, así que hay un diálogo donde cualquiera puede proponer cosas. A veces viene un periodista con una pista o una hipótesis y pide al programador que lo confirme con los datos. Y al revés: nosotros podemos encontrar un dato que nos de pie a proponer algo a los periodistas.”

La tirantez viene cuando, explica Escudero, el periodista pide al programador que los datos avalen su hipótesis y resulta que estos no siguen esa línea. “Hay gente que tiene la mente más abierta para decir ‘Oye, esta hipótesis mía no se ha validado’ y no pasa nada, y otros que dicen ‘Pues habrá algún dato que la avale’ y siguen adelante aunque los datos digan lo contrario”. No pasa todos los días, reconoce Escudero, pero pasa.

El artículo sigue en Telos

Deja un comentario