Periodismo automatizado en agencias de noticias europeas [reseña]

Fuente: informe reseñado

Putting Europe’s Robots on the Map: Automated journalism in news agencies es el título de un reciente informe del Reuters Institute for the Study of Journalim sobre la automatización en redacciones de agencias de noticias europeas, un ámbito que a veces se conoce como periodismo automatizado, periodismo computacional e incluso como robot periodista. Es su autor Alexander Fanta, un periodista de la Austrian Press Agency (APA).

El informe, de 24 páginas ha sido llevado a cabo mediante una serie de entrevistas con responsables de agencias además de una revisión bibliográfica de un tema que, pese a su juventud, ya dispone de diversas publicaciones.

Como es un informe relativamente corto, lo mejor, qué duda cabe, es leerlo en toda su extensión, pero para poder proponer una primera aproximación, tipo resumen ejecutivo, hemos tomado el apartado denominado Key findings. Lo que sigue es una traducción, más o menos literal, de tal apartado.

Por cierto, en la ilustración que acompaña el informe, España aparece entre los países sombreados (en lugar de destacados), porque la agencia contactada por el autor, Efe, señaló que no están utilizando esta tecnología.

Informe sobre periodismo automaatizado. Cubierta informe Reuters
Cubierta del informe

Principales resultados del informe

Lo que sigue es una traducción (propia) de las páginas 10-12  del apartado Key findings del informe reseñado:

Las agencias de noticias en toda Europa están adoptando la automatización en sus salas de redacción. Mi encuesta incluye 14 organizaciones con sede en Europa, así como Associated Press (AP) con sede en los Estados Unidos. Entre ellas, nueve informan que utilizan alguna forma de creación automática de texto. Otras dos señalan que están trabajando en proyectos de automatización.

Una agencia de noticias, Lusa de Portugal, experimentó con informes automatizados para la elección parlamentaria portuguesa de 2015. Lusa no ha utilizado la tecnología desde entonces, pero «la agencia es consciente de que esta tecnología será parte del futuro del periodismo», dijo un alto responsable de la agencia.

Tres agencias de noticias, CTK de Czechia, Efe de España y Ansa de Italia, aseguran que no utilizan ninguna forma de automatización.

Los ámbitos de uso más comunes para los robots-periodistas son las finanzas y los deportes. 7 de cada 9 agencias de noticias utilizan la automatización en uno o ambos campos. Una razón por la que muchas agencias de noticias se centran en la automatización de los deportes es la disponibilidad de datos, señala Maija Lappalainen de la agencia de noticias finlandesa STT. En concreto,  observa que «en los deportes tienes las reglas, sabes que éste es el ganador, éste es el perdedor y esto es lo que sucedió. Es una forma fácil de empezar».

Los robots periodistas también escriben sobre los resultados de las elecciones, así como sobre las cifras oficiales de educación, desempleo y sector inmobiliario. Estos resultados suelen depender de que las fuentes oficiales proporcionen cifras en un formato fácilmente utilizable.

La aplicación más común consiste en usar plantillas que transcriben datos tabulados en palabras, una tecnología también conocido como Generación de Lenguaje Natural (NLG).  En concreto, 8 de cada 9 agencias usan la tecnología de automatización de esa manera. Pero también hay otras formas de automatización del texto. Una herramienta de control de versiones desarrollada por la agencia de noticias holandesa ANP consiste en un bot que reescribe las historias humanas en un lenguaje más simple para el servicio denominado Kids Feed.

La mayoría de los robots-periodistas no son muy sofisticados. Sólo dos organizaciones de noticias encuestadas, Reuters y la agencia noruega NTB, dicen que sus algoritmos son capaces de comparar nueva información con datos históricos e interpretar esos datos en forma de afirmaciones. Un widget lanzado por la agencia de noticias sueca TT compara las cifras locales de rendimiento escolar y los precios de la vivienda con el promedio nacional.

Otras agencias de noticias usan robots sólo para reportar nuevos datos, proporcionando instantáneas básicas en lugar de historias de largas capaces de poner eventos en un marco histórico. Una razón para esto es la precaución contra posibles errores al comparar los nuevos datos con los antiguos. «Realmente nos hemos mantenido alejados de eso, porque obviamente, cuanto más sofisticado es lo que intentas conseguir, más aumentas las posibilidades de error», explica Lisa Gibbs de AP.

No todo el uso de la automatización es transparente a clientes y lectores. Reuters, AP y NTB suelen identificar sus noticias producidas por robots. Sin embargo, esto no se aplica a alertas de una sola línea, llamadas snaps, que Reuters envía. Al menos dos agencias publican noticias parcialmente creadas con plantillas sin mencionar al robot como co-autor.

Gran parte del contenido automatizado se publica sin ser revisado por editores humanos. Reg Chua, gerente de innovación de Reuters, informa que su agencia genera 950 alertas y 400 noticias al día y que se publican sin interferencias humanas. Al menos otras cuatro agencias de noticias publican por al menos algo de material automatizado sin supervisión humana.

Los editores responsables sostienen que el valor de la automatización quedaría muy limitado si las historias tuvieran que pasar por la supervisión humana. Otro factor mencionado es que los robots, cuando están bien entrenados, son muy precisos. «Una de las grandes ventajas de los algoritmos es que no cometen el mismo error dos veces. Una vez corregido el error, no volverán a hacerlo «, dice Helen Vogt, de NTB.

Una motivación importante para automatizar el contenido es el deseo de crear nuevos productos. Por lo menos 6 agencias de noticias en esta encuesta señalaron que automatizaron el contenido para crear un nuevo producto o ampliar en gran medida el servicio existente en ciertos campos.

Por el contrario, la reducción de los costos del trabajo humano no fue mencionada por ninguna agencia de noticias como factor en la decisión de automatizar. Sin embargo, desempeña un papel en la asignación de recursos en la sala de redacción. Después de automatizar los informes de beneficios, AP informó de un ahorro de tres empleados de tiempo completo, que fueron asignados a otras tareas.

Una posible razón por la que la automatización no puede reemplazar mucho personal humano es el costo. Varios encuestados mencionaron los gastos de desarrollo como una barrera para la entrada y para una mayor expansión. Los conocimientos técnicos necesarios normalmente no se encuentran en la propia empresa, y por lo tanto puede crear un gasto considerable por la necesidad de desarrollo externo.

Algunas agencias de noticias también señalaron los altos costos de operación de los productos automatizados. «La gente piensa que la automatización es barata, pero la automatización en realidad no es tan barata. Si automatizas, te cuesta dinero. Tienes que mantenerlo, seguirlo, rastrearlo, y tienes que manejarlo. En realidad no está [aquí] para ahorrar mucho dinero ‘, dijo Reg Chua de Reuters.

La automatización ha creado la nueva tarea de mantenimiento de datos. Los conjuntos de datos para informes de ganancias deben actualizarse constantemente para tener en cuenta a las empresas que cambian de nombre y las fusiones, de lo contrario pueden producir historias incorrectas o engañosas. «No es una de estas cosas donde se crea el proceso y luego simplemente puedes olvidarte de él. Tienes que gestionar constantemente los conjuntos de datos «, dijo Lisa Gibbs de la AP.

El acceso a los datos depende frecuentemente de terceros: proveedores y fuentes oficiales. Mis datos son algo incompletos, pero al menos cuatro agencias de noticias dependen de datos de fuentes externas para su automatización. Al menos dos agencias de noticias pagan por esos datos. Si bien esto puede no representar un panorama general, es un fuerte indicador de que las agencias de noticias tienen una tendencia a la acudir a  fuente de sus datos externas en lugar de desarrollar recursos propios. Una notable excepción a esto es Reuters, que busca y estructura su propio conjunto de datos financieros.

 

Una vez revisadas las claves principales, cabe insistir que el informe trata desarrolla los aspectos anteriores en otros apartados, concretamente en Discussion: The limits of automation y Conclusion que constituyen el grueros del informe.

El informe cuenta con una introducción donde detalla la metodología, un anexo con la lista de las ocho personas entrevistadas para el informe y una bibliografía que incluye 14 artículos e informes sobre el tema.


La referencia

Alexander Fanta. Putting Europe’s Robots on the Map: Automated journalism in news agencies. Reuters Institute for the Study of Journalism. July, 2017

 Acceso


Referencias incluidas en el informe (editadas)