Análisis comparado de la calidad de crónicas deportivas elaboradas por inteligencia artificial y periodistas


Universidad de Castilla-La Mancha, España

Resumen

Introducción: En los últimos años se ha normalizado la presencia de programas de inteligencia artificial en las redacciones periodísticas, lo que ha permitido la redacción de textos a través de algoritmos. La presente investigación analiza las características de las crónicas deportivas realizadas por inteligencia artificial, comparándolas con las realizadas por periodistas. El objetivo es conocer si este tipo de textos cuentan con los mismos estándares de calidad de los que disponen las crónicas realizadas por periodistas. Metodología: La metodología empleada parte del análisis de contenido de 28 crónicas periodísticas, 14 escritas por periodistas y 14 escritas mediante programas de inteligencia artificial. En todos los casos se trata de crónicas deportivas sobre partidos correspondientes a la Liga de Fútbol Profesional (de primera y segunda división). Resultados: Los resultados demuestran que los textos generados mediante la inteligencia artificial son eficaces a la hora de recoger y ordenar datos, así como dar a conocer las acciones del juego. Sin embargo, carecen de muchas de las cualidades de la crónica deportiva, presentes en los textos firmados por periodistas. Conclusiones: Las crónicas producidas por la inteligencia artificial no suponen un aporte de calidad al género periodístico, careciendo de carácter analítico o interpretativo, en ambos casos, cualidades presentes tradicionalmente en el periodismo deportivo.

PALABRAS CLAVE: inteligencia artificial; periodismo deportivo; producción periodística; crónica; calidad; periodismo; automatización de contenidos.

Comparative analysis of the sports chronicle quality written by artificial intelligence and journalists

Abstract

Introduction: In recent years, the presence of artificial intelligence programs in newsrooms has become standardised, which has allowed the writing of texts through algorithms. This research analyses the characteristics of sports chornicles written by artificial intelligence, comparing them with those written by journalists. The aim is to find out whether these types of texts have the same quality standards as those of chronicles written by journalists. Methodology: The methodology used is based on the content analysis of 28 journalistic chronicles, 14 written by journalists and 14 written by artificial intelligence programmes. In all cases, these are sports chronicles on matches corresponding to the Spanish Professional Football League (first and second division). Results: The results show that AI- generated texts are effective in collecting and ordering data and in reporting game action. However, they lack many of the qualities of a sports chronicle, which are present in texts written by journalists. Conclusions: The chronicles produced by artificial intelligence do not represent a quality contribution to the journalistic genre, lacking analytical or interpretative character, in both cases qualities traditionally present in sports journalism.

KEYWORDS: artificial intelligence; sports journalism; journalistic production; chronicle; quality; journalism; content automation.

(*) El autor Rubén Ramos recibe financiación del Fondo Europeo de Desarrollo Regional (FEDER) convocatoria 2018/11744

(**) El autor Luis Mauricio Calvo recibe financiación del Fondo Europeo de Desarrollo Regional (FEDER) convocatoria 2020/3771.

Cómo citar este artículo / Referencia normalizada

Murcia Verdú, F. J., Ramos Antón, R. y Calvo Rubio, L. M. (2022). Análisis comparado de la calidad de crónicas deportivas elaboradas por inteligencia artificial y periodistas. Revista Latina de Comunicación Social, 80, 91-111. https://doi.org/10.4185/RLCS-2022-1553

Keywords

artificial intelligence, sports journalism, journalistic production, chronicle, quality, journalism, content automation

Introducción

La inteligencia artificial se ha incorporado a la dinámica de los medios de comunicación en los últimos años, coincidiendo con un momento de amplia demanda de contenidos, en plena eclosión digital. Si bien el propio concepto de inteligencia artificial se remonta a Alan Turing, a mediados del siglo pasado, no se plantea su posible aplicación al periodismo hasta la primera década del presente (Matsumoto, Nakayama, Harada, & Kuniyoshi, 2007). Su incorporación a las dinámicas profesionales de los medios de comunicación supone una oportunidad, tal y como ha ocurrido con otros elementos propios del ecosistema digital, como las redes sociales, el teléfono móvil o el vídeo online (Cornia, Sehl, & Nielsen, 2016). Asimismo, el denominado data journalism o periodismo de datos, a pesar de responder a una definición poco específica (Broussard, 2018, p. 91) también surge como resultado de los avances tecnológicos recientes en las redacciones periodísticas.

La incorporación de la inteligencia artificial al periodismo, aparte de liberar a los periodistas para poderse dedicar a otras tareas y de favorecer la producción de artículos de forma mucho más rápida (Sim y Shin, 2016), también ofrece numerosos interrogantes. Entre ellos,Carlson (2015) identifica algunos que engloban cuestiones tan importantes como el estilo de la redacción y la producción de las noticias. Esta tecnología resulta útil en la generación de noticias rutinarias en temas repetitivos sobre los que se dispone de datos claros, precisos y estructurados (Graefe, 2016).

Su presencia en las redacciones periodísticas ha despertado el interés académico desde diversos prismas (Calvo-Rubio y Ufarte-Ruiz, 2021; ) (Parratt-Fernández, Mayoral-Sánchez, & Mera-Fernández, 2021; Túñez, 2021). Así, se han analizado las posibilidades que ofrece para combatir la desinformación (Manfredi y Ufarte, 2020), los profundos cambios que va a suponer, incluso en el diseño de las redacciones (Ali y Hassoun, 2019) o la oportunidad que representa para los medios de comunicación, en un momento en el que estos necesitan una rápida generación de contenidos con menores costes de producción (Montal y Reich, 2016).

A pesar de considerarse una actividad humana, algunos autores (Miroshnichenko, 2018) aseguran que ya es posible que los robots puedan realizar el trabajo periodístico hasta desplazar a los profesionales. La investigación llevada a cabo porClerwall (2014) demostró que los lectores no eran capaces de diferenciar noticias creadas por periodistas de aquellas elaboradas mediante sistemas de inteligencia artificial. En el caso de Graefe (2016), su estudio llegó a comprobar que los lectores otorgaban una mayor credibilidad a las noticias escritas por la inteligencia artificial que abordaban temáticas relativas al fútbol o la economía. En lo que respecta a la estructura y redacción de textos, el trabajo de Túñez-López, Toural-Bran y Valdiviezo-Abad (2019) no encuentra diferencias entre los producidos por humanos y la inteligencia artificial, a pesar de las que sí se pueden encontrar en enfoque y género periodístico. Una perspectiva contraria a la que adopta Diakopulos (2019), quien reivindica la necesaria presencia humana en lo que define como “algorithmic media” (p. 339), o Murcia y Ufarte (2019), que alertan sobre los peligros que pueden ceñirse sobre la calidad periodística en el caso de que se generalice esta práctica.

La relación entre la inteligencia artificial y los seres humanos en las redacciones periodísticas, como ocurre en general con cualquier avance tecnológico en la sociedad, se encuentra sujeta a una continua negociación (Lewis, Guzman y Schmidt, 2019). La implementación de estas técnicas obliga a resituar el papel que juegan los periodistas y, desde una perspectiva ética, a los medios de comunicación a ser transparentes con la utilización de este tipo de herramientas. Los lectores tienen derecho a saber si una pieza está escrita por un periodista o por un programa de inteligencia artificial (Ufarte, Calvo y Murcia, 2021).Lemelshtrich (2018) plantea que para poder competir con la inteligencia artificial los periodistas humanos deben pensar de forma diferente, experimentar con nuevas formas de expresión para contar sus historias o disponer de una formación multidisciplinar más profunda en artes y filosofía, en la búsqueda de soluciones más creativas e innovadoras (p. 26). Esto es, profundizar en las cualidades más humanas del periodismo al mismo tiempo que se familiarizan con las posibilidades que ofrecen las nuevas tecnologías. Siguiendo esa línea, el estudio realizado por Túñez, Fieiras, and Vaz-Álvarez (2021), recopilando la visión de académicos y responsables de empresas en el ámbito español, señala que la automatización del periodismo puede adquirir más importancia en la cobertura de temas con datos estructurados que en eventos de ámbito local, por lo que se sugiere la incentivación de las aportaciones de los periodistas.

Periodismo deportivo, inteligencia artificial y calidad

A pesar de su relevancia en los medios de comunicación contemporáneos, el periodismo deportivo no se ha caracterizado por ser objeto de análisis, lejos del trato que habitualmente reciben otras áreas de la industria mediática (English, 2016).

A nivel tecnológico, el periodismo deportivo ha sabido innovar, incorporando avances tales como el periodismo de datos a sus crónicas y retransmisiones (Rojas, 2014; Horky y Pelka, 2017) o la inclusión del video en 360º a la narrativa habitual de las coberturas periodísticas (Martínez y Torrado, 2017, p. 154). No en vano, tal y como señalan Boyle y Haynes (2009), un aspecto que ha caracterizado tradicionalmente la cultura de los aficionados al deporte ha sido la constante necesidad de velocidad en la transmisión de información, algo que la incorporación de estas tecnologías favorece (p. 183). Esa necesidad de contenido relacionado con el deporte no solo ha implicado a los medios, sino también a las instituciones deportivas, que también han desplegado diferentes estrategias en las redes sociales para estrechar su vínculo con los fans (Thompson, Martin, Gee, & Geurin, 2017).

En el año 2010 comenzaron a desarrollarse proyectos de inteligencia artificial vinculados con la elaboración de noticias deportivas (Bunz, 2010). En el ámbito español ha sido incorporada a las redacciones para la documentación o la elaboración de crónicas, como las realizadas por BeSoccer (Segarra-Saavedra, Cristòfol y Martínez-Sala, 2019) o AnaFut en El Confidencial (Rojas y Toural, 2019). En ambos casos se destaca la oportunidad que supone la utilización de esta tecnología para el futuro del periodismo, en un ámbito en el que el análisis de datos se encuentra tan normalizado.

En esa misma línea,Galily (2018) defiende que la inteligencia artificial aplicada al periodismo deportivo puede suponer la incorporación de un mayor número de profesionales, destinados a la generación, recopilación y gestión de los datos para alimentar los procesos de generación de la inteligencia artificial. Las innovaciones tecnológicas también suponen la alteración del rol tradicional del periodista deportivo, pasando el profesional a ocupar un papel de moderador más que de mediador (Perreault y Bell, 2020) o centrándose en la búsqueda de historias periodísticas en torno a la competición o sus protagonistas (Rojas & Toural, 2019).

Tradicionalmente el periodismo deportivo se ha visto acompañado de una percepción de falta de seriedad en contraste con el de otro tipo de ámbitos (English, 2017). En una investigación realizada en Chile, Scherman y Mellado (2019) detectaron que el periodismo deportivo utiliza menos fuentes de información, integra menos puntos de vista y presenta al público menos información verificable. Resultados similares se encontraron en la investigación llevada a cabo en España y México por Márquez- Ramírez y Rojas (2017) sobre el tratamiento informativo de uno de los mayores casos de corrupción del fútbol mundial, el denominado FIFA Gate. En el caso español, esta investigación constató que el nivel de proactividad de El País duplicó al del diario Marca. No obstante, en todo el mundo se están apreciando cambios en las prácticas profesionales (Weedon et al., 2016; Goikoetxea y Ramírez, 2020), lo que podría redundar en la búsqueda de modelos más centrados en la calidad.

Entre las características que reúne el lenguaje deportivo se encuentra la pasión (Naranjo de Arcos, 2011, p. 243; Loaiza, 2018, p. 221) o el uso habitual de sintagmas bélico o épico, especialmente visible en algunos géneros, como es el caso de las crónicas periodísticas (Arroyo y García, 2012; Martínez, 2018), donde desde un momento temprano se ensayaron muchas de las técnicas habituales en el llamado nuevo periodismo (Sánchez y Armañanzas, 2009).

La crónica suele entenderse como uno de los géneros más relevantes del periodismo deportivo, llegando a ser calificada como la “reina” de los mismos (Sobrados, 2009, p. 82), con un protagonismo destacado en deportes como el fútbol. Un género que destaca por su riqueza, que resulta prolífico en la utilización de recursos literarios (Dauncey y Cooke, 2020) y de figuras retóricas, como es el caso de metáforas (Kovljanin, 2018), anáforas (Quintero, 2015), hipérboles (Quintero y Hernández, 2019) o personificaciones (López, 2019).

Se trata de un relato creativo donde se aprecia el estilo del autor (Sobrados, 2009, p. 90) y que bebe da la hibridación propia del periodismo actual, en el que el cronista más allá de informar tiene por objetivo deleitar al lector (Román, 2015). Un género considerado de “escape” por Marín (2000), que da “rienda suelta, sin exagerar, a las virtudes culturales y literarias del periodismo deportivo”. La naturaleza de la crónica también permite estimular la subjetividad y el apego a unos determinados valores como mecanismo de cohesión de lectores y aficiones (Naranjo de Arcos, 2011, p. 347).

Pese a que la academia ha abordado estas cuestiones desde diversos ámbitos, no han proliferado los trabajos que, simultáneamente, aborden el periodismo deportivo, la inteligencia artificial y la calidad, por lo que esta investigación aspira a aportar conocimiento sobre la materia.

Objetivos

La presente investigación surge con el siguiente objetivo principal:

• Comparar la calidad periodística entre las crónicas deportivas elaboradas por sistemas de inteligencia artificial y aquellas surgidas de la mano de un periodista.

Además, cuenta con dos objetivos específicos que se extraen del principal:

• Determinar la capacidad de la inteligencia artificial para reproducir las características propias de las crónicas deportivas.

• Establecer las características que definen las crónicas elaboradas a través de algoritmos.

Para ayudar a alcanzar estos objetivos se han planteado una serie de preguntas de investigación a las que se tratará de dar respuesta. Son las siguientes:

P1. ¿Cumplen las crónicas producidas automáticamente las características propias de las crónicas periodísticas?

P2. ¿Puede la inteligencia artificial reproducir la pasión/énfasis que caracteriza a las crónicas deportivas?

P3. ¿Mantienen las crónicas elaboradas por algoritmos elementos valorativos para poder encuadrarla en los géneros de interpretación?

Las hipótesis de partida son las siguientes:

H1. Las crónicas elaboradas por sistemas de inteligencia artificial no alcanzan la calidad de las crónicas realizas por humanos al no cumplir con las características propias del género.

H2. La falta de interpretación es uno de los obstáculos que limitan la calidad de las crónicas producidas por las máquinas.

Metodología

Para desarrollar el trabajo de campo se han empleado técnicas de análisis de contenido que, según Bardin (2002, p. 32), permiten “obtener indicadores (cuantitativos o no) por procedimientos sistemáticos y objetivos de descripción del contenido de los mensajes, permitiendo la inferencia de conocimientos relativos a las condiciones de producción/recepción (variables inferidas) de estos mensajes”.

Como primer paso, se definió el objeto de estudio (Abela, 2002): crónicas periodísticas de un mismo partido de fútbol elaboradas por un sistema de inteligencia artificial y por un periodista. La muestra ha estado compuesta por 28 crónicas deportivas: 14 elaboradas por sistemas de inteligencia artificial y otras tantas por periodistas. El tamaño de la muestra se legitima recurriendo al concepto de saturación. El análisis nos ha llevado a alcanzar un punto en el que aumentar los casos no aporta información significativa en relación con el objetivo planteado (Berteaux, 1980; Callejo 1998).

La selección ha respondido a criterios de conveniencia. Los autores se han puesto en contacto con Narrativa, una empresa española surgida en 2015 que se ha convertido en referente en sistemas de generación de lenguaje natural, que ha facilitado 14 crónicas de partidos de fútbol elaborados por algoritmos y publicados en medios de comunicación. La mitad de estos textos corresponden a partidos de LaLiga Santander (primera división) y LaLiga Smartbank (segunda división). En el primer caso, los encuentros se celebraron entre los días 2 y 3 de octubre de 2021. En el segundo, corresponden al periodo comprendido entre el 19 y el 26 de septiembre de 2021.

Para comparar cada una de estas piezas se han localizado crónicas de los mismos partidos publicadas en medios de ámbito provincial y nacional y escritas por periodistas. Siguiendo estos criterios, la muestra ha quedado conformada de la siguiente forma:

Table 1: Piezas periodísticas que forman parte de la muestra.

Inteligencia artificial

Autor/a

ID

Fecha de publicación

Medio

Partido

Categoría

Medio

Fecha publicación

ID

1

2/10/21

Encancha.cl

Cádiz-Valencia

Diario de Cádiz

2/10/2

15

2

3/10/21

Encancha.cl

Granada-Sevilla

Granada Hoy

3/10/21

16

3

2/10/21

Encancha.cl

Osasuna-Rayo Vallecano

Diario de Navarra

2/10/21

17

4

2/10/21

Infobae

Atlético de Madrid - F.C. Barcelona

As

3/10/21

18

5

3/10/21

Infobae

Espanyol-Real Madrid

Mundo Deportivo

3/10/21

19

6

3/10/21

Infobae

Getafe-Real Sociedad

ElDesmarque

3/10/21

20

7

2/10/21

Infobae

Mallorca-Levante

Última Hora

2/10/21

21

8

19/09/21

Sport

Huesca-Fuenlabrada

Marca

19/09/21

22

9

26/09/21

Sport

Valladolid-Alcorcón

Marca

26/09/21

23

10

12/09/21

Sport

Ponferradina-Almería

Diario de Almería

12/09/21

24

11

12/09/21

Sport

Oviedo-Cartagena

La Voz de Asturias

13/09/21

25

12

26/09/21

Sport

Leganés-Mirandés

As

26/09/21

26

13

13/09/21

Sport

Lugo-Huesca

La Voz de Galicia

14/09/21

27

14

26/09/21

Sport

Tenerife-Valladolid

El Dorsal

12/09/21

28

Fuente: Elaboración propia

Cada una de estas crónicas se estableció como unidad de registro.

Para valorar la calidad de las crónicas periodísticas se elaboró una ficha de análisis compuestas por 11 dimensiones y 20 variables. La selección de variables parte del Valor Agregado Periodístico (VAP), un instrumento elaborado por los investigadores de la Escuela de Periodismo de la Universidad Católica de Chile que conforma uno de los intentos más sólidos para evaluar la calidad de los contenidos periodísticos (Alessandri et al., 2001). En palabras de Pellegrini y Mujica (2006, p.15), el VAP es “aquello que el medio añade a la información que el público podría obtener directamente”. Esta metodología está en la base de estudios de calidad de trabajos periodísticos en distintos ámbitos ( ; Pérez y Luque, 2004) (García, 2018; Pérez, 2013; Rodríguez, 2012).

A una selección de las variables del VAP se han incorporado otras relacionadas con las características propias de las crónicas deportivas. El resultado ha sido una ficha de análisis con las siguientes variables y codificación.

Table 2: Ficha de análisis

Dimensión

Variable

Definición

Identificación

Fecha

Fecha de publicación

Medio

Medio de comunicación en el que se ha publicado

Redacción

Autoría de la pieza (inteligencia artificial/humano)

Fuentes

Documentales

Presencia de fuentes documentales (sí/no)

Personales

Presencia de fuentes personales (sí/no)

Estructura narrativa

Tipo de narración

Tipo de estructura que sigue el texto para narrar el partido: pirámide invertida -de lo más relevante a lo menos relevante-, cronológica -relato de los acontecimientos siguiendo un orden temporal- y mixta -uso de características de las dos formatos anteriores-.

Estilo

Número de adjetivos valorativos

Número de adjetivos que incorporan cualidades al sustantivo que acompañan y que suponen una valoración del autor.

Número de verbos de atribución

Número de verbos utilizados para indicar quién es el autor de una cita (afirmó, lamentó, dijo, etc.)

Uso de recursos literarios

Presencia de figuras retóricas empleadas para incrementar la expresividad del texto (metáforas, hipérboles, metonimias, etc.) Se establecen tres tramos según la cantidad de estos recursos: pocos (menos de cinco figuras en el texto), medio (entre seis y diez) y muchos (más de 11)

Frecuencia de palabras

Términos más usados

Palabras que aparecen con más frecuencia en el texto

Contenido

Número de datos comprobables

Cantidad total de datos que pueden verificarse con otras fuentes. Es la suma de las tres variables siguientes.

Número de datos comprobables- antecedentes

Cantidad de datos que pueden verificarse con otras fuentes y que están vinculados con circunstancias acontecidas antes de los hechos que se narran

Número de datos comprobables- consecuencias

Cantidad de datos que pueden verificarse con otras fuentes y que están vinculados con hechos o circunstancias futura relacionadas con los hechos que se narran

Número de datos comprobables- consecuencias

Cantidad de datos que pueden verificarse con otras fuentes y que están vinculados el desarrollo de los hechos que se narran

Observación periodística

Presencia de elementos de valoración del autor en el texto.

Titular

Tipo de titular

Tipología del titular empleado en la pieza: informativo -explican lo acontecido con referencia al protagonista-, expresivo -buscan el impacto en el lector a través de las emociones- o apelativo -buscan llamar la atención del lector y no aportan información sobre el hecho en sí-.

Multiperspectiva

Presencia de distintos puntos de vista

Presencia en el texto de distintas versiones sobre un mismo hecho. Puede adoptar los siguientes valores: un solo punto de vista, un punto de vista con referencia a otra versión o mezcla de puntos de vista.

Sesgo

Orientación clara del texto a favor de uno de los equipos participantes (Sí/No)

Comprensión

Grado de entendimiento

Facilidad para entender lo ocurrido a través del texto. Puede adoptar los siguientes valores: No se comprende -cuando el texto no permite determinar lo ocurrido; No, en su mayoría -su comprensión presenta muchas dificultades-; Sí, en su mayoría -es posible determinar con facilidad lo acontecido, aunque hay algunas partes que resultan confusas-; Sí, totalmente -el texto es claro y permite conocer con exactitud lo ocurrido-.

Fuerza

Énfasis

Actitud del narrador caracterizadas por la fuerza en la expresión, la intensidad y la emoción. Puede adoptar los siguientes valores: Opinión -cuando el énfasis se basa en la visión personal del narrador-, Especulativo -el creador del texto se apoya en ideas o pensamiento no fundamentados- y fáctico -cuando se ciñe a los hechos-.

Fuente: Elaboración propia

Para evitar los sesgos en la codificación el análisis fue realizado por tres codificadores simultáneamente, lo que puede entenderse como una “triangulación de investigadores” que aporta validez y confiabilidad a los resultados (Martínez, 2006).

Para el análisis de la frecuencia de palabras se ha empleado la herramienta Nvivo 11. Todos los datos se han volcado en tablas para facilitar su análisis.

Resultados/Discusión

Uso de fuentes

En las crónicas seleccionadas, tanto las elaboradas mediante algoritmos como las escritas a través de humanos, no aparecen fuentes documentales. La inmediatez de los medios digitales propicia que las crónicas se publiquen de manera inminente y no haya un tiempo de meditación para consultar otro tipo de fuentes, de archivo o las propias de un partido, como pueden ser las actas del árbitro, para ahondar más a fondo en algunas causas de expulsión de jugadores y otros motivos.

No es usual el empleo de fuentes personales en las crónicas seleccionadas elaboradas con inteligencia artificial ni en las que están escritas por periodistas. En este apartado únicamente aparece una fuente

personal en el partido Cádiz-Valencia, y está relacionada con un antecedente (ID-15). En este caso, el único texto que dispone este tipo de fuente cuenta con la intervención humana y recupera la actualidad deportiva de todo el transcurso de la semana, algo que la inteligencia artificial no emplea en sus textos.

Estructura narrativa

La estructura narrativa es significativa si se cruzan los datos con el tipo de redacción de la crónica (IA / Humana). El empleo de estadísticas propicia que la inteligencia artificial de Narrativa tenga una distribución del texto mixta en el 100% de sus escritos, donde aparecen elementos importantes al principio del texto (pirámide invertida), pero después dispone de párrafos donde se describen de manera cronológica. Además, concluye en la mayoría de ellos con datos de importancia como las amonestaciones y la clasificación general de La Liga.

Por otra parte, el tipo de estructura cambia sustancialmente cuando el texto lo escribe un redactor. De los siete textos correspondientes a primera división, cinco de ellos se escriben de manera cronológica, 1 emplea la pirámide invertida y una cuenta con una organización mixta. Por su parte, el 100% de las crónicas de segunda división se redactan de manera cronológica. Por tanto, atendiendo al corpus global de los textos redactados mediante el factor humano, el 85,71% se elaboran cronológicamente, el 7,14% utilizan la pirámide invertida y el otro 7,14% presenta una narrativa mixta.

Estilo

El estilo del periodista es lo que va a determinar las mayores diferencias entre los textos escritos por inteligencia artificial y los que son pensados por un periodista. Los adjetivos valorativos, los verbos de atribución (en los textos que aparecen fuentes personales) y las figuras retóricas componen un añadido interpretativo que enriquecen el texto y que son un rasgo común en las piezas redactadas por humanos.

La cuantificación de los adjetivos valorativos supone un elemento de interpretación importante en las crónicas deportivas. Si se suman todos los adjetivos de las piezas elaboradas por algoritmos se alcanza la cifra de ocho, un 4,47% de los adjetivos contabilizados, y una media de 0,57% por pieza. Un valor muy por debajo de la adjetivación empleada en escritos de periodistas donde la suma se dispara a 171, que supone el 95,53% del conjunto, y una media de 12,21 por publicación.

También es significativo que el cambio de categoría supone un incremento sustancial de la adjetivación realizada por periodistas. Mientras que en primera se contabilizan 101, en segunda se reduce a 70. La media de adjetivos valorativos en crónicas de la máxima categoría es de 14,42 y supone el 59,06% de las atribuciones de este tipo de escritos. Sin embargo, se reduce la presencia valorativa en la división de plata con diez adjetivos de media por publicación de periodistas y un 40,94% del uso de calificativos. La extensión de la crónica, el mayor o menor índice del sesgo y la cercanía (medio local o nacional) influyen a la hora de emplear más valoración en el texto. Algunos de los adjetivos que se pueden leer a lo largo de los textos elaborados por redactores son “letal” (ID-22), “desatado” (ID-23), “discuti- ble” (ID-24), “agridulce” (ID-20) “descarada” (ID-16), “nefasto” (ID-19) y “punzante” (ID-28), entre otros. En cambio, en los realizados por algoritmos el que más se repite es “positiva” (ID-13), y también aparecen los adjetivos “acertado” y “disputado” (ID-10).

Los verbos de atribución están directamente relacionados con las fuentes personales. En esta selección no aparecen verbos de atribución significativos, únicamente en el partido Valencia-Cádiz se puede leer uno de ellos. Concretamente, “anunció” (ID-15) es el verbo empleado para el uso de una fuente personal. En este caso, el texto está redactado por un periodista. Es un recurso que no está demasiado empleado en la selección del corpus global, pero que es indicativo del empleo del conocimiento y seguimiento del tema.

El uso de recursos literarios es un indicativo que sirve para diferenciar entre factor humano e inteligencia artificial. A la hora de cuantificar la cantidad numérica de la muestra: poco (0-5), medio (6-10) y mucho (>11), se aprecia que los textos redactados por humanos incluyen de manera predominante las figuras retóricas. En este sentido, ningún texto elaborado mediante algoritmos supera los tres usos de figuras retóricas. Si se suma el número total de figuras retóricas que aparecen en los 14 textos escritos con inteligencia artificial se contabilizan nueve y la media por texto sería de 0,64, por tanto, su intervalo de uso se sitúa entre cero y cinco (poco). Por otra parte, los textos redactados por humanos incorporan 193 figuras retóricas por lo que la media es de 13,14 recursos por escrito y el uso se colocaría en el intervalo de >11 (mucho). Con respecto al corpus global, el número de figuras retóricas empleadas en textos elaborados por inteligencia artificial solamente supone el 4,66%, de modo que los redactados por periodistas representan el 95,34% restante.

Si se desglosa por categorías, 131 figuras retóricas de los textos redactados por periodistas corresponden a la división de honor del fútbol español, con una media de 18,71 (mucho) por texto y aparecen en el 71,20% de escritos de esta índole. En los relacionados con la categoría inferior, la cantidad de figuras retóricas empleadas se limita a 53, lo que supone una media 7,57 por texto (6-10, uso medio) y el 28,80% de la cifra total de los recursos literarios empleados. Algunos ejemplos de figuras retóricas que aparecen en los textos realizados por humanos son: anáforas como “y mascar y mascar” (ID-18), personificaciones como “el Granada CF ya sonríe” (ID-16), hipérboles como “explotó el estadio y la celebración del pichichi” (ID-19), símiles como “Pedrosa que llegaba como una moto” (ID-19), metáforas como “convirtieron la hierba del Metropolitano en un laberinto de espejos” (ID- 18) y metonimias como “fueron trabados con una amarilla a Merino” (ID-20), entre otros recursos y ejemplos.

Frecuencia de palabras

El estilo del periodista es lo que va a determinar las mayores diferencias entre los textos escritos por inteligencia artificial y los que son pensados por un periodista. Los adjetivos valorativos, los verbos de atribución (en los textos que aparecen fuentes personales) y las figuras retóricas componen un añadido interpretativo que enriquecen el texto y que son un rasgo común en las piezas redactadas por humanos.

A la hora de establecer una frecuencia de palabras se han descartado aquellos términos vacíos de contenido o que, en este contexto, no aportan valor al estudio, como es el caso de conjunciones o nexos, gentilicios y nombres propios de futbolistas, ciudades y estadios de fútbol, entre otros. Hay que tener en cuenta que se han analizado las mismas crónicas, unas escritas por inteligencia artificial (14) y las otras por periodistas (14). También se han descartado las palabras con tres o menos letras.

La frecuencia de palabras del corpus global de los textos escritos mediante la inteligencia artificial desprende que muchos de sus conceptos son usados de manera muy reiterada en los textos periodísticos creados por el software de Narrativa. Es el caso de los términos “equipo/s”, que se repite en 61 ocasiones y ocupa el 1,40% de todas las palabras empleadas en estas piezas periodísticas; “partido/s”, con una reiteración de 53 veces y el 1,21% de frecuencia; punto/s, con 49 usos y el 1,12%; y “parte”, con 48 repeticiones y el 1,10%, que es la última palabra que supera el 1% de presencia en los textos periodísticos redactados mediante inteligencia artificial. Por tanto, prevalece el mayor empleo de unas palabras con respecto a otras y no hay un equilibrio en el uso de términos.

https://s3-us-west-2.amazonaws.com/typeset-prod-media-server/e4432471-3de5-4fa9-8595-2ab50c5aaf18image6.jpeg
Figure 1: Nube de palabras más usadas en textos redactados con inteligencia artificial.

Fuente: Elaboración propia con la herramienta Nvivo 11.

Todo lo contrario sucede con los textos escritos mediante la labor humana. Aunque hay palabras que son las más empleadas por la propia necesidad de narrar un partido de fútbol, su frecuencia se encuentra mucho más repartida. Las dos palabras que más veces aparecen en los escritos redactados por periodistas, “minuto/s” y “primera/s y primero/s”, se emplean en el 0,45% de las 14 crónicas deportivas, en un total de 40 ocasiones. Le suceden “balón” y “partido/s”, ambas con 36 usos y ocupan el 0,40% del corpus.

https://s3-us-west-2.amazonaws.com/typeset-prod-media-server/e4432471-3de5-4fa9-8595-2ab50c5aaf18image7.jpeg
Figure 2: Nube de palabras más usadas en textos redactados por periodistas.

Fuente: Elaboración propia con la herramienta Nvivo 11.

Las palabras que coinciden en el listado de las 20 más empleadas son: “equipo/s”, “partido/s”, “punto/s”, “parte”, “minuto/s”, “local/es” y “llegó”. Por tanto, de las 20 palabras más frecuentes de cada uno de los métodos de redacción solamente estas siete son idénticas. Por otra parte, los términos más repetidos que aparecen en los textos escritos con inteligencia artificial y que no entran dentro de los más usados por las piezas redactadas por periodistas son: “resultado”, “marcador”, “contra”, “visitante”, “conjunto”, “tres”, “estadio”, “victoria/s”, “encuentro”, “frente”, “tarjeta/s”, “último/s” y “casa”. En el caso de las palabras que aparecen exclusivamente en textos con autoría son: “primera/s y primero/s”, “balón”, “juego”, “área”, “poco/s”, “centro/s”, “fuera/s”, “nuevo”, “primer”, “amarilla/s”, “segundo”, “final/es” y “tuvo”.

Tabla 3. Las 20 palabras más usadas en los textos redactados con inteligencia artificial y por periodistas. Elaboración propia.

Inteligencia Artificial

Conteo

%

Autor/a

Conteo

%

Equipo/s

61

1,40

Minuto/s

40

0,45

Partido/s

53

1,21

Primera/s, primero/s

40

0,45

Punto/s

49

1,12

Balón

36

0,40

Parte

48

1,10

Partido/s

36

0,40

Resultado

33

0,76

Equipo/s

29

0,32

Marcador

32

0,73

Juego

28

0,31

Contra

27

0,62

Área

25

0,28

Minuto/s

26

0,60

Llegó

21

0,23

Visitante/s

26

0,60

Punto/s

21

0,23

Conjunto

24

0,55

Poco/s

20

0,22

Tres

24

0,55

Parte

19

0,21

Estadio

23

0,53

Centro/s

19

0,21

Local/es

22

0,50

Fuera/s

19

0,21

Victoria/s

22

0,50

Nuevo

17

0,19

Encuentro

21

0,48

Primer

17

0,19

Frente

20

0,46

Amarilla/s

16

0,18

Tarjeta/s

18

0,41

Local/es

16

0,18

Último/s

17

0,39

Segundo

16

0,18

Casa

16

0,37

Final/es

15

0,17

Llegó

16

0,37

Tuvo

15

0,17

Fuente. Elaboración propia

En este listado, se puede apreciar una metonimia en los textos escritos por periodistas donde emplean “amarilla/s” sin precisar que es “tarjeta/s”. El término “amarilla” aparece entre los 20 más empleados, mientras que “tarjeta/s” entre los más reiterados. Sin embargo, en la redacción de piezas periodísticas con inteligencia artificial sucede al contrario y es “tarjeta/s” el término más frecuente y no aparece “amarilla/s” entre los más usados.

La frecuencia de palabras también se puede desglosar por división (primera con siete textos y segunda con otros siete) y por elaboración (inteligencia artificial e intervención humana). Las cinco palabras más repetidas en textos de primera división y redactados por periodistas son: “balón” (24, 0,46%), “minuto/s” (24, 0,46%), “partido/s” (23, 0,44%), “equipo/s” (16, 031%) y “llegó” (15, 0,29%). Por otra parte, si las piezas periodísticas de primera división están creadas por inteligencia artificial la frecuencia sería la siguiente: “equipo/s” (32, 1,69%), “punto/s” (26, 1,37%), “partido/s” (24, 1,27%), “parte” (21, 1,11%) y “marcador” (19, 1%).

La frecuencia de palabras de la categoría de plata del fútbol español también cuenta con sus particularidades en el uso de los términos. De esta forma, los términos más reiterados en los textos de segunda división y elaborados por redactores son: “juego” (18, 0,48%), “minuto/s” (16, 0,42%), “equipo/s” (13, 0,34%), “partido/s” (13, 0,34%) y “balón” (12, 0,32%). Para los textos de segunda división confeccionados mediante el software de Narrativa los términos con más usos son: “equipo/s” (29, 1,17%), “partido/s” (29, 1,17%), “parte” (27, 1,09%), “punto/s” (23, 0,93%) y “resultado” (17, 0,69%).

Los textos escritos para primera división y segunda división, pero con autoría propia, coinciden en 4 de las cinco palabras más usadas y se diferencian únicamente en un término, “llegó” para la categoría de oro y “juego” para la segunda. Este mismo análisis realizado en escritos elaborados con inteligencia artificial cuenta con una coincidencia de cuatro de las cinco palabras más frecuentes. Únicamente varía en una palabra en primera división (“marcador”) y otra en segunda división (“resultado”).

Hay alguna diferencia más si se comparan los textos de primera división escritos por la intervención humana y por la inteligencia artificial. De las cinco palabras más frecuentes, coinciden tres y se diferencian en dos: “balón” y “llegó” para textos con autoría y “punto/s” y “marcador” para aquellas piezas elaboradas por algoritmos. Por su parte, para la segunda división la coincidencia solamente es de dos de las cinco palabras. Por tanto, hay tres palabras con más usabilidad dependiendo del procedimiento a la hora de escribir la información: “juego”, “minuto/s” y “balón” en los textos redactados por periodistas y “parte”, “punto/s” y “resultado” en las piezas creadas por el software.

Contenido

Datos comprobables

Los datos son parte primordial de la inteligencia artificial y con la suma de todos los comprobables (antecedentes, consecuencias y hechos en sí) se alcanzan los 184 usos, mientras que los redactados por humanos llegan a los 128. En primera división, las crónicas están más igualadas en el uso de los datos comprobables, con 91 mediante inteligencia artificial y 77 a través del factor humano. En segunda división, el uso se distancia más, con 93 en los escritos elaborados por inteligencia artificial, y 54 por los periodistas.

Los datos comprobables que hablan sobre los antecedentes son más empleados en inteligencia artificial, con 38 apariciones (19 en primera y 19 en segunda) que, en textos elaborados por periodistas, con siete (tres en primera y cuatro en segunda). Es evidente que la inteligencia artificial emplea sus bases de datos relacionados con los partidos jugados anteriores, rachas de resultados y posición anterior en la clasificación para la redacción de sus textos periodísticos. Algunos ejemplos serían los siguientes: “Sevilla ganó en sus dos últimos partidos de la competición contra Espanyol en su feudo y Valencia en su estadio, por 2-0 y 3-1” (ID-2); “acumulando un total de siete derrotas en la competición” (ID-6); y “el Almería venía de vencer 2-0 en su feudo al Málaga en el último partido celebrado” (ID-10), entre otros.

A la hora de contabilizar el número de datos comprobables que tratan las consecuencias en textos elaborados por inteligencia artificial, se han identificado 54 veces apariciones, tanto en los partidos de primera (28) como en los de segunda (26). Sin embargo, las crónicas elaboradas por humanos suman menos de la mitad de las apariciones con respecto a los algoritmos, con 22 apariciones, diez en primera y 12 en segunda. De esta forma, se aprecia un uso mayor de las bases de datos para construir sus crónicas deportivas con la escalada o descenso en la clasificación y los puntos acumulados tras el encuentro, entre otros. Todos los textos realizados con algoritmos cuentan con este tipo de datos como, por ejemplo: “el conjunto gaditano es decimocuarto tras la finalización del duelo” (ID-1); “con este resultado, Mallorca se queda con 11 puntos” (ID-7); y “el conjunto chicharrero es segundo, mientras que el Valladolid es noveno al terminar el encuentro” (ID-14).

El número de datos comprobables de los hechos acontecidos en el transcurso del partido presenta una igualdad en términos generales. Mientras que en los escritos elaborados por periodistas se han contabilizado un total de 99 hechos, en los creados por algoritmos suman 92. La principal diferencia se encuentra en primera división porque los textos elaborados por humanos incluyen 61 hechos, mientras que los de inteligencia artificial alcanzan 44. Ahora bien, en segunda división, se igualan más las cifras,

con 48 usos en inteligencia artificial y 38 en textos redactados por periodistas. Los datos comprobables aparecen en todos los textos en mayor o menor medida como, por ejemplo: “el Lugo ganó 3-2 contra el Huesca” (ID-13), “tras doblegar al Mirandés en Anduva (1-2)” (ID-26) y “un gol de Baba a los 75 minutos” (ID-7), entre otros datos.

Observación periodística

La observación periodística no aparece en ningún texto elaborado mediante algoritmos, pero se muestra en muchos de sus textos frases que se repiten como “afrontó con ganas”, “quería mejorar su situación” y “con los ánimos reforzados”. Por su parte, las publicaciones realizadas por periodistas cuentan todas con la observación periodística, que está directamente relacionada con la adjetivación.

Título

La inteligencia artificial trabaja con datos y se aprecia en los títulos de sus textos periodísticos. Todos sus escritos emplean títulos de tipo informativo, con estructura sencilla y con el resultado del encuentro como denominador común (en la mayoría de ellos). En cambio, los tipos de título varían si los escriben los periodistas y dependiendo de la categoría. En primera división, cuatro serían informativos, dos apelativos y uno expresivo. En cambio, en segunda división, seis de ellos son informativos y uno apelativo.

Presencia de distintos puntos de vista y sesgo

Con respecto a la presencia de uno o varios puntos de vista, hay una total homogeneidad en los resultados obtenidos y todos los textos seleccionados del corpus solo cuentan con un solo punto de vista.

El sesgo es un rasgo frecuente en las crónicas deportivas. Mientras que en los textos elaborados con inteligencia artificial no se aprecia el sesgo, en los que están redactados por humanos predomina esta característica. De los siete partidos, seis de ellos sí cuentan con sesgo, mientras que el partido Mallorca- Levante, publicado en la web Ultimahora.es, se escribe de una manera objetiva hacia los dos equipos. En este sentido, en segunda división, se repite la tendencia en los escritos creados por periodistas, hay seis que sí lo poseen y uno de ellos que no cuenta con este rasgo, concretamente el partido Valladolid- Alcorcón, publicado en la versión online del diario Marca.

Compresión

Otro de los puntos analizados es la comprensión de los textos. Todos los escritos son comprensibles, tanto los que están realizados mediante inteligencia artificial como aquellos que los redacta el periodis- ta. Una de las características principales del periodismo es la claridad y se cumple con este elemento en todas las piezas seleccionadas.

Énfasis

El énfasis que el periodista aporta a las crónicas deportivas sirve para determinar la intervención del redactor en el texto. En este caso, el 100% de las piezas elaboradas mediante algoritmos cuentan con un énfasis fáctico, es decir, están basadas en los hechos. Por otra parte, el énfasis se centra en la opinión en 12 de los textos redactados por humanos, mientras que otro de ellos hace hincapié conjuntamente en la opinión y en la especulación. La pieza restante presenta un énfasis fáctico.

Discusión y conclusiones

Tal y como ya se ha señalado anteriormente, no abundan los estudios que analicen la calidad aportada por la inteligencia artificial en el periodismo deportivo. Desde una óptica más general, del estudio realizado se manifiesta que en la línea apuntada por Lemelshtrich (2018, p. 19), el desarrollo tecnológico se encuentra todavía con límites a la hora de escribir historias periodísticas de calidad. A pesar de que desde la industria vinculada se plantean como objetivos mejorar la expresividad o utilizar metáforas (Goldberg, 2013), estos no se han logrado, al menos en la muestra analizada en la presente investigación.

Contrariamente a lo aducido por Miroshnichenko (2018), la calidad de los periodistas humanos no se encuentra sobrevalorada frente a la inteligencia artificial, teniendo en cuenta los datos de esta investigación. Como defiende este autor, los algoritmos pueden dominar las redacciones por razones económicas, pero no está demostrado que lo hagan porque sean capaces de producir mejores textos en la actualidad.

Coincidiendo con lo apuntado por Rojas y Toural (2019), el futuro determinará de qué modo el lenguaje natural generado por la inteligencia artificial es capaz o no de lograr una mayor elaboración en los textos que permita igualarse al de los periodistas profesionales.

El análisis comparado de las 28 crónicas deportivas que componen la muestra de este estudio permite extraer una serie de conclusiones. En primero lugar, la presencia de adjetivos valorativos es sustancialmente mayor en los textos escritos por periodistas que en los creados por inteligencia artificial. Por tanto, la interpretación, descripción y valoración por parte del redactor supone un añadido de calidad en sus textos con respecto a los elaborados por algoritmos (H2/P1/P3). Por otra parte, el mayor empleo de las figuras retóricas también está relacionado con los escritos redactados por periodistas. Es otro de los elementos que ayudan a la narración y a la descripción de las crónicas deportivas, además de ser fundamental para identificar el estilo del periodista. Por tanto, las piezas creadas con inteligencia artificial carecen de una narración más cercana a lo sucedido en el partido de fútbol (H1/P1/P3). Los escritos de partidos de primera división y redactados por periodistas incluyen más figuras retóricas y adjetivos, lo que indica que se trata de contenidos que han requerido de un mayor trabajo de producción, especialmente en cuanto al estilo y el lenguaje.

Otra de las características del periodismo deportivo que se aprecia en la gran cantidad de adjetivación de los textos escritos por humanos es la pasión. Por tanto, los escritos elaborados mediante inteligencia artificial carecen de este elemento identificador de las crónicas deportivas (H1/P2). Además, el énfasis en los textos realizados por periodistas sirve como indicador de la pasión en las crónicas deportivas. La mayoría de ellas cuentan con el valor de la opinión, por lo que aportan interpretación y valoración a las crónicas, algo de lo que adolecen las piezas creadas por Algoritmos (H2/P2/P3).

El número de datos comprobables es mucho mayor en los textos elaborados con algoritmos, que en los escritos por humanos. Por tanto, el empleo de las bases de datos sirve para ofrecer información estadística mucho más completa que los periodistas. Además, los datos sobre antecedentes y consecuencias, que también predominan en publicaciones sobre inteligencia artificial, ayudan a dar información importante al lector y a contextualizar los hechos. Con respecto a la distribución de las crónicas, los textos periodísticos elaborados mediante algoritmos cuentan con una estructura prefijada mixta, sin atender a lo que necesitaría cada tipo de crónica. Sin embargo, en los escritos elaborados por periodistas predomina una narración cronológica detallando cada incidencia del partido de valor noticioso. En cambio, en la inteligencia artificial solo aparecen los datos.

De este análisis se desprende que la aplicación de la inteligencia artificial al periodismo deportivo, en el caso de las crónicas de partidos de fútbol, supone un avance importante en cuanto al tratamiento de las acciones o lances del juego, expresadas a través de los datos observables. Ahora bien, no supone un aporte de calidad en cuanto al carácter analítico y de interpretación propio de géneros periodísticos con tanta tradición como la crónica deportiva, limitándose casi exclusivamente a la exposición cronológica de los hechos acontecidos a lo largo de un partido de fútbol.

Este carácter interpretativo se demuestra reservado a las crónicas realizadas por periodistas, con una mayor producción en aquellas que corresponden a los encuentros de la primera división (LaLiga Santander). No obstante, uno de los límites de la presente investigación se sitúa en la posibilidad de que en el futuro se desarrollen aplicaciones logarítmicas que permitan desarrollar estas funciones también en los textos generados por inteligencia artificial. Una posibilidad no observada en las crónicas analizadas en esta investigación.