Perder la memoria de las noticias falsas
La verificación de datos es una herramienta importante en la lucha contra la desinformación en línea, que puede tener graves consecuencias para las personas y la sociedad al influir en elecciones, conflictos y cuestiones sanitarias. Sin embargo, de acuerdo con una encuesta realizada en el marco del proyecto vera.ai, financiado con fondos europeos, la tarea esencial de archivar los casos de desinformación se ve muy dificultada por las medidas contra la captura masiva de datos adoptadas por plataformas de medios sociales como Facebook e Instagram. ¿Qué ocurre en este caso? Hay menos verificaciones de datos documentadas y menos pruebas de rastros de desinformación. Según se informa en un artículo publicado en el sitio web de la Digital Methods Initiative, «muchos enlaces a diversos contenidos desaparecen (borrados por las plataformas o los usuarios finales, o mantenidos en grupos privados tras su desacreditación)». Esto perjudica a la memoria de verificación de datos y dificulta los esfuerzos de los científicos sociales por evaluar el alcance de la desinformación en las distintas plataformas.
Ucrania en el centro de atención
Sin embargo, ¿cuál es el alcance real de la «pérdida de memoria» en la verificación de datos? Para responder a esta pregunta, un grupo de investigadores de la Universidad de Ámsterdam (los Países Bajos), socia del proyecto vera.ai, utilizó el conjunto de datos de verificación de datos «War in Ukraine» publicado por el Observatorio Europeo de los Medios de Comunicación Digitales (EDMO, por sus siglas en inglés). Los investigadores analizaron 1 991 artículos de verificación de datos y extrajeron más de 41 000 enlaces, de los cuales 6 002 eran páginas web archivadas. El equipo identificó las múltiples organizaciones de verificación de datos que contribuyen a archivar enlaces, su recuento de contribuciones y su país de origen. También investigaron la evolución de las publicaciones a lo largo del tiempo, a medida que avanzaba la guerra en Ucrania. El estudio reveló que al menos el 15 % de los enlaces hacia contenidos archivados en el conjunto de datos «War in Ukraine» del EDMO están mal archivados. «La “pérdida de memoria” es todavía más importante puesto que se han identificado muchos errores debidos a vídeos no reproducibles durante un análisis manual de una muestra de cien enlaces», informan los autores en el artículo. Además, al 23 % de los enlaces de Facebook no archivados procedentes del mismo conjunto de datos les falta contenido. También se analizan los servicios de archivo utilizados: «En la actualidad, 3 servicios principales (archive.today y sus sitios satélite con un 44,1 % de presencia en el conjunto de datos, Archive.org con un 29,2 % y perma.cc con un 26,6 %) dominan este ámbito. Mientras archive.today depende de la publicidad, perma.cc es un servicio de semipago y comercial creado en la Universidad de Harvard, y US Wayback Machine / Internet Archive sigue siendo el archivo web de libre acceso. Su uso por parte de organizaciones de verificación de datos depende a menudo de su capacidad para archivar contenido de las plataformas y, sobre todo, de Facebook, debido a las medidas contra los bots y la captura masiva de datos». Los investigadores también descubrieron que, aunque las páginas de las plataformas parecen seguir siendo accesibles, muchas de ellas muestran advertencias archivadas de distintos tipos de problemas de archivado, que van desde obstáculos al acceso hasta contenidos de vídeo no reproducibles. A continuación, el equipo de vera.ai: VERification Assisted by Artificial Intelligence pretende ampliar sus estudios a más conjuntos de datos. Para más información, consulte: vera.ai sitio web del proyecto
Palabras clave
vera.ai, datos, verificación de datos, Ucrania, desinformación, archivo