Etiquetar datos sensibles en la investigación en ciencias biológicas
Desde el cambio climático hasta las pandemias mundiales, el mundo se enfrenta a importantes desafíos relacionados con el medio ambiente y la salud que llevan a las instituciones de investigación en ciencias biológicas a compartir sus datos y recursos digitales en busca de soluciones. Sin embargo, muchos de los datos generados por la investigación biológica y médica son sensibles, ya sea por su naturaleza personal o por cuestiones de propiedad intelectual, problemas de riesgo biológico o el Protocolo de Nagoya.
Una caja de herramientas para datos sensibles
En el proyecto EOSC-Life, financiado con fondos europeos, se reúne a infraestructuras de investigación para crear un espacio colaborativo, digital y abierto para la investigación en ciencias biológicas en el que los datos, las herramientas y los flujos de trabajo de análisis sean más fáciles de encontrar, accesibles, interoperables y reutilizables, es decir que cumplan los llamados principios FAIR. Para respaldar este proceso de «FAIRificación», se ha desarrollado una caja de herramientas que proporciona información a los investigadores que tienen la intención de compartir o utilizar datos sensibles en un entorno en la nube como la Nube Europea de la Ciencia Abierta (EOSC, por sus siglas en inglés). La caja de herramientas se describe en un artículo publicado en la revista «Scientific Reports». La caja de herramientas se basa en un sistema de categorización o etiquetado creado y armonizado en un grupo de seis infraestructuras de investigación en ciencias biológicas que participaron en el proyecto EOSC-Life. No crea contenidos nuevos, sino que permite a los científicos encontrar recursos que son pertinentes para compartir datos sensibles en todas las infraestructuras de investigación participantes, y contiene enlaces a objetos digitales relacionados con datos sensibles, como reglamentos, directrices, mejores prácticas y «software», para respaldar el intercambio y la reutilización de datos.
Desarrollo en tres etapas
El sistema de categorización de la caja de herramientas permite el etiquetado coherente de los recursos. Se desarrollaron tres versiones diferentes del sistema de categorización, cada una probada por un estudio piloto posterior. En última instancia, esto condujo a un sistema con siete categorías principales: tipo de dato sensible; tipo de recurso; campo de investigación; tipo de dato; etapa en el ciclo de vida del intercambio de datos; ámbito geográfico; y temas concretos. La tercera versión del sistema de categorización se probó en el tercer estudio piloto con 110 recursos, a uno de los cuales le faltaban datos. Por lo tanto, en este estudio piloto, se utilizó un total de 109 recursos etiquetados como contenido inicial para el demostrador de la caja de herramientas. El demostrador es una herramienta de «software» que permite a los investigadores buscar objetos digitales vinculados a datos sensibles y cuyo filtrado se basa en el sistema de categorización. Los autores del estudio aclaran: «La herramienta permite el filtrado previo de los recursos vinculados a datos sensibles con texto libre en el título, por identificador digital de objetos o por autores. Es posible seguir filtrando con el tipo de elemento (p. ej., artículo de una revista, seminario web, informe, o “software”) y la selección de cualquiera de las etiquetas enumeradas previamente de las distintas categorías de la tercera versión del sistema. El resultado de la búsqueda puede guardarse como PDF o JSON». Según los autores, los próximos pasos importantes incluyen evaluar la usabilidad y la facilidad de uso del demostrador de la caja de herramientas, ampliar la caja de herramientas para abarcar más recursos, promover una adopción más extendida por parte de diferentes comunidades de ciencias biológicas y desarrollar una visión a largo plazo para el mantenimiento y la sostenibilidad. El proyecto EOSC-Life (Providing an open collaborative space for digital biology in Europe) finaliza en agosto de 2023. Para más información, consulte: Sitio web del proyecto EOSC-Life
Palabras clave
EOSC-Life, ciencias biológicas, datos, caja de herramientas, sistema de categorización, investigación, infraestructura de investigación