Los «realatares» pronto llegarán a nuestras pantallas
Garantizar que los integrantes de la comunidad sorda tengan acceso a la información, la comunicación y el conocimiento es fundamental para su participación total e igualitaria en la sociedad. El objetivo de la Directiva de servicios de comunicación audiovisual es garantizar que los Estados miembros de la Unión Europea se aseguren de que los servicios de los medios de comunicación contribuyen a la igualdad y accesibilidad en relación con la distribución de contenidos y su accesibilidad. No obstante, producir contenido en lengua de signos es caro, y muchas compañías ofrecen solo una pequeña parte de sus programas con presentación signada, que suelen emitirse a altas horas de la noche. El proyecto Content4All, financiado con fondos europeos, se propuso cambiar esta situación y hacer que el contenido sea más accesible para la comunidad sorda por medio de un flujo de trabajo de traducción en lengua de signos automática con un avatar humano fotorrealista en 3D para las emisiones de televisión. «Teníamos dos objetivos principales. El primero era proporcionar una tecnología de bajo coste para crear versiones con interpretación en lengua de signos de contenido producido para el público oyente, sin afectar a la experiencia visual de los usuarios actuales. El segundo era crear conjuntos de datos y algoritmos para explorar la creación de contenido interpretado en lengua de signos de forma automática», apunta Giacomo Inches, coordinador del proyecto y tecnólogo de innovación de Fincons Group.
Presentación del «realatar», el avatar
El avatar se logra mediante un innovador estudio multicámara en el que se captan los movimientos de personas reales y, a continuación, se procesan con la ayuda de algoritmos de inteligencia artificial. El resultado final es un avatar fotorrealista en 3D, denominado «realatar», que puede distribuirse por medio de transmisiones de vídeo. Inches explica además lo siguiente: «Mientras que la generación de lengua de signos automática fue un estudio tecnológico en el laboratorio, que no estaba destinada a su comercialización, analizamos el nuevo concepto, el “estudio remoto”» para los organismos de radiodifusión televisiva, en el que los intérpretes de lengua de signos podían llevar a cabo su trabajo sin tener que desplazarse hasta las instalaciones centrales de la cadena». El tiempo ahorrado podía emplearse entonces en generar más contenido signado. Las tecnologías utilizadas en el proyecto se basaban en avanzados algoritmos de aprendizaje profundo y aprendizaje automático. Dichos algoritmos permiten que un ordenador observe una gran cantidad de datos y, a partir de instrucciones por medio de ejemplos, proporcione un resultado deseado. «En el proyecto, los algoritmos ayudaron a reproducir una persona real como un ser humano virtual en tiempo real, en una aplicación HbbTV específica», destaca Inches. Esta solución ofrece a los organismos de radiodifusión televisiva una forma asequible y sostenible de crear programas en lengua de signos, que en último término daría paso a una producción mayor.
Un futuro con logros considerables
«El carácter innovador de este concepto fue galardonado con el prestigioso premio NAB a la Innovación Tecnológica en la Conferencia sobre Ingeniería de Radiodifusión y Tecnología de la Información de 2020», explica Inches. Por otra parte, con la ayuda de sus organizaciones de representación asociadas, el proyecto pudo trabajar con miembros de la comunidad sorda de Bélgica y Suiza para validar los componentes tecnológicos. Los debates al respecto permitieron que el proyecto presentara una iniciativa en el marco de la Acción COST, LEAD-ME, que reúne a las partes interesadas europeas del campo de la accesibilidad en los medios de comunicación. Otros dos proyectos, EASIER y SignON, aprovecharán y ampliarán el legado del proyecto de Content4All, empleando directamente la recopilación signada. Además, Fincons Group, coordinador y principal socio industrial, está explorando formas concretas de aprovechar los resultados del proyecto para su red. Inches concluye: «A largo plazo, un resultado concreto del proyecto sería el empleo de la recopilación de texto alineada con vídeos en lengua de signos con fines de investigación y precomerciales, y por tanto la contribución a avances futuros de todos los algoritmos para el reconocimiento en lengua de signos».
Palabras clave
Content4All, lengua de signos, avatar, comunidad sorda, servicios de comunicación, «realatar», avatar humano en 3D, emisiones de televisión, accesibilidad en los medios de comunicación