Una nuova tecnologia per trasmettere video di alta qualità senza consumare i tuoi dati
Lo streaming video su Internet, sia come video on demand per contenuti esistenti che in live streaming per eventi, è un settore in forte espansione. Tuttavia, lo streaming di alta qualità non è universalmente disponibile, poiché spesso mancano le connessioni a banda larga necessarie. Anche il costo di Internet mobile è proibitivo per molti: uno studio ha infatti scoperto che il costo impedisce a quasi il 50 % delle persone con accesso alla rete 4G di utilizzare gli smartphone per Internet a livello globale. Il progetto ENHANCEplayer, supportato dall’UE, si è proposto di ridurre il carico dell’infrastruttura provocato dall’invio di video a risoluzione/velocità in bit inferiori su Internet con il lettore video ricevente abilitato per ampliare la qualità. «Mentre gli approcci tradizionali aumentano l’efficienza di codifica del video, rischiando incompatibilità con hardware precedente, abbiamo iniziato con la qualità dell’esperienza dello spettatore, non con metriche tecniche», spiega Ely Loew, il coordinatore del progetto.
Miglioramento della rete neurale
I membri del consorzio del progetto Artomatix e THEO Technologies hanno condiviso le loro infrastrutture tecnologiche per sviluppare una soluzione prototipo. Il punto di partenza di ENHANCEplayer era che la risoluzione video minima necessaria per gli organismi emittenti è 540 p per i dispositivi mobili. Artomatix ha ipotizzato che la tecnologia a super risoluzione potrebbe essere ottimizzata per una varietà di dispositivi e dimostrarsi abbastanza veloce da ampliare la risoluzione dei fotogrammi video in tempo reale, fino a 25-30 fotogrammi al secondo. THEO Technologies ha riprogettato il suo lettore video universale, «THEOplayer», per includere i moduli di upscaling di Artomatix. Il prototipo ENHANCEplayer risultante funziona addestrando una rete neurale con due versioni di una serie di immagini: una risoluzione di origine, ad esempio 360 p, e una risoluzione target, ad esempio 720 p. Il modello aggiunge quindi pixel alla versione a 360 p in modo che corrisponda alla qualità dell’immagine a 720 p. Per testare ulteriormente il sistema, il progetto ha creato un modello di prova di concetto personalizzato per video inviati da partner di organismi emittenti: VRT in Belgio, NPO nei Paesi Bassi e RTP (sito web in portoghese) in Portogallo. Il primo successo è stato lo streaming di un video a 360 p con la risoluzione aumentata a 540 p per un iPhone 11. «In quel momento, tutti i dubbi sulla tecnologia sono scomparsi. Il nostro entusiasmo è stato rafforzato dai test di trasmissione e dagli spettatori intervistati, che hanno confermato la qualità video potenziata», afferma Loew. Questa svolta è stata resa possibile perché l’iPhone 11 ha nuovi chip di rete neurale in grado di eseguire l’apprendimento automatico. Questi chip stanno diventando sempre più importanti nei nuovi dispositivi mobili. Nonostante anche i nuovi telefoni Android dispongano di chip di rete neurale, la loro architettura ha rallentato l’elaborazione dei singoli fotogrammi video disabilitando l’esecuzione del modello in tempo reale. «Pertanto, attualmente, questa tecnologia dipende dall’hardware», osserva Loew.
Opportunità ampliate
Secondo un sondaggio si prevede che il mercato globale dei servizi over-the-top crescerà da 81,6 miliardi di dollari nel 2019 a 156,9 miliardi di dollari entro il 2024, con una proiezione di un aumento del consumo di larghezza di banda di circa quattro volte tra il 2017 e il 2022. Si prevede che la porzione di streaming video live cresca di un fattore pari a 15. Riducendo la larghezza di banda necessaria, ENHANCEplayer riduce al minimo il carico sull’infrastruttura di comunicazione, diminuendo al contempo il consumo di energia, e aumenta anche l’accesso per coloro a cui è negato per motivi tecnici o di costo, quali le comunità rurali e i paesi in via di sviluppo. Inoltre, apre opportunità per contenuti generati da non professionisti utilizzando attrezzature di base. Oltre a rivedere le opzioni per le funzionalità hardware di Android, il gruppo sta ora lavorando alla visualizzazione del browser web. «Stimiamo che l’infrastruttura hardware e browser necessaria per gestire i modelli di rete neurale per l’upscaling della risoluzione in tempo reale sia pronta tra uno-due anni», aggiunge Loew. Il gruppo sta anche considerando una serie di direzioni future, tra cui l’integrazione dell’upscaling in un codec video o nell’ambito di un dispositivo di visualizzazione video, quale un televisore, oppure l’abilitazione di un upscaling parziale per i dispositivi più vecchi.
Parole chiave
ENHANCEplayer, streaming, video, velocità di trasmissione dei dati, internet, iPhone, cellulare, larghezza di banda, paesi in via di sviluppo