Un migliore riconoscimento vocale automatico per controllare il traffico aereo in modo più sicuro
Sebbene il riconoscimento vocale stia diventando sempre più sofisticato nei prodotti di consumo, alcuni settori che davvero potrebbero beneficiarne rimangono indietro. Gli assistenti digitali preposti al controllo del traffico aereo accedono ai sensori del traffico aereo e terrestre, ma la comunicazione vocale tra controllori e piloti non è resa loro automaticamente disponibile, nonostante sia la fonte più preziosa di informazioni. Per digitalizzare le comunicazioni vocali, i controllori devono trascrivere le informazioni, una procedura che richiede fino a un terzo del loro tempo. Il progetto HAAWAII (Highly Automated Air Traffic Controller Workstations with Artificial Intelligence Integration), finanziato nell’ambito dell’impresa comune SESAR, ha sviluppato un nuovo software di riconoscimento vocale basato sulle reti neurali profonde. «Come evidenziato da Alan Turing negli anni ‘50, il riconoscimento vocale non coincide con la comprensione del discorso, quindi abbiamo lavorato anche a quello», afferma Hartmut Helmke, coordinatore del progetto del Centro aerospaziale tedesco, che ospita il progetto. «Abbiamo raggiunto un tasso di errori per parola inferiore al 5 %, il che si traduce in un tasso di riconoscimento dei comandi di oltre l’85 % per i controllori del traffico aereo.»
Individuare gli errori di ritrasmissione per la gestione del traffico aereo
Il riconoscimento vocale di controllori del traffico aereo e piloti rimane impegnativo a causa di versioni locali della fraseologia standardizzata, diversi accenti inglesi (la lingua internazionale dell’aviazione), diverse velocità nel parlare e canali rumorosi. I partner di HAAWAII NATS e Isavia, fornitori di servizi di navigazione aerea con sede rispettivamente nel Regno Unito e in Islanda, hanno registrato oltre 500 ore di comunicazioni vocali tra controllori e piloti, di cui 40 ore sono state in seguito trascritte a mano parola per parola. Dopo aver alimentato il software di riconoscimento vocale di HAAWAII con solo un’ora di dati trascritti a mano, il miglioramento del riconoscimento vocale è raddoppiato. In seguito al suo addestramento su tutti i dati trascritti e non trascritti, il tasso di riconoscimento vocale è stato superiore al 95 % per i controllori e al 90 % per i piloti. «Il vero problema con le parole che non vengono correttamente riconosciute è quando sono correlate a informazioni cruciali per la sicurezza, quali l’indicativo di chiamata o i nomi dei waypoint. La combinazione della voce ai dati dei radar ha consentito al nostro sistema di migliorare a livello semantico. Ad esempio, abbiamo ottenuto un tasso di riconoscimento del 97 % per gli indicativi di chiamata degli aeromobili impiegati dai controllori», osserva Helmke. È stato inoltre impiegato l’apprendimento automatico per creare un assistente di rilevamento degli errori di ritrasmissione. Gli errori di ritrasmissione si verificano quando, ad esempio, un controllore autorizza un pilota a portarsi a 7 000 piedi, ma il pilota ripete 8 000 piedi, rischiando una collisione se non rilevato. L’assistente di rilevamento degli errori di ritrasmissione genera un allarme nel momento in cui tali errori si verificano. Questo assistente è stato valutato in laboratorio da cinque controllori del traffico aereo islandesi. «Il numero di errori di ritrasmissione individuati durante i test di laboratorio è stato superiore all’80 % per le valutazioni offline delle trascrizioni provenienti da dati reali, con un tasso di falsi allarmi inferiore al 20 %», aggiunge Helmke. Nel corso di quest’anno sono programmati studi con i controllori di NATS, e Isavia intende inoltre dimostrare l’assistente di rilevamento degli errori di ritrasmissione all’interno del proprio ambiente operativo.
Più accuratezza e meno carico di lavoro
Attraverso la riduzione del carico di lavoro e l’incremento dell’accuratezza dei controllori del traffico aereo, un riconoscimento vocale e una comprensione del discorso efficaci potrebbero migliorare notevolmente la sicurezza aerea. Migliaia di ore di trascrizione offrono inoltre ai fornitori di servizi di navigazione aerea informazioni di gestione utili, quali la frequenza di impartizione o ripetizione di determinati comandi per aeromobile, che suggeriscono entrambi elevati carichi di lavoro. Il riconoscimento vocale potrebbe inoltre essere impiegato a sostegno di simulazioni sul posto di lavoro, rendendo l’addestramento più economico e possibile a distanza. «Il nostro prototipo è stato messo all’opera nei dintorni di Londra, lo spazio aereo più congestionato d’Europa, e anche nello spazio aereo di Isavia, coprendo più di 5 000 000 di chilometri quadrati. Ha compreso le voci dei piloti con un tasso di errore inferiore al 10 %, nonostante gli accenti provenienti da tutto il mondo, per non menzionare i canali vocali molto rumorosi», conclude Helmke.
Parole chiave
HAAWAII, riconoscimento vocale, controllo del traffico aereo, parole, comandi, spazio aereo, carico di lavoro, sicurezza aerea, trascrizioni, rilevamento degli errori, voce, radar