Un mejor reconocimiento automático de la voz para un control del tráfico aéreo más seguro
Si bien el reconocimiento de voz se está volviendo cada vez más sofisticado en los productos de consumo, algunos sectores que realmente podrían beneficiarse van a la zaga. Los asistentes digitales de control del tráfico aéreo acceden a los sensores de tráfico aéreos y en tierra, pero no tienen acceso automático a las comunicaciones de voz entre los controladores y los pilotos, a pesar de ser la fuente de información más valiosa. Para digitalizar las comunicaciones de voz, los controladores deben transcribir la información, lo que les lleva hasta un tercio de su tiempo. El proyecto HAAWAII (Highly Automated Air Traffic Controller Workstations with Artificial Intelligence Integration), que se financió en el marco de la Empresa Común SESAR, ha desarrollado un nuevo «software» de reconocimiento de voz basado en redes neuronales profundas. «Como indicó Alan Turing en los años cincuenta del siglo pasado, el reconocimiento de voz no es la comprensión del habla, por lo que también trabajamos en eso», expresa Hartmut Helmke, coordinador del proyecto del Centro Aeroespacial Alemán, anfitrión del proyecto. «Hemos logrado una tasa de palabras erróneas inferior al 5 %, lo que se traduce en una tasa de reconocimiento de órdenes superior al 85 % para los controladores de tráfico aéreo».
Detección de errores de colación para la gestión del tráfico aéreo
El reconocimiento de voz de los controladores de tráfico aéreo y los pilotos sigue siendo un reto debido a las versiones locales de la fraseología normalizada, los diferentes acentos en inglés (el idioma internacional de la aviación), las diferentes velocidades del habla y los canales ruidosos. Los socios de HAAWAII NATS e Isavia, proveedores de servicios de navegación aérea del Reino Unido e Islandia respectivamente, registraron más de quinientas horas de comunicaciones de voz entre controladores y pilotos. Cuarenta de estas horas fueron luego transcritas textualmente de forma manual. Después de proporcionar al «software» de reconocimiento de voz de HAAWAII solo una hora de datos transcritos manualmente, el reconocimiento de palabras se duplicó. Tras entrenarlo con todos los datos transcritos y no transcritos, la tasa de reconocimiento de palabras fue superior al 95 % para los controladores y superior al 90 % para los pilotos. «El verdadero problema con las palabras reconocidas de forma errónea se presenta cuando están relacionadas con información crítica para la seguridad, como los distintivos de llamadas o los nombres de los puntos de ruta. La combinación de la voz con los datos de radar permitió que nuestro sistema mejorara a nivel semántico. Por ejemplo, logramos una tasa de reconocimiento del 97 % para los distintivos de llamadas de las aeronaves utilizados por los controladores», comenta Helmke. El aprendizaje automático también se utilizó para crear un asistente de detección de errores de colación (REDA, por sus siglas en inglés). Los errores de colación son aquellos en los que, por ejemplo, un controlador autoriza para que un piloto ascienda a 7 000 pies pero el piloto lo repite como 8 000 pies, lo que plantea el riesgo de una colisión si el error no se detecta. El REDA genera una alerta cuando se presentan estos errores. Cinco controladores de tráfico aéreo de Islandia evaluaron al REDA en un laboratorio. «La cantidad de errores de colación detectados durante estas pruebas de laboratorio superó el 80 % a partir de las evaluaciones fuera de línea de las transcripciones de datos reales, con una tasa de falsas alarmas por debajo del 20 %», agrega Helmke. Las pruebas con los controladores de NATS están planificadas para este año, e Isavia también tiene la intención de probar el REDA en su propio entorno operativo.
Mayor precisión y menor volumen de trabajo
Al reducir el volumen de trabajo y aumentar la precisión de los controladores de tráfico aéreo, un reconocimiento de voz y comprensión del habla eficaces podrían aumentar significativamente la seguridad aérea. Las miles de horas de transcripciones también ofrecen a los proveedores de servicios de navegación aérea información de gestión útil, como la frecuencia con la que se dan o repiten ciertas órdenes por aeronave, que en ambos casos sugiere un gran volumen de trabajo. El reconocimiento de voz también podría usarse para respaldar simulaciones en el puesto de trabajo, lo cual permite que la formación sea más asequible y factible a distancia. «Nuestro prototipo ha funcionado en Londres, el espacio aéreo más congestionado de Europa, y también en el espacio aéreo de Isavia, que abarcan más de cinco millones de kilómetros cuadrados. Comprendió las voces de los pilotos, con una tasa de palabras erróneas inferior al 10 %, a pesar de los acentos de todo el mundo, por no mencionar los canales de voz muy ruidosos», concluye Helmke.
Palabras clave
HAAWAII, reconocimiento de voz, control de tráfico aéreo, palabras, órdenes, espacio aéreo, volumen de trabajo, seguridad aérea, transcripciones, detección de errores, voz, radar