Une meilleure reconnaissance automatique de la parole pour un contrôle du trafic aérien plus sûr
Alors que la reconnaissance vocale devient de plus en plus sophistiquée dans les produits de consommation, certains secteurs qui pourraient vraiment en bénéficier restent à la traîne. Les assistants numériques de contrôle du trafic aérien ont accès aux capteurs de trafic aérien et terrestre, mais les communications vocales entre les contrôleurs et les pilotes ne leur sont pas accessibles automatiquement, alors qu’elles constituent la source d’information la plus précieuse. Pour numériser les communications vocales, les contrôleurs doivent transcrire les informations, ce qui occupe jusqu’à un tiers de leur temps de travail. Le projet HAAWAII (Highly Automated Air Traffic Controller Workstations with Artificial Intelligence Integration), financé dans le cadre de l’entreprise commune SESAR, a mis au point un nouveau logiciel de reconnaissance vocale basé sur des réseaux neuronaux profonds. «Comme Alan Turing l’a souligné dans les années 1950, la reconnaissance vocale n’est pas synonyme de compréhension de la parole. C’est pour cette raison que nous avons également travaillé sur ce point», explique Hartmut Helmke, coordinateur du projet au Centre aérospatial allemand, qui en est l’hôte. «Nous avons atteint un taux d’erreur de mots inférieur à 5 %, ce qui se traduit par un taux de reconnaissance des commandes supérieur à 85 % pour les contrôleurs aériens.»
Une détection des erreurs de relecture pour l’ATM
Il reste compliqué d’appliquer la reconnaissance vocale aux contrôleurs du trafic aérien et aux pilotes en raison des versions locales de la phraséologie standardisée, des différents accents anglais (la langue internationale de l’aviation), des vitesses d’élocution différentes et du niveau de bruit des canaux. NATS et Isavia, partenaires de HAAWAII respectivement fournisseurs de services de navigation aérienne au Royaume-Uni et en Islande, ont enregistré plus de 500 heures de communications vocales entre contrôleurs et pilotes. Sur ces enregistrements, 40 heures de communications ont ensuite été transcrites manuellement mot à mot. Après avoir fourni au logiciel de reconnaissance vocale HAAWAII une seule heure de données transcrites manuellement, le taux de reconnaissance des mots a été multiplié par deux. Après l’avoir entraîné sur l’ensemble des données transcrites et non transcrites, le taux de reconnaissance des mots était supérieur à 95 % pour les contrôleurs et à 90 % pour les pilotes. «Les mots mal reconnus posent véritablement problème lorsqu’ils concernent des informations critiques pour la sécurité, comme les indicatifs d’appel ou les noms des points de cheminement. La combinaison des données vocales et radar a permis à notre système de s’améliorer au niveau sémantique. Nous avons par exemple atteint un taux de reconnaissance de 97 % pour les indicatifs d’appel des avions utilisés par les contrôleurs», indique Hartmut Helmke. L’apprentissage automatique a également été utilisé pour créer un assistant de détection des erreurs de relecture (REDA pour «Readback Error Detection Assistant»). On parle d’erreur de relecture lorsque, par exemple, un contrôleur donne l’autorisation à un pilote de monter à 7 000 pieds, mais que le pilote, en répétant l’autorisation accordée, mentionne une altitude de 8 000 pieds, ce qui risque de provoquer une collision si cela n’est pas détecté. Le REDA génère une alerte lorsque ce type d’erreur se produit. Le REDA a été évalué en laboratoire par cinq contrôleurs aériens islandais. «Par rapport aux évaluations hors ligne de transcriptions de données réelles, le nombre d’erreurs de relecture détectées lors de ces essais en laboratoire a été supérieur à 80 %, avec un taux de fausses alertes inférieur à 20 %», ajoute Hartmut Helmke. Des essais avec des contrôleurs NATS sont prévus cette année, Isavia ayant également l’intention de procéder à la démonstration du REDA dans son propre environnement opérationnel.
Une précision accrue et une charge de travail réduite
En réduisant la charge de travail et en augmentant la précision des contrôleurs du trafic aérien, une reconnaissance et une compréhension efficaces de la parole pourraient accroître considérablement la sécurité aérienne. Des milliers d’heures de transcription offrent également aux fournisseurs de services de navigation aérienne des informations de gestion utiles, telles que les fréquences auxquelles certaines commandes sont données ou répétées par avion. Ces informations peuvent indiquer une charge de travail élevée. La reconnaissance vocale pourrait également être utilisée pour soutenir les simulations sur le terrain, ce qui rendrait la formation moins coûteuse et possible à distance. «Notre prototype a fonctionné autour de Londres, dans l’espace aérien le plus encombré d’Europe, ainsi que dans l’espace aérien d’Isavia, qui couvre plus de 5 millions de kilomètres carrés. Il a réussi à comprendre les voix des pilotes avec un taux d’erreur de mots inférieur à 10 %, malgré la présence d’accents du monde entier, sans parler du niveau élevé de bruit dans les canaux de communication vocale», conclut Hartmut Helmke.
Mots‑clés
HAAWAII, reconnaissance vocale, contrôle du trafic aérien, mots, commandes, espace aérien, charge de travail, sécurité aérienne, transcriptions, détection des erreurs, voix, radar