Trouver l'épingle dans la meule de foin
L'effet «cocktail party» et d'autres environnements aussi bruyants sont des exemples extrêmes des difficultés qu'implique la séparation des sons. Les auditeurs tentent souvent de suivre une seule voix dans le brouhaha survenant lors d'une conversation, associé au tintement des verres et à la musique de fond. Les humains ne sont cependant pas les seuls à rencontrer ce problème; en effet, les algorithmes machines qui interprètent les sons doivent également y faire face. Des programmes sophistiqués de reconnaissance vocale, par exemple, sont pratiquement parfaits si la personne se trouve seule dans une pièce calme, mais leurs résultats sont médiocres dans des conditions réelles où plusieurs sources se mélangent. Une solution à ce problème consisterait à utiliser plusieurs microphones pour enregistrer différentes personnes s'exprimant simultanément. La voix d'un orateur particulier pourrait ensuite être sélectionnée à partir de l'indépendance des signaux audio. En pratique, toutefois, l'hypothèse des signaux indépendants ne produit en fait qu'une approximation, tout au plus. Il est intéressant de noter que les informations préalables sur les sources de signal (comme la distance qui les sépare) permettent de réduire la complexité de la solution et de concevoir des algorithmes simplifiés. Le problème se résume alors à une question: comment identifier de manière précise les signaux de voix qui doivent être regroupés et ceux qui doivent être interprétés séparément? Avec un coût différent pour les différents résultats possibles, les statistiques bayésiennes ont permis aux partenaires du projet BLISS de prendre la meilleure décision à partir des informations disponibles. Ils ont commencé par faire une approximation des dépendances entre sources de signal à l'aide d'équations mathématiques. Les modèles obtenus ont été utilisés pour annuler ou supprimer les dépendances afin de faciliter la séparation des signaux restants. Le principal inconvénient des méthodes bayésiennes réside dans leur complexité de calcul, qui a, par le passé, limité leur champ d'application aux problèmes simples de séparation aveugle. Toutefois, l'approche proposée n'est liée à aucun type de signal particulier. Ses applications vont de la séparation des enregistrements en stéréo pour les systèmes d'aide à l'écoute, aux ondes cervicales des capteurs médicaux en passant par les signaux radio des réseaux de télécommunications.