Espionner les préférences des utilisateurs
Les scientifiques du projet EVALUATE (Theory and practice of algorithms for analysis of people and data on the web) ont vu dans le World Wide Web la plus grande base de données disponible. Cet ensemble de données provenant entre autres des réseaux sociaux, des systèmes de commerce électronique et d'administration électronique, est si volumineux et complexe qu'il est difficile pour les utilisateurs d'y trouver les informations qu'ils recherchent. L'adaptation d'un moteur de recherche pour répondre aux besoins d'un utilisateur constitue toujours un problème ouvert, que l'équipe d'EVALUATE a cherché à résoudre. Les utilisateurs révèlent leurs préférences par le biais de leurs choix. Ces choix peuvent être un clic sur un lien affiché dans la page de résultats d'une recherche web. Les précédentes études utilisaient le retour explicite des utilisateurs pour adapter le classement effectué par le moteur de recherche. Cependant, les utilisateurs sont en général réticents à fournir un retour explicite, ce qui fait que ce retour est trop limité pour être représentatif. Pour surmonter ce problème, les chercheurs ont développé des algorithmes d'apprentissage automatique actif utilisant des données implicites de rétroaction afin d'optimiser les fonctions de classement. À la différence de l'apprentissage traditionnel (passif), ces nouveaux outils peuvent collecter un ensemble d'instances puis choisir un sous-ensemble pour lesquels des données sont disponibles. Les chercheurs d'EVALUATE se sont penchés sur deux applications: apprendre à classer les préférences par paires, et effectuer des regroupements avec des informations supplémentaires arrivant sous la forme de contraintes par paires. L'objectif était d'ordonner de façon linéaire les éléments depuis le préféré jusqu'au moins souhaitable, tout en étant éventuellement en désaccord avec quelques préférences ou contraintes par paires. Ces nouvelles techniques se sont avérées supérieures aux algorithmes précédents. Les applications en ligne les plus populaires, dont les moteurs de recherche et les réseaux sociaux, dépendent de leur capacité à fournir des résultats de recherche, des publicités et des recommandations. Le travail de recherche mené au cours du projet EVALUATE va bien au-delà des limites traditionnelles de l'informatique. L'approche multidisciplinaire adoptée pour les problèmes de données massives promet d'intégrer l'humain dans toutes les étapes de l'analyse des données.
Mots‑clés
Préférences utilisateur, ressources en ligne, World Wide Web, algorithmes, réseaux sociaux, moteur de recherche