Vers une réutilisation fructueuse d'ontologies
Face à l'explosion du Web, la quantité d'informations disponibles en ligne a connu une croissance exponentielle. Mais l'absence de standardisation et de vocabulaire commun devrait déboucher sur une certaine hétérogénéité, entravant l'échange d'informations et la communication. Les ontologies, qui capturent la sémantique d'informations en provenance de diverses sources et qui fournissent une description déclarative concise, ont dès lors acquis une importance sans précédent. C'est la prise de conscience des avantages des ontologies pour le traitement des informations qui a conduit à la création d'ontologies monolithiques pour des domaines du monde réel. Dans le cadre du projet WONDERWEB, des chercheurs ont coordonné leurs efforts afin de développer des méthodes de modularisation et des outils de gestion de domaines de grande taille, contenant des milliers de concepts. Cette notion de modularisation est tirée du génie logiciel, où elle fait référence à la conception de logiciels à partir de composants bien définis pouvant être gérés et réutilisés en toute indépendance. Des chercheurs de la Vrije Universiteit d'Amsterdam ont tenté de s'attaquer aux problèmes d'évolutivité grâce à une méthode de découpage basée exclusivement sur la structure de l'ontologie. L'un des aspects pratiques consistait à ignorer son incapacité à capturer des dépendances importantes identifiées lors de l'analyse des classes et la définition logique de concepts. Une étude sémantique basée sur la structure a pu être élargie à des ontologies de grande taille contenant des centaines de milliers de concepts. Ce découpage itératif a déjà été appliqué avec succès à des ontologies du monde réel disponibles dans un schéma OWL (Web Ontology Language) ou RDF (Resource Description Framework), dont la Suggested Upper Merged Ontology (SUMO). La SUMO a été développée au sein du groupe de travail sur les ontologies supérieures standard de l'IEEE en tant qu'ontologie standard destinée à promouvoir l'interopérabilité des données, la recherche et la récupération d'informations et le traitement du langage naturel. Des résultats prometteurs ont également été obtenus avec cette approche minimale lors d'une deuxième expérience portant sur le découpage créé pour la partie administrative de l'ontologie du National Cancer Institute (NCI). Il reste à présent à déterminer si l'utilisation d'informations structurelles complémentaires au concept de hiérarchie donne de meilleurs résultats. Les recherches futures pourraient également prendre une toute autre direction, à savoir l'étude des performances de la méthode sur des graphiques intégrant des dépendances résultant de relations définies par l'utilisateur.