Déploiement du web sémantique

Il est désormais possible d'extraire des informations sémantiques à partir de données web et de les stocker de manière à pouvoir les récupérer de manière efficace au moyen d'un cadre de gestion novateur développé dans le cadre du projet PARMENIDES.

Économie numérique

La prise de décision stratégique, en particulier dans les domaines de plus en plus importants de la veille économique et de la veille concurrentielle, exige la collecte d'informations pertinentes sur les tendances de marché, les fusions et les valeurs des sociétés, par exemple. L'une des caractéristiques du processus d'extraction de ces informations à partir de sources multiples est qu'il nécessite de nombreuses ressources, mais surtout qu'il doit être effectué de manière assez fréquente. Les chercheurs du projet PARMENIDES, financé par le cinquième programme-cadre, ont adopté une approche systématique orientée ontologie pour intégrer l'ensemble du processus de collecte et d'analyse des informations. En vue de décomposer les activités en requêtes conventionnelles, ils ont par ailleurs développé des méthodes dédiées capables d'établir des ontologies de manière semi-automatique dans des domaines d'application spécifiques, d'annoter des documents avec des composants ontologiques et d'identifier les entités au sein de ces documents. Deux méthodologies complémentaires ont été étudiées en vue de la définition d'ontologies dans des textes non structurés, essentiellement constitués d'articles de presse et de rapports non intégrés à une base de données. La méthodologie orientée modèle, qui trouve son origine dans le traitement du langage naturel, exprime la structure et la sémantique des documents au moyen de modèles de règles et les enrichit à l'aide d'annotations formelles. De son côté, la méthodologie KDD (Knowledge Discovery in Databases, découverte de connaissances dans des bases de données) se charge de la découverte des concepts et relations qui caractérisent les documents et peut de surcroît être appliquée au domaine du discours. Les actifs informationnels extraits sont conservés dans un référentiel de documents afin de faciliter les opérations de découverte d'informations au fil du temps et de permettre l'identification de nouvelles tendances qui, autrement, demeureraient cachées. Bien que la pléthore d'ontologies «prêtes à l'emploi» offre du matériel conceptuel standardisé, souvent combiné à des suggestions extrêmement intéressantes concernant les relations conceptuelles associées, ces connaissances doivent être fréquemment restructurées. Le système d'extraction de connaissances Parmenides pourrait donc répondre à la pénurie de matériel ontologique dans des domaines qui sont actuellement la cible de nombreuses activités de recherche.